Prévia do material em texto
<p>Após a análise do dataset Pokemon Stats Generations 1-9 disponível no Kaggle, podem ser encontrados dados faltantes em certos atributos, como pontos de estatísticas ou habilidades dos Pokémon. Há várias abordagens para lidar com esses dados faltantes:</p><p>Substituição dos valores faltantes:</p><p>Média ou mediana: Para atributos numéricos (como HP ou ataque), os valores ausentes podem ser substituídos pela média ou mediana das entradas disponíveis. Isso mantém a estrutura do dataset, mas pode reduzir a variabilidade, gerando um impacto nos resultados de modelos preditivos.</p><p>Modo: Para atributos categóricos (como tipo de Pokémon), pode-se utilizar o valor mais comum (modo) para preencher as lacunas, embora isso também possa enviesar o modelo.</p><p>Consequência: A substituição pode afetar a precisão e variabilidade dos dados, especialmente se houver muitos valores faltantes. Modelos podem se tornar menos robustos se forem preenchidos de maneira inadequada.</p><p>Utilização do dataset com dados faltantes:</p><p>Em alguns casos, é possível ignorar registros incompletos, mas isso pode reduzir o tamanho da amostra, levando a um enfraquecimento estatístico.</p><p>Outra abordagem é utilizar algoritmos que suportam diretamente valores ausentes, ou técnicas de imputação avançada, como modelos baseados em regressão ou algoritmos de aprendizado de máquina que estimam os valores ausentes.</p><p>Impacto: Deixar os dados faltantes no dataset pode influenciar negativamente os resultados, dependendo da proporção de dados ausentes e da sensibilidade do algoritmo escolhido.</p>