Logo Passei Direto
Buscar
Dados nulos representam valores ausentes em um conjunto de dados e podem impactar diretamente a qualidade das análises e os resultados dos modelos preditivos. Saber identificar, interpretar e tratar dados nulos é fundamental para lidar com problemas reais em Ciência de Dados.
Analise as afirmações abaixo sobre dados nulos e escolha a alternativa que contém apenas as afirmações verdadeiras.
I. Dados nulos podem ser substituídos por valores calculados, como a média ou a mediana, para evitar a perda de informações durante a análise.
II. A presença de dados nulos em um dataset pode causar erros em algoritmos de aprendizado de máquina que não lidam nativamente com valores ausentes.
III. Métodos de imputação são usados exclusivamente para remover todos os dados nulos de um conjunto de dados.
IV. A remoção de linhas ou colunas com dados nulos é sempre a melhor abordagem para lidar com valores ausentes.
V. A análise da distribuição dos dados deve ser considerada ao decidir como tratar os valores nulos.
User badge image
Progresso com Exercícios

há 2 meses

Respostas

User badge image

Ed Verified user icon

há 2 meses

Vamos analisar cada uma das afirmações: I. Dados nulos podem ser substituídos por valores calculados, como a média ou a mediana, para evitar a perda de informações durante a análise. Verdadeiro, essa é uma prática comum na imputação de dados nulos. II. A presença de dados nulos em um dataset pode causar erros em algoritmos de aprendizado de máquina que não lidam nativamente com valores ausentes. Verdadeiro, muitos algoritmos não conseguem processar dados nulos e isso pode levar a erros. III. Métodos de imputação são usados exclusivamente para remover todos os dados nulos de um conjunto de dados. Falso, métodos de imputação são usados para substituir dados nulos, não apenas para removê-los. IV. A remoção de linhas ou colunas com dados nulos é sempre a melhor abordagem para lidar com valores ausentes. Falso, essa abordagem não é sempre a melhor, pois pode resultar em perda significativa de informações. V. A análise da distribuição dos dados deve ser considerada ao decidir como tratar os valores nulos. Verdadeiro, essa análise é importante para escolher a melhor estratégia de imputação. Com base nas análises, as afirmações verdadeiras são I, II e V. Portanto, a alternativa que contém apenas as afirmações verdadeiras é: não há uma alternativa correta listada.

Essa resposta te ajudou?

0
Dislike0

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

Mais perguntas desse material

Mais conteúdos dessa disciplina