Os cientistas de dados avaliam a adequação e a qualidade, identificando se alguma melhoria pode ser feita no conjunto de dados os resultados necess...
Os cientistas de dados avaliam a adequação e a qualidade, identificando se alguma melhoria pode ser feita no conjunto de dados os resultados necessários. Por exemplo, um cientista de dados pode descobrir que poucos pontos de dados influenciam o modelo de aprendizado de máquina em direção a um determinado resultado. Dados de baixa qualidade ou dados ruins custam, a uma organização, média de US$ 13,5 milhões por ano, o que é um custo alto demais para suportar. Dados ruins ou má qualidade dos dados podem alterar a precisão dos insights ou podem ocasionar insights incorretos, e é por isso que a preparação é de extrema importância, mesmo que consuma tempo e seja a tarefa menos agradável do processo de ciência de dados. Portanto, a preparação de dados é necessária devido à presença de dados não formatados do mundo real. Com base na maioria dos dados do mundo real, analise as sentenças a seguir:
I- A maioria dos dados do mundo real é composta por dados imprecisos (dados ausentes), por dados ruidosos e dados inconsistentes.
II- Existem muitos motivos para os dados ausentes não serem coletados continuamente como erro na entrada de dados, problemas técnicos com biometria e muito mais.
III- A presença de dados ruidosos (dados errôneos e outliers) se deve aos motivos que ocasionam a existência de duplicação de dados, entrada de dados humanos, contendo erros de códigos ou nomes, como violação de restrições de dados e muito mais.
IV- A presença de inconsistências se deve às razões para a existência de dados ruidosos podem ser um problema tecnológico de gadget que coleta dados, um erro humano durante a entrada de dados e muito mais.
Assinale a alternativa CORRETA: As sentenças II e III estão corretas. As sentenças II e IV estão corretas. As sentenças I e II estão corretas. Somente a sentença IV está correta. A B C D
Compartilhar