A cada dia, uma enorme quantidade de dados é gerada. Relatório da IDC (do inglês International Data Corporation), de novembro de 2018, estima que até 2025 a quantidade de dados gerados aumentará em 61% por ano. Esses dados são gerados por atividades, como transações financeiras, monitoramento ambiental, obtenção de dados clínicos e genéticos, captura de imagens, navegação na internet e uso de redes sociais. Esses dados assumirão vários formatos diferentes, incluindo séries temporais, itemsets, transações, grafos ou redes sociais, textos, páginas web, imagens, vídeos e áudios. Com o aumento crescente da quantidade de dados gerada, tem aumentado muito a distância entre a quantidade de dados existente e a porção desses dados que é analisada e compreendida. Apesar do crescente número de bases de dados disponíveis, na maioria das vezes não é possível aplicar algoritmos de AM diretamente sobre esses dados. Técnicas de pré-processamento são frequentemente utilizadas para corrigir problemas nos dados e para tornar os conjuntos de dados mais adequados para o uso de algoritmos de AM. Para ajudar a entender os dados e identificar as tarefas de pré-processamento adequadas, e mesmo para garantir a qualidade e facilidade de interpretação dos resultados obtidos, é importante fazer uma caracterização dos dados e também uma exploração inicial com estatísticas descritivas básicas e/ou técnicas básicas de visualização. Com base no excerto apresentado, assinale a alternativa CORRETA sobre tarefas de pré-processamento:
Fonte: FACELI, K. et.al. Inteligência Artificial: Uma Abordagem de Aprendizado de Máquina. 2. ed. Rio de Janeiro: LTC, 2022.
A) Seleção de fonte de dados treinados através de um modelo de aprendizagem máquina.
B) Verificação do conjunto de dados se possuem consistência dos dados imputados.
C) Preparação de pseudocódigo e seu código para a mineração de dados.
D) Preparação da base com relação a inserção ou remoção de dados, integrações de bases e transformações para uma melhor compreensão.
Ed
há 4 dias
Vamos analisar as alternativas apresentadas sobre tarefas de pré-processamento de dados: A) Seleção de fonte de dados treinados através de um modelo de aprendizagem máquina. - Esta opção não se refere diretamente ao pré-processamento, mas sim à seleção de dados já processados. B) Verificação do conjunto de dados se possuem consistência dos dados imputados. - Embora a verificação de consistência seja uma parte importante do pré-processamento, essa opção é um pouco limitada e não abrange todas as tarefas de pré-processamento. C) Preparação de pseudocódigo e seu código para a mineração de dados. - Esta opção fala sobre a programação e não sobre o pré-processamento em si. D) Preparação da base com relação a inserção ou remoção de dados, integrações de bases e transformações para uma melhor compreensão. - Esta opção abrange várias tarefas de pré-processamento, como a inserção e remoção de dados, integração de diferentes bases e transformações, que são essenciais para preparar os dados para análise. Diante da análise, a alternativa correta sobre tarefas de pré-processamento é: D) Preparação da base com relação a inserção ou remoção de dados, integrações de bases e transformações para uma melhor compreensão.