Baixe o app para aproveitar ainda mais
Prévia do material em texto
Acadêmico: Disciplina: Preparação e Análise Exploratória de Dados () Avaliação: Avaliação Final (Discursiva) - Individual Semipresencial ( Cod.:) ( peso.:4,00) Prova: Nota da Prova: - 1. John W. Tukey foi quem definiu a expressão Exploratory Data Analysis (EDA) e fez contribuições significativas tanto para as ciências físicas quanto ciências sociais. Referente especificamente à análise exploratória de dados, suas contribuições inovadoras incluíram o algoritmo de transformação Fourier, mudando o uso da estatística descritiva por meio da EDA, assim como a linguagem e o paradigma da estatística. Curiosamente, é difícil, se impossível, encontrar uma definição precisa da EDA. Disserte sobre as definições da expressão EDA. Resposta Esperada: *São três as principais características, sendo elas: apresentação gráfica, flexibilidade no ponto de vista e nas instalações e busca intensa de parcimôn simplicidade. Na análise exploratória de dados, não há substituto para a flexibilidade para se adaptar ao que é calculado e ao que queremos rastrear. I aplica às necessidades da situação e aos dados já fornecidos. *O histograma deve ser considerado obsoleto. *A análise exploratória de dados não req probabilidade, importância ou confiança. *A análise exploratória de dados é ativa e sensível, em vez de passivamente descritiva, e realmente enfatiza descoberta de conteúdo inesperado. *A análise exploratória de dados é uma atitude, um tipo de flexibilidade, uma disposição para procurar coisas que pensamos que existam. *A análise exploratória de dados isola os padrões e características dos dados e os revela fortemente aos analistas. Se precis conselhos curtos sobre o que é EDA, é: uma atitude flexível e algum papel milimetrado ou transparências, ou ambos. 2. A limpeza de dados é referente aos valores ausentes. Podemos dizer que um valor que não foi coletado é um valor ausente, contudo ele existe no m Ter um valor ausente é diferente de ter um valor vazio. Isso porque valor vazio se refere a um valor que não existe no mundo real. De forma geral, os ausentes podem ser tratados removendo os valores ausentes, recuperando os valores ausentes, ou restringindo a execução de algoritmos de mach learning. Nesse sentido, disserte sobre esses três tipos de tratamento. Resposta Esperada: *Remover de valores ausentes inclui a exclusão de atributos ou instâncias do conjunto de dados, mas isso impõe restrições ao valor dos dados (perda informações). * Recuperar o valor ausente inclui substituir o valor ausente por um valor padrão ou médio; no entanto isso pode introduzir informações distorcidas que não estão incluídas em eventos e situações. * Por fim, restringir a execução de algoritmos de aprendizado de máquina limita a análise algoritmos que podem ser aplicados aos dados, técnica K de vizinho mais próximo (KNN), classificadores bayesianos e várias técnicas estatísticas nã lidar com valores ausentes.
Compartilhar