Prévia do material em texto
Lista de Exercícios - Análise estatística com ANOVA e teste de Tukey Obs: Primeiro instale os softwares R-4.2.2-win e RStudio-2022.12.0-353, disponíveis na pasta Softwares. Depois, assista o vídeo para resolver a Lista de Exercícios. 1. A Tabela I apresenta os valores da acurácia obtidos pelos algoritmos de classificação, considerando quatro classes de plantas. Realize o teste estatístico ANOVA no RStudio e informe o valor-p. p = 0,149 = 1,49% Tabela I Resultados da acurácia obtidos pelos algoritmos de classificação. Classe Algoritmo Acurácia (%) Buva Capim amargoso Soja Fundo SMO SMO SMO SMO 93.12 75.87 78.0 85.25 Buva Capim amargoso Soja Fundo RandomForest RandomForest RandomForest RandomForest 93.0 76.87 81.87 76.87 Buva Capim amargoso Soja Fundo J48 J48 J48 J48 90.5 36.75 37.25 72.12 Buva Capim amargoso Soja Fundo NaiveBayes NaiveBayes NaiveBayes NaiveBayes 45.0 36.75 42.37 30.37 Buva Capim amargoso Soja Fundo IBk IBk IBk IBk 87.12 33.0 34.37 71.5 2. Considerando o nível de significância igual a 0,05 (ou 5%), podemos afirmar que existe diferença estatística significativa entre os algoritmos analisados? Por quê? Sim, existe uma diferença estatística significativa entre os algoritmos, pois devemos rejeitar a hipótese nula de que não há diferença entre as médias. 3. Realize o pós-teste com o teste de Tukey no RStudio e apresente o valor-p resultante da comparação entre os pares de algoritmos. J48-IBK 99,95% NaïveBayes-IBK 63,08% RandomForest-IBK 30,16% SMO-IBK 27,17% NaiveBayes-J48 50,79% RandomForest-J48 40,14% SMO-J48 36,54% RandomForest-NaiveBayes 25,98% SMO-NaiveBayes 22,64% SMO-RandomForest 99,99% 4. O pós-teste com o teste de Tukey indica diferença estatística significativa entre quais algoritmos? Os algoritmos que tiveram mais semelhança quando comparados entre si foram SMO- RandomForest e J48-IBK, e os que tiveram maior diferença quando comparados foram SMO- NaiveBayes. 5. Crie o diagrama de boxplot para avaliar a taxa de dispersão de dados dos algoritmos. Quais algoritmos tiveram melhor desempenho no experimento? Por quê? Os algoritmos que obtiveram maior acurácia em no experimento foram RandomForest e SMO, pois seu melhor resultado ficou maior que 90% e suas medianas estão entre 80 e 90%. Obs: Salve os resultados dos exercícios em um arquivo texto de sua preferência (Lista-Exercicios- Aula8.doc) e envie-o para evertontetila@gmail.com. Prazo de entrega: 26/02/2023. mailto:evertontetila@gmail.com