Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

Lista de Exercícios - Análise estatística com ANOVA e teste de Tukey 
Obs: Primeiro instale os softwares R-4.2.2-win e RStudio-2022.12.0-353, disponíveis na pasta 
Softwares. Depois, assista o vídeo para resolver a Lista de Exercícios. 
1. A Tabela I apresenta os valores da acurácia obtidos pelos algoritmos de classificação, 
considerando quatro classes de plantas. Realize o teste estatístico ANOVA no RStudio e informe 
o valor-p. p = 0,149 = 1,49% 
 Tabela I 
Resultados da acurácia obtidos pelos algoritmos de classificação. 
Classe Algoritmo Acurácia (%) 
Buva 
Capim amargoso 
Soja 
Fundo 
SMO 
SMO 
SMO 
SMO 
93.12 
75.87 
78.0 
85.25 
Buva 
Capim amargoso 
Soja 
Fundo 
RandomForest 
RandomForest 
RandomForest 
RandomForest 
93.0 
76.87 
81.87 
76.87 
Buva 
Capim amargoso 
Soja 
Fundo 
J48 
J48 
J48 
J48 
90.5 
36.75 
37.25 
72.12 
Buva 
Capim amargoso 
Soja 
Fundo 
NaiveBayes 
NaiveBayes 
NaiveBayes 
NaiveBayes 
45.0 
36.75 
42.37 
30.37 
Buva 
Capim amargoso 
Soja 
Fundo 
IBk 
IBk 
IBk 
IBk 
87.12 
33.0 
34.37 
71.5 
 
2. Considerando o nível de significância igual a 0,05 (ou 5%), podemos afirmar que existe 
diferença estatística significativa entre os algoritmos analisados? Por quê? 
Sim, existe uma diferença estatística significativa entre os algoritmos, pois devemos rejeitar a 
hipótese nula de que não há diferença entre as médias. 
 
3. Realize o pós-teste com o teste de Tukey no RStudio e apresente o valor-p resultante da 
comparação entre os pares de algoritmos. 
J48-IBK 99,95% 
NaïveBayes-IBK 63,08% 
RandomForest-IBK 30,16% 
SMO-IBK 27,17% 
NaiveBayes-J48 50,79% 
RandomForest-J48 40,14% 
SMO-J48 36,54% 
RandomForest-NaiveBayes 25,98% 
SMO-NaiveBayes 22,64% 
SMO-RandomForest 99,99% 
 
4. O pós-teste com o teste de Tukey indica diferença estatística significativa entre quais 
algoritmos? 
Os algoritmos que tiveram mais semelhança quando comparados entre si foram SMO-
RandomForest e J48-IBK, e os que tiveram maior diferença quando comparados foram SMO-
NaiveBayes. 
 
5. Crie o diagrama de boxplot para avaliar a taxa de dispersão de dados dos algoritmos. Quais 
algoritmos tiveram melhor desempenho no experimento? Por quê? 
 
 
 
 
Os algoritmos que obtiveram maior acurácia em no experimento foram RandomForest e SMO, pois 
seu melhor resultado ficou maior que 90% e suas medianas estão entre 80 e 90%. 
 
 
 
Obs: Salve os resultados dos exercícios em um arquivo texto de sua preferência (Lista-Exercicios-
Aula8.doc) e envie-o para evertontetila@gmail.com. Prazo de entrega: 26/02/2023. 
 
mailto:evertontetila@gmail.com

Mais conteúdos dessa disciplina