Lista-Exercicios-Aula8

Engenharias

Koji Harada

em 31/08/2025

Conteúdos escolhidos para você

103 pág.

Dissertação - Heber Valdo Nogueira - 2017

UFRJ

18 pág.

TCC UMA ANÁLISE UTILIZANDO MINERAÇÃO DE DADOS PARA INFERÊNCIA ASSOCIADA AOS FENÔMENOS EL NIÑO, LA NIÑA E ANOS NEUTROS

Perguntas dessa disciplina

Uma equipe de cientistas de dados está a desenvolver um modelo de rede neural para um sistema embarcado de reconhecimento de placas de veículos, qu...

UNIVESP

1. Variável é toda característica que, observada em uma unidade da população ou amostra, pode variar de um indivíduo para outro (Callegari-Jacques...

UNILAVRAS

Uma equipe de auditoria interna está analisando o desempenho de vendas diárias de uma filial específica, que é uma variável contínua. Durante a fas...

Uma consultoria contábil está avaliando se a implementação de um novo sistema de gestão financeira resultou em uma redução significativa nos erros ...

Uma equipe de auditoria interna está analisando o desempenho de vendas diárias de uma filial específica, que é uma variável contínua. Durante a fas...

Material

Conteúdos escolhidos para você

103 pág.

Dissertação - Heber Valdo Nogueira - 2017

UFRJ

18 pág.

TCC UMA ANÁLISE UTILIZANDO MINERAÇÃO DE DADOS PARA INFERÊNCIA ASSOCIADA AOS FENÔMENOS EL NIÑO, LA NIÑA E ANOS NEUTROS

Perguntas dessa disciplina

Uma equipe de cientistas de dados está a desenvolver um modelo de rede neural para um sistema embarcado de reconhecimento de placas de veículos, qu...

UNIVESP

1. Variável é toda característica que, observada em uma unidade da população ou amostra, pode variar de um indivíduo para outro (Callegari-Jacques...

UNILAVRAS

Uma equipe de auditoria interna está analisando o desempenho de vendas diárias de uma filial específica, que é uma variável contínua. Durante a fas...

Uma consultoria contábil está avaliando se a implementação de um novo sistema de gestão financeira resultou em uma redução significativa nos erros ...

Uma equipe de auditoria interna está analisando o desempenho de vendas diárias de uma filial específica, que é uma variável contínua. Durante a fas...

Prévia do material em texto

Lista de Exercícios - Análise estatística com ANOVA e teste de Tukey
Obs: Primeiro instale os softwares R-4.2.2-win e RStudio-2022.12.0-353, disponíveis na pasta
Softwares. Depois, assista o vídeo para resolver a Lista de Exercícios.
1. A Tabela I apresenta os valores da acurácia obtidos pelos algoritmos de classificação,
considerando quatro classes de plantas. Realize o teste estatístico ANOVA no RStudio e informe
o valor-p. p = 0,149 = 1,49%
Tabela I
Resultados da acurácia obtidos pelos algoritmos de classificação.
Classe Algoritmo Acurácia (%)
Buva
Capim amargoso
Soja
Fundo
SMO
SMO
SMO
SMO
93.12
75.87
78.0
85.25
Buva
Capim amargoso
Soja
Fundo
RandomForest
RandomForest
RandomForest
RandomForest
93.0
76.87
81.87
76.87
Buva
Capim amargoso
Soja
Fundo
J48
J48
J48
J48
90.5
36.75
37.25
72.12
Buva
Capim amargoso
Soja
Fundo
NaiveBayes
NaiveBayes
NaiveBayes
NaiveBayes
45.0
36.75
42.37
30.37
Buva
Capim amargoso
Soja
Fundo
IBk
IBk
IBk
IBk
87.12
33.0
34.37
71.5

2. Considerando o nível de significância igual a 0,05 (ou 5%), podemos afirmar que existe
diferença estatística significativa entre os algoritmos analisados? Por quê?
Sim, existe uma diferença estatística significativa entre os algoritmos, pois devemos rejeitar a
hipótese nula de que não há diferença entre as médias.

3. Realize o pós-teste com o teste de Tukey no RStudio e apresente o valor-p resultante da
comparação entre os pares de algoritmos.
J48-IBK 99,95%
NaïveBayes-IBK 63,08%
RandomForest-IBK 30,16%
SMO-IBK 27,17%
NaiveBayes-J48 50,79%
RandomForest-J48 40,14%
SMO-J48 36,54%
RandomForest-NaiveBayes 25,98%
SMO-NaiveBayes 22,64%
SMO-RandomForest 99,99%

4. O pós-teste com o teste de Tukey indica diferença estatística significativa entre quais
algoritmos?
Os algoritmos que tiveram mais semelhança quando comparados entre si foram SMO-
RandomForest e J48-IBK, e os que tiveram maior diferença quando comparados foram SMO-
NaiveBayes.

5. Crie o diagrama de boxplot para avaliar a taxa de dispersão de dados dos algoritmos. Quais
algoritmos tiveram melhor desempenho no experimento? Por quê?

Os algoritmos que obtiveram maior acurácia em no experimento foram RandomForest e SMO, pois
seu melhor resultado ficou maior que 90% e suas medianas estão entre 80 e 90%.

Obs: Salve os resultados dos exercícios em um arquivo texto de sua preferência (Lista-Exercicios-
Aula8.doc) e envie-o para evertontetila@gmail.com. Prazo de entrega: 26/02/2023.

mailto:evertontetila@gmail.com

Lista-Exercicios-Aula8

Engenharias

Ferramentas de estudo

Conteúdos escolhidos para você

1646678396516

Dissertação - Heber Valdo Nogueira - 2017

1646678447315

Análise Agrícola e Regressão

TCC UMA ANÁLISE UTILIZANDO MINERAÇÃO DE DADOS PARA INFERÊNCIA ASSOCIADA AOS FENÔMENOS EL NIÑO, LA NIÑA E ANOS NEUTROS

Perguntas dessa disciplina

Uma equipe de cientistas de dados está a desenvolver um modelo de rede neural para um sistema embarcado de reconhecimento de placas de veículos, qu...

1. Variável é toda característica que, observada em uma unidade da população ou amostra, pode variar de um indivíduo para outro (Callegari-Jacques...

Uma equipe de auditoria interna está analisando o desempenho de vendas diárias de uma filial específica, que é uma variável contínua. Durante a fas...

Uma consultoria contábil está avaliando se a implementação de um novo sistema de gestão financeira resultou em uma redução significativa nos erros ...

Uma equipe de auditoria interna está analisando o desempenho de vendas diárias de uma filial específica, que é uma variável contínua. Durante a fas...

Conteúdos escolhidos para você

1646678396516

Dissertação - Heber Valdo Nogueira - 2017

1646678447315

Análise Agrícola e Regressão

TCC UMA ANÁLISE UTILIZANDO MINERAÇÃO DE DADOS PARA INFERÊNCIA ASSOCIADA AOS FENÔMENOS EL NIÑO, LA NIÑA E ANOS NEUTROS

Perguntas dessa disciplina

Uma equipe de cientistas de dados está a desenvolver um modelo de rede neural para um sistema embarcado de reconhecimento de placas de veículos, qu...

1. Variável é toda característica que, observada em uma unidade da população ou amostra, pode variar de um indivíduo para outro (Callegari-Jacques...

Uma equipe de auditoria interna está analisando o desempenho de vendas diárias de uma filial específica, que é uma variável contínua. Durante a fas...

Uma consultoria contábil está avaliando se a implementação de um novo sistema de gestão financeira resultou em uma redução significativa nos erros ...

Uma equipe de auditoria interna está analisando o desempenho de vendas diárias de uma filial específica, que é uma variável contínua. Durante a fas...

Mais conteúdos dessa disciplina