ANOVA PARTE 2 - ESTATÍSTICA 2 - 2017/1 - PROF. RICARDO TAVARES

•

UFOP

0

Felipe Fonseca

23/09/2017

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Probabilidade e Estatística

29.888 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

UNIVERSIDADE FEDERAL DE OURO PRETO
Texto Complementar aos slides sobre ANOVA
Prof. Ricardo Tavares
A técnica de análise de variância (ANOVA) foi desenvolvida principalmente pelo estatístico inglês
Ronald A. Fisher, a partir de 1918.
Uma das preocupações estatísticas ao analisar dados, é a de criar modelos que explicitem estruturas
do fenômeno em observação. A identificação dessas estruturas permite conhecer melhor o
fenômeno, bem como fazer afirmações sobre possíveis comportamento do mesmo.
OBSERVAÇÃO = PREVISÍVEL + ALEATÓRIO
PREVISÍVEL: é expressada por uma função matemática com parâmetros desconhecidos.
ALEATÓRIO: assumimos uma estrutura de probabilidade; um modelo de probabilidade conhecido.
A ANOVA é um teste de hipóteses para médias de mais de duas populações.
Um tratamento (ou fator) é uma propriedade, ou característica, que permite distinguir as diferentes
populações de outras.
O método de ANOVA é baseado neste conceito fundamental: com a suposição que todas as
populações têm a mesma variância ( 2σ ) (elas são homocedásticas), estimamos o valor comum de
2σ usando duas diferentes abordagens. A estatística do teste F é a razão destas estimativas, desta
forma uma estatística F grande significativamente (localizada mais a direita no gráfico da
distribuição F) traz evidência contra médias populacionais iguais. As duas abordagens para estimar
a variância 2σ são as seguintes:
1) A variância entre amostras (também chamada de variância devido ao tratamento) é uma
estimativa da variância populacional comum ( 2σ ) que é baseada na variação entre as médias
amostrais.
2) A variância dentro das amostras (também chamada de variância devido ao erro) é uma estimativa
da variância populacional comum ( 2σ ) baseada nas variâncias amostrais.
A estatística de teste para uma ANOVA one-way (um único fator) é dada por,
amostras das dentro variância
amostras as entre variância
=F
Treinando os cálculos e uma ilustração interessante sobre o efeito da média para com a
estatística do teste F:
Fonte: Livro do Triola (versão original)
Cálculo do valor p no excel: =DISTF(0,1428 ; 2 ; 9)
Cálculo do valor p no R: pf(q=0.1428, df1=2, df2=9, lower.tail = F)
Exemplo: Uma bioquímica (Tecnologia de Alimentos) está interessada em estudar a extração de
pigmentos naturais, com aplicação como corante em alimentos. Numa primeira etapa tem-se a
necessidade de escolher o melhor solvente extrator. A escolha do(s) melhor(es) solventes foi
realizada através da medida da absorbância de um pigmento natural do fruto de baguaçú.
Fator = solventes; a=5 níveis; n=5 repetições.
Unidade experimental: 10 gramas de polpa do fruto de baguaçú.
Casualização: a partir de 1 kg de polpa, foram sendo retiradas amostras de 10gr, onde foram
aplicados os tratamentos, numa ordem aleatória.
As observações obtidas de absorbância são mostradas na tabela 1.1
Rejeita-se a hipótese nula e concluímos que as médias de tratamentos diferem entre si, ou seja, os
solventes afetam significativamente as médias de absorbância.
Intervalo de confiança para uma diferença de médias, por exemplo, para 43 µµ − :
Testes para comparações múltiplas
Suponha que através da ANOVA para comparação de g médias (tratamentos) concluímos que a
hipótese nula deve ser rejeitada ao nível alfa de significância, ou seja, concluímos que nem todas as
populações têm a mesma média. Neste caso devemos usar um dos testes de Comparações Múltiplas
para identificar qual ou quais grupos tem médias diferentes das demais. Precisamos descobrir se a
diferença está entre o primeiro tratamento e o segundo, ou se está entre o primeiro e o terceiro, ou
entre o segundo e o terceiro, e assim por diante. Alguns dos métodos de comparações múltiplas
mais conhecidos são Tukey, Duncan, Scheffé, Método da Diferença Mínima Significativa (LSD),
Dunnett (apenas quando se compara cada tratamento com um controle), etc.
Nota sobre os créditos: O material referente ao teste de Tukey foi retirado das notas de aula da
Profa. Thaís Rotsen (UFOP).
Observação: Precisamos comparar: AB, AC, AD, BC, BD, CD, e portanto faltam cinco.