Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL DE OURO PRETO Texto Complementar aos slides sobre ANOVA Prof. Ricardo Tavares A técnica de análise de variância (ANOVA) foi desenvolvida principalmente pelo estatístico inglês Ronald A. Fisher, a partir de 1918. Uma das preocupações estatísticas ao analisar dados, é a de criar modelos que explicitem estruturas do fenômeno em observação. A identificação dessas estruturas permite conhecer melhor o fenômeno, bem como fazer afirmações sobre possíveis comportamento do mesmo. OBSERVAÇÃO = PREVISÍVEL + ALEATÓRIO PREVISÍVEL: é expressada por uma função matemática com parâmetros desconhecidos. ALEATÓRIO: assumimos uma estrutura de probabilidade; um modelo de probabilidade conhecido. A ANOVA é um teste de hipóteses para médias de mais de duas populações. Um tratamento (ou fator) é uma propriedade, ou característica, que permite distinguir as diferentes populações de outras. O método de ANOVA é baseado neste conceito fundamental: com a suposição que todas as populações têm a mesma variância ( 2σ ) (elas são homocedásticas), estimamos o valor comum de 2σ usando duas diferentes abordagens. A estatística do teste F é a razão destas estimativas, desta forma uma estatística F grande significativamente (localizada mais a direita no gráfico da distribuição F) traz evidência contra médias populacionais iguais. As duas abordagens para estimar a variância 2σ são as seguintes: 1) A variância entre amostras (também chamada de variância devido ao tratamento) é uma estimativa da variância populacional comum ( 2σ ) que é baseada na variação entre as médias amostrais. 2) A variância dentro das amostras (também chamada de variância devido ao erro) é uma estimativa da variância populacional comum ( 2σ ) baseada nas variâncias amostrais. A estatística de teste para uma ANOVA one-way (um único fator) é dada por, amostras das dentro variância amostras as entre variância =F Treinando os cálculos e uma ilustração interessante sobre o efeito da média para com a estatística do teste F: Fonte: Livro do Triola (versão original) Cálculo do valor p no excel: =DISTF(0,1428 ; 2 ; 9) Cálculo do valor p no R: pf(q=0.1428, df1=2, df2=9, lower.tail = F) Exemplo: Uma bioquímica (Tecnologia de Alimentos) está interessada em estudar a extração de pigmentos naturais, com aplicação como corante em alimentos. Numa primeira etapa tem-se a necessidade de escolher o melhor solvente extrator. A escolha do(s) melhor(es) solventes foi realizada através da medida da absorbância de um pigmento natural do fruto de baguaçú. Fator = solventes; a=5 níveis; n=5 repetições. Unidade experimental: 10 gramas de polpa do fruto de baguaçú. Casualização: a partir de 1 kg de polpa, foram sendo retiradas amostras de 10gr, onde foram aplicados os tratamentos, numa ordem aleatória. As observações obtidas de absorbância são mostradas na tabela 1.1 Rejeita-se a hipótese nula e concluímos que as médias de tratamentos diferem entre si, ou seja, os solventes afetam significativamente as médias de absorbância. Intervalo de confiança para uma diferença de médias, por exemplo, para 43 µµ − : Testes para comparações múltiplas Suponha que através da ANOVA para comparação de g médias (tratamentos) concluímos que a hipótese nula deve ser rejeitada ao nível alfa de significância, ou seja, concluímos que nem todas as populações têm a mesma média. Neste caso devemos usar um dos testes de Comparações Múltiplas para identificar qual ou quais grupos tem médias diferentes das demais. Precisamos descobrir se a diferença está entre o primeiro tratamento e o segundo, ou se está entre o primeiro e o terceiro, ou entre o segundo e o terceiro, e assim por diante. Alguns dos métodos de comparações múltiplas mais conhecidos são Tukey, Duncan, Scheffé, Método da Diferença Mínima Significativa (LSD), Dunnett (apenas quando se compara cada tratamento com um controle), etc. Nota sobre os créditos: O material referente ao teste de Tukey foi retirado das notas de aula da Profa. Thaís Rotsen (UFOP). Observação: Precisamos comparar: AB, AC, AD, BC, BD, CD, e portanto faltam cinco.
Compartilhar