Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Análise de variância – ANOVA Analysis of variance Conceito: é um teste estatístico que visa fundamentalmente verificar se existe uma diferença significante entre as médias e se os fatores exercem influência nesta diferença. Experimento ou Ensaio É um trabalho previamente planejado, que segue determinados princípios básicos e no qual se faz a comparação dos efeitos dos tratamentos. Tratamento É o método, elemento ou material cujo efeito deseja-se medir ou comparar, em um experimento; Unidade experimental ou parcela É a unidade que vai receber o tratamento e fornecer os dados que refletirão ou não os seus efeitos. Tamanho e forma ótimos de parcela são aqueles que resultam em menor variação entre parcelas dentro do mesmo bloco. Delineamento experimental é o plano que será utilizado na experimentação; implica no modo de como os tratamentos serão designados às unidades experimentais. Ex: DIC, DBC, DQL; Princípios básicos da experimentação Princípio da repetição: consiste na reprodução do experimento básico e tem por finalidade propiciar a obtenção de uma estimativa do erro experimental. Trat. A Trat. B Fig. 1 - Experimento básico A A A A A A B B B B B B Fig. 2 - Princípio da repetição Princípio da casualização: tem a finalidade de propiciar a todos os tratamentos a mesma probabilidade de ser designado a qualquer uma das unidades experimentais. Trat. A Trat. B Fig. 3 - Experimento básico B A A B A B A B A B B A Fig. 4 - Princípio da repetição + casualização Princípio do controle local: consiste na homogeneização das condições experimentais visando a redução do erro experimental. Ex: dividindo um ambiente heterogêneo em subambientes homogêneos. Cada par de parcelas que deve ser homogêneo (tratamentos A e B) é denominado de bloco. Pode haver variação entre blocos. Trat. A Trat. B Fig. 5 - Experimento básico B A A B A B A B A B B A Fig. 6 - Princípio da repetição + casualização + controle local ♦ Quando se tem diversos tratamentos a comparar, cada bloco será constituído por um grupo de parcelas que será múltiplo do número de tratamentos. 2 2. Delineamento inteiramente ao acaso ou ensaio randômico (DIC) É aquele que o pesquisador dispõe de unidades similares para conduzir seu experimento. Deve designar os tratamentos às unidades por puro e simples sorteio, ou seja, sem qualquer tipo de restrição. É importante que as unidades experimentais sejam similares, ou seja, que respondam aos tratamentos de forma similar. É recomendável que todos os tratamentos tenham igual número de repetições. Exemplo 1: Um experimento com quatro medicamentos, designados 1, 2, 3 e 4, foi executado em um DIC. Os medicamentos foram testados para avaliar sua eficácia na redução da PAS. Seis pacientes escolhidos aleatoriamente foram avaliados por medicamento, e a pressão arterial foi medida nos mesmos. A partir dos dados apresentados na tabela abaixo, testar a hipótese da não existência de diferenças entre os efeitos dos medicamentos para o nível de significância 5%. Medicamento 1 (mmHg) Medicamento 2 (mmHg) Medicamento 3 (mmHg) Medicamento 4 (mmHg) 100 120 98 130 115 125 99 128 98 110 103 140 110 106 105 125 95 105 100 124 100 103 105 120 Soma 618 669 610 767 Média 103,0 111,5 101,7 127,8 Hipóteses 𝐻0: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 𝐻1: 𝑎𝑠 𝑚é𝑑𝑖𝑎𝑠 𝑛ã𝑜 𝑠ã𝑜 𝑡𝑜𝑑𝑎𝑠 𝑖𝑔𝑢𝑎𝑖𝑠 Especificações 𝑛 = 24 (Unidades experimentais) Graus de liberdade no numerador (entre colunas), 𝑘 − 1 = 4 − 1 = 3 Graus de liberdade no denominador (dentro), 𝑘(𝑟 − 1) = 4(6 − 1) = 20 Graus de liberdade total = 𝑛 − 1 = 23 Nível de significância: 𝛼 = 0,05 Valor crítico de 𝐹0,05;(3 , 20) = 3,10 Regras de decisão Rejeitar 𝐻0 se 𝐹 ≥ 3,10 Não rejeitar 𝐻0 se 𝐹 < 3,10 Cálculos: Fator de correção: 𝐹𝐶 = (∑ 𝑥)2 𝑛 = (100 + 115 + ⋯ + 124 + 120)2 24 = 295.704 Soma de quadrados total 𝑆𝑄𝑡𝑜𝑡 = ∑ 𝑥 2 − 𝐹𝐶 = (1002 + 1152 + ⋯ + 1242 + 1202) − 295.704 = 3.594 Soma de quadrados entre os tratamentos 𝑆𝑄𝑡𝑟𝑎𝑡 = ∑ 𝑇2 𝑟 − 𝐹𝐶 = 6182 + 6692 + 6102 + 7672 6 − 𝐹𝐶 = 298.312,33 − 295.704 = 2.608,33 Soma de quadrados de erros 𝑆𝑄𝑒 = 𝑆𝑄𝑡𝑜𝑡 − 𝑆𝑄𝑡𝑟𝑎𝑡 = 3.594 − 2.608,33 = 985,67 Quadrado médio dos tratamentos 3 𝑄𝑀𝑡 = 𝑆𝑄𝑡 𝑘 − 1 = 𝑆𝑄𝑡 𝑘 − 1 = 2.608,33 3 = 869,44 Quadrado médio do erro experimental 𝑄𝑀𝑒 = 𝑆𝑄𝑒 𝑘(𝑟 − 1) = 𝑆𝑄𝑒 𝑘(𝑟 − 1) = 985,67 20 = 49,28 Razão 𝐹 𝐹 = 𝑄𝑀𝑡 𝑄𝑀𝑒 = 896,44 49,28 = 17,64 Conclusão Rejeita-se 𝐻0, porque 17,64 > 3,10. A diferença entre as médias dos tratamentos é significativa, ou seja, pelo menos dois medicamentos diferem entre si quanto à sua eficácia na redução da PAS. 3. Um experimento para comparar o efeito de cinco drogas na diminuição da pressão arterial. Para fazer esse experimento o médico tomou 30 pacientes e os dividiu ao acaso em seis grupos: o grupo controle recebeu um placebo e os outros grupos receberam, cada um, uma das drogas. Os valores apresentados na tabela abaixo são referentes a diminuição da pressão arterial, dada pela diferença entre a pressão arterial no início e no final do experimento. As diferenças de médias de diminuição da pressão arterial são significantes? Tratamento A B C D E Controle 25 10 18 23 11 8 17 -2 8 29 23 -6 27 12 4 25 5 6 21 4 14 35 17 0 15 16 6 33 9 2 4. Delineamento inteiramente ao acaso com número diferente de repetições (DIC) É aquele que o número de unidades de que o pesquisador dispõe não seja múltiplo do número de tratamentos que pretende comparar. Do ponto de vista da Estatística, é melhor que todos os tratamentos tenham igual número de repetições: a análise é mais exata. No entanto, esse tipo de experimento é indicado na experimentação com seres humanos, quando o uso de grupo de controle tem restrições de natureza ética. Nesse caso, recomenda-se que o grupo controle tenha menor número de repetições do que os grupos tratados. Exemplo 2: Verificando os índices de produção segundo os postos de trabalho, durante certo período, analisar se as diferenças se devem aos postos de trabalho, isto é, se os postos de trabalho diferem quanto à produtividade. Posto A Posto B Posto C 90,8 85,5 65,5 100,0 83,0 77,1 81,1 73,7 Soma T 271,9 242,2 142,6 Média 90,6 80,7 71,3 Hipóteses 𝐻0: 𝜇1 = 𝜇2 = 𝜇3 𝐻1: 𝑎𝑠 𝑚é𝑑𝑖𝑎𝑠 𝑛ã𝑜 𝑠ã𝑜 𝑡𝑜𝑑𝑎𝑠 𝑖𝑔𝑢𝑎𝑖𝑠 Especificações 𝑛 = 8 (Unidades experimentais) Graus de liberdade: De tratamentos: k - 1 = 3 – 1 = 2 4 Do resíduo: n – k = 8 – 3 = 5 Do total: (k - 1) + (n - k) = 7 Nível de significância: 𝛼 = 0,05 Valor crítico de 𝐹0,05;(2 , 5) = 5,79 Regras de decisão Rejeitar 𝐻0 se 𝐹 ≥ 5,79 Não rejeitar 𝐻0 se 𝐹 < 5,79 Cálculos: Fator de correção: 𝐹𝐶 = (∑ 𝑥)2 𝑛 = (271,9 + 242,2 + 142,6)2 8 = 431.254,9 8 = 53906,9 Soma de quadrados total 𝑆𝑄𝑡𝑜𝑡 = ∑ 𝑥 2 − 𝐹𝐶 = (90,82 + 1002 + ⋯ + 65,52 + 77,12) − 53906,9 = 780,6 Soma de quadrados entre os tratamentos 𝑆𝑄𝑡𝑟𝑎𝑡 = ∑ 𝑇2 𝑟 − 𝐹𝐶 = 271,92 3 + 242,22 3 + 142,62 2 − 𝐹𝐶 = 54364,2 − 53906,9 = 457,3 Soma de quadrados de erros 𝑆𝑄𝑒 = 𝑆𝑄 − 𝑆𝑄𝑡 = 780,6 − 457,3 = 323,3 Quadrado médio dos tratamentos 𝑄𝑀𝑡 = 𝑆𝑄𝑡 𝑘 − 1 = 𝑆𝑄𝑡 𝑘 − 1 = 457,3 2 = 228,7 Quadrado médio do erro experimental 𝑄𝑀𝑒 = 𝑆𝑄𝑒 𝑘(𝑛 − 1) = 𝑆𝑄𝑒 𝑘(𝑛 − 1) = 323,3 5 = 64,6 Razão 𝐹 𝐹 = 𝑄𝑀𝑡 𝑄𝑀𝑒 = 228,7 64,6 = 3,54 Conclusão Aceita-se 𝐻0, porque 3,54 < 5,79. A diferença entre as médias dos tratamentos NÃO é significativa,ou seja, as médias dos postos de trabalho não diferem quanto à produtividade. 5 5. Delineamento em blocos casualizados (DBC) É aquele em que o pesquisador dispõe de pequenos grupos de unidades similares, mas nenhum deles com número suficiente de unidades para fazer um experimento inteiramente ao acaso. Exemplo 3: Um agrônomo deseja verificar se quatro variedades de milho têm, em média, a mesma produtividade. A área do teste possui nítida variação de fertilidade. Portanto, antes de sortear as variedades (tratamentos) às parcelas (unidades experimentais), precisam ser demarcadas, ou seja, formar blocos com a mesma fertilidade. Realizado isso, o agrônomo deve fixar quatro parcelas em cada bloco e sortear uma variedade para cada parcela. Diante disso, é razoável concluir, observando as médias, que os tratamentos A, B, C e D conduzem a médias estatisticamente diferentes? Bloco Tratamentos B B2 B2/k A B C D I 32 24 35 21 112 12544 3136 II 24 35 43 26 128 16384 4096 III 33 42 39 30 144 20736 5184 IV 38 36 43 39 156 24336 6084 V 33 38 55 34 160 25600 6400 Médias 32 35 43 30 24900 T 160 175 215 150 T2 25600 30625 46225 22500 T2/r 5120 6125 9245 4500 24990 Hipóteses 𝐻0: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 𝐻1: 𝑎𝑠 𝑚é𝑑𝑖𝑎𝑠 𝑛ã𝑜 𝑠ã𝑜 𝑡𝑜𝑑𝑎𝑠 𝑖𝑔𝑢𝑎𝑖𝑠 Especificações 𝑛 = 20 (Unidades experimentais) Graus de liberdade: De tratamentos: k - 1 = 4 – 1 = 3 Do Bloco: r - 1 = 5 - 1 = 4 Do resíduo: (kr - 1) –(k-1)-(r-1) = 19 – 3 - 4 = 12 Do total: (kr - 1) = 20-1=19 Nível de significância: 𝛼 = 0,05 Valor crítico de 𝐹0,05;(3,5) = 5,79 Regras de decisão Rejeitar 𝐻0 se 𝐹 ≥ 5,79 Não rejeitar 𝐻0 se 𝐹 < 5,79 Cálculos: Fator de correção: 𝐹𝐶 = (∑ 𝑥)2 𝑛 = (700)2 20 = 24500 Soma de quadrados total 𝑆𝑄 = ∑ 𝑥2 − 𝐹𝐶 = (322 + 242 + ⋯ + 342) − 24500 = 1190 Soma de quadrados entre os tratamentos 𝑆𝑄𝑡 = ∑ 𝑇2 𝑟 − 𝐹𝐶 = 1602 5 + 1752 5 + 2152 5 + 1502 5 − 𝐹𝐶 = 490 Soma de quadrados de blocos 𝑆𝑄𝐵 = ∑ 𝐵2 𝑘 − 𝐹𝐶 = 1122 4 + 1282 4 + 1442 4 + 1562 4 + 1602 4 − 𝐹𝐶 = 400 Soma de quadrados de erros 6 𝑆𝑄𝑒 = 𝑆𝑄 − 𝑆𝑄𝑡 − 𝑆𝑄𝐵 = 1190 − 490 − 400 = 300 Quadrado médio dos tratamentos 𝑄𝑀𝑡 = 𝑆𝑄𝑡 𝑘 − 1 = 𝑆𝑄𝑡 𝑘 − 1 = 490 3 = 163,3 Quadrado médio de blocos 𝑄𝑀𝐵 = 𝑆𝑄𝐵 𝑟 − 1 = 400 4 = 100 Quadrado médio dos experimental 𝑄𝑀𝑒 = 𝑆𝑄𝑟 (𝑘 − 1)(𝑟 − 1) = 300 3 × 4 = 25 Razão 𝐹 𝐹 = 𝑄𝑀𝑡 𝑄𝑀𝑒 = 163,3 25 = 6,53 Conclusão Rejeita-se 𝐻0, porque 6,53 > 3,49. Podemos, portanto, concluir que, em média, os tratamentos levam a valores estatisticamente diferentes. Definições e termos utilizados na ANOVA - DIC Fórmula Definição 𝐹𝐶 = (∑ 𝑥)2 𝑛 Fator de correção – constante empregada em várias fórmulas. 𝑆𝑄 = ∑ 𝑥2 − 𝐹𝐶 Soma de quadrados total – representa a soma dos quadrados dos desvios em relação à média. 𝑆𝑄𝑡 = ∑ 𝑇2 𝑟 − 𝐹𝐶 Soma de quadrados de tratamentos – representa a soma dos quadrados dos desvios em relação à média amostral com relação à média total ou a variação entre os tratamentos. 𝑆𝑄𝑒 = 𝑆𝑄 − 𝑆𝑄𝑡 Soma de quadrados de erro experimental (dentro dos grupos) – representa a variação dentro dos tratamentos, isto é, a variação entre as unidades experimentais com o mesmo tratamento. 𝑄𝑀𝑡 = 𝑆𝑄𝑡 𝑘 − 1 Quadrado médio entre tratamentos também denominado variância entre tratamentos – representa a variação entre os tratamentos. 𝑄𝑀𝑒 = 𝑆𝑄𝑒 𝑘(𝑛 − 1) Quadrado médio do erro experimental também denominado variância dentro dos grupos – representa a variabilidade dentro do mesmo tratamento. 𝐺𝑙𝑡 = 𝑘 − 1 Graus de liberdade da soma dos quadrados dos tratamentos. 𝐺𝑙𝑒 = 𝑘(𝑛 − 1) Graus de liberdade da soma dos quadrados do erro experimental. 𝐹 = 𝑄𝑀𝑡 𝑄𝑀𝑒 Razão entre a variância entre os tratamentos e variância média dentro dos tratamentos. Definições e termos utilizados na ANOVA - DBC Fórmula Definição 𝐹𝐶 = (∑ 𝑥)2 𝑛 Fator de correção – constante empregada em várias fórmulas. 𝑆𝑄 = ∑ 𝑥2 − 𝐹𝐶 Soma de quadrados total – representa a soma dos quadrados dos desvios em relação à média. 𝑆𝑄𝑡 = ∑ 𝑇2 𝑟 − 𝐹𝐶 Soma de quadrados de tratamentos – representa a soma dos quadrados dos desvios em relação à média amostral com relação à média total ou a variação entre os tratamentos. 𝑆𝑄𝐵 = ∑ 𝐵2 𝑘 − 𝐹𝐶 Soma de quadrados dos blocos – representa a variabilidade devida a heterogeneidade do material. 𝑆𝑄𝑒 = 𝑆𝑄 − 𝑆𝑄𝑡 − 𝑆𝑄𝐵 Soma de quadrados de erro experimental (dentro dos grupos) – representa a variação dentro dos tratamentos, isto é, a variação entre as unidades experimentais com o mesmo tratamento. 𝑄𝑀𝑡 = 𝑆𝑄𝑡 𝑘 − 1 Quadrado médio entre tratamentos também denominado variância entre tratamentos – representa a variação entre os tratamentos. 7 𝑄𝑀𝑒 = 𝑆𝑄𝑒 𝑘(𝑛 − 1) Quadrado médio do erro experimental também denominado variância dentro dos grupos – representa a variabilidade dentro do mesmo tratamento. 𝐺𝑙𝑇 = 𝑘 − 1 Graus de liberdade da soma dos quadrados dos tratamentos. 𝐺𝑙𝐵 = 𝑟 − 1 𝐺𝑙𝑒 = (𝑘 − 1)(𝑟 − 1) Graus de liberdade da soma dos quadrados do erro experimental. 𝐹 = 𝑄𝑀𝑡 𝑄𝑀𝑒 Razão entre a variância entre os tratamentos e variância média dentro dos tratamentos. Exercícios 1) O resultado das vendas efetuadas por 3 vendedores de uma indústria durante certo período é dado a seguir. Deseja-se saber, ao nível de 5%, se há diferença de eficiência entre os vendedores. A B C 29 27 30 27 27 30 31 30 31 29 28 27 32 29 30 2) Um ensaio de tração mede a quantidade de uma solda a ponto de um material revestido de alumínio. A fim de determinar se há “efeito de máquina” quando se solda um material de bitola especificada, obtém-se as seguintes amostras de 3 máquinas. Realize a análise da variância conveniente. Máquina A: 3,2; 4,1; 3,5; 3,0; 3,1 Máquina B: 4,9; 4,5; 4,5; 4,0; 4,2 Máquina C: 3,0; 2,9; 3,7; 3,5; 4,2 3) Os dados da tabela seguinte referem-se às quantidades produzidas de um produto por determinado método em diferentes postos de trabalho. Os quatro níveis do fator A representam postos de trabalho. Os dois níveis do fator B representam os servidores de trabalho. Os resultados fornecidos correspondem à produção de um dia para cada posto e supervisor. Pede-se: a. É a quantidade afetada significativamente por diferenças nos postos de trabalho para (𝛼 = 0,01)? b. É indiferente que se use o supervisor 1 ou supervisor 2, com (𝛼 = 0,05)? Nível do fator B Nível fator Total A B C D Supervisor 1 31 27 33 30 121 Supervisor 2 47 35 39 46 157 Total 78 62 72 66 78 4) Uma máquina para ensaio de desgaste consta de 4 escovas, sob as quais se fixam amostras do material, a fim de medir suas resistências à abrasão. A perda de peso do material, depois de um dado número de ciclos, é usada como medida de resistência ao desgaste. Os dados da tabela a seguir indicam a perda de peso de 4 materiais ensaiados. Realize a análise da variância conveniente. Material Posição da escova 1 2 3 4 A 1,93 2,38 2,20 2,25 B 2,55 2,72 2,75 2,70 C 2,40 2,68 2,31 2,28 D 2,33 2,40 2,28 2,25 8 6. Delineamento em quadrado latino (DQL) É aquele que exige a construção de blocos em duas direções: em linhas e em colunas (dupla blocagem). Os fatores propostos podem ser de origem qualitativa ou quantitativa, mas a variável dependente necessariamente deverá ser contínua. Exemplo 4 – Um engenheiro de produção quer saber se o númerode itens produzidos por dia varia com o operador da máquina. O engenheiro já sabe que a quantidade produzida depende do dia da semana e da máquina. Planeja, então, um experimento em quadrado latino para comparar a produção de cinco operadores (A, B, C, D, E) em cinco máquinas (1, 2, 3, 4, 5) em cinco dias da semana (2ª, 3ª, 4ª, 5ª, 6ª). 2ª 3ª 4ª 5ª 6ª Máquina 1 D A B C E Máquina 2 C E A B B Máquina 3 E B C D A Máquina 4 B D E A C Máquina 5 A C D E B Uma análise de variância só pode ser feita se forem satisfeitas algumas suposições básicas: 9 Validação das pressuposições básicas A ANOVA exige que sejam feitas a validação das pressuposições sobre os erros, sem as quais os resultados da análise não são válidos. Os pressupostos básicos da análise da variância são: Ausência de dados (erros) discrepantes; Os erros são variáveis aleatórias independentes (não auto correlacionados); A variação é constante (homocedasticidade); A distribuição dos erros é normal. 1. Análise dos resíduos Ninguém conhece as médias populacionais dos tratamentos (𝜇1, 𝜇2, … , 𝜇𝑛) nem os erros 𝑒𝑖. No entanto, o pesquisador faz um estudo estatístico para obter as estimativas dessas médias. Ninguém conhece os erros 𝑒𝑖, porque eles são definidos em função das médias verdadeiras (𝜇1, 𝜇2, … , 𝜇𝑛). Mas temos as estimativas dessas médias, pelas médias amostrais. Podemos estimar os erros fazendo a diferença entre cada dado e a média do tratamento a que ele pertence: 𝑒𝑖𝑗 = 𝑦𝑖𝑗 − �̅� As estimativas dos erros recebem o nome de resíduos. É o estudo dessas estimativas, ou seja, é a análise dos resíduos que ajuda verificar se a análise da variância feita é aceitável. Exemplo: Os dados abaixo se referem às vendas de um artigo (em mil itens) em quatro filiais de uma loja de departamento (1, 2, 3 e 4). Tratamento 1 Tratamento2 Tratamento 3 Tratamento 4 25 31 22 33 26 25 26 29 20 28 28 31 23 27 25 34 21 24 29 28 Média 23 27 26 31 Tratamento 1 Tratamento2 Tratamento 3 Tratamento 4 25-23=2 31-27=4 22-26=-4 33-31=2 26-23=3 25-27=-2 26-26=0 29-31=-2 20-23=-3 28-27=1 28-26=2 31-31=0 23-23=0 27-27=0 25-26=-1 34-31=3 21-23=-2 24-27=-3 29-26=3 28-31=-3 10 No gráfico abaixo, os tratamentos estão no eixo das abscissas e os resíduos (valores calculados na tabela acima) estão no eixo das ordenadas. O gráfico dos resíduos é básico: quando o modelo é adequado, os resíduos exibem um padrão aleatório. Não apresentam tendência. Dados discrepantes (outliers) Dado discrepantes (outliers) é um valor muito maior ou muito menor do que o valor esperado. Podem-se verificar outliers no próprio gráfico de resíduos. O valor discrepante fica mais visível se for desenhado um gráfico com resíduos padronizados em um lugar dos resíduos propriamente ditos. Para obter os resíduos padronizados (𝑒𝑝𝑖), basta dividir os resíduos pela raiz quadrada do quadrado médio dos resíduos (QME) da análise da variância. A expressão dos resíduos padronizados fica então: 𝑒𝑝𝑖 = 𝑒𝑖 √𝑄𝑀𝐸⁄ Realizada a análise da variância do exemplo referente às vendas de um artigo (em mil itens) em quatro filiais de uma loja de departamento (1,2,3 e 4), o valor do QMR é 7: Anova Fonte da variação SQ gl MQ F valor-P F crítico Entre grupos 163,75 3 54,58333 7,797619 0,001976 3,238872 Dentro dos grupos 112 16 7 Total 275,75 19 Então, o resíduo padronizado para a primeira observação do tratamento 1 será: 𝑒𝑝𝑖 = 𝟐/ √𝟕 = 𝟎, 𝟕𝟓𝟔 Os demais resíduos estão apresentados na tabela seguinte: O gráfico dos resíduos padronizados é o que segue: 1 2 3 4 0,8 1,5 1,5 0,8 1,1 -0,8 0,0 -0,8 -1,1 0,4 0,8 0,0 0,0 0,0 -0,4 1,1 0,8 1,1 1,1 -1,1 Valores fora do intervalo de -3 e +3 devem ser considerados suspeitos. Como todos os valores estão dentro do intervalo de -3 e +3, logo não existe outliers neste estudo. 11 INDEPENDÊNCIA OU AUTOCORRELAÇÃO RESIDUAL Para fazer uma análise da variância, é preciso pressupor que os erros são variáveis aleatórias independentes. Mas o que significa pressupor que os erros são variáveis aleatórios independentes? Exemplo Considere um experimento com voluntários. Se for obtido um dado de cada voluntário, é razoável admitir que passe valores - e, consequentemente, os erros - são independentes. No entanto, se o pesquisador obtiver vários dados do mesmo voluntário, é razoável considerar que tais dados - e os erros - sejam dependentes. Isto porque qualquer medida obtida em uma pessoa em determinado momento deve estar correlacionada com a medida obtida em momento anterior. Unidades experimentais observadas em sequência - no tempo ou no espaço - geralmente têm correlação. Medidas feitas na mesma unidade experimental estão, muito frequentemente correlacionadas, A correlação entre observações seriadas ou tomadas em sequência é chamada de correlação serial. Se isso acontecer não é razoável pressupor Independência. Se os erros forem dependentes - porque foram tomadas observações na mesma unidade ou em unidades agrupadas ou em séries temporais - o resultado da análise da variância fica totalmente comprometido. Aliás a não independência é o mais grave problema para análise porque o nível de significância se torna muito maior do que o informado. Mais ainda, a dependência é difícil de ser corrigida. Então diante de qualquer suspeita de não Independência, é essencial proceder à análise dos resíduos. Desenha-se um gráfico dos resíduos padronizados contra a ordem em que as observações foram coletadas (no tempo e no espaço). Se a pressuposição de independência estiver satisfeita, os resíduos devem ficar dispersos em torno de zero, sem um padrão definido (aleatoriamente), como acontece no gráfico A apresentado abaixo. A análise de resíduos é extremamente útil, mas é gráfica. Isso significa que não se pode associar um nível de probabilidade à conclusão de que os erros não são independentes. Mas a pressuposição de independência pode ser transformada em hipótese e essa hipótese pode ser -10 -5 0 5 10 0 5 10 15 20 25 12 colocada em teste. Quando existe forte suspeita de não independência pode se aplicar o Teste de Durbin-Watson, que veremos a seguir: Teste de Durbin-Watson Usando um gráfico residual, as violações dos pressupostos do modelo não são sempre fáceis de detectar e podem apesar de os gráficos parecerem bem-comportados. A análise de resíduos, usando gráficos residuais, é um método subjetivo. Nesse sentido, a verificação da independência é usualmente feita através do Teste de Durbin-Watson à correlação entre resíduos sucessivos. Se houver independência, a magnitude de um resíduo não influencia a magnitude do resíduo seguinte. Neste caso, a correlação entre resíduos sucessivos é nula (autocorrelação = 0). As hipóteses do teste, para aferir se a relação entre dois resíduos consecutivos é estatisticamente significativa, são então: 𝑯𝟎: Auto correlação igual a zero, portanto existe independência 𝑯𝟏: Auto correlação diferente de zero, portanto existe dependência Esse teste serve para detectar se há presença significativa de auto correlação entre os resíduos em um modelo de análise da variância. O coeficiente de Durbin-Watson mede a correlação entre cada resíduo e o resíduo da observação imediatamente anterior. A equação é a seguinte: 𝐷 = ∑ (𝑒𝑖 − 𝑒𝑖−1) 2𝑛 𝑖=1 ∑ 𝑒𝑖2 𝑛 𝑖=1 Onde 𝑒𝑖 é o resíduo para o tempo i. Os valores da estatística 𝐷 são interpretados da seguinte forma: 𝐷 ≈ 0 ⟶ 𝑟𝑒𝑠í𝑑𝑢𝑜𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎𝑚𝑒𝑛𝑡𝑒 𝑎𝑢𝑡𝑜 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑑𝑜 𝐷 ≈ 2 ⟶ 𝑟𝑒𝑠í𝑑𝑢𝑜 𝑛ã𝑜 𝑠ã𝑜 𝑎𝑢𝑡𝑜 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑑𝑜 𝐷 ≈ 4 ⟶ 𝑟𝑒𝑠í𝑑𝑢𝑜 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎𝑚𝑒𝑛𝑡𝑒 𝑎𝑢𝑡𝑜 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑑𝑜 Com a tabela de Durbin-Watson para o nível de significância 𝛼, tamanho da amostra n e 𝑁𝑉𝐼 (número de variáveis independentes do modelo), obtém-se 𝑑𝑈, que é o limite superior de variação, e 𝑑𝐿, o limite inferior. Os valores 𝑑𝑈 e 𝑑𝐿 encontram-se tabelados para os níveis de significância de 1% e 5% e tamanhos de amostras fixas estão anexas ao livro. Regra de decisão para o teste de Durbin-Watson Valor de D Interpretação 0 ≤ 𝐷 < 𝑑𝐿 Evidência de auto correlação positiva 𝑑𝐿 ≤ 𝐷 < 𝑑𝑈 Zona de indecisão 13 𝑑𝑈 ≤ 𝐷 < 4 − 𝑑𝑈 Ausência de auto correlação 4 − 𝑑𝑈 ≤ 𝐷 < 4 − 𝑑𝐿 Zona de indecisão 4 − 𝑑𝐿 ≤ 𝐷 ≤ 4 Evidência de auto correlação negativa Exemplo Sequência de Tempo 𝑒𝑖 𝑒𝑖 2 𝑒𝑖−1 𝑒𝑖 − 𝑒𝑖−1 (𝑒𝑖 − 𝑒𝑖−1) 2 1 2 4 0 2 4 2 3 9 2 1 1 3 -3 9 3 -6 36 4 0 0 -3 3 9 5 -2 4 0 -2 4 6 4 16 -2 6 36 7 -2 4 4 -6 36 8 1 1 -2 3 9 9 0 0 1 -1 1 10 -3 9 0 -3 9 11 -4 16 -3 -1 1 12 0 0 -4 4 16 13 2 4 0 2 4 14 -1 1 2 -3 9 15 3 9 -1 4 16 16 2 4 3 -1 1 17 -2 4 2 -4 16 18 0 0 -2 2 4 19 3 9 0 3 9 20 -3 9 3 -6 36 112 257 𝐷 = ∑ (𝑒𝑖 − 𝑒𝑖−1) 2𝑛 𝑖=1 ∑ 𝑒𝑖2 𝑛 𝑖=1 = 257 112 ≈ 2,29 Interpretação: Consultando a tabela de Durbin-Watson para 5%, n=20 e 𝑁𝑉𝐼 = 1 (Em a=ANOVA de um fator só temos uma variável independente que são os tratamentos), temos que 𝑑𝐿 = 1,20 e 𝑑𝑈 = 1,41. Assim, 𝑑𝑈 < 𝐷 < 4 − 𝑑𝑈 1,41 ≤ 2,29 < 2,59 Decisão: Ausência de auto correlação. 14 Variância constante (homocedasticidade) Se for razoável admitir que os erros são independentes, o passo seguinte consiste em verificar se as variâncias são constantes, ou como preferem dizer os estatísticos, se existe homocedasticidade. No caso do modelo de análise da variância de um único fator, convém verificar se as variâncias dos tratamentos são iguais. A violação do pressuposto da homocedasticidade compromete a credibilidade do Teste F. Uma regra prática defendida por quem estudou o assunto sugere pressupor que os resultados de uma análise da variância sejam considerados válidos desde que a maior variância não exceda em três vezes a menor. 7,5 6,5 = 1,15 < 3 Interpretação: Pelo exposto, é razoável pressupor variâncias iguais. Teste de Levene: A lógica do teste de Levene é simples: quanto maiores são as variâncias, maiores serão os resíduos. Podemos, então, pensar num modelo de regressão em que o resíduo é a variável dependente e a variância, a independente, e testar a existência da associação através do Teste F (F= variação explicada pelas variâncias/ variação explicada por fatores aleatórios ou alheios ao modelo). Se as variâncias são homogêneas, o resultado do Teste F para comparar as médias dos valores absolutos dos resíduos será não significante, isto é, os resíduos são mais fortemente 15 explicados por fatores aleatórios do que pelas variâncias tidas como variáveis explicativas. No gráfico, isso resultará em erros dispersos de forma aleatória com compacidade constante. Interpretação: A credibilidade da hipótese nula de que as médias são iguais é altíssima, ou melhor, absoluta. As diferenças de médias são não significantes, são fruto de erro amostral. Portanto, as variâncias podem ser consideradas homogêneas. Normalidade Em linhas gerais, o pesquisador não precisa se preocupar com a não normalidade, a não ser que os dados não transgridam fortemente a forma gaussiana. A distribuição de erros foge completamente da normalidade quando: É assimétrica forte; É leptocúrtica ou cume. 16 Exercícios. 1) Uma companhia deseja testar 4 diferentes tipos de pneus, A, B, C e D. As vidas médias dos pneus (em milhares de milhas) constam na tabela abaixo, onde cada tipo foi testado aleatoriamente em 6 automóveis idênticos. Determine: A 33 38 36 40 31 35 B 32 40 42 38 30 34 C 31 37 35 33 34 30 D 28 34 32 30 33 31 a) As hipóteses: nula e alternativa. b) Vida média dos diferentes pneus. c) Variação total. d) Variação entre os grupos. e) Variação dentro dos grupos. f) O valor de F crítico e de F observado. g) Emitir uma conclusão estatística e uma conclusão prática com base no teste F ao nível de significância de 5%. 2) Em um experimento onde pretendia-se testar 4 tipos de rações para camarão da Malásia obteve resultados em kg de camarão por tanque de engorda. a. Realizar: b. A análise de variância (ANOVA); c. Aplicar o teste F (𝛼 = 0,05 e 𝛼 = 0,01); d. Emitir uma conclusão estatística e uma conclusão prática com base no teste F; e. Calcular o CV (Coeficiente de variação) e emitir conclusão.
Compartilhar