Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal de Ouro PretoUniversidade Federal de Ouro Preto Planejamento e Análise de Experimentos com um único fator (one-way): A Análise de Variância – ANOVA Modificações realizadas em cima do material de apoio do livro do Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia. São Paulo: Atlas, 2004 Prof. Ricardo Tavares Amostras independentesAmostras independentes • Exemplo 1 – Considere o problema de comparar dois materiais (A e B), para sola de tênis, em termos do grau de desgaste após um certo período de uso. Seguem dois projetos de experimentos alternativos: • Projeto I – Um grupo de indivíduos usa tênis com solas feitas com o material A; e outro grupo usa tênis com solas feitas com o material B. Amostras independentesAmostras independentes Material BMaterial A divisão aleatória Mensuração do grau de desgaste Mensuração do grau de desgaste Amostras pareadas (se Amostras pareadas (se gg > 2, “em blocos”) > 2, “em blocos”) • Exemplo 1: • Projeto II – Fabricam-se, para a realização do experimento, pares de tênis com os dois tipos de sola, isto é, um dos pés com o material A e o outro pé com o material B. Em cada par, o material usado em cada pé (direito ou esquerdo) é decidido por sorteio Amostras pareadas (se Amostras pareadas (se gg > 2, “em blocos”) > 2, “em blocos”) Mensuração do grau de desgaste BA BA AB BAAB alocação aleatória de A e B em cada par Amostras pareadasAmostras pareadas • Importância de considerar os pares na análise: criança 1 2 3 4 5 ... desgaste material A material B desgaste Amostra 3Amostra 2Amostra 1 12 10 8 6 4 2 D ad os Boxplot Considere a comparação de três amostras Ponto a ser discutido:Ponto a ser discutido: • A diferença entre as três médias é apenas conseqüência da variação amostral? • A diferença entre as médias das amostras é conseqüência da variação amostral ou é uma evidência da diferença entre as médias das populações? Comparação entre vários tratamentos.Comparação entre vários tratamentos. Amostras independentesAmostras independentes • Análise de variância (ANOVA), que supõe: – as observações devem ser independentes; – as variâncias populacionais devem ser iguais nos g grupos; e – a distribuição das observações em cada grupo deve ser normal. Exemplo: Comparação de três tipos de rede.Exemplo: Comparação de três tipos de rede. • Considere o problema de comparar 3 tipos de rede de computadores, C1, C2 e C3, em termos do tempo médio de transmissão de pacotes de dados entre duas máquinas. • Experimento (projeto completamente aleatorizado com um fator): 8 replicações com cada tipo de rede, aleatorizando a ordem dos 24 ensaios e mantendo fixos os demais fatores controláveis. Exemplo: Exemplo: Projeto do experimento. Projeto do experimento. Seqüência número Uso da dos testes do ensaio rede 1 16 C2 2 14 C2 3 24 C3 4 6 C1 ... ... ... 24 11 C3 ensaios de 1 a 8: C1 ensaios de 9 a 16: C2 ensaios de 17 a 24: C3 Exemplo. Dados do experimento:Exemplo. Dados do experimento: Seqüência número Tempo de dos testes do ensaio Rede resposta (y) 1 16 C2 7,8 2 14 C2 8,2 3 24 C3 6,3 4 6 C1 7,2 ... ... ... ... 24 11 C2 7,8 Exemplo: Perguntas a serem respondidas pela Exemplo: Perguntas a serem respondidas pela análise estatística.análise estatística. • Existe diferença real (significativa) entre os 3 tipos de rede? • Qual é a estimativa do tempo de resposta para cada tipo de rede? Exemplo: Dados do experimentoExemplo: Dados do experimento Tipo de rede Replicação C1 C2 C3 1 7,2 7,8 6,3 2 9,3 8,2 6,0 3 8,7 7,1 5,3 4 8,9 8,6 5,1 5 7,6 8,7 6,2 6 7,2 8,2 5,2 7 8,8 7,1 7,2 8 8,0 7,8 6,8 Soma 65,7 63,5 48,1 Média 8,21 7,94 6,01 Modelo da ANOVAModelo da ANOVA gg = 3 grupos = 3 grupos tratamento (1) (2) (3) y11 y21 y31 y12 y22 y32 ... ... ... y1n y2n y3n Média global: Média: .1y .2y .3y ..y ijiij ey ++= τµ i = 1, 2, 3j = 1, 2, ..., n observação efeito do tratamento i média global erro aleatório = média do fator iii τµµ += HipótesesHipóteses H0: τ1 = τ2 =...= τg = 0 ou µ1 = µ2 =...= µg H1: τi ≠ 0 ou µi ≠ µj para algum i para algum par (i, j) Obs.: µi= µ +τi ijiij ey ++= τµ ijij ey += µ As observações Sob H1: Sob H0: Hipóteses e modelo subjacenteHipóteses e modelo subjacente Sob H0: τ1 = τ2 =...= τg = 0 ijiij ey ++= τµ ijij ey += µ Hipóteses e modelo subjacenteHipóteses e modelo subjacente Sob H1: τi ≠ 0 para algum i ijiij ey ++= τµ Análise de variância (ANOVA) com um fatorAnálise de variância (ANOVA) com um fator Tratamento Replicação 1 2 ... g 1 y11 y21 ... yg1 2 y12 y22 ... yg2 ... ... ... ... ... n y1n y2n ... ygn Soma y1. y2. ... yg. Média ... ∑= i iyy ... .1y .2y .gy ∑= i iyg y . 1.. ( )∑ ∑ = = −= g i n j ijTot yySQ 1 1 2 .. gl = N - 1 onde: N = ng Soma de quadrados total: Graus de liberdade: Análise de variância (ANOVA) com um fatorAnálise de variância (ANOVA) com um fator Tratamento Replicação 1 2 ... g 1 y11 y21 ... yg1 2 y12 y22 ... yg2 ... ... ... ... ... n y1n y2n ... ygn Soma y1. y2. ... yg. Média ... ∑= i iyy ... .1y .2y .gy ∑= i iyg y . 1.. gl = g - 1( ) ( )∑∑ ∑ == = −=−= g i i g i n j iTrat yynyySQ 1 2 ... 1 1 2 ... Soma de quadrados dos tratamentos: Graus de liberdade: Análise de variância (ANOVA) com um fatorAnálise de variância (ANOVA) com um fator Tratamento Replicação 1 2 ... g 1 y11 y21 ... yg1 2 y12 y22 ... yg2 ... ... ... ... ... n y1n y2n ... ygn Soma y1. y2. ... yg. Média ... ∑= i iyy ... .1y .2y .gy ∑= i iyg y . 1.. gl = N - g( )∑ ∑ = = −= g i n j iijErro yySQ 1 1 2 . Soma de quadrados do erro: Graus de liberdade: Análise de variância (ANOVA) com um fatorAnálise de variância (ANOVA) com um fator Erro Trat QM QMf =Estatística do teste (possíveis valores da razão f): Obs.: Na aula discutimos sobre os índices quase apagados! Teste FTeste F • Se H0: τ1 = τ2 =...= τg = 0 for verdadeira e considerando as suposições anteriormente enunciadas, a estatística f tem distribuição F com (g - 1) graus de liberdade no numerador e (N - g) graus de liberdade no denominador. Densidade de probabilidade F possíveis valores da estatística F, sob H 0 de ns id ad e de p ro ba bi lid ad e 0,00 0,25 0,50 0,75 0 1 2 3 4 f valor p Regra de decisão. Abordagem valor p • p ≤ α • p > α rejeita H0 (prova-se estatisticamente H1) aceita H0 (os dados não mostram evidência para afirmar H1) α = nível de significância (probab. tolerável de se rejeitar Ho quando esta for verdadeira) Usual: α = 0,05 = 5% Verificação da Adequação do Modelo • Um resíduo é definido como: • Resíduo: A diferença entre uma observação e a média do tratamento correspondente. iijij yye −= As suposições associadas ao modelo, é feita através da analise dos resíduos: 1. Os erros tem média zero e a mesma variância sigma2; 2. Os erros são independentes, ou seja, um valor de um erro não depende de qualquer outro erro; 3. Os erros têm distribuição normal. Logo, os erros são iid N(0, sigma2). Verificação da Adequação do Modelo • Suposição de Independência Gráfico de Resíduos vs Ordem • Suposição de Igualdade de Variância Gráfico de Resíduos vs Médias dos Tratamentos • Suposição de Normalidade Gráfico de Probabilidade Normal Análise dos resíduosAnálisedos resíduos Resíduos x fator C1 C2 C3 Rede -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 R es íd uo s Gráfico de probabilidade normal -1 0 1 Resíduos -3 -2 -1 0 1 2 3 V al or e sp er ad o pe la n or m al 0,01 0,05 0,15 0,35 0,55 0,75 0,95 0,99 Avaliação das suposições da ANOVA através de gráficos dos resíduos: Suposições do Modelo Residual P er ce nt 20100-10-20 99 90 50 10 1 Fitted Value R es id ua l 9590858075 10 0 -10 Residual Fr eq ue nc y 12840-4-8-12 4 3 2 1 0 Observation Order R es id ua l 24222018161412108642 10 0 -10 Normal Probability Plot of the Residuals Residuals Versus the Fitted Values Histogram of the Residuals Residuals Versus the Order of the Data Residual Plots for resistencia Estimação das médias Estimação das médias n QMtyIC erroii γγµ ±= .),( Intervalo de confiança para o valor esperado da resposta sob o i-ésimo tratamento (nível de conf. γ): C1 C2 C3 Rede 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 Te m po d e tra ns m is sã o Teste F para amostras em blocosTeste F para amostras em blocos ∑∑ == j j i i yyy .... Tratamento Bloco 1 2 ... g Soma 1 y11 y21 ... yg1 y.1 2 y12 y22 ... yg2 y.2 ... ... ... ... ... h y1h y2h ... ygh y.h Soma y1. y2. ... yg. Notação para os dados: Teste F para amostras em blocos:Teste F para amostras em blocos: quadro da ANOVAquadro da ANOVA Exemplo 9.5Exemplo 9.5 • Seja o problema de comparar 3 algoritmos de busca em um banco de dados. Realiza-se um experimento com 6 buscas experimentais, sendo que em cada uma é sorteado um número aleatório que indica o registro do banco de dados a ser localizado. Em cada um dos 6 processos de busca, são usados separadamente os três algoritmos em estudo, mas sob as mesmas condições, em termos dos fatores controláveis. São anotados os tempos de resposta ao usuário. • Hipóteses: – H0: em média, os três algoritmos são igualmente rápidos; e – H1: em média, os três algoritmos não são igualmente rápidos Exemplo 9.5Exemplo 9.5 Ensaio Algoritmo de busca (bloco) A1 A2 A3 1 8,3 8,1 9,2 2 9,4 8,9 9,8 3 9,1 9,3 9,9 4 9,9 9,6 10,3 5 8,2 8,1 8,9 6 10,9 11,2 13,1 Soma 55,8 55,2 61,2 Média 9,3 9,2 10,2 Exemplo 9.5Exemplo 9.5 Fonte da variação SQ gl QM f Algoritmos 3,64 2 1,82 14,29 Blocos 21,95 5 4,39 Erro 1,27 10 0,13 Total 26,86 17 Qual é a conclusão? ANOVA em projetos fatoriais com 2 fatoresANOVA em projetos fatoriais com 2 fatores ∑∑ == j j i i yyy ....... Fator A Fator B 1 2 ... g Soma 1 y111, ..., y11n y211, ..., y21n ... yg11, ..., yg1n y.1. 2 y121, ..., y12n y221, ..., y22n ... yg21, ..., yg2n y.2. ... ... ... ... ... h y1h1, ..., y1hn y2h1, ..., y2hn ... ygh1, ..., yghn y.h. Soma y1.. y2.. ... yg.. Notação para os dados: ANOVA em projetos fatoriais com 2 fatoresANOVA em projetos fatoriais com 2 fatores Exemplo 9.6Exemplo 9.6 • Considere o problema de comparar 3 topologias de rede de computadores (C1, C2 e C3) e 2 protocolos (L1 e L2), em termos do tempo de resposta ao usuário. Realizou-se um experimento com 4 replicações em cada combinação de topologia e protocolo. Deseja-se verificar se há diferenças entre as topologias, entre os protocolos e eventual interação entre topologia e protocolo. Então, quer-se testar as seguintes hipóteses nulas: – H0(A): os tempos esperados de resposta são iguais para as três topologias; – H0(B): os tempos esperados de resposta são iguais para os dois protocolos; – H0(AB): a mudança de protocolo não altera as diferenças médias do tempo de resposta nas três topologias (ausência de interação). Exemplo 9.6Exemplo 9.6 Dados: Exemplo 9.6Exemplo 9.6 ANOVA: Quais as conclusões? Exemplo 9.6Exemplo 9.6 C1 C2 C3 Topologia 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 Te m po L1 L2 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 Valores preditos -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 R es íd uo s (a) Perfil das médias (b) Análise dos resíduos Quais as conclusões? Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14 Slide 15 Slide 16 Slide 17 Slide 18 Slide 19 Slide 20 Slide 21 Slide 22 Slide 23 Slide 24 Slide 25 Slide 26 Slide 27 Slide 28 Slide 29 Slide 30 Slide 31 Slide 32 Slide 33 Slide 34 Slide 35 Slide 36 Slide 37 Slide 38 Slide 39 Slide 40
Compartilhar