Baixe o app para aproveitar ainda mais
Prévia do material em texto
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Aulas 19, 20 e 21 Análise de Variância – ANOVA Profs. Fernando Tobal Berssaneti André Leme Fleury Renato de Oliveira Moraes Leandro Alves Patah Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística • A principal técnica para o estudo de problemas envolvendo a comparação de várias médias é a Análise de Variância • Ela busca identificar diferenças entre médias populacionais devidas a várias causas atuando simultaneamente sobre os elementos das populações • A análise de variância é uma ferramenta de comparação de várias médias, isto é, usamos a mesma para testar a hipótese de que a média de uma determinada característica é a mesma em diversas populações Comparação de Várias Médias Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Comparação de várias médias Análise de Variância Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística • Para isso, partimos de duas premissas: • Primeiro: assumimos que as populações são homocedásticas, isto é, que possuem a mesma variância (pode-se verificar esta hipótese pelos testes de Bartlett e Cochran, não contemplados em nossa disciplina) • Em segundo lugar, precisamos assumir que as populações são normalmente distribuídas Análise de Variância Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Homocedasticidade • Variâncias iguais Hipóteses Testes de Bartlett e Cochran Análise de Variância Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Homocedasticidade • Variâncias iguais População normal Hipóteses Análise de Variância Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Um fator ou uma classificação Análise de Variância Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística • Vamos supor que uma drogaria esteja interessada em avaliar o trabalho de seus funcionários. Para isso, ela selecionou 8 clientes pela manhã, 8 à tarde e 8 à noite para que eles dessem uma nota de 0 a 10 para o atendimento recebido • Depois de reunir as notas, o gerente da farmácia gostaria de saber se existe alguma diferença no atendimento entre os períodos do dia, isto é, se as notas médias dos três períodos são iguais • Para isso, ele precisa fazer uma Análise de Variância. Veja que temos 3 amostras, com 8 elementos cada uma. Podemos calcular, então, a média e a variância de cada amostra Exemplo 01 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística • Manhã • Tarde • Noite 8 clientes por período Notas de 0 a 10 Exemplo 01 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Período Notas Manhã 4 5 5 4 8 4 3 7 Tarde 2 4 3 7 5 4 2 5 Noite 3 6 6 4 5 4 6 6 ?noitetardemanhã Exemplo 01 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Período Notas S² Manhã 4 5 5 4 8 4 3 7 5,0 2,9 Tarde 2 4 3 7 5 4 2 5 4,0 2,9 Noite 3 6 6 4 5 4 6 6 5,0 1,4 x 8 elementos 3 amostras Exemplo 01 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Análise de Variância – Uma Classificação e Amostras de Mesmo Tamanho Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrados Graus de Liberdade Quadrado Médio Fcal F k-1 k(n-1) 𝑆𝑄𝑇 nk-1 Quadro da Análise de Variância Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Notas Manhã Tarde Noite Ti T= Qi Q= Exemplo 01 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrados Graus de Liberdade Quadrado Médio Fcal F 𝑆𝑄𝑇 Exemplo 01 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Três peças de concreto foram submetidas a testes de dureza, obtendo-se os seguintes valores. Verificar, as níveis de significância de 5% e 1% , se existe diferença significativa entre os três fornecedores Exercício 01 (Exemplo pág. 154 – Costa Neto) Concreto Dureza A 68 74 77 70 71 B 67 65 69 66 67 C 73 77 76 69 80 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Concretos A B C Ti T= Qi Q= Exercício 01 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrados Graus de Liberdade Quadrado Médio Fcal F 𝑆𝑄𝑇 Exercício 01 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Análise de Variância – Uma Classificação e Amostras de Tamanhos Diferentes 𝑇𝑖 = 𝑗=1 𝑛𝑖 𝑥𝑖𝑗 𝑄𝑖 = 𝑗=1 𝑛𝑖 𝑥𝑖𝑗 2 𝑇 = 𝑖=1 𝑘 𝑇𝑖 = 𝑖=1 𝑘 𝑗=1 𝑛𝑖 𝑥𝑖𝑗 𝑄 = 𝑖=1 𝑘 𝑄𝑖 = 𝑖=1 𝑘 𝑗=1 𝑛𝑖 𝑥𝑖𝑗 2 𝑥𝑖 = 𝑇𝑖 𝑛𝑖 𝑥 = 𝑇 𝑖=1 𝑘 𝑛𝑖 𝑛𝑖 = 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑖 − é𝑠𝑖𝑚𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrados Graus de Liberdade Quadrado Médio Fcal F SQE 𝑇𝑖 2 𝑛𝑖 − 𝑇2 𝑛𝑖 𝑘 − 1 𝑆𝐸 2 = 𝑆𝑄𝐸 𝑘 − 1 𝐹 = 𝑆𝐸 2 𝑆𝑅 2 𝐹𝑘−1; 𝑛𝑖−𝑘;𝛼 SQR 𝑄 − 𝑇𝑖 2 𝑛𝑖 𝑛𝑖 − 𝑘 𝑆𝑅 2 = 𝑆𝑄𝑅 𝑛𝑖 − 𝑘 SQT 𝑄 − 𝑇2 𝑛𝑖 𝑛𝑖 − 1 Quadro da Análise de Variância Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística São dados 3 grupos de observações: Podemos identificar, aos níveis de significância usuais (1% e 5%), a existência de diferença entre as medias das populações das quais provieram essas amostras? Grupo A 15 18 18 20 19 24 19 Grupo B 19 20 16 21 19 15 9 13 19 Grupo C 29 27 23 20 21 Exercício 02 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Grupos A B C Ti T= Qi Q= Exercício 02 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrados Graus de Liberdade Quadrado Médio Fcal F 𝑆𝑄𝑇 Exercício 02 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Análise de Variância – Duas Classificações e Sem Repetição Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrados Graus de Liberdade Quadrado Médio Fcal F Entre linhas (SQL) k-1 Entre colunas (SQC) n-1 Residual (SQR) Por diferença (k-1)(n-1) Total (SQT) nk-1 Quadro da Análise de Variância Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Cinco diferentes modelos de motocicletas de mesma cilindrada foram testados com três diferentes fornecedores de pneus. Os dados de durabilidade dos pneus, em 1000 km rodados, estãona tabela a seguir. Ao nível de significância de 5%, existem diferenças significativas entre os modelos de motos e entre os fornecedores de pneus? Exercício 03 Modelo A Modelo B Modelo C Modelo D Modelo E Fornecedor 01 54 32 38 46 50 Fornecedor 02 57 40 42 45 53 Fornecedor 03 55 36 38 44 51 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fornecedor 01 02 03 Xij (Xij)2 Xij (Xij)2 Xij (Xij)2 Ti Qi (Ti)2 Tj Qj (Tj)2 Exercício 03 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrados Graus de Liberdade Quadrado Médio Fcal F Entre linhas (SQL) k-1= Entre colunas (SQC) n-1= Residual (SQR) (k-1)(n-1)= Total (SQT) nk-1= Exercício 03 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística As vendas de 3 vendedoras que atendem uma certa região, durante 8 semanas, são fornecidas a seguir. Existem evidências, ao nível de significância de 10%, de que as vendas médias semanais não sejam iguais ou que o desempenho das 3 vendedoras seja diferente? Vendedora 1 2 3 4 5 6 7 8 Rosa 186 222 198 216 210 194 203 219 Sueli 197 203 194 208 220 209 190 205 Tânia 174 213 190 197 233 206 199 221 Exercício 04 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Vendedora Rosa Sueli Tânia Xij (Xij)2 Xij (Xij)2 Xij (Xij)2 Ti Qi (Ti)2 Tj Qj (Tj)2 Exercício 04 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrados Graus de Liberdade Quadrado Médio Fcal F Entre linhas (SQL) k-1= Entre colunas (SQC) n-1= Residual (SQR) (k-1)(n-1)= Total (SQT) nk-1= Exercício 04 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Dão se, a seguir, os números de peças defeituosas produzidas por quatro operadores trabalhando, em turnos, em três diferentes máquinas: Existem evidências de que os operadores ou máquinas não estejam produzindo com a mesma qualidade (α = 5%)? O1 O2 O3 O4 M1 35 38 41 32 M2 31 40 38 31 M3 36 35 43 25 Exercício 05 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Máquina M1 M2 M3 Xij (Xij)2 Xij (Xij)2 Xij (Xij)2 Ti Qi (Ti)2 Tj Qj (Tj)2 Exercício 05 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrados Graus de Liberdade Quadrado Médio Fcal F Entre linhas (SQL) k-1= Entre colunas (SQC) n-1= Residual (SQR) (k-1)(n-1)= Total (SQT) nk-1= Exercício 05 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Análise de Variância – Duas Classificações e Com Repetição Temos r observações correspondendo ao cruzamento da linha i (i=1, 2, 3, ...,k) com a coluna j (j=1, 2, 3, ..., n), num total de nkr observações. O fato de haver repetições (replicações – r > 1) permite obter uma estimativa de 2 dentro dos nk tratamentos. Esta estimativa será representada por S2Tr e a respectiva soma de quadrados por SQTr. SQT = SQTr + SQR nkr-1 = (nk-1) + nk(r-1) 𝑆𝑄𝐿 = 𝑖=1 𝑘 𝑇𝑖 2 𝑛𝑟 − 𝑇2 𝑛𝑘𝑟 𝑆𝑄𝐶 = 𝑗=1 𝑛 𝑇𝑗 2 𝑘𝑟 − 𝑇2 𝑛𝑘𝑟 𝑆𝑄𝑇𝑟 = 𝑖=1 𝑘 𝑗=1 𝑛 𝑇𝑖𝑗 2 𝑟 − 𝑇2 𝑛𝑘𝑟 𝑆𝑄𝐼 = 𝑆𝑄𝑇𝑟 − 𝑆𝑄𝐿 − 𝑆𝑄𝐶 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 𝑟 𝑜𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠 𝑠𝑜𝑏 𝑐𝑎𝑑𝑎 𝑡𝑟𝑎𝑡𝑎𝑚𝑒𝑛𝑡𝑜, 𝑐𝑜𝑚 𝑟 > 1 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠 = 𝑛𝑘𝑟 𝑆𝑄𝑇 = 𝑆𝑄𝑇𝑟 + 𝑆𝑄𝑅 𝑛𝑘𝑟 − 1 = (𝑛𝑘 − 1) + 𝑛𝑘(𝑟 − 1) Análise de Variância – Duas Classificações e Com Repetição Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 𝑆𝑄𝑇 = 𝑄 − 𝑇2 𝑛𝑘𝑟 𝑆𝑄𝑅 = 𝑆𝑄𝑇 − 𝑆𝑄𝑇𝑟 Havendo interação entre linhas e colunas (por hipótese inicial ou por conclusão do teste Fi), o efeito fixo será testado com base em: e o efeito aleatório pela comparação do respectivo 𝑆2 com 𝑆𝑅 2. Não havendo interação, procede-se analogamente aos casos anteriores, sendo a corresponde soma de quadrados acrescida à residual. 𝐹𝐿 = 𝑆𝐿 2 𝑆𝐼 2 𝐹𝐶 = 𝑆𝐶 2 𝑆𝐼 2 Análise de Variância – Duas Classificações e Com Repetição Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrado Graus de Liberdade Quadrado Médio Fcal F Entre Linhas SQL k – 1 𝑆𝐿 2 = 𝑆𝑄𝐿 𝑘 − 1 FL Entre Colunas SQC n – 1 𝑆𝐶 2 = 𝑆𝑄𝐶 𝑛 − 1 FC Interação SQI (k – 1) (n – 1) 𝑆𝐼 2 = 𝑆𝑄𝐼 (𝑘 − 1)(𝑛 − 1) 𝐹𝐼 = 𝑆𝐼 2 𝑆𝑅 2 𝐹 𝑘−1 𝑛−1 ; 𝑛𝑘 𝑟−1 ; 𝛼 Entre tratamentos SQTr nk – 1 𝑆𝑇𝑟 2 = 𝑆𝑄𝑇𝑟 𝑛𝑘 − 1 𝐹𝑇𝑟 = 𝑆𝑇𝑟 2 𝑆𝑅 2 𝐹𝑛𝑘−1; 𝑛𝑘 𝑟−1 ; 𝛼 Residual SQT – SQTr nk (r – 1) 𝑆𝑅 2 = 𝑆𝑄𝑅 𝑛𝑘(𝑟 − 1) Total SQT nkr – 1 Quadro da Análise de Variância Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Foram observados os tempos, em segundos, gastos por quatro operários para montar uma peça, por três métodos diferentes. Cada operário montou duas peças por método, conforme tabela abaixo. Verifique a existência de diferenças significativas entre os métodos e/ou entre os operários (α = 5%) Operários A B C D Métodos I 54 46 55 51 52 47 54 60 II 59 61 59 56 57 55 61 57 III 59 63 63 59 62 58 61 60 Exemplo 02 (Exemplo pág. 163 – Costa Neto) Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Operários A B C D x x2 x x2 x x2 x x2 Ti Qi T2i M é to d o s I II III Tj Qj T2j Exemplo 02 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrado Graus de Liberdade Quadrado Médio Fcal F5% Entre Linhas Entre Colunas Interação Entre tratamentos Residual Total Exemplo 02 – Quadro da Análise de Variância Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrado Graus de Liberdade Quadrado Médio Fcal F5% Entre Linhas Entre Colunas Residual Total Exemplo 02 – Quadro da Análise de Variância Modificado Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Numa experiência didática, vinte alunos de uma classe considerada muito homogênea receberam aulas de certa disciplina segundo dois métodos diferentes (A e B), sendo todas as aulas dadas pelo mesmo professor em dois períodos diferentes: no começo da manhã e no fim da tarde. Assim, o professor ministrou aulas a quatro turmas de cinco alunos cada, duas pela manhã e duas a tarde. Os alunos foram distribuídos pelas turmas por sorteio. As médias finais foram: Manhã, Método A: 6,4 7,0 7,3 6,2 6,9 Manhã, Método B: 7,5 8,0 9,8 6,9 8,4 Tarde, Método A: 6,8 7,2 6,0 7,7 5,3 Tarde, Método B: 5,4 8,3 9,0 7,5 7,7 Realize a Analise de Variância pertinente. Quais as condições, aos níveis usuais (1% e 5%)? Foi encontrada interação entre horário de aula e método de ensino? Exercício 06 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – EstatísticaPeríodo Manhã Tarde x x2 x x2 Ti Qi T2i M é to d o s A B Tj Qj T2j Exemplo 06 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrado Graus de Liberdade Quadrado Médio Fcal F5% Entre Linhas Entre Colunas Interação Entre tratamentos Residual Total Exercício 06 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrado Graus de Liberdade Quadrado Médio Fcal F5% Entre Linhas Entre Colunas Residual Total Exercício 06 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Comparações Múltiplas Método de Tukey Quando temos k linhas e n colunas, as medias 1 e m serão consideradas distintas se: Método de Scheffé As medias 1 e m serão consideradas distintas entre si se: Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Três peças de concreto foram submetidas a testes de dureza, obtendo-se os seguintes valores. Verificar, aos níveis de significância de 5% e 1% , se existe diferença significativa entre os três fornecedores Exercício 07 (Exemplo pág. 168 – Costa Neto) Concreto Dureza A 68 74 77 70 71 B 67 65 69 66 67 C 73 77 76 69 80 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrados Graus de Liberdade Quadrado Médio Fcal F Exercício 07 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Fonte de Variação Soma de Quadrados Graus de Liberdade Quadrado Médio F F 172,133 2 86,067 8,02 F5% = 3,89 128,800 12 10,733 300,933 Exercício 07
Compartilhar