Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
ANOVA 5. Análise da Variância (ANOVA) É um método desenvolvido por Fisher e usado para testar a igualdade de médias de diferentes populações que apresentam variâncias iguais (condição de homocedasticidade). Pode parecer que o termo análise da variância se mostre mal aplicado, uma vez que o objetivo é testar a igualdade de médias populacionais. No entanto, é a partir de uma análise de estimativas da variância definidas e calculadas de diferentes formas, que se pode tirar conclusões a respeito das médias populacionais. As ferramentas de ANOVA do Excel corespondem a três técnicas diferentes todas destinadas a testar o seguinte par de hipóteses. H0 : todas as populações têm médias iguais H1 : pelo menos uma das médias populacionais difere das demais As técnicas são: ANOVA - fator único, ANOVA - fator duplo sem repetição e ANOVA fator duplo com repetição. As ferramentas do Excel correspondentes a essas técnicas têm a mesma denominação. FU 5.1. ANOVA de Fator Único 5.1.1. ANOVA de Fator Único (Conceituação) Essa técnica trabalha com k amostras de tamanhos diversos retiradas de k populações, cujas médias queremos comparar. As populações devem ser normais com variâncias iguais (condição de homocedasticidade). A ANOVA fator único considera que as populações tenham sido submetidas a diferentes tipos de tratamento e procura saber se os mesmos produzem, em média, o mesmo efeito. Os tratamentos em questão constituem o fator único que dá título à técnica. O seguinte par de hipóteses deverá ser testado. H0 : m1 = m2 = ... = mk H1 : $ mi <> mj , i <>j A não rejeição de H0 significa a não comprovação de diferença significativa entre as médias populacionais. A ferramenta do Excel para esta técnica é a ANOVA: fator único encontrada no menu em Ferramentas, opção Análise de Dados. Essa ferramenta, além de fornecer um resumo estatístico dos dados, gera uma matriz de resultados, cujo modelo é apresentado abaixo. Essa técnica baseia-se em que, sendo H0 verdadeira, existem três maneiras pelas quais a variância s², comum implicitamente a todas as populações, pode ser estimada. Uma maneira consiste em calcular a variância das médias amostrais (s²x|) e multiplicar por n, já que a variância das médias amostrais é uma estimativa de s²/n, sendo n o tamanho da menor amostra. É chamada de variância entre amostras (sE²). Outra maneira consiste em estimar a variância a partir dos elementos de cada amostra, calculando em seguida a média (ms²) das k estimativas. É chamada de variância dentro ou residual (sR²). Uma terceira maneira é obtida através da variância de todos os dados considerando as k amostras reunidas em uma só. É chamada de variância total (sT²). As duas primeiras são fornecidas pela ferramenta do Excel na coluna MQ (média dos quadrados) na matriz dos resultados. A variância sT² não é fornecida pela ferramenta mas pode ser obtida dividindo-se o valor de SQT (soma dos quadrados total) pelo valor de GLT (grau de liberdade total), gerados pela ferramenta. A matriz de resultados gerada pela ferramenta Anova: fator único traz na primeira coluna a fonte da variação e nas demais os valores de SQ (soma dos quadrados), gl (graus de liberdade), MQ (média dos quadrados), a estatística F, o valor p e o valor de F crítico. A seguir é mostrado um modelo da matriz dos resultados gerada pela ferramenta Anova: fator único. Nesse modelo, foi escrito em cada célula o que representa cada resultado numérico gerado na matriz. ANOVA Fonte da SQ gl MQ=SQ/gl F valor-P F crítico variação Entre SQE GLE = k-1 sE²=SQE/GLE FE=sE²/sR² valor p Fcrítico grupos Dentro dos SQR GLR=k*(n-1) sR²=SQR/GLR grupos Total SQT=SSQi GLT=SGLi sT²=SQT/GLT A decisão de rejeitar ou não H0 é feita com base na estatística valor p fornecida na matriz de resultados (penúltima coluna) de acordo com a seguinte regra: Se valor p < a, H0 será rejeitada indicando haver diferença entre as médias das populações. A decisão também pode ser feita com base nos valores de F e Fcrítico da seguinte maneira: Se F > Fcrítico, H0 será rejeitada. 5.1.2. ANOVA de fator único (Roteiro) Para testar a igualdade das médias de k populações, submetidas a tratamentos diversos, através de k amostras que podem ter ou não o mesmo tamanho (n), devemos usar a ferramenta ANOVA: fator único obedecendo ao seguinte roteiro: 1. Clicar sucessivamente em Ferramentas, Análise de dados, Anova: fator único e OK; 2. Transferir para o campo Intervalo de Entrada a matriz dos dados incluindo os títulos das colunas; 3. Manter o botão Colunas ativado; 4. Ativar a caixa Rótulos; 5. Informar o valor de Alfa no campo correspondente; 6. Ativar o botão Intervalo de Saída e digitar no campo ao lado a célula de saida dos resultados; 7. Clicar OK; Decisão valor p < a rejeitar H0 valor p >= a não rejeitar H0 F > Fcrítico indica também a rejeição de H0. A rejeição de H0 indica haver diferença entre as médias populacionais. Hipótese nula: as médias decorrentes dos diversos tipos de tratamento são todas iguais. Isto é: o fator tratamento não causa nenhum efeito. Hipótese alternativa: pelo menos uma das médias é diferente das demais. Isto é, há efeito do fator tratamento. entre amostras dentro das amostras ou residual 5.1 Exercício 5.1 Considere abaixo três amostras genéricas, com tamanhos diferentes, retiradas de populações que receberam distintos tratamentos. Há evidência, ao nível de 5% de significância,de que haja diferença entre as médias das populações que originaram essas amostras. Amostra 1 Amostra 2 Amostra 3 64 71 52 66 73 57 59 66 53 65 70 56 62 68 53 62 69 51 61 67 60 70 59 R. Sim. Valor p = 0,0000. Solução Anova: fator único RESUMO Grupo Contagem Soma Média Variância dp li ls Amostra 1 9 558 62 6.5 2.5495097568 60.0402768336 63.9597231664 Amostra 2 8 554 69.25 5.0714285714 2.2519832529 67.3669957159 71.1330042841 Amostra 3 6 322 53.6666666667 5.4666666667 2.3380903889 51.2125921364 56.1207411969 ANOVA Fonte da variação SQ gl MQ F valor-P F crítico Entre grupos 834.384057971 2 417.1920289855 72.6604404619 0.0000000007 3.492829137 Dentro dos grupos 114.8333333333 20 5.7416666667 Total 949.2173913044 22 43.1462450593 valor p 0.00% < alfa rejeitar H0 Há evidência de que as médias das populações sejam diferentes ao nível de 5% de significância. b) Observe o resumo estatístico da ferramenta utilizada e informe como obter a média e a variância de cada uma das amostras e da totalidade delas. 5.2 Exercício 5.2 (Neufeld) Uma empresa recebeu propostas de treinamento em vendas de dois cursos A e B. Para comparar a efetividade entre eles e também se valeria a pena o treinamento de seus vendedores, três grupos de 5 vendedores foram selecionados aleatoriamente. Um grupo foi inscrito no curso A, outro no curso B e o terceiro não recebeu nenhum treinamento. Após a conclusão dos cursos, o volume de vendas de cada vendedor foi observado durante um periodo de duas semanas resultando nos dados abaixo. Curso A Curso B Sem curso 2058 3339 2228 2176 2777 2578 3449 3020 1227 2517 2437 2044 944 3067 1681 a) Diante desses dados, há evidência, ao nível de 10% de significância, de que de fato valeu a pena o treinamento dos vendedores? b) Com base nos dados gerados pela ferramenta utilizada, informe os valores da média e da variância de cada uma das amostras e mostre como são obtidas as estimativas da variância da população. R. Sim. Valor p = 0,07843. Solução: a) Diante desses dados, há evidência, ao nível de 10% de significância, de que de fato valeu a pena o treinamento dos vendedores? Anova: fator único RESUMO Grupo Contagem Soma Média Variância Curso A 5 11144 2228.8 813654.7 Curso B 5 14640 2928 115147 Sem curso 5 9758 1951.6 268895.3 ANOVA Fonte da variação SQ gl MQ F valor-P F crítico Entre grupos 2531795.7333333343 2 1265897.8666666672 3.1708300179 0.0784252008 2.8067930202 Dentro dos grupos 4790788 12 399232.3333333333 Total 7322583.733333334 14 523041.6952380953 valor p)treinamento 7.84% < alfa rejeitar H0)treinamento Há evidência, ao nível de 10% de significância, de que o treinamento foi fator importante para o aumento das vendas. b) Com base nos dados gerados pela ferramenta utilizada, informe os valores da média e da variância de cada uma das amostras e mostre como são obtidas as estimativas da variância da população. x|A 2228.8 s²A 813654.7 x|B 2928 s²B 115147 x|SC 1951.6 s²SC 268895.3 MQ)entre grupos =var(matriz de x|)*n 1265897.8666666672 1265897.866666671 MQ)dentro dos grupos =media(matriz de s²) 399232.3333333333 399232.3333333333 MQ)total =SQ)total/gl)total =VAR(matriz total dos dados) 523041.6952380953 523041.6952380953 FDSR 5.2. ANOVA de fator duplo sem repetição 5.2.1. ANOVA de fator duplo sem repetição (Conceituação) Esta técnica é também conhecida como análise de fator duplo sem interação e também lida com amostras de tamanhos diferentes extraídas de populações diferentes com variâncias iguais (condição de homocedasticidade). Os elementos são observados segundo dois critérios, que são os fatores, acarretando duas classificações cruzadas. São k amostras de n elementos por um critério e n amostras de k elementos por outro critério. Consistem portanto de k*n observações dispostas em uma matriz n x k. Cada valor observado, combinação de uma linha com uma coluna, representa um diferente tratamento a que cada elemento foi submetido. Duas hipóteses nulas deverão ser testadas independentemente contra uma hipótese alternativa e contraditória H0L : m1L = m2L = ... = mnL H0C : m1C = m2C = ... = mkC H1 : $ mi <> mj , i <>j A aceitação de H0L significa a não comprovação de diferença significativa entre as médias pelo fator linha e a aceitação de H0C significa a não comprovação de diferença significativa entre as médias pelo fator coluna. A ferramenta do Excel para esta técnica é a ANOVA: fator duplo sem repetição encontrada em Ferramentas, opção Análise de Dados (vide roteiro abaixo). A ANOVA de fator duplo sem repetição baseia-se em que, sendo verdadeiras as hipóteses nulas, existem quatro maneiras pelas quais a variância s², comum implicitamente a todas as populações, pode ser estimada. A variância entre linhas (sL²), a variância entre colunas (sC²), a variância residual (sR²) e a variância total (sT²). As três primeiras são fornecidas pela ferramenta do Excel na coluna MQ da matriz dos resultados. A variância sT² não é fornecida pela ferramenta mas, pode ser obtida dividindo-se a soma dos quadrados total (SQT) por GLT (graus de liberdade total), ambos gerados pela ferramenta. Esta ferramenta fornece igualmente um resumo estatístico dos dados, além de gerar uma matriz de resultados, cujo modelo é mostrado a seguir. ANOVA Fonte da SQ gl MQ=SQ/gl F valor-P F crítico variação Linhas SQL GLL=k-1 sL²=SQL/GLL FL=sL²/sR² valorp)Linhas FLcrítico Colunas SQC GLC=n-1 sC²=SQC/GLC FC=sC²/sR² valorp)Colunas FCcrítico Erro SQR GLR=GLL*GLC sR²=SQR/GLR Total SQT=SSQi GLT=SGLi sT²=SQT/GLT A decisão de rejeitar ou não as hipóteses nulas é feita com base nos valores p correspondentes. Há um valor p para o fator linha e outro para o fator coluna. Assim, se valor p)linhas < a, rejeita-se H0)linhas e se valorp)colunas < a, rejeita-se H0)colunas. Da mesma maneira, a decisão também pode ser feita com base nos valores de F e Fcrítico gerados na matriz de resultados. 5.2.2. ANOVA de fator duplo sem repetição (Roteiro) Para testar a igualdade das médias pelos critérios das linhas e das colunas deve-se usar a ferramenta ANOVA: fator duplo sem repetição obedecendo ao seguinte roteiro. 1. Clicar sucessivamente em Ferramentas, Análise de dados, Anova: fator duplo sem repetição e OK; 2. Transferir para o campo Intervalo de Entrada a matriz dos dados incluindo os títulos das linhas e colunas; 3. Ativar a caixa Rótulos; 4. Informar o valor de Alfa no campo correspondente; 5. Ativar o botão Intervalo de Saída e digitar no campo ao lado a célula de saida dos resultados; 6. Clicar OK; Decisão valor p)linhas < a, rejeitar H0L valor p)colunas < a, rejeitar H0C F > Fcrítico leva às mesmas conclusões. entre linhas entre colunas dentro das amostras ou residual 1ª Hipótese nula As médias pelo fator linha são todas iguais. Isto é, não há efeito principal do fator linha. 2ª Hipótese nula As médias pelo fator coluna são todas iguais. Isto é, não há efeito principal do fator coluna. Hipótese alternativa: pelo menos uma das médias, por um dos fatores, difere das demais. Isto é, há efeito devido a pelo menos um dos fatores. 5.3 Exercício 5.3 (Costa Neto) Em uma experiência agrícola, foram usados seis diferentes fertilizantes em duas variedades de milho tendo sido obtidas as colheitas dadas a seguir, em toneladas. Verificar, ao nível de 1% de significância, se existem diferenças significaticas entre: a) as variedades de milho; b) os tipos de fertilizante. Fert. A Fert. B Fert. C Fert. D Ferti. E Fert. F Milho 1 5.4 3.2 3.8 4.6 5.0 4.4 Milho 2 5.7 4.0 4.2 4.5 5.3 5.0 R. a) Não. Valor p)linhas = 0,02785; b) Sim. Valor p)colunas = 0,002040. Solução: Anova: fator duplo sem repetição RESUMO Contagem Soma Média Variância DP LI LS Milho 1 6 26.4 4.4 0.64 0.8 Milho 2 6 28.7 4.7833333333 0.4376666667 0.6615638039 Fert. A 2 11.1 5.55 0.045 0.2121320344 -3.99855 15.09855 Fert. B 2 7.2 3.6 0.32 0.5656854249 -21.8628 29.0628 Fert. C 2 8 4 0.08 0.2828427125 -8.7314 16.7314 Fert. D 2 9.1 4.55 0.005 0.0707106781 1.36715 7.73285 Ferti. E 2 10.3 5.15 0.045 0.2121320344 -4.39855 14.69855 Fert. F 2 9.4 4.7 0.18 0.4242640687 -14.3971 23.7971 ANOVA Fonte da variação SQ gl MQ F valor-P F crítico Linhas 0.4408333333 1 0.4408333333 9.4128113879 0.0278461542 16.2581272889 Colunas 5.1541666667 5 1.0308333333 22.0106761566 0.0020400837 10.9671418613 Erro 0.2341666667 5 0.0468333333 Total 5.8291666667 11 a) as variedades de milho; valor p)milho 2.78% > alfa não rejeitar H0)milho Não há diferença significativa entre as variedades de milho ao nível de 5%. Isto é, a colheita de milho independe das variedades existentes. b) os tipos de fertilizante. valor p)fertilizante 0.20% < alfa rejeitar H0)fertilizante Há diferença significativa entre os fertilizantes. A colheita de milho depende do tipo de fertilizante ao nível de 1% de significância. 5.4 Exercício 5.4 (Neufeld) Um bureau de serviços de computação quer determinar se o projeto de teclados ergonômicos para computadores recém-surgidos no mercado exerce efeito no desempenho dos digitadores. Cinco digitadores com diferentes habilidades foram selecionados de maneira aleatória. A cada um foi dada a oportunidade de conhecer cada teclado antes de testá-los e cada digitador foi avaliado com três teclados distintos. No quadro abaixo constam o número de palavras digitadas em um determinado tempo por cada digitador. a) Existe evidência, ao nível de significãncia de 5%, de que o tipo de teclado interfere no desempenho dos digitadores? b) Há diferenças entre os digitadores nesse mesmo nível de significância? Tal resultado era esperado? c) Com base nos dados gerados pela ferramenta utilizada, informe os valores da média e da variância de cada uma das amostras e mostre como são obtidas as estimativas da variância da população. proposto em aula modificado Teclado A Teclado B Teclado C Digitador 1 51 57 72 Digitador 2 109 112 117 Digitador 3 47 43 51 Digitador 4 98 98 107 Digitador 5 70 69 77 R. a) Sim. Valor p)teclado = 0,003429; b) Sim e sim. Valor p)digitadores @ 0. Solução: a) Existe evidência, ao nível de significãncia de 5%, de que o tipo de teclado interfere no desempenho dos digitadores? Anova: fator duplo sem repetição RESUMO Contagem Soma Média Variância DP LI LS Digitador 1 3 180 60 117 10.8166538264 33.1215286149 86.8784713851 Digitador 2 3 338 112.6666666667 16.3333333333 4.0414518843 102.624 122.7093333333 Digitador 3 3 141 47 16 4 37.0603377656 56.9396622344 Digitador 4 3 303 101 27 5.1961524227 88.088 113.912 Digitador 5 3 216 72 19 4.3588989435 61.1685041969 82.8314958031 Teclado A 5 375 75 767.5 27.7037903544 40.6067155392 109.3932844608 Teclado B 5 379 75.8 819.7 28.6304034201 40.2563579041 111.3436420959 Teclado C 5 424 84.8 724.2 26.9109643083 51.3909812799 118.2090187201 ANOVA Fonte da variação SQ gl MQ F valor-P F crítico Linhas 9151.0666666667 4 2287.7666666667 193.605077574 0.0000000542 3.8378544787 Colunas 296.1333333333 2 148.0666666667 12.5303244006 0.0034285814 4.4589683057 Erro 94.5333333333 8 11.8166666667 Total 9541.7333333333 14 valor p)teclado = 0,003429< alfa rejeitar H0)teclado O tipo de teclado interfere no desempenho dos digitadores ao nível de 5% de significância. b) Há diferenças entre os digitadores nesse mesmo nível de significância? Tal resultado era esperado? valor p)digitador = 0,0000 < alfa rejeitar H0)digitador Os digitadores têm desempenhos diferentes independentemente do teclado. Esta conclusão já era esperada porque os digitadores têm habilidades diferentes como indicam as estatísticas amostrais c) Com base nos dados gerados pela ferramenta utilizada, informe os valores da média e da variância de cada uma das amostras e mostre como são obtidas as estimativas da variância da população. x|D1 60 s²D1 117 x|D2 112.6666666667 s²D2 16.3333333333 x|D3 47 s²D3 16 x|D4 101 s²D4 27 x|D5 72 s²D5 19 x|TA 75 s²TA 767.5 x|TB 75.8 s²TB 819.7 x|TC 84.8 s²TC 724.2 MQ)linha =var(matriz de x|D)*nD 2287.7666666667 MQ)colunas =var(matriz de x|T)*nT 148.0666666667 MQ)residual ? consultar MQ)total =SQ)total/gl)total =VAR(matriz total dos dados) FDCR 5.3. ANOVA de fator duplo com repetição 5.3.1. ANOVA de fator duplo com repetição (Conceituação) Esta técnica é também conhecida como análise de fator duplo com interação e também trabalha com amostras de tamanhos diferentes extraídas de populações diferentes com variâncias iguais (condição de homocedasticidade). Destina-se a examinar a relação entre duas característcas quaisquer (fatores) que possam afetar um resultado específico. Essa técnica difere da anterior (sem repetição) nos seguintes aspectos: 1. São feitas r observações sob cada tratamento. Ou seja, são r observações correspondendo ao cruzamento de cada linha i com cada coluna j em um total de n*k*r observações; 2. Além do efeito de cada fator, a análise também considera as interações entre os fatores, isto é, os possíveis efeitos associados às combinações dos fatores. Esta técnica trabalha com três hipóteses nulas e uma hipótese alternativa. As duas primeiras hipóteses nulas são referentes aos fatores linha e coluna, como na técnica sem repetição e a terceira reporta-se às interações entre os fatores. H0L : m1L = m2L = ... = mnL H0C : m1C = m2C = ... = mkC H0)I : m1I = m2I = ... = mn*kI H1 : $ mi <> mj , i <>j A ferramenta do Excel para esta técnica é a ANOVA: fator duplo com repetição encontrada no menu em Ferramentas, opção Análise de Dados. Abaixo, sugere-se um roteiro para uso da ferramenta. Essa ferramenta, como as demais, além de fornecer um resumo estatístico dos dados, gera uma matriz de resultados. ANOVA Fonte da SQ gl MQ=SQ/gl F valor-P F crítico variação Amostra SQL GLL sL²=SQL/GLL FL=sL²/sR² valorp)L FLcrítico Colunas SQC GLC sC²=SQC/GLC FC=sC²/sR² valorp)C FCcrítico Interações SQI GLI sI²=SQI/GLI FI=sI²/sR² valorp)I FIcrítico Dentro SQR GLR sR²=SQR/GLR Total SQT=SSQi GLT=SGLi sT²=SQT/GLT A decisão de rejeitar ou não as hipóteses nulas é feita com base nos valores p correspondentes que deverão ser comparados com a, como nas demais técnicas. Há um valor p para o fator linha, outro para o fator coluna e um terceiro correspondente às interações. Como também ocorre nas outras ferramentas, a decisão pode ser feita com base nos valores F e Fcrítico gerados na matriz de resultados. 5.3.1. ANOVA de fator duplo com repetição (Roteiro) Para testar a igualdade das médias pelos critérios das linhas, das colunas e das interações, devemos usar a ferramenta ANOVA: fator duplo com repetição de acordo com o seguinte roteiro: 1. Clicar sucessivamente em Ferramentas, Análise de dados, Anova: fator duplo com repetição e OK; 2. Transferir para o campo Intervalo de Entrada a matriz dos dados incluindo os títulos das linhas e colunas; 3. Clicar no campo Linhas por amostra e digitar o valor de r; 4. Informar o valor de Alfa no campo correspondente; 5. Ativar o botão Intervalo de Saída e digitar no campo ao lado a célula de saida dos resultados; 6. Clicar OK; Decisão valor p)linhas < a, rejeitar H0L valor p)colunas < a, rejeitar H0C valor p)interações < a, rejeitar H0I. F > Fcrítico leva às mesmas conclusões. 3ª Hipótese nula as médias das interações (linhas versus coluna) são todas iguais. Isto é, não há efeito combinado dos dois fatores. entre linhas entre colunas Residual Hipótese alternativa: pelo menos uma das médias, por um dos fatores, difere das demais. Isto é, há efeito em ao menos um dos três casos. 1ª Hipótese nula As médias pelo fator linha são todas iguais. Isto é, não há efeito principal do fator linha. 2ª Hipótese nula As médias pelo fator coluna são todas iguais. Isto é, não há efeito principal do fator coluna. 5.5 Exercício 5.5 (Neufeld) Um fabricante de perfumes submeteu um novo perfume a um teste de mercado em várias cidades. Além da essência do perfume, a experiência tem mostrado que as vendas dependem muito da embalagem e da estratégia de propaganda. Três diferentes estratégias de propaganda (sofisticada, despojada e popular) e três modelos de embalagem (A, B e C) foram testados com o novo pefume.Cada combinação foi submetida a dois mercados diferentes durante seis meses. No final desse periodo, o nível de vendas em milhares de unidades foi registrado e exibido no quadro abaixo nos dois mercados. Com base nesses dados, existe evidência de diferenças nas médias populacionais para as diferentes estratégias de propaganda, para os diferentes modelos de embalagens e para as interações entre as estratégias de propaganda e os modelos das embalagens, ao nível de 5% de significância? Embalagem Sofisticada Despojada Popular A 2.80 2.04 1.58 2.73 1.33 1.26 B 3.29 1.50 1.00 2.68 1.40 1.82 C 2.54 3.15 1.92 2.59 2.88 1.33 R. Não. Valor p)embalagem = 0,07606; Sim. Valor p)propaganda = 0,000373; Sim. Valor p)interações = 0,02241. Solução: Anova: fator duplo com repetição RESUMO Sofisticada Despojada Popular Total A Contagem 2 2 2 6 Soma 5.53 3.37 2.84 11.74 Média 2.765 1.685 1.42 1.9566666667 Variância 0.00245 0.25205 0.0512 0.4672266667 B Contagem 2 2 2 6 Soma 5.97 2.9 2.82 11.69 Média 2.985 1.45 1.41 1.9483333333 Variância 0.18605 0.005 0.3362 0.7505766667 C Contagem 2 2 2 6 Soma 5.13 6.03 3.25 14.41 Média 2.565 3.015 1.625 2.4016666667 Variância 0.00125 0.03645 0.17405 0.4447766667 Total Contagem 6 6 6 Soma 16.63 12.3 8.91 Média 2.7716666667 2.05 1.485 Variância 0.0732566667 0.62848 0.12407 DP 0.2706596879 0.7927673051 0.3522357165 LI 2.4875805382 1.2179063987 1.1152911535 LS 3.0557527951 2.8820936013 1.8547088465 ANOVA Fonte da variação SQ gl MQ F valor-P F crítico Amostra 0.8072111111 2 0.4036055556 3.4770268977 0.0760626686 4.2564920477 Colunas 4.9910777778 2 2.4955388889 21.4988513449 0.0003733899 4.2564920477 Interações 2.2771222222 4 0.5692805556 4.9043026706 0.0224096878 3.6330902731 Dentro 1.0447 9 0.1160777778 Total 9.1201111111 17 valor p)estratégia = 0,000373 <alfa rejeitar H0)estratégia A estratégia de propaganda interfere nas vendas do produto valor p)embalagem = 0,07606 > alfa não rejeitar H0)embalagem O tipo de embalagem não interfere nas vendas do produto valor p)interações = 0,02241 < alfa rejeitar H0)interações Há efeito combinado entre os tipos de embalagem e as estratégias de propaganda, em função dos mercados diferentes. 5.6 Exercício 5.6 (Costa Neto) Foram observados os tempos, em segundos, gastos por quatro operários para a montagem de peças de acordo com três métodos diferentes. Cada operário montou duas peças usando cada método. Os tempos de montagem foram registrados abaixo. a) Verificar se existe diferença significativa entre os métodos e/ou entre operários ao nível de 5% de significância, bem como a evidência de interação. b) Com base nos dados gerados pela ferramenta utilizada, informe os valores da média e da variância de cada uma das amostras bem como as estimativas da variância da população. Operário1 Operário2 Operário3 Operário4 Método1 54 46 55 51 52 47 54 60 Método2 59 61 59 56 57 55 61 57 Método3 59 63 63 59 62 58 61 60 R. valor p)método = 0,000148; valor p)operário = 0,1564; valor p)interações = 0,2043. Solução: a) Verificar se existe diferença significativa entre os métodos e/ou entre operários ao nível de 5% de significância, bem como a evidência de interação. Anova: fator duplo com repetição RESUMO Operário1 Operário2 Operário3 Operário4 Total Método1 Contagem 2 2 2 2 8 Soma 106 93 109 111 419 Média 53 46.5 54.5 55.5 52.375 Variância 2 0.5 0.5 40.5 20.2678571429 Método2 Contagem 2 2 2 2 8 Soma 116 116 120 113 465 Média 58 58 60 56.5 58.125 Variância 2 18 2 0.5 4.9821428571 Método3 Contagem 2 2 2 2 8 Soma 121 121 124 119 485 Média 60.5 60.5 62 59.5 60.625 Variância 4.5 12.5 2 0.5 3.6964285714 Total Contagem 6 6 6 6 Soma 343 330 353 343 Média 57.1666666667 55 58.8333333333 57.1666666667 Variância 13.3666666667 50.8 12.9666666667 11.7666666667 ANOVA Fonte da variação SQ gl MQ F valor-P F crítico Amostra 286.3333333333 2 143.1666666667 20.0935672515 0.000147811 3.8852903117 Colunas 44.4583333333 3 14.8194444444 2.0799220273 0.156412962 3.4902996049 Interações 72.6666666667 6 12.1111111111 1.6998050682 0.2043376301 2.9961171322 Dentro 85.5 12 7.125 Total 488.9583333333 23 21.259057971 valor p)métodos = 0,000148 < alfa rejeitar H0)métodos O método interfere no tempo de montagem valor p)operário = 0,1564 > alfa não rejeitar H0)operário O tempo de montagem das peças independe do operário que a executa. valor p)interações = 0,2043 > alfa não rejeitar H0)interações Não há evidência de efeito combinado operário x método, independentemente da peça que está sendo montada. b) Com base nos dados gerados pela ferramenta utilizada, informe os valores da média e da variância de cada uma das amostras bem como as estimativas da variância da população. x|M1 52.375 s²M1 20.2678571429 x|M2 58.125 s²M2 4.9821428571 x|M3 60.625 s²M3 3.6964285714 x|O1 57.1666666667 s²O1 13.3666666667 x|O2 55 s²O2 50.8 x|O3 58.8333333333 s²O3 12.9666666667 x|O4 57.1666666667 s²O4 11.7666666667 s²L 143.1666666667 s²C 14.8194444444 s²I 12.1111111111 s²D 7.125 s²T 21.259057971 5.7 Exercício 5.7 (Costa Neto com amostras ampliadas) Chapas metálicas foram submetidas a três diferentes tratamentos térmicos A, B e C. Após o tratamento, foram feitas as medidas de dureza superficial, em rockwell B, de cada chapa obtendo-se os resultados abaixo. Verificar, ao nível de 1% de significância, se existe diferença significativa entre os tratamentos térmicos aplicados. A B C 68 67 73 74 65 77 77 69 76 70 66 69 71 67 80 69 66 71 72 65 74 75 68 79 73 69 75 76 68 72 R. Sim. Valor p = 0,0000. Solução: Anova: fator único RESUMO Grupo Contagem Soma Média Variância A 10 725 72.5 9.1666666667 B 10 670 67 2.2222222222 C 10 746 74.6 12.2666666667 ANOVA Fonte da variação SQ gl MQ F valor-P F crítico Entre grupos 308.0666666667 2 154.0333333333 19.5345232504 0.0000056681 5.4881177685 Dentro dos grupos 212.9 27 7.8851851852 Total 520.9666666667 29 valor p)tratamento 0.00% < alfa rejeitar H0 Há evidência de que os tratamentos térmicos tenham causado efeitos diferentes. 5.8 Exercício 5.8 (Lapponi) Uma empresa de porte médio manufatura autopeças para o mercado de reposição e está tentando reduzir o tempo de fabricação de cada peça. Para tanto, foram testados dois processos diferentes e três dosagens de um aditivo para acelerar a a secagem em um certo número de peças. Os tempos, em horas, estão registrados na tabela abaixo. Faça uma análise da variância ao nível de 5% de significância Aditivo Processo 1 Processo 2 Dosagem 1 2.5 2.9 2.8 2.6 2.9 2.8 2.7 2.3 2.7 2.9 Dosagem 2 2.9 2.8 2.7 2.9 2.8 2.8 2.6 2.9 3 2.6 Dosagem 3 2.6 2.4 2.7 2.7 2.8 2.7 2.5 2.1 2.9 2.5 R. valor p)dosagem = 0,062843; valor p)processo = 0,2574; valor p)interações = 0,3697. Solução: Anova: fator duplo com repetição RESUMO Processo 1 Processo 2 Total Dosagem 1 Contagem 5 5 10 Soma 13.6 13.5 27.1 Média 2.72 2.7 2.71 Variância 0.022 0.065 0.0387777778 Dosagem 2 Contagem 5 5 10 Soma 14 14 28 Média 2.8 2.8 2.8 Variância 0.025 0.015 0.0177777778 Dosagem 3 Contagem 5 5 10 Soma 13.5 12.4 25.9 Média 2.7 2.48 2.59 Variância 0.025 0.062 0.0521111111 Total Contagem 15 15 Soma 41.1 39.9 Média 2.74 2.66 Variância 0.0225714286 0.0597142857 ANOVA Fonte da variação SQ gl MQ F valor-P F crítico Amostra 0.222 2 0.111 3.1121495327 0.0628434539 3.4028317941 Colunas 0.048 1 0.048 1.3457943925 0.2574254525 4.2596752792 Interações 0.074 2 0.037 1.0373831776 0.369734344 3.4028317941 Dentro 0.856 24 0.0356666667 Total 1.2 29 Todos os valores p estão acima de alfa não rejeitar nenhuma hipótese nula Não há interferência do processo, nem das dosagens do aditivo e muito menos efeito combinado dos dois fatores no tempo de fabricação das peças. 5.9 Exercício 5.9 (Neufeld) Quatro casas foram avaliadas por quatro avaliadores e chegaram aos valores abaixo. Aval. A Aval. B Aval. C Aval. D Casa 1 R$ 101,900.00 R$ 101,944.00 R$ 100,967.00 R$ 100,175.00 Casa 2 R$ 72,744.00 R$ 76,893.00 R$ 73,206.00 R$ 74,820.00 Casa 3 R$ 132,217.00 R$ 136,232.00 R$ 131,935.00 R$ 132,889.00 Casa 4 R$ 211,213.00 R$ 213,941.00 R$ 212,735.00 R$ 213,796.00 a) Existe evidência, ao nível de 2% de significância, de que são diferentes os valores estipulados pelos avaliadores para a mesma casa? b) Há diferenças entre as casas? Tal conclusão já era esperada? R. Não. Valor p = 0,02258. Sim e sim. Valor p)casas @ 0. Solução: Anova: fator duplo sem repetição RESUMO Contagem Soma Média Variância Casa 1 4 404986 101246.5 713267 Casa 2 4 297663 74415.75 3519476.25 Casa 3 4 533273 133318.25 3933442.25 Casa 4 4 851685 212921.25 1585961.5833333333 Aval. A 4 518074 129518.5 3555799541.6666665 Aval. B 4 529010 132252.5 3557375621.6666665 Aval. C 4 518843 129710.75 3638987770.9166665 Aval. D 4 521680 130420 3654591120.6666665 ANOVA Fonte da variação SQ gl MQ F valor-P F crítico Linhas 43209651726.6875 3 14403217242.229166 12217.1162412421 0 5.5096620599 Colunas 18646003.1875 3 6215334.395833333 5.2719792748 0.0225852791 5.5096620599 Erro 10610438.0625 9 1178937.5625 Total 43238908167.9375 15 a) Existe evidência, ao nível de 2% de significância, de que são diferentes os valores estipulados pelos avaliadores para a mesma casa? valor p)avaliadores = 0,02259 > alfa não rejeitar H0)avaliadores Não há evidência de que sejam diferentes as avaliações feitas para a mesma casa. b) Há diferenças entre as casas? Tal conclusão já era esperada? valor p)casas = 0,0000 < alfa rejeitar H0)casas Há diferenças significativas nos valores das casas, o que já era esperado pelas estatísticas amostrais
Compartilhar