Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 UNIVERSIDADE EDUARDO MONDLANE FACULDADE DE LETRAS ADMINISTRAÇÃO PÚBLICA Resumo Teórico da Aula 9: Teste de hipóteses Métodos Quantitativos II 2º Semestre de 2019 Análise de variância (ANOVA-one way) A análise de variância é um teste estatístico amplamente difundido entre os analistas, e visa fundamentalmente verificar se existe uma diferença significativa entre as médias ( três ou mais médias) e se os factores exercem influência em alguma variável dependente. Os factores propostos podem ser de origem qualitativa ou quantitativa, mas a variável dependente necessariamente deverá ser quantitativa. A principal aplicação da ANOVA (analise of variance) é a comparação de médias oriundas de três ou mais grupos diferentes, também chamados tratamentos, como por exemplo médias históricas de questões de satisfação, empresas que operam simultaneamente com diferentes rendimentos, entre muitas outras aplicações. Embora se denomine “análise de variância”, trata-se de um procedimento para averiguar se os valores médios são estatisticamente diferentes (e não para ver se as variâncias são diferentes). O nome resulta da ANOVA recorrer ao cálculo de variâncias para decidir se as médias são diferentes. O raciocínio é o seguinte: calcula-se a variância dentro de cada grupo e depois compara-se com a variância entre os grupos – se houver diferenças, é porque as médias dos grupos são diferentes. Isto é, Se a variância residual (variância dentro de cada grupo) for claramente inferior à variância entre grupos, então pode-se afirmar que os valores médios são diferentes. Portanto, existem dois métodos para calcular-se a variância: dentro de grupos ( 2 Ds ) e a variância das entre os grupos ( 2 Es ). Pressupostos para realização do teste ANOVA As amostras devem ser aleatórias e independentes As populações de onde as amostras foram extraidas devem ter uma distribuição normal Deve existir homogeneidade de variâncias isto é, os grupos devem ter variancias iguais ( 223 2 2 2 1 .... k ). A ANOVA é robusta face a violações de algumas condições referidas, nomeadamente a exigência de normalidade (desde que todos os grupos tenham dimensão suficiente) e a exigência da homogeneidade das variâncias (desde que os grupos tenham dimensão semelhante ou tamanhos de amostras iguais). Mais grave é a violação da independência das observações entre grupos (não devem estar correlacionados; resolve-se garantindo a aleatoriedade na formação dos grupos em comparação). HIPÓTESES kH ....: 3210 :1H Existe pelomenos um grupo com media diferente 2 ESTATISTICA DO TESTE ;~ );;1(2 2 knK D E F s s F onde 1 )()()( 2222 2 112 k xxnxxnxxn s kkE k kk nnn xnxnxn x 21 2211 kn snsnsn s kkD 22 22 2 112 )1()1()1( knnnn 21 K : numero de Médias (grupos) a comparar K – 1 : graus de liberdades do Numerador n – k : graus de liberdades do Denominador REGRA DE DECISÃO: Rejeitar )....(: 3210 kH se );;1( knKcalculado FF Nota: o distribuição F no teste ANOVA é sempre unilateral a direita. Se não se rejeitar H0, é fácil concluir que os grupos são idênticos. Mas se se rejeitar H0, apenas sabemos que pelo menos um dos grupos é diferente dos restantes. Como determinar os grupos que diferem entre si? Existem inúmeros procedimentos para decidir que média são realmente diferentes umas das outras, nomeadamente, Teste de Tukey; Teste de Tukey-kramer ; Teste de Dunnet; Teste de Scheffe; teste da diferença mínima significativa (least significant difference (LSD) test) e Teste de Bonferroni. Todos estes procedimentos consistem em comparar pares de médias. (nesta disciplina, os testes de comparação múltiplas não serão tratados ou desenvolvidos) Exemplo1: O aumento de peso de mulheres grávidas parece ter um efeito importante no peso dos bebês. Se o aumento de peso não é adequado, a criança tem mais probabilidades de ser pequena e tenderá a ser menos saudável. Num estudo conduzido em três províncias moçambicanas, registaram-se os aumentos de peso (em Kg) das mulheres durante o 3o trimestre de gravidez: N Média Desvio padrão Maputo (1) 46 3,7 2,5 Inhambane (2) 111 3,1 1,8 Niassa (3) 52 2,9 1,8 O nível de significancia de 5%, teste a hipótese de que em média o aumento de peso, das mulheres grávidas nas três províncias observadas é o mesmo. Dados: 182,3 5211146 9,2521,31117,346 21 2211 k kk nnn xnxnxn x 13 )182,39,2(52)182,31,3(111)182,37,3(46 1 )()()( 2221 2 3 2 22 2 112 k xxxxnxxn sE 2Es 8,612249 3,897524 3209 8,1)152(8,1)1111(5,2)146()1()1()1( 22222 22 2 112 kn snsnsn s kkD 3 HIPÓTESES 3210 : H :1H Existe palomemos um grupo com média diferente 05,0%5 Estatística do teste: ;~ );;1(2 2 knK D E F s s F Regra de decisão: 033,3)05,0;206;2()05,0;3209;13();;1( FFF knK Rejeitar )( 3210 H se 033,3calculadoF 2097,2 3,897524 612249,8 2 2 D E s s F Decisão: Não rejeitar )( 3210 H Conclusão: A o nível de significância de 5%, há evidências suficientes para apoiar afirmação de em média o aumento de peso, das mulheres grávidas nas três províncias observadas é o mesmo. Exemplo2: Suponha que é director de marketing de uma empresa que pretende relançar um produto no mercado. Você estudou três campanhas de marketing diferentes, cada uma deles combina de modo diferente factores como o preço do produto, a apresentação do produto, promoções associadas, etc. Qualquer uma destas campanhas é levada a cabo no ponto de venda, não havendo qualquer publicidade nos meios de comunicação. Cada uma delas é feita num conjunto de lojas seleccionadas aleatoriamente, durante um período de duração limitada. Note que as lojas são seleccionadas de modo a que as três amostras sejam aleatórias e independentes entre si. As vendas (em unidades monetárias – u. m.) registadas durante este período constam da tabela seguinte. Campanha 1 8 6 5 6 7 -------- --------- Campanha 2 10 8 12 7 9 10 11 Campanha 3 7 5 8 6 7 5 --------- O nível de significancia de 1%, teste a hipótese de que há diferença entre as três campanhas relativamente à sua eficácia. Seja Xi a v.a. que representa o volume de vendas de uma loja sujeita à campanha I (i=1, 2 ou 3). Admitamos que X1, X2 e X3 têm distribuição normal com iguais variâncias. Dados: N Média Desvio padrão Campanha (1) 5 6,4 1,140175 Campanha (2) 7 9,5714 1,718249 Campanha (3) 6 6.333 1,21106 Dados: 611,7 675 333,665714,974,65 21 2211 k kk nnn xnxnxn x 13 )611,7333,6(6)611,75714,9(7)611,74,6(5 1 )()()( 22223 2 22 2 112 k xxxxnxxn sE 2Es 22,015 4 3675 21106,1)16(718249,1)17(140175,1)15()1()1()1( 222 22 22 2 112 kn snsnsn s kkD 2,01652 Ds HIPÓTESES 3210 : H (não há diferença entre as campanhas de marketing relativamente ao volume médio de vendas a que conduzem) :1H Existe pelomenos um grupo com media diferente (pelo menos uma campanhas de marketing que conduziu um volumes médios de vendas diferentes) 05,0%5 Estatística do teste: ;~ );;1(2 2 knK D E F s s F Regra de decisão: 359,6)01,0;15;2()01,0;318;13();;1( FFF knK Rejeitar )( 3210 H se 359,6calculadoF 917,10 2,0165 015,22 2 2 D E s s F Decisão: Rejeitar )( 3210 H Conclusão: A o nível de significância de 1%, há evidências suficientes para apoiar afirmação de há diferença entre as três campanhas relativamente à suaeficácia. TESTES DE COMPARAÇÃO MÚLTIPLA Quando a aplicação da análise de variância conduz à rejeição da hipótese nula, temos evidência de que existem diferenças entre as medias populacionais. Mas, entre que médias se registam essas diferenças? Os testes de comparação múltipla permitem responder à questão anterior, isto é, permitem investigar onde se encontram as diferenças possíveis entre k medias populacionais. Existem muitos testes deste tipo, no entanto, aqui vamos abordar apenas dois: teste HSD (honestly significant difference) de Tuckey teste de Scheffé Estes testes permitem examinar simultaneamente pares de médias amostrais para identificar quais os pares onde se registam diferenças significativas. Nota: Os testes de comparação Multipla não vão ser desenvolvidos com mais detalhes nesta disciplina, deixando uma recomendação para que cada estudantes, caso queira aprofundar esses tema, vá fazer leitura nos Livros, que constam nss referencias Bibliografica mencionadas no plano Tematico da disciplina entregue no inicio do semestre. 5 UNIVERSIDADE EDUARDO MONDLANE FACULDADE DE LETRAS ADMINISTRAÇÃO PÚBLICA Resumo Teorico da Aula 9: Teste de hipóteses Métodos Quantitativos II 2º Semestre de 2019 Ficha n 0 9: ANOVA (Análise de variância) de um factor (One Way) 1. Em um curso de extensão universitária pesquisaram-se os salários mensais (em unidades de referência) e a área de formação acadêmica dos estudantes, com base em uma amostra aleatória. Após eliminar-se os dados excessivamente discrepantes, obteve-se o resultado abaixo. n Média Desvio Padrão Ciências Socias 21 31 19 Psicologia 15 34 28 Engenharias 7 38 22 a) Calcule a estimativa da variância dentro dos grupos (variação dentro dos grupos). b) Calcule a estimativa da variância entre os grupos (variação entre os grupos). c) Ao nível de significância de 0,05, podemos considerar que os salários de cada área são iguais? 2. Suponhamos que um pesquisador conduziu um experimento inteiramente ao acaso em um conjunto de dados que se pressupõe que sejam normalmente distribuídos e que possuem variância e iguais (homogeneas). O interiesse do pesquisador é avaliar se existe uma diferença significativa entre os tratamentos T1, T2 e T3. Ao nível de significância de 5% teste afirmação de existe uma diferença significativa entre os tratamentos? T1 T2 T3 3 11 16 5 12 21 4 10 17 n 3 3 3 Média 3 11 18
Compartilhar