Buscar

Aula 9 teste ANOVA

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
 
UNIVERSIDADE EDUARDO MONDLANE 
FACULDADE DE LETRAS 
ADMINISTRAÇÃO PÚBLICA 
Resumo Teórico da Aula 9: Teste de hipóteses Métodos Quantitativos II 2º Semestre de 2019 
 Análise de variância (ANOVA-one way) 
 
A análise de variância é um teste estatístico amplamente difundido entre os analistas, e visa fundamentalmente 
verificar se existe uma diferença significativa entre as médias ( três ou mais médias) e se os factores exercem 
influência em alguma variável dependente. 
 
Os factores propostos podem ser de origem qualitativa ou quantitativa, mas a variável dependente necessariamente 
deverá ser quantitativa. 
 
 A principal aplicação da ANOVA (analise of variance) é a comparação de médias oriundas de três ou mais grupos 
diferentes, também chamados tratamentos, como por exemplo médias históricas de questões de satisfação, 
empresas que operam simultaneamente com diferentes rendimentos, entre muitas outras aplicações. 
 
Embora se denomine “análise de variância”, trata-se de um procedimento para averiguar se os valores 
médios são estatisticamente diferentes (e não para ver se as variâncias são diferentes). 
 
O nome resulta da ANOVA recorrer ao cálculo de variâncias para decidir se as médias são diferentes. 
 
O raciocínio é o seguinte: calcula-se a variância dentro de cada grupo e depois compara-se com a 
variância entre os grupos – se houver diferenças, é porque as médias dos grupos são diferentes. Isto é, Se 
a variância residual (variância dentro de cada grupo) for claramente inferior à variância entre grupos, 
então pode-se afirmar que os valores médios são diferentes. 
 Portanto, existem dois métodos para calcular-se a variância: dentro de grupos (
2
Ds ) e a variância das entre os grupos 
(
2
Es ). 
 
Pressupostos para realização do teste ANOVA 
 
 As amostras devem ser aleatórias e independentes 
 As populações de onde as amostras foram extraidas devem ter uma distribuição normal 
 Deve existir homogeneidade de variâncias isto é, os grupos devem ter variancias iguais 
( 223
2
2
2
1 .... k  ). 
 
A ANOVA é robusta face a violações de algumas condições referidas, nomeadamente a exigência 
de normalidade (desde que todos os grupos tenham dimensão suficiente) e a exigência da 
homogeneidade das variâncias (desde que os grupos tenham dimensão semelhante ou tamanhos de 
amostras iguais). 
 
Mais grave é a violação da independência das observações entre grupos (não devem estar 
correlacionados; resolve-se garantindo a aleatoriedade na formação dos grupos em comparação). 
 
HIPÓTESES 
kH   ....: 3210 
:1H Existe pelomenos um grupo com media diferente 
2 
 
ESTATISTICA DO TESTE 
 ;~ );;1(2
2
knK
D
E F
s
s
F  onde
1
)()()( 2222
2
112



k
xxnxxnxxn
s kkE 
k
kk
nnn
xnxnxn
x



21
2211
 
kn
snsnsn
s kkD



22
22
2
112 )1()1()1( 
knnnn  21 
 
K : numero de Médias (grupos) a comparar 
K – 1 : graus de liberdades do Numerador 
n – k : graus de liberdades do Denominador 
 
REGRA DE DECISÃO: 
Rejeitar )....(: 3210 kH   se );;1( knKcalculado FF  
Nota: o distribuição F no teste ANOVA é sempre unilateral a direita. 
Se não se rejeitar H0, é fácil concluir que os grupos são idênticos. Mas se se rejeitar H0, apenas 
sabemos que pelo menos um dos grupos é diferente dos restantes. Como determinar os grupos 
que diferem entre si? 
 
Existem inúmeros procedimentos para decidir que média são realmente diferentes umas das outras, 
nomeadamente, Teste de Tukey; Teste de Tukey-kramer ; Teste de Dunnet; Teste de Scheffe; teste da 
diferença mínima significativa (least significant difference (LSD) test) e Teste de Bonferroni. Todos estes 
procedimentos consistem em comparar pares de médias. (nesta disciplina, os testes de comparação 
múltiplas não serão tratados ou desenvolvidos) 
 
 
Exemplo1: O aumento de peso de mulheres grávidas parece ter um efeito importante no peso dos bebês. Se o 
aumento de peso não é adequado, a criança tem mais probabilidades de ser pequena e tenderá a ser menos 
saudável. Num estudo conduzido em três províncias moçambicanas, registaram-se os aumentos de peso (em Kg) das 
mulheres durante o 3o trimestre de gravidez: 
 N Média Desvio padrão 
Maputo (1) 46 3,7 2,5 
Inhambane (2) 111 3,1 1,8 
 Niassa (3) 52 2,9 1,8 
O nível de significancia de 5%, teste a hipótese de que em média o aumento de peso, das mulheres grávidas nas três 
províncias observadas é o mesmo. 
Dados: 182,3
5211146
9,2521,31117,346
21
2211 






k
kk
nnn
xnxnxn
x 
13
)182,39,2(52)182,31,3(111)182,37,3(46
1
)()()( 2221
2
3
2
22
2
112






k
xxxxnxxn
sE
2Es 8,612249 
3,897524
3209
8,1)152(8,1)1111(5,2)146()1()1()1(
22222
22
2
112 






kn
snsnsn
s kkD
 
 
3 
 
HIPÓTESES 
3210 :  H 
:1H Existe palomemos um grupo com média diferente 
05,0%5  
Estatística do teste: ;~ );;1(2
2
knK
D
E F
s
s
F  
Regra de decisão: 033,3)05,0;206;2()05,0;3209;13();;1(   FFF knK  
Rejeitar )( 3210  H se 033,3calculadoF 
2097,2
3,897524
612249,8
2
2

D
E
s
s
F 
Decisão: Não rejeitar )( 3210  H 
Conclusão: A o nível de significância de 5%, há evidências suficientes para apoiar afirmação de em média o aumento 
de peso, das mulheres grávidas nas três províncias observadas é o mesmo. 
Exemplo2: Suponha que é director de marketing de uma empresa que pretende relançar um produto no 
mercado. Você estudou três campanhas de marketing diferentes, cada uma deles combina de modo 
diferente factores como o preço do produto, a apresentação do produto, promoções associadas, etc. 
Qualquer uma destas campanhas é levada a cabo no ponto de venda, não havendo qualquer publicidade 
nos meios de comunicação. Cada uma delas é feita num conjunto de lojas seleccionadas aleatoriamente, 
durante um período de duração limitada. Note que as lojas são seleccionadas de modo a que as três 
amostras sejam aleatórias e independentes entre si. As vendas (em unidades monetárias – u. m.) registadas 
durante este período constam da tabela seguinte. 
 
Campanha 1 8 6 5 6 7 -------- --------- 
Campanha 2 10 8 12 7 9 10 11 
Campanha 3 7 5 8 6 7 5 --------- 
 
O nível de significancia de 1%, teste a hipótese de que há diferença entre as três campanhas relativamente à 
sua eficácia. 
 
 Seja Xi a v.a. que representa o volume de vendas de uma loja sujeita à campanha I (i=1, 2 ou 3). 
 Admitamos que X1, X2 e X3 têm distribuição normal com iguais variâncias. 
 
Dados: 
 N Média Desvio padrão 
Campanha (1) 5 6,4 1,140175 
Campanha (2) 7 9,5714 1,718249 
Campanha (3) 6 6.333 1,21106 
Dados: 
611,7
675
333,665714,974,65
21
2211 






k
kk
nnn
xnxnxn
x 
13
)611,7333,6(6)611,75714,9(7)611,74,6(5
1
)()()( 22223
2
22
2
112






k
xxxxnxxn
sE
2Es 22,015 
4 
 
3675
21106,1)16(718249,1)17(140175,1)15()1()1()1( 222
22
22
2
112






kn
snsnsn
s kkD
 2,01652 Ds 
HIPÓTESES 
3210 :  H 
(não há diferença entre as campanhas de marketing relativamente ao volume médio de vendas a que conduzem) 
:1H Existe pelomenos um grupo com media diferente 
(pelo menos uma campanhas de marketing que conduziu um volumes médios de vendas diferentes) 
 
05,0%5  
Estatística do teste: ;~ );;1(2
2
knK
D
E F
s
s
F  
Regra de decisão: 359,6)01,0;15;2()01,0;318;13();;1(   FFF knK  
Rejeitar )( 3210  H se 359,6calculadoF 
917,10
2,0165
015,22
2
2

D
E
s
s
F 
Decisão: Rejeitar )( 3210  H 
Conclusão: A o nível de significância de 1%, há evidências suficientes para apoiar afirmação de há 
diferença entre as três campanhas relativamente à suaeficácia. 
TESTES DE COMPARAÇÃO MÚLTIPLA 
 
Quando a aplicação da análise de variância conduz à rejeição da hipótese nula, temos evidência de que 
existem diferenças entre as medias populacionais. Mas, entre que médias se registam essas diferenças? 
 
Os testes de comparação múltipla permitem responder à questão anterior, isto é, permitem investigar onde 
se encontram as diferenças possíveis entre k medias populacionais. 
 
Existem muitos testes deste tipo, no entanto, aqui vamos abordar apenas dois: 
 
 teste HSD (honestly significant difference) de Tuckey 
 teste de Scheffé 
 
Estes testes permitem examinar simultaneamente pares de médias amostrais para identificar quais 
os pares onde se registam diferenças significativas. 
 
 
Nota: Os testes de comparação Multipla não vão ser desenvolvidos com mais detalhes nesta 
disciplina, deixando uma recomendação para que cada estudantes, caso queira aprofundar esses 
tema, vá fazer leitura nos Livros, que constam nss referencias Bibliografica mencionadas no plano 
Tematico da disciplina entregue no inicio do semestre. 
 
 
 
 
5 
 
 
UNIVERSIDADE EDUARDO MONDLANE 
FACULDADE DE LETRAS 
ADMINISTRAÇÃO PÚBLICA 
Resumo Teorico da Aula 9: Teste de hipóteses Métodos Quantitativos II 2º Semestre de 2019 
Ficha n
0
 9: ANOVA (Análise de variância) de um factor (One Way) 
 
1. Em um curso de extensão universitária pesquisaram-se os salários mensais (em unidades de referência) e a 
área de formação acadêmica dos estudantes, com base em uma amostra aleatória. Após eliminar-se os 
dados excessivamente discrepantes, obteve-se o resultado abaixo. 
 
 n Média Desvio Padrão 
Ciências Socias 21 31 19 
Psicologia 15 34 28 
Engenharias 7 38 22 
 
a) Calcule a estimativa da variância dentro dos grupos (variação dentro dos grupos). 
b) Calcule a estimativa da variância entre os grupos (variação entre os grupos). 
c) Ao nível de significância de 0,05, podemos considerar que os salários de cada área são iguais? 
 
2. Suponhamos que um pesquisador conduziu um experimento inteiramente ao acaso em um conjunto de 
dados que se pressupõe que sejam normalmente distribuídos e que possuem variância e iguais 
(homogeneas). O interiesse do pesquisador é avaliar se existe uma diferença significativa entre os 
tratamentos T1, T2 e T3. Ao nível de significância de 5% teste afirmação de existe uma diferença significativa 
entre os tratamentos? 
 
 
 T1 T2 T3 
 3 11 16 
 5 12 21 
 4 10 17 
n 3 3 3 
Média 3 11 18

Outros materiais