Buscar

Aula14 teste duas amostras

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

TESTE DE HIPÓTESES COM DUAS AMOSTRAS 
 
TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS 
 
 A hipótese nula (Ho) usualmente testada é a de que as duas amostras tenham sido obtidas de 
populações com médias iguais, ou seja ( ) 0021 =− μμ . 
 O uso da distribuição normal para duas amostras independentes é utilizada sempre σ (desvio-
padrão da população) for conhecido ou variâncias populacionais conhecidas (σ2). 
 
 Utiliza-se a distribuição t de Student se σ for desconhecido, ou seja, quando o desvio-padrão 
da amostra for conhecido E NÃO O DA POPULAÇÃO, ou seja, variâncias desconhecidas (s2). O uso 
da distribuição de Student (t) leva em conta se as variâncias populacionais são equivalentes ou diferentes. 
 Estudaremos os seguintes casos: 
 
 A) POPULACÕES NORMAIS COM VARIÂNCIAS CONHECIDAS 
 
 Consideremos duas populações normais independentes com médias 1μ e 2μ e variâncias e , 
sendo e duas amostras independentes obtidas, respectivamente, dessas populações, e 
2
1σ 22σ
1n 2n 1x e 2x suas 
médias. 
 A estatística de teste a ser usada é: 
 
 ( )
2
2
2
1
2
1
21
c
nn
xxz σ+σ
−= 
 
 
 
 
 
 
 
 
 B) POPULACÕES NORMAIS COM VARIÂNCIAS DESCONHECIDAS E EQUIVALENTES 
 
 Quando as variâncias de duas populações Normais forem desconhecidas, mas iguais usamos uma 
media ponderada das variâncias amostrais e , no cálculo da estatística de teste : 21s
2
2s ct
 
( )
2nn
S).1n(S).1n(ˆ
ˆ.
n
1
n
1
xxt
21
2
22
2
112
2
21
21
c
−+
−+−=σ
σ⎟⎟⎠
⎞⎜⎜⎝
⎛ +
−= 
 
 
 
 
 
 
 
 
 
 
 A distribuição t é utilizada com um número de graus de liberdade igual a gl = n 221 −+n
 
 
 
 
1
 
 C) POPULACÕES NORMAIS COM VARIÂNCIAS DESCONHECIDAS E DIFERENTES 
 
 Quando as variâncias de duas populações Normais forem desconhecidas e diferentes, usamos as 
variâncias amostrais e , no cálculo da estatística de teste : 21s
2
2s ct
 ( )
2
2
2
1
2
1
21
c
n
s
n
s
xxt
+
−= 
 
 
 
 
 
 
 
 A distribuição t é utilizada com um número de graus de liberdade igual a: 
 
 
2
11 2
2
2
2
2
1
2
1
2
1
2
2
2
1
2
1
−
+
⎟⎟⎠
⎞
⎜⎜⎝
⎛
++
⎟⎟⎠
⎞
⎜⎜⎝
⎛
⎟⎟⎠
⎞
⎜⎜⎝
⎛ +
=
n
n
s
n
n
s
n
s
n
s
gl 
 
 
 
 
 
 
 
 
 
 
 
TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS COM 
OBSERVACÕES EMPARELHADAS 
 
 Fazemos testes de comparação de médias para dados emparelhados (amostras dependentes), obtidas 
de populações Normais. Para cada par definido, o valor da primeira amostra está claramente associado ao 
respectivo valor da segunda amostra. 
 Para observações emparelhadas, ou amostras pareadas, o teste apropriado para a diferença entre duas 
médias consiste em determinar primeiro a diferença “d” entre cada par de valores, e então testar a hipótese 
nula de que a média das diferenças na população é zero. Então, do ponto de vista de cálculo, o teste é 
aplicado a uma única amostra de valores d. 
 A média e o desvio padrão da amostra de valores “d” são obtidos pelas fórmulas: 
 
 
1n
d.ndS
22
d −
−= ∑ n
d
d ∑= 
 
 
 
 A estimativa do erro padrão da diferença média entre observações emparelhadas é obtida pela 
fórmula: 
 
n
Sˆ d
d
=σ 
 
 
 
 
 
2
 
 Uma vez que o erro padrão da diferença média é calculado com base nas diferenças observadas em 
amostras emparelhadas (logo σ é desconhecido) e uma vez que os valores de d geralmente podem ser 
admitidos como tendo distribuição Normal, as distribuições t são apropriadas para testar a hipótese nula de 
que 0=dμ . A distribuição t nesse caso terá um número de graus de liberdade igual a: gl = n-1 
 A estatística de teste, então, será dada por: 
 
d
d
c ˆ
d
t oσ
μ−= 
 
 
 
 
 
 
 
 
 
TESTE QUI-QUADRADO PARA DUAS AMOSTRAS NÃO-RELACIONADAS 
(OU TESTE DE INDEPENDÊNCIA: TABELAS DE CONTINGÊNCIA) 
 
 
A utilização em pesquisa de marketing do teste qui-quadrado para duas amostra não-relacionadas 
é para verificar se as distribuições absolutas de duas amostras não-relacionadas diferem 
significativamente em relação a determinada variável. Por exemplo: verificar se as classes 
socioeconômicas diferem significativamente no consumo de determinado produto; verificar se as 
escolhas do tamanho do automóvel difere significativamente em função do tamanho da família etc. 
 
Condições para utilização: 
 
Dados qualitativos. 
Distribuição dos dados em freqüências absolutas. 
Amostras não-relacionadas ou independentes. 
Não pode ser utilizado se mais de 20% das freqüências absolutas forem inferiores a 5 ou se 
qualquer freqüência for inferior a 1. Nestes casos a solução para tornar a utilização do teste possível 
é a de agrupar células até ter as condições atendidas. 
 
Conceito: 
 
O teste qui-quadrado para duas amostras não-relacionadas é, semelhantemente ao teste qui-
quadrado de uma amostra, um teste do tipo aderência, isto é, o quanto que a distribuição observada 
(Oi) se ajusta à distribuição esperada (Ei). Através da comparação entre Oi e Ei, aceita-se ou rejeita-
se H0, a determinado nível de significância α. 
 
Procedimento sumarizado do teste: 
 
1) Formular as hipóteses 
 
 H0: As variáveis envolvidas são independentes. 
 Ha: As variáveis envolvidas não são independentes. 
 
2) Calcular a estatística de teste 
 
 
3
 ( Oij – Eij )2 
Χ2 = ∑ ∑ ----------------- 
 i j Eij 
3) Encontrar o valor crítico na tabela qui-quadrado 
 O valor do χ2tabelado correspondente encontra-se na linha (r-1).(k-1) e na coluna α, sendo “r” e 
“k”, respectivamente, o nº de categorias das variáveis envolvidas no estudo. 
 
4) Concluir 
 Se χ2calculado for menor do que o χ2tabelado, rejeita-se H0. 
 
5) Interpretar 
 Ex.: Para α = 0,05, pode-se afirmar que o consumo do produto P depende da classe 
socioeconômica. Os dados amostrais indicam que a classe D é a que mais consome o produto e 
a classe A é a que menos consome. 
 
Aplicação: 
A Albert’s Brewery of Tucson, Arizona, fabrica e distribui três tipos de cerveja: light, normal e 
escura. Em uma análise de segmentos de mercado para as três cervejas, o grupo de pesquisa de 
mercado da empresa levantou a questão de que a preferência pelos três tipos de cerveja varia de 
acordo com o sexo do consumidor. Se a preferência pela cerveja independe do sexo, uma campanha 
publicitária será iniciada para todas as cervejas da Alber. Entretanto, se a preferência pela cerveja 
depende do sexo do consumidor, a empresa adaptará suas promoções para diferentes mercados-
alvo. 
 
Uma amostra aleatória simples de 150 consumidores de cerveja foi selecionada. Depois de 
experimentar cada cerveja, os indivíduos assinalaram suas preferências ou primeira escolha. De 
acordo com o sexo e o tipo de cerveja preferida, obteve-se a seguinte tabulação cruzada resumindo 
as respostas do estudo 
: 
Preferência de cerveja SEXO 
Light Normal Escura 
TOTAL 
Masculino 20 40 20 80 
Feminino 30 30 10 70 
TOTAL 50 70 30 150 
 
PROCEDIMENTO PARA O TESTE DE HIPÓTESES: 
 
1) HIPÓTESES 
Ho: A preferência pela cerveja é independente do sexo do consumidor 
Ha: A preferência pela cerveja não é independente do sexo do consumidor. 
 
2) CÁLCULO DA ESTATÍSTICA DE TESTE 
Supondo que a hipótese nula é verdadeira, isto é, as variáveis são independentes, devem-se calcular 
as freqüências esperadas para cada célula da tabela. Verificamos que 50/150=0,3333 ou 33,33% 
prefere cerveja light; 70/150= 0,4667 ou 46,67% prefere a normal e 30/150=0,20 ou 20% prefere 
cerveja escura. 
Portanto, para uma amostra de 80 homens, esperamos que 50/150 x 80 =26,67 homens (ou 33,33% 
dos 80 homens ) prefiram cerveja light; 70/150 x 80 =37,33 prefiram cerveja normal( ou 46,67% 
dos 80 homens) e 30/150 x 80 =16 prefiram cerveja escura ( ou 20 % dos 80 homens). Para as 70 
 
4
mulheres o raciocínio é o mesmo: 50/150 x 70= 23,33 mulheres prefiram a light: 70 /150 x 70= 
32,67 prefiram a normal e 30/150 x 70= 14 prefiram a escura. 
 
Observe que o cálculo pode ser resumido assim: 
 
 (Total da linha i) x (Total da coluna j) 
Eij = .............................................................. 
Tamanho da amostra. 
 
Os valores esperados supondo que Ho é verdadeira estão na tabela abaixo. 
OBS: Note que as somas das colunas e linhas não se alteraram: 
 
Preferência de cerveja SEXO 
Light Normal Escura 
TOTAL
Masculino 26,67 37,33 16 80 
Feminino 23,33 32,67 14 70 
TOTAL 50 70 30 150 
 
Estatística de teste: 
 
 ( Oij – Eij )2 
Χ2 = ∑ ∑ ----------------- 
 i j Eij 
 
 
Preferência de cerveja SEXO 
Light Normal Escura 
TOTAL
Masculino 1,67 0,19 1,00 
Feminino 1,91 0,22 1,14 
TOTAL 6,13 
 
Calculando a estatística de teste, obtemos χcalculado = 6,13. 
 
3) VALOR CRÍTICO DO TESTE 
(número de linhas -1) x (número de colunas -1) = (2-1) (3-1)= 2. 
O valor crítico, na tabela da qui-quadrado, para alfa = 0,05, é χα = 5,99147. 
 
4) CONCLUSÃO 
Como o χcalculado > χα , rejeita-se Ho (0,025 < valor p < 0,05). 
 
 
5) INTERPRETAÇÃO 
Para α = 0,05, pode-se afirmar que a preferência pelo tipo de cerveja não é independente do sexo do 
entrevistado. Pela análise das freqüências esperadas e observados, há indicação que as mulheres tem 
preferência maior pela light e os homens pela normal e escura. 
 
5

Outros materiais