Baixe o app para aproveitar ainda mais
Prévia do material em texto
TESTE DE HIPÓTESES COM DUAS AMOSTRAS TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS A hipótese nula (Ho) usualmente testada é a de que as duas amostras tenham sido obtidas de populações com médias iguais, ou seja ( ) 0021 =− μμ . O uso da distribuição normal para duas amostras independentes é utilizada sempre σ (desvio- padrão da população) for conhecido ou variâncias populacionais conhecidas (σ2). Utiliza-se a distribuição t de Student se σ for desconhecido, ou seja, quando o desvio-padrão da amostra for conhecido E NÃO O DA POPULAÇÃO, ou seja, variâncias desconhecidas (s2). O uso da distribuição de Student (t) leva em conta se as variâncias populacionais são equivalentes ou diferentes. Estudaremos os seguintes casos: A) POPULACÕES NORMAIS COM VARIÂNCIAS CONHECIDAS Consideremos duas populações normais independentes com médias 1μ e 2μ e variâncias e , sendo e duas amostras independentes obtidas, respectivamente, dessas populações, e 2 1σ 22σ 1n 2n 1x e 2x suas médias. A estatística de teste a ser usada é: ( ) 2 2 2 1 2 1 21 c nn xxz σ+σ −= B) POPULACÕES NORMAIS COM VARIÂNCIAS DESCONHECIDAS E EQUIVALENTES Quando as variâncias de duas populações Normais forem desconhecidas, mas iguais usamos uma media ponderada das variâncias amostrais e , no cálculo da estatística de teste : 21s 2 2s ct ( ) 2nn S).1n(S).1n(ˆ ˆ. n 1 n 1 xxt 21 2 22 2 112 2 21 21 c −+ −+−=σ σ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ + −= A distribuição t é utilizada com um número de graus de liberdade igual a gl = n 221 −+n 1 C) POPULACÕES NORMAIS COM VARIÂNCIAS DESCONHECIDAS E DIFERENTES Quando as variâncias de duas populações Normais forem desconhecidas e diferentes, usamos as variâncias amostrais e , no cálculo da estatística de teste : 21s 2 2s ct ( ) 2 2 2 1 2 1 21 c n s n s xxt + −= A distribuição t é utilizada com um número de graus de liberdade igual a: 2 11 2 2 2 2 2 1 2 1 2 1 2 2 2 1 2 1 − + ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ ++ ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ + = n n s n n s n s n s gl TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS COM OBSERVACÕES EMPARELHADAS Fazemos testes de comparação de médias para dados emparelhados (amostras dependentes), obtidas de populações Normais. Para cada par definido, o valor da primeira amostra está claramente associado ao respectivo valor da segunda amostra. Para observações emparelhadas, ou amostras pareadas, o teste apropriado para a diferença entre duas médias consiste em determinar primeiro a diferença “d” entre cada par de valores, e então testar a hipótese nula de que a média das diferenças na população é zero. Então, do ponto de vista de cálculo, o teste é aplicado a uma única amostra de valores d. A média e o desvio padrão da amostra de valores “d” são obtidos pelas fórmulas: 1n d.ndS 22 d − −= ∑ n d d ∑= A estimativa do erro padrão da diferença média entre observações emparelhadas é obtida pela fórmula: n Sˆ d d =σ 2 Uma vez que o erro padrão da diferença média é calculado com base nas diferenças observadas em amostras emparelhadas (logo σ é desconhecido) e uma vez que os valores de d geralmente podem ser admitidos como tendo distribuição Normal, as distribuições t são apropriadas para testar a hipótese nula de que 0=dμ . A distribuição t nesse caso terá um número de graus de liberdade igual a: gl = n-1 A estatística de teste, então, será dada por: d d c ˆ d t oσ μ−= TESTE QUI-QUADRADO PARA DUAS AMOSTRAS NÃO-RELACIONADAS (OU TESTE DE INDEPENDÊNCIA: TABELAS DE CONTINGÊNCIA) A utilização em pesquisa de marketing do teste qui-quadrado para duas amostra não-relacionadas é para verificar se as distribuições absolutas de duas amostras não-relacionadas diferem significativamente em relação a determinada variável. Por exemplo: verificar se as classes socioeconômicas diferem significativamente no consumo de determinado produto; verificar se as escolhas do tamanho do automóvel difere significativamente em função do tamanho da família etc. Condições para utilização: Dados qualitativos. Distribuição dos dados em freqüências absolutas. Amostras não-relacionadas ou independentes. Não pode ser utilizado se mais de 20% das freqüências absolutas forem inferiores a 5 ou se qualquer freqüência for inferior a 1. Nestes casos a solução para tornar a utilização do teste possível é a de agrupar células até ter as condições atendidas. Conceito: O teste qui-quadrado para duas amostras não-relacionadas é, semelhantemente ao teste qui- quadrado de uma amostra, um teste do tipo aderência, isto é, o quanto que a distribuição observada (Oi) se ajusta à distribuição esperada (Ei). Através da comparação entre Oi e Ei, aceita-se ou rejeita- se H0, a determinado nível de significância α. Procedimento sumarizado do teste: 1) Formular as hipóteses H0: As variáveis envolvidas são independentes. Ha: As variáveis envolvidas não são independentes. 2) Calcular a estatística de teste 3 ( Oij – Eij )2 Χ2 = ∑ ∑ ----------------- i j Eij 3) Encontrar o valor crítico na tabela qui-quadrado O valor do χ2tabelado correspondente encontra-se na linha (r-1).(k-1) e na coluna α, sendo “r” e “k”, respectivamente, o nº de categorias das variáveis envolvidas no estudo. 4) Concluir Se χ2calculado for menor do que o χ2tabelado, rejeita-se H0. 5) Interpretar Ex.: Para α = 0,05, pode-se afirmar que o consumo do produto P depende da classe socioeconômica. Os dados amostrais indicam que a classe D é a que mais consome o produto e a classe A é a que menos consome. Aplicação: A Albert’s Brewery of Tucson, Arizona, fabrica e distribui três tipos de cerveja: light, normal e escura. Em uma análise de segmentos de mercado para as três cervejas, o grupo de pesquisa de mercado da empresa levantou a questão de que a preferência pelos três tipos de cerveja varia de acordo com o sexo do consumidor. Se a preferência pela cerveja independe do sexo, uma campanha publicitária será iniciada para todas as cervejas da Alber. Entretanto, se a preferência pela cerveja depende do sexo do consumidor, a empresa adaptará suas promoções para diferentes mercados- alvo. Uma amostra aleatória simples de 150 consumidores de cerveja foi selecionada. Depois de experimentar cada cerveja, os indivíduos assinalaram suas preferências ou primeira escolha. De acordo com o sexo e o tipo de cerveja preferida, obteve-se a seguinte tabulação cruzada resumindo as respostas do estudo : Preferência de cerveja SEXO Light Normal Escura TOTAL Masculino 20 40 20 80 Feminino 30 30 10 70 TOTAL 50 70 30 150 PROCEDIMENTO PARA O TESTE DE HIPÓTESES: 1) HIPÓTESES Ho: A preferência pela cerveja é independente do sexo do consumidor Ha: A preferência pela cerveja não é independente do sexo do consumidor. 2) CÁLCULO DA ESTATÍSTICA DE TESTE Supondo que a hipótese nula é verdadeira, isto é, as variáveis são independentes, devem-se calcular as freqüências esperadas para cada célula da tabela. Verificamos que 50/150=0,3333 ou 33,33% prefere cerveja light; 70/150= 0,4667 ou 46,67% prefere a normal e 30/150=0,20 ou 20% prefere cerveja escura. Portanto, para uma amostra de 80 homens, esperamos que 50/150 x 80 =26,67 homens (ou 33,33% dos 80 homens ) prefiram cerveja light; 70/150 x 80 =37,33 prefiram cerveja normal( ou 46,67% dos 80 homens) e 30/150 x 80 =16 prefiram cerveja escura ( ou 20 % dos 80 homens). Para as 70 4 mulheres o raciocínio é o mesmo: 50/150 x 70= 23,33 mulheres prefiram a light: 70 /150 x 70= 32,67 prefiram a normal e 30/150 x 70= 14 prefiram a escura. Observe que o cálculo pode ser resumido assim: (Total da linha i) x (Total da coluna j) Eij = .............................................................. Tamanho da amostra. Os valores esperados supondo que Ho é verdadeira estão na tabela abaixo. OBS: Note que as somas das colunas e linhas não se alteraram: Preferência de cerveja SEXO Light Normal Escura TOTAL Masculino 26,67 37,33 16 80 Feminino 23,33 32,67 14 70 TOTAL 50 70 30 150 Estatística de teste: ( Oij – Eij )2 Χ2 = ∑ ∑ ----------------- i j Eij Preferência de cerveja SEXO Light Normal Escura TOTAL Masculino 1,67 0,19 1,00 Feminino 1,91 0,22 1,14 TOTAL 6,13 Calculando a estatística de teste, obtemos χcalculado = 6,13. 3) VALOR CRÍTICO DO TESTE (número de linhas -1) x (número de colunas -1) = (2-1) (3-1)= 2. O valor crítico, na tabela da qui-quadrado, para alfa = 0,05, é χα = 5,99147. 4) CONCLUSÃO Como o χcalculado > χα , rejeita-se Ho (0,025 < valor p < 0,05). 5) INTERPRETAÇÃO Para α = 0,05, pode-se afirmar que a preferência pelo tipo de cerveja não é independente do sexo do entrevistado. Pela análise das freqüências esperadas e observados, há indicação que as mulheres tem preferência maior pela light e os homens pela normal e escura. 5
Compartilhar