Grátis
57 pág.

Comparação entre duas populações
Denunciar
Pré-visualização | Página 3 de 4
crítica (5B) Nível Descritivo (6) Decidir e concluir (A) Se Zobs RC, rejeita-se H0 Se Zobs RC, não se rejeita H0 (B) Se P rejeita-se H0 Se P > não se rejeita H0 36 Exemplo 2 : Para investigar a lealdade de consumidores a um determinado produto, sorteou-se uma amostra de 200 homens e 200 mulheres. Foram classificados como tendo alto grau de fidelidade 100 homens e 120 mulheres. Os dados trazem evidências de diferença de grau de fidelidade entre os sexos? Em caso afirmativo, construa um intervalo de confiança para a diferença. 37 Sejam: pH: proporção de homens com alto grau de fidelidade pM: proporção de mulheres com alto grau de fidelidade H0: pH = pM H1: pH pM , (1) Hipóteses estatísticas: (2) Estatística do teste (3) Fixar o nível de significância do teste : = 5% ) 11 )((1 )( MH MH nn pp pp Z ˆˆ ˆˆ MH MMHH nn pnpn p ˆˆ ˆ 38 nH = 200 100 com alto grau de fidelidade 0,5 200 100 ˆ Hp 0,6 200 120 ˆ Mp nM = 200 120 com alto grau de fidelidade (4) Calcular as medidas necessárias • Valor da estatística do teste: 01,2 200200 55,055,0 6,050 11 )(1 )( , zobs 0,55 200200 6,02005,0200 pˆ 39 P = 2 P(Z -2,01) = 0,044 (5A) Região crítica (5B) Nível Descritivo = 5% RC = {Z : Z < -1,96 ou Z > 1,96 } (6) Decidir e concluir (A) zobs RC, rejeita-se H0 (B) Se P rejeita-se H0 40 MH pp ˆ ˆ - fornece uma estimativa por ponto para a verdadeira diferença pH – pM das proporções populacionais. ˆˆˆˆ ˆˆ M MM H HH MH n pp n pp pp )(1)(1 1,96 - Um intervalo de confiança de 95% para a diferença pH - pM, usando a aproximação normal, é Note que o erro padrão da diferença das proporções amostrais não é o mesmo que aquele usado no teste; no teste de hipóteses, o erro padrão empregado foi baseado na suposição de que a hipótese nula era verdadeira; essa suposição não é necessária no cálculo de um intervalo de confiança. 41 0,5Hpˆ No exemplo, como e , um intervalo de confiança aproximado de 95% para pH – pM é 0,6Mpˆ )03,0 ;197,0( )097,01,0 ;097,01,0( 200 )6,01(6,0 200 )5,01(5,0 96,1 )6,05,0( Note que, como esperado, o intervalo não contém o valor zero. 42 AMOSTRAS DEPENDENTES (teste t-pareado) 43 característica das amostras dependentes (pareadas): para cada unidade amostral realizamos duas medições. As medidas são tomadas em um único “indivíduo” em dois pontos distintos no tempo. Em geral, observações pareadas correspondem a medidas tomadas antes e depois de uma dada intervenção -- cada indivíduo é examinado antes que um certo tratamento seja aplicado e novamente depois que o tratamento foi completado. Outro tipo de emparelhamento: o pesquisador “casa” os indivíduos de um grupo com aqueles de um segundo grupo, de modo que os membros de um par sejam parecidos (em relação a características, tais como, a idade e o gênero). 44 Planejamento empregado na tentativa de se controlar fontes de variação que poderiam influenciar os resultados da comparação. Se as medidas são feitas no mesmo sujeito uma certa variabilidade biológica é eliminada -- não temos que nos preocupar com o fato de um sujeito ser mais velho do que outro ou se um é homem e o outro é mulher. A intenção do emparelhamento é, portanto, fazer uma comparação mais precisa. 45 Exemplo 3: Uma empresa deseja estudar o efeito de uma pausa de dez minutos para um cafezinho sobre a produtividade de seus trabalhadores. Para isso, sorteou seis operários, e contou o número de peças produzidas durante uma semana sem intervalo e uma semana com intervalo. Os resultados sugerem se há ou não melhora na produtividade? Caso haja melhora, qual deve ser o acréscimo médio de produção para todos os trabalhadores da fábrica? Xi : número de peças produzidas pelo operário i na semana sem intervalo Operário 1 2 3 4 5 6 Sem intervalo 23 35 29 33 43 32 Com intervalo 28 38 29 37 42 30 Yi : número de peças produzidas pelo operário i na semana com intervalo 46 Efeito do emparelhamento: eliminar quaisquer distorções que poderiam ser introduzidas ao se comparar indivíduos que diferem com relação a outras variáveis, como idade, sexo, peso, etc. Suponha que os dois grupos de observações possam ser dispostos como a seguir: Variável de interesse: D = Y – X e uma amostra de D é d1, d2, ...dn Amostra 1 Amostra 2 x1 y1 x2 y2 ... ... xn yn di = yi - xi d1 = y1 - x1 d2 = y2 - x 2 ... dn = yn - xn 47 H0: D = 0 H1: D 0 ou D < 0 ou D > 0 O efeito produzido para o i-ésimo indivíduo pode ser representado pela variável diferença Di = Yi - Xi (“com”–“sem”) Supondo Di N(D, D 2), para i = 1, ..., n, numa situação geral, queremos testar as hipóteses: a pausa para o café não produz efeito A pausa aumenta a produtividade a pausa para o café produz algum efeito 48 O parâmetro D é estimado pela média amostral das diferenças: Como não temos informação sobre a variância das diferenças, estimamos seu valor por SD 2, dado por: n i iD n D 1 1 2 1 2 )( 1 1 DD n S i n i D Estatística do teste: nS D T D Sob H0, T tem distribuição t-Student com n-1 graus de liberdade. 49 • A média da amostra fornece uma estimativa por ponto para a verdadeira diferença das médias das populações D Y - X. • Em geral supomos que X e Y têm distribuição normal e, consequentemente, podemos considerar que a distribuição das diferenças tem distribuição normal. Obs.: no caso geral, é necessário uma verificação da suposição de normalidade da diferença Y-X pela análise gráfica e/ou testes de hipóteses. Comentários 50 Voltando ao exemplo, gostaríamos de saber se há alguma evidência estatística de que a pausa para o café aumenta a produtividade. (1) Hipóteses: H0: D = 0 H1: D > 0 que equivale a H0: X = Y H1: X < Y (2) Estatística de teste: . ,~ 0)1( Ht nS D T n D sob (3) Nível de significância: = 5%. 51 Amostra de pares di = yi - xi: 5, 3, 0, 4, -1, -2 (média amostral das diferenças) (desvio padrão das diferenças) 51 6 9 6 6 1 , d d i i 88,2 )( 6 1 2 1-6 i i D dd s (4) Calcular medidas necessárias 2761 6882 51 , , , tobs Sob a hipótese nula H0, T tem distribuição t-Student com 6 -1 = 5 graus de liberdade. (5A) Região Crítica = 5% RC = {T : T 2,015 } 52 (5B) Nível descritivo: P(T 1,276) 0,15 (valor exato: 0,129) não há evidência experimental para concluirmos que a a pausa para um cafezinho melhora a produtividade média. (6) Decidir e concluir (A) tobs RC não se rejeita H0 (B) P > não se rejeita H0 53 Se a hipótese