A maior rede de estudos do Brasil

Grátis
57 pág.
Comparação entre duas populações

Pré-visualização | Página 3 de 4

crítica 
(5B) Nível Descritivo 
 (6) Decidir e concluir 
 (A) Se Zobs  RC, rejeita-se H0 
 Se Zobs  RC, não se rejeita H0 
 
 (B) Se P    rejeita-se H0 
 Se P >   não se rejeita H0 
36 
Exemplo 2 : Para investigar a lealdade de consumidores a um 
determinado produto, sorteou-se uma amostra de 200 homens 
e 200 mulheres. Foram classificados como tendo alto grau de 
fidelidade 100 homens e 120 mulheres. Os dados trazem 
evidências de diferença de grau de fidelidade entre os sexos? 
Em caso afirmativo, construa um intervalo de confiança para a 
diferença. 
 
37 
Sejam: pH: proporção de homens com alto grau de fidelidade 
 pM: proporção de mulheres com alto grau de fidelidade 
H0: pH = pM 
H1: pH  pM , 
(1) Hipóteses estatísticas: 
(2) Estatística do teste 
(3) Fixar o nível de significância do teste :  = 5% 
)
11
)((1
)(
MH
MH
nn
pp
pp
Z



ˆˆ
ˆˆ
 
 
MH
MMHH
nn
pnpn
p



ˆˆ
ˆ
38 
 nH = 200  100 com alto grau de fidelidade 
0,5
200
100
ˆ
Hp
0,6
200
120
ˆ
Mp
 nM = 200  120 com alto grau de fidelidade 
(4) Calcular as medidas necessárias 
• Valor da estatística do teste: 
01,2
200200
55,055,0
6,050










11
)(1
)(
 
,
zobs
0,55



200200
6,02005,0200
pˆ
39 
P = 2 P(Z  -2,01) = 0,044 
(5A) Região crítica 
(5B) Nível Descritivo 
 = 5%  RC = {Z : Z < -1,96 ou Z > 1,96 } 
 (6) Decidir e concluir 
 (A) zobs  RC, rejeita-se H0 
 
 (B) Se P    rejeita-se H0 
 
40 
MH pp ˆ ˆ - 
 fornece uma estimativa por ponto para a 
verdadeira diferença pH – pM das proporções 
populacionais. 
 
ˆˆˆˆ
 ˆˆ







 



M
MM
H
HH
MH
n
pp
n
pp
pp
)(1)(1
1,96 - 
Um intervalo de confiança de 95% para a diferença 
pH - pM, usando a aproximação normal, é 
Note que o erro padrão da diferença das proporções amostrais 
não é o mesmo que aquele usado no teste; 
no teste de hipóteses, o erro padrão empregado foi baseado 
na suposição de que a hipótese nula era verdadeira; essa 
suposição não é necessária no cálculo de um intervalo de 
confiança. 
41 
0,5Hpˆ
No exemplo, como e , um intervalo de 
confiança aproximado de 95% para pH – pM é 
0,6Mpˆ
)03,0 ;197,0(
)097,01,0 ;097,01,0(
200
)6,01(6,0
200
)5,01(5,0
96,1 )6,05,0(









 



Note que, como esperado, o intervalo não contém o valor zero. 
42 
AMOSTRAS DEPENDENTES 
(teste t-pareado) 
43 
 característica das amostras dependentes (pareadas): 
para cada unidade amostral realizamos duas medições. 
 As medidas são tomadas em um único “indivíduo” em dois 
pontos distintos no tempo. 
 Em geral, observações pareadas correspondem a medidas 
tomadas antes e depois de uma dada intervenção -- cada 
indivíduo é examinado antes que um certo tratamento seja 
aplicado e novamente depois que o tratamento foi completado. 
 Outro tipo de emparelhamento: o pesquisador “casa” os 
indivíduos de um grupo com aqueles de um segundo grupo, de 
modo que os membros de um par sejam parecidos (em 
relação a características, tais como, a idade e o gênero). 
44 
 Planejamento empregado na tentativa de se controlar 
fontes de variação que poderiam influenciar os resultados da 
comparação. 
 Se as medidas são feitas no mesmo sujeito uma certa 
variabilidade biológica é eliminada -- não temos que nos 
preocupar com o fato de um sujeito ser mais velho do que 
outro ou se um é homem e o outro é mulher. 
 
 A intenção do emparelhamento é, portanto, fazer uma 
comparação mais precisa. 
45 
Exemplo 3: Uma empresa deseja estudar o efeito de uma pausa de 
dez minutos para um cafezinho sobre a produtividade de seus 
trabalhadores. Para isso, sorteou seis operários, e contou o número 
de peças produzidas durante uma semana sem intervalo e uma 
semana com intervalo. Os resultados sugerem se há ou não melhora 
na produtividade? Caso haja melhora, qual deve ser o acréscimo 
médio de produção para todos os trabalhadores da fábrica? 
Xi : número de peças produzidas pelo operário i na semana sem 
intervalo 
Operário 1 2 3 4 5 6 
Sem intervalo 23 35 29 33 43 32 
Com intervalo 28 38 29 37 42 30 
Yi : número de peças produzidas pelo operário i na semana com 
intervalo 
46 
Efeito do emparelhamento: 
eliminar quaisquer distorções que poderiam ser introduzidas 
ao se comparar indivíduos que diferem com relação a outras 
variáveis, como idade, sexo, peso, etc. 
Suponha que os dois grupos de observações possam ser 
dispostos como a seguir: 
Variável de interesse: D = Y – X e uma amostra de D é 
d1, d2, ...dn 
Amostra 1 Amostra 2 
x1 y1 
x2 y2 
... ... 
xn yn 
di = yi - xi 
d1 = y1 - x1 
d2 = y2 - x 2 
... 
dn = yn - xn 
47 
H0: D = 0 
H1: D  0 ou 
 D < 0 ou 
 D > 0 
O efeito produzido para o i-ésimo indivíduo pode ser 
representado pela variável diferença Di = Yi - Xi (“com”–“sem”) 
Supondo Di  N(D, D
2), para i = 1, ..., n, 
 
numa situação geral, queremos testar as hipóteses: 
 a pausa para o café não produz efeito 
 
A pausa aumenta a 
produtividade 
 a pausa para o café produz algum efeito 
48 
O parâmetro D é estimado pela média amostral das diferenças: 
Como não temos informação sobre a variância das diferenças, 
estimamos seu valor por SD
2, dado por: 



n
i
iD
n
D
1
1
2
1
2 )(
1
1
DD
n
S i
n
i
D 

 

Estatística do teste: 
nS
D
T
D

Sob H0, T tem distribuição t-Student com n-1 graus de 
liberdade. 
49 
• A média da amostra fornece uma estimativa por ponto para a 
verdadeira diferença das médias das populações D  Y - X. 
• Em geral supomos que X e Y têm distribuição normal e, 
consequentemente, podemos considerar que a distribuição 
das diferenças tem distribuição normal. 
Obs.: no caso geral, é necessário uma verificação da 
suposição de normalidade da diferença Y-X pela análise gráfica 
e/ou testes de hipóteses. 
Comentários 
50 
Voltando ao exemplo, 
gostaríamos de saber se há alguma evidência estatística de 
que a pausa para o café aumenta a produtividade. 
(1) Hipóteses: 
H0: D = 0 
H1: D > 0 
que equivale a 
H0: X = Y 
H1: X < Y 
(2) Estatística de teste: 
. ,~ 0)1( Ht
nS
D
T n
D
sob
(3) Nível de significância:  = 5%. 
51 
Amostra de pares  di = yi - xi: 5, 3, 0, 4, -1, -2 
 
 (média amostral das diferenças) 
 
 
 (desvio padrão das diferenças) 
 
51
6
9
6
6
1 ,
d
d i
i



88,2
)(
6
1
2
 




1-6 
i
i 
D
dd
s
(4) Calcular medidas necessárias 
2761
6882
51
,
,
,
tobs 
Sob a hipótese nula H0, 
T tem distribuição t-Student com 6 -1 = 5 graus de liberdade. 
(5A) Região Crítica 
 = 5%  RC = {T : T  2,015 } 52 
(5B) Nível descritivo: 
 P(T  1,276)  0,15 (valor exato: 0,129) 
 não há evidência experimental para concluirmos que a 
a pausa para um cafezinho melhora a produtividade 
média. 
 (6) Decidir e concluir 
 (A) tobs  RC  não se rejeita H0 
 
 (B) P >   não se rejeita H0 
53 
Se a hipótese

Crie agora seu perfil grátis para visualizar sem restrições.