A maior rede de estudos do Brasil

Grátis
57 pág.
Comparação entre duas populações

Pré-visualização | Página 2 de 4

H1: X < Y 
 H0: X - Y = 0 
 H1: X - Y < 0 
ou, equivalentemente, 
usando diferenças  
(2) Estatística de teste 
Exemplo 1: salário de profissionais da saúde. Queremos verificar 
se o salário das mulheres é menor do que o dos homens. 
Suponha agora: NÃO conhecemos as variâncias e sabemos que 
são diferentes (x  Y ). 
Temos que 







m
σ
n
σ
μμN~YX YXYX
22
, 
18 
Assim, 
)(
22
1 0,
)()(
N
m
σ
n
σ
μμYX
Z
YX
YX ~ 









Não conhecemos X
2 e Y
2  estimamos por sx
2 e sY
2. 
Finalmente, a estatística de teste, sob H0, é 
.
)(
)(
22
m
S
n
S
YX
T
YX 


. 
/ 1)]()(1)()[(
)]()[(
22
222



mmsnns
msns
YX
YX
///
//
22

Sob H0, T ~ t(), em que  é o número de graus de liberdade 
dado por 
19 
(3) Nível de significância:  = 5% 
(4) Calcular medidas necessárias: 
 Média Desvio padrão 
Masculino 4302,87 335,74 
Feminino 4021,68 301,08 
 
 , -
,,
,,
tobs 123
28
74335
22
08301
874302684021
22












.147
1)]/(28/28)(335,741)/(22/22)[(301,08
/28)](335,74/22)[(301,08
2222
222
 , 



Assim, usamos   47. 
20 
(5A) Região crítica 
(6A) Decidir e Concluir 
A região crítica deve ter a forma: RC = {T ≤ ttab}  ttab = ? 
Da tabela da t(47 g.l.), com  = 5%, ttab= -1,68 
  RC = { T ≤ -1,68} 
 tobs RC  rejeita-se H0 
(5B) Nível descritivo P 
 P = P(T ≤ -3,12) = 0,0015 
(6B) Decidir e Concluir 
 P <   rejeita-se H0 
21 
• Intervalo de confiança para a diferença X - Y: 
 No exemplo: 
 IC(X-Y;10%) = (-281,19-1,6890,26; -281,19+1,6890,26) 
 = (-432,82; -129,56). 
em que ttab é obtido da tabela t com  graus de liberdade. 
22 
Comparação entre 
duas variâncias 
23 
Um teste de hipóteses importante consiste em verificar se 
duas populações têm a mesma variância. 
Considere uma amostra X1, ...,Xn de uma população com 
distribuição N(X, X
2) e uma amostra Y1, ...,Ym de uma 
população com distribuição N(Y, Y
2). Suponha que as duas 
amostras sejam independentes. 
(1) Hipóteses estatísticas: 
(2) Estatística de teste 
Se SX
2 e SY
2 são as variâncias amostrais respectivas, então a 
estatística do teste é 
2
2
Y
X
S
S
F 
 H0: 
2
X = 
2
Y 
 H1: X
2
  Y
2 ou X
2
 > Y
2 ou X
2
 < Y
2
 
24 
  Qual é a distribuição de probabilidade de F ? 
Se a hipótese nula H0 é verdadeira (X
2 = Y
2), a estatística 
F possui distribuição de probabilidade F de Snedecor com 
n-1 graus de liberdade no numerador e m-1 graus de 
liberdade no denominador. 
  2
)1(~ 

 n
X
X
σ
Sn
U 
2
2
1
Resultado: 
Sejam X ~ N(X, X
2) e Y ~ N(Y, Y
2) independentes. Para 
amostras aleatórias X1, X2, ..., Xn, de X e Y1, Y2, ..., Ym, de Y, 
temos 
  2
)1(~ 

 m
Y
Y
σ
Sm
V 
2
2
1
 
 
)1;1(~
1
1



 mnF
mV
nU
S
S
F
Y
X
2
2
Se X
2 = Y
2, então 
25 
Obtenção dos valores críticos: Teste bilateral 
• Para  fixado, encontre na tabela F(n-1; m-1) um valor f2 
tal que P(F (n-1; m-1) > f2) = /2 e 
• Para  fixado, encontre na tabela F(m-1; n-1) (observe 
que os g.l. foram trocados) um valor g1 tal que P(F (m-1; 
n-1) > g1) = /2 e calculamos f1=1/g1. 
(3) Nível de significância:  
(4) Calcular medidas necessárias: 
Obter SX
2 e SY
2,as variâncias amostrais, e calcular F. 
(5A) Região crítica 
Se H1: X
2
 > Y
2
 , 
Se H1: X
2
 < Y
2
 , 
Se H1: X
2
  Y
2
 , 
RC = {F: F < f } 
RC = {F: F < f1 ou F > f2 } 
RC = {F: F > f } 
26 
tabela 
(5B) Nível Descritivo 
P = P(F(n-1; m-1) < Fobs) 
P = 2  P(F(n-1; m-1) > Fobs) ou 
P = 2  P(F(n-1; m-1) < Fobs) 
P = P(F(n-1; m-1) > Fobs) 
 (6) Decidir e concluir 
 (A) Se Fobs  RC, rejeita-se H0 
 Se Fobs  RC, não se rejeita H0 
 
 (B) Se P    rejeita-se H0 
 Se P >   não se rejeita H0 
27 
Se H1: X
2
  Y
2
 , 
Se H1: X
2
 > Y
2
 , 
Se H1: X
2 
 < Y
2
 , 
28 
Intervalo de confiança para o quociente Y
2/X
2 
com coeficiente de confiança  
   
 























2
2
22
2
2
2
1222
22
1
2121
 
1
1
)1;1(
X
Y
X
Y
X
Y
YY
XX
S
S
f
S
S
fPf
S
S
fP
f
mV
nU
fPfmnFfP





29 
Considere o Exemplo 1, dos salários de profissionais da saúde. 
Queremos verificar se a variabilidade do salário das mulheres é 
igual à dos homens. 
(1) Hipóteses estatísticas: H0: M
2
  F
2 
 H1: M
2 
  F
2 
(2) Estatística de teste 
Se SM
2 e SF
2 são as variâncias amostrais respectivas, 
então a estatística do teste é 
27) ;21( ~ 
2
2
F
S
S
F
M
F
(3) Nível de significância  = 5%. 
(4) Calcular as medidas necessárias 
SM = 335,74 e SF = 301,08 804,0 
74,335
08,301
2
2
 obsF
(5A) Região crítica 
RC = {F : F < f1 ou F > f2 }, 
 sendo f1 e f2 obtidos por 
f2 : encontre na tabela F(21; 27) o valor f2 tal que 
P(F(21;27) > f2) = 0,025  f2 = 2,25 (aprox.) e 
f1 : encontre na tabela F(27; 21) um valor g1 tal que 
P(F (27; 21) > g1) = 0,025 e calculamos f1=1/g1=1/2,34 = 0,427 
RC = {F : F < 0,427 ou F > 2,25 }, 
(6) Decidir e concluir 
Fobs = 0,804  RC  não se rejeita H0 
(5B) Nível descritivo 
P = 2  P(F(21; 27) < 0,804) = 2  (1- 0,69) = 0,62 >  
 não se rejeita H0 
30 
Dist F 
31 
Intervalo de confiança de 95% para o quociente Y
2/X
2 : 
 O valor “1”  IC, como esperado. 
Comparação entre duas 
proporções 
32 
Como vimos para a média, muito frequentemente, podemos 
estar interessados na comparação de duas proporções de 
duas populações independentes. 
(1) Hipóteses estatísticas: H0: p1 = p2 
 H1: p1  p2 ou p1 > p2 ou p1 < p2 
 extraímos uma uma a.a. de tamanho n1 de uma população 
com proporção p1; se observamos x1 sucessos na amostra, 
então 
).ˆ 1
1
1
1 de pontual (estimador p
n
X
p 
 Analogamente, selecionamos uma amostra de tamanho n2 
da população com proporção p2 e se observamos x2 sucessos, 
então 
).ˆ 2
2
2
2 de pontual (estimador p
n
X
p 
(2) Estatística de teste 
33 
 
21
2211
nn
pnpn
p



ˆˆ
ˆ
A quantidade é uma média ponderada das duas proporções 
das amostras, e . 
pˆ
21 pp ˆ ˆ
. 
21
2 1
nn
XX



21
ˆ - ˆ pp
 
2
2
1
11
21
2121
))
)ˆˆ
)ˆˆ
n
pp
n
pp
ppVar
ppppE





(1(1
(
(
2 
 

Se a hipótese nula é verdadeira, temos que p1 = p2 = p, os 
dados de ambas as amostras podem ser combinados para 
estimar esse parâmetro comum, por 
34 
)
11
)( - (1
21 nn
pp ˆˆ
Sob a hipótese nula H, o estimador do erro padrão da 
diferença é dado por: 
21 p- p ˆ ˆ
• Estatística do teste: 
)
11
)((1
)(
21
21
nn
pp
pp
Z



ˆˆ
ˆˆ
 
 Se n1 e n2 são suficientemente grandes, essa 
estatística, sob H, tem uma distribuição normal com 
média 0 e desvio padrão 1. 
35 
(3) Nível de significância:  
(4) Calcular medidas necessárias 
(5A) Região

Crie agora seu perfil grátis para visualizar sem restrições.