A maior rede de estudos do Brasil

Grátis
57 pág.
Comparação entre duas populações

Pré-visualização | Página 1 de 4

1 
Comparação entre duas 
populações 
 AMOSTRAS INDEPENDENTES 
2 
Comparação entre 
duas médias 
3 
Na comparação de duas populações, dispomos de duas 
amostras, em que são possíveis as seguintes situações: 
Em aplicações práticas é comum que o interesse seja 
comparar as médias de duas diferentes populações (ambas as 
médias são desconhecidas). 
 variâncias pop. conhecidas 
variâncias pop. 
desconhecidas 

 iguais 
 diferentes 
 2 amostras 
 dependentes 
 independentes 
Discutiremos apenas os testes conhecidos como paramétricos, 
que assumem que as variáveis se comportam segundo um 
modelo Normal. 
Introdução 
4 
Exemplo 1: Um pesquisador deseja comparar o salário de 
profissionais da saúde de ambos os sexos. Para isso, 
selecionou uma amostra aleatória de 50 profissionais, sendo 
22 do sexo feminino e 28 do sexo masculino. Sabe-se, de 
estudos anteriores, que o salário de profissionais da saúde 
segue uma distribuição normal. 
 
Masculino Feminino 
4708 4412 4010 3768 
4603 3868 4122 3939 
4017 4252 4344 4459 
4534 4265 4446 3827 
4402 4377 3938 4197 
4526 4000 4514 4306 
4584 3441 3400 3935 
4594 4172 4264 3748 
4236 4203 3850 3838 
4817 4001 3676 4016 
4008 4464 3604 4274 
4083 4706 
3788 4681 
4009 4729 5 
Exemplo 1 
As duas populações, de onde as amostras são provenientes, 
são independentes e normalmente distribuídas; 
- a população dos salários de profissionais da saúde do sexo 
feminino tem média X e variância X
2 
  X ~ N(X, X
2) 
- a população dos salários de profissionais da saúde do sexo 
masculino tem média Y e variância Y
2 
  Y ~ N(Y, Y
2) 
 Interesse: Comparar as médias das duas populações. 
6 
• Hipóteses estatísticas: 
 da pop. normal com média X e desvio padrão X  extrai-se 
uma a.a. de tamanho n  
 H0: X = Y 
 H1: X  Y 
 ou X > Y 
 ou X < Y 
 H0: X - Y = 0 
 H1: X - Y  0 
 ou X - Y > 0 
 ou X - Y < 0 
ou, equivalentemente, 
usando diferenças  
X
X
Xs
x
 de amostra da padrão desvio
 de amostra da média :
 :
 da pop. normal com média Y e desvio padrão Y  extrai-se 
uma a.a. de tamanho m  
Ys
Yy
Y 
 : 
de amostra da padrão desvio :
de amostra da média
Obs.: note que os números de observações nas 2 amostras, 
n e m, não precisam ser iguais. 7 
grupo 1 grupo 2 
população 
média X
 Y 
desvio padrão X
 Y 
m n tamanho 
sY sX desvio padrão 
média 
amostra 
x y
Situações possíveis com respeito às variâncias X
2 e Y
2: 
1. conhecidas: teste Z 
2. desconhecidas: 
 - iguais: teste-t de duas amostras 
 - diferentes: teste-t modificado 
Obs.: O teste de comparação de variâncias pode ser utilizado 
como um procedimento preliminar em teste de comparação de 
médias, auxiliando a escolha da técnica adequada. 8 
CASO 1: variâncias conhecidas 
(1) Hipóteses estatísticas: 
 H0: X = Y 
 H1: X < Y 
 H0: X - Y = 0 
 H1: X - Y < 0 
ou, equivalentemente, 
usando diferenças  
(2) Estatística de teste 
Considere o Exemplo 1, dos salários de profissionais da saúde. 
Queremos verificar se o salário das mulheres é menor do que o 
dos homens. 
 Como X e Y são 
independentes com distribuição normal, com médias X e Y 
e desvio padrão X
2 e Y
2, respectivamente, então 
• Estimador de X - Y : YX - 
• Distribuição amostral do estimador: 
,






m
σ
n
σ
μμNYX YXYX
22
,~
9 
 Se as variâncias são conhecidas, a estatística de teste é 
dada por 
m
σ
n
σ
YX
Z
YX
22
)(
 


(2) Estatística de teste 
Sob H0, Z ~ N(0,1). 
(3) Nível de significância:  = 5% 
(4) Calcular medidas necessárias: 
 Média 
Masculino 4302,87 
Feminino 4021,68 
Informação dada: 
X= 280 e Y= 300 
 
10 
(5A) Região crítica 
(6A) Decidir e Concluir 
A região crítica deve ter a forma: RC = { Z ≤ ztab }  ztab = ? 
Da tabela da N(0,1), com  = 5%, ztab= -1,64 
  RC = { Z ≤ -1,64} 
(4) Calcular medidas necessárias: 
415,3
28
300
 
22
280
87,430268,4021




22
)(
obsz
 zobsRC  rejeita-se H0 
(5B) Nível descritivo P 
 P = P(Z ≤ -3,415) = 0,0003. 
(6B) Decidir e Concluir 
 P <   rejeita-se H0 11 
 As médias do salários das mulheres é menor do que a 
dos homens. Quão menor? 
• Intervalo de confiança para a diferença X-Y: 
 


























mn
zYX
mn
zYXP
z
mn
YX
zPzZzP
YX
tabYX
YX
tab
tab
YX
YX
tabtabtab
2222
22
)()( 
)(



 No exemplo: 
 IC(X-Y;10%) = (-281,19-1,6482,33; -281,19+1,6482,33;) 
 = (-416,21;-146,17) 12 
CASO 2: variâncias desconhecidas, iguais 
(1) Hipóteses estatísticas: 
 H0: X = Y 
 H1: X < Y 
 H0: X - Y = 0 
 H1: X - Y < 0 
ou, equivalentemente, 
usando diferenças  
(2) Estatística de teste 
Exemplo 1: salário de profissionais da saúde. Queremos verificar 
se o salário das mulheres é menor do que o dos homens. 
Suponha agora: NÃO conhecemos as variâncias. Temos apenas 
a informação de que são iguais (x= Y= ), mas não sabemos o 
valor. 
Temos que 
,
11
 



















mn
σμμN
m
σ
n
σ
μμNYX
YX
YX
YX
2
22
,~
,~
13 
Assim, 
)( 1 0,
11
)()(
2
N
mn
σ
μμYX
Z YX ~ 









. 
2
1)(1)( 222



mn
smsn
s YXp
Não conhecemos , precisamos estimar por: 
- A estimativa sp
2 combina informação de ambas amostras 
para se produzir uma estimativa mais confiável de 2; 
- Na verdade, sp
2 é média ponderada das duas variâncias 
amostrais sX
2 e sY
2, onde cada variância é ponderada pelos 
seus graus de liberdade associados; 
- Se n é igual a m, sp
2 é a média aritmética simples; caso 
contrário, maior peso é dado à variância da maior amostra. 
14 
(2) Estatística de teste 
)
mn
S
YX
T
p
11
(
)(
2 


(3) Nível de significância:  = 5% 
(4) Calcular medidas necessárias: 
 Média Desvio padrão 
Masculino 4302,87 335,74 
Feminino 4021,68 301,08 
s2p= [(22-1)301,08
2+(28-1)335,742] / (22+28-2) = 103065 
sp = 321,037 
 Sob H0, T ~ t (n+m-2). 
15 
(4) Calcular medidas necessárias: 
, 3,074- 
)
28
1
22
1
(321,037
4302,87)021,68(




4
obsT
(5A) Região crítica 
(6A) Decidir e Concluir 
 A região crítica deve ter a forma: RC = { T ≤ ttab }  ttab = ? 
 Da tabela da t(48 g.l.), com  = 5%, ttab= -1,68 
  RC = {T ≤ -1,68} 
 tobs  RC  rejeita-se H0 
(5B) Nível descritivo P 
 P= P(T ≤ -3,074) = 0,0017 
(6B) Decidir e Concluir 
 P <   rejeita-se H0 16 
• Intervalo de confiança para a diferença X-Y: 
 No exemplo: 
 IC(X-Y; 10%) = 
= (-281,19-1,68321,0370,285; -281,19+1,68321,0370,285) 
= (-434,85;-127,53). 
em que ttab é obtido da tabela t com (n+m-2) graus de 
liberdade. 
17 
CASO 3: variâncias desconhecidas, diferentes 
(1) Hipóteses estatísticas: 
 H0: X = Y

Crie agora seu perfil grátis para visualizar sem restrições.