Estatísticas amostrais
9 pág.

Estatísticas amostrais


DisciplinaEstatística I25.686 materiais123.521 seguidores
Pré-visualização9 páginas
4. Estat
´
ısticas amostrais
Enquanto que numa p opulac¸˜
ao as medidas de lo calizac¸˜
ao e dis-
p ers
˜
ao s˜
ao fixas, caracterizando a p opulac¸
˜
ao e designando-se p or
paametros, numa amostra estas medidas s
˜
ao estimativas dos pa-
rˆ
ametros da p opulac¸˜
ao e designam-se p or estat´ısticas.
Seja Xuma vari´
avel aleat´
oria que representa uma caracter
´
ıstica ob-
servada numa p opulac¸˜
ao. Efetuam-se nobservac¸˜
oes indep endentes
e em condic¸˜
oes id
ˆ
enticas.
Sejam X1,X2,...,Xnas nv.a. asso ciadas `
as nobservac¸˜
oes.
X1,X2,...,Xns˜
ao v.a. indep endentes seguindo a mesma distribui-
c¸
˜
ao.
A v.a. de dimens˜
ao n, (X1,X2,...,Xn) constitui uma amostra
aleat´oria; a amostra ´
e um valor particular da amostra aleat´
oria.
´
Oscar Felgueiras 4. Estat
´
ısticas amostrais 1 / 36
4. Estat
´
ısticas amostrais
A partir de uma amostra aleat´
oria X1,X2,...,Xn, vamos estar par-
ticularmente interessados em estimar:
a m
´
edia µda p opulac¸
˜
ao;
a vari
ˆ
ancia σ2da p opulac¸
˜
ao.
A estat
´
ıstica habitualmente usada para estimar a m
´
edia µ´
e a edia
amostral
X=X1+X2+. . . +Xn
n.
A m
´
edia amostral p o de ser vista como uma vari´
avel aleat´
oria. Se
considerarmos v´
arias amostras obtidas da mesma p opulac¸˜
ao, cada
uma ter´
a provavelmente uma m
´
edia diferente.
´
Oscar Felgueiras 4. Estat
´
ısticas amostrais 2 / 36
4.1. Amostragem de uma p opulac¸
˜
ao normal N(µ, σ 2)
edia amostral
Se XN(µ, σ 2), ent˜
ao
XN(µ, σ2
n).
Ou seja, a m
´
edia amostral tamb
´
em segue uma distribuic¸˜
ao normal
com m
´
edia µe desvio padr˜
ao σ /n. Em particular, reduzindo a
vari´
avel aleat´
oria obt
´
em-se
Xµ
σ /nN(0,1).
O desvio padr
˜
ao da m
´
edia amostral, σ /n´
e denominado p or erro
padr˜
ao da m
´
edia (σX, EPM ou SEM)
´
Oscar Felgueiras 4. Estat
´
ısticas amostrais 3 / 36
4.1. Exerc
´
ıcio 1
Sup onha que numa dada p opulac¸˜
ao o p eso corp oral ´
e normalmente
distribu
´
ıdo apresentando uma m
´
edia de 70 Kg e um desvio padr˜
ao
de 10 Kg.
a) Qual a probabilidade de uma amostra de 25 indiv
´
ıduos ter um
p eso m
´
edio entre 68 e 72 kg?
b) Estudou-se um grup o de 25 p essoas para as quais o p eso m
´
edio
foi de 74 Kg. Qual a probabilidade de se encontrar uma m
´
edia
igual ou sup erior a esta numa amostra de 25 indiv
´
ıduos?
c) Quais os valores m
´
edios do p eso que limitam os 95% valores
centrais (2.5% em cada cauda) em amostras de dimens
˜
ao 25?
d) Qual a dimens˜
ao amostral necess´
aria para que 95% das
m
´
edias amostrais estejam inclu
´
ıdas entre ±1 Kg da m
´
edia da
p opulac¸˜
ao?
´
Oscar Felgueiras 4. Estat
´
ısticas amostrais 4 / 36
4.1. Exerc
´
ıcio 1
Sup onha que numa dada p opulac¸˜
ao o p eso corp oral ´
e normalmente
distribu
´
ıdo apresentando uma m
´
edia de 70 Kg e um desvio padr˜
ao
de 10 Kg.
a) Qual a probabilidade de uma amostra de 25 indiv
´
ıduos ter um
p eso m
´
edio entre 68 e 72 kg?
Seja Xa vari´
avel aleat´
oria que representa o p eso corp oral em Kg de
um indiv
´
ıduo da p opulac¸˜
ao. Ent˜
ao
XN(70,102) e XN(70,102/25),
onde Xrepresenta a m
´
edia amostral de tamanho 25. Assim,
P(68 <X<72) 0.6827.
Em Excel:
NORM.DIST(72;70;2;TRUE)-NORM.DIST(68;70;2;TRUE)
Em R:
pnorm(72,70,2)-pnorm(68,70,2)
´
Oscar Felgueiras 4. Estat
´
ısticas amostrais 5 / 36
4.1. Exerc
´
ıcio 1
Sup onha que numa dada p opulac¸˜
ao o p eso corp oral ´
e normalmente
distribu
´
ıdo apresentando uma m
´
edia de 70 Kg e um desvio padr˜
ao
de 10 Kg.
b) Estudou-se um grup o de 25 p essoas para as quais o p eso m
´
edio
foi de 74 Kg. Qual a probabilidade de se encontrar uma m
´
edia
igual ou sup erior a esta numa amostra de 25 indiv
´
ıduos?
Tendo em conta que,
XN(70,22),
segue que
P(X74) 0.0228.
Em Excel:
1-NORM.DIST(74;70;2;TRUE)
Em R:
1-pnorm(74,70,2)
´
Oscar Felgueiras 4. Estat
´
ısticas amostrais 6 / 36
4.1. Exerc
´
ıcio 1
Sup onha que numa dada p opulac¸˜
ao o p eso corp oral ´
e normalmente
distribu
´
ıdo apresentando uma m
´
edia de 70 Kg e um desvio padr˜
ao
de 10 Kg.
c) Quais os valores m
´
edios do p eso que limitam os 95% valores
centrais (2.5% em cada cauda) em amostras de dimens
˜
ao 25?
Queremos no fundo determinar os quantis 0.025 e 0.975 da m
´
edia
amostral. Assim, os limites ser
˜
ao
66.08Kg e 73.92Kg.
Em Excel:
NORM.INV(0,025;70;2) e NORM.INV(0,975;70;2)
Em R:
qnorm(0.025,70,2) eqnorm(0.975,70,2)
´
Oscar Felgueiras 4. Estat
´
ısticas amostrais 7 / 36
4.1. Exerc
´
ıcio 1
Sup onha que numa dada p opulac¸˜
ao o p eso corp oral ´
e normalmente
distribu
´
ıdo apresentando uma m
´
edia de 70 Kg e um desvio padr˜
ao
de 10 Kg.
d) Qual a dimens˜
ao amostral necess´
aria para que 95% das
m
´
edias amostrais estejam inclu
´
ıdas entre ±1 Kg da m
´
edia da
p opulac¸˜
ao?
Queremos determinar o tamanho nda amostra tal que
P(69 <X<71) 0.95.
Dada a simetria da distribuic¸˜
ao da m
´
edia amostral, isto equivale a,
P(X<71) 0.975.
Como XN(70,(10/n)2), p o demos fazer a reduc¸˜
ao da vari´
avel
tomando ZN(0,1) e obtendo
P(X<71) = P(Z<71 70
10/n) = P(Z<n/10).
´
Oscar Felgueiras 4. Estat
´
ısticas amostrais 8 / 36
4.1. Exerc
´
ıcio 1
Sup onha que numa dada p opulac¸˜
ao o p eso corp oral ´
e normalmente
distribu
´
ıdo apresentando uma m
´
edia de 70 Kg e um desvio padr˜
ao
de 10 Kg.
d) Qual a dimens˜
ao amostral necess´
aria para que 95% das
m
´
edias amostrais estejam inclu
´
ıdas entre ±1 Kg da m
´
edia da
p opulac¸˜
ao?
A quest˜
ao resume-se agora a determinar ntal que
P(Z<n/10) 0.975,
ou seja, n/10 N0.975 (0,1) n(10N0.975 (0,1))2384.1
Assim, a dimens˜
ao amostral necess´
aria ´
e de 385.
Em Excel:
(10*NORM.S.INV(,975))ˆ2
Em R:
(10*qnorm(.975))ˆ2
´
Oscar Felgueiras 4. Estat
´
ısticas amostrais 9 / 36
4.1. Amostragem de uma p opulac¸
˜
ao normal N(µ, σ 2)
Variˆancia amostral
Se XN(µ, σ 2), ent˜
ao a variˆ
ancia amostral
σ2=S2=1
n1
n
X
i=1
(XiX)2
tem m
´
edia e variˆ
ancia resp etivamente iguais a
E(S2) = σ2,V(S2) = 2σ4
n1.
A sua distribuic¸˜
ao ´
e caracterizada p or
(n1)S2
σ2χ2(n1).
´
Oscar Felgueiras 4. Estat
´
ısticas amostrais 10 / 36
4.1. Exerc
´
ıcio 2
Sup onha que numa dada p opulac¸˜
ao o p eso corp oral ´
e normalmente
distribu
´
ıdo apresentando uma m
´
edia de 70 Kg e um desvio padr˜
ao
de 10 Kg.
a) Que p ercentagem das amostras de 25 indiv
´
ıduos tem um desvio
padr˜
ao maior que 10 kg?
b) Estudou-se um grup o A de 20 p essoas e um grup o B de 50.
Qual a probabilidade de a variˆ
ancia do grup o A ser maior que
a do grup o B?
c) Qual o valor da variˆ
ancia amostral do p eso que limita os 95%
menores valores em amostras de dimens˜
ao 25?
d) Qual a dimens
˜
ao amostral necess
´
aria para que o desvio padr˜
ao
da vari
ˆ
ancia amostral seja menor que 1?
´
Oscar Felgueiras 4. Estat
´
ısticas amostrais 11 / 36
4.1. Exerc
´
ıcio 2
X: p eso em Kg, XN(70,102)
a) Que p ercentagem das amostras de 25 indiv
´
ıduos tem um desvio
padr˜
ao maior que 10 kg?
Quer-se determinar a probabilidade do desvio padr
˜
ao de uma amos-
tra de tamanho 25 ser maior que 10, ou seja,
P(S>10),onde 24S2
102χ2(24)
Assim,
P(S>10) = P(S2>102) = P(24S2/102>24) 0.4616.
Em Excel:
1-CHISQ.DIST(24;24;TRUE)
Em R:
1-pchisq(24,24)
´
Oscar Felgueiras 4. Estat
´
ısticas amostrais 12 / 36