Buscar

04_ExerciciosResolvidos_InferenciaIndutiva_01_amostragem_n

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO
DEPARTAMENTO DE ESTATI´STICA E INFORMA´TICA - DEInfo
ESTATI´STICA EXPLORATO´RIA B
Resoluc¸a˜o dos exerc´ıcos das listas 15-16,
17-18, 19-20
Monitor: Nielson Avelino de Santana
Orientador: Paulo Renato Alves Firmino
25 de setembro de 2014
Suma´rio
0.1 [15-16] Planos Amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
0.2 [17-18] Estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
0.3 [17-18] Estimadores Me´dia & TCL . . . . . . . . . . . . . . . . . . . . . . . . . . 4
0.4 [17-18] Estimadores: Me´dia & Distribuic¸a˜o t-Student . . . . . . . . . . . . . . . . 7
0.5 [19-20] Estimadores - Me´dia & TCL: Tamanho da Amostra . . . . . . . . . . . . 9
Infereˆncia Indutiva
0.1 [15-16] Planos Amostrais
Exerc´ıcio 1 Recorra a sua calculadora para montar uma amostra aleato´ria simples envolvendo
(n=) 4 colegas de classe. O propo´sito sera´ estudar a proporc¸a˜o de recifenses na turma.
1. Qual e´ a populac¸a˜o sob estudo?
2. Qual e´ o paraˆmetro populacional de interesse?
3. Fac¸a uma ana´lise descritiva da amostra
4. Infira sobre a populac¸a˜o
5. Quais suposic¸o˜es embasam suas infereˆncias?
Antes de iniciamos a resoluc¸a˜o desta questa˜o, suponha que a populac¸a˜o (alunos da classe)
sob estudo seja a seguinte:
1. Joa˜o - Recife;
2. Jose´ - Camaragibe;
3. Hugo - Recife;
4. Rafael - Paulista;
5. Pedro - Recife;
6. Tiago - Paulista;
7. Elena - Olinda.
Resoluc¸a˜o Exerc´ıcio 1 Gerando uma amostra aleato´ria:
Para se gerar amostras aleato´rias, usa-se X ∼ Uniforme(a, b), onde a e b sa˜o respectivamente
os limites inferior e superior do intervalo sobre o qual deseja-se gerar nu´meros aleatorios.
De maneira geral, uma instaˆncia de X, x, pode ser obtida a partir da igualdade x = a +
(b − a) · u, onde u e´ uma instaˆncia da varia´vel U ∼ Uniforme(0, 1), conhecida como nu´mero
1
pseudo-randoˆmico e que pode ser gerada por calculadoras (algumas trazem a func¸ao RND, por
exemplo) ou por software (como Excel ou R).
Ressalta-se que como cada indiv´ıduo da populac¸a˜o a ser amostrada tem um identificador
(no inteiro entre 1 e N-tamanho da populac¸a˜o), a = 0.5 e b = N + 0.5 e faz-se necessa´rio
trabalhar com Int(x): o inteiro mais pro´ximo de x. Logo, em s´ıntese, apo´s se gerar um no
pseudo-randoˆmico no intervalo de 0 a 1, u, tem-se como indiv´ıduo a compor a amostra aquele
cujo identificador e´ Int[(a− 0.5) + (b− a+ 1) · u].
Considere que a amostra aleato´ria gerada seja a seguinte:
Elena - 7, Rafael - 4, Hugo - 3, Joa˜o - 1;
1.1) Como resposta para esta questa˜o temos os alunos da turma (que representam a po-
pulac¸a˜o sob estudo).
1.2) Buscamos estudar a proporc¸a˜o de recifenses da turma. Este e´ o paraˆmetro (populacio-
nal) sobre o qual desejamos inferir. Vale ressaltar que uma proporc¸a˜o tambe´m representa uma
me´dia.
1.3) A ana´lise descritiva permite sumarizar a amostra a partir de distribuic¸o˜es de frequeˆncia,
gra´ficos e medidas pontuais (como me´dia, mediana e variaˆncia), por exemplo. Nossa ana´lise
descritiva poderia partir de medidas de posic¸a˜o (tais como moda, mediana, me´dia) e dispersa˜o
(a exemplo da variaˆncia e IQV), ale´m de gra´ficos (pareto, pizza, barras).
Para esta questa˜o, temos a seguinte distribuic¸a˜o de frequeˆncias ordenada alfabeticamente a
partir do nome das cidades:
ı´ndice(i) Cidadei Frequeˆncia absoluta (ni) Frequeˆncia relativa (fi)
1 Olinda 1 0.25
2 Paulista 1 0.25
3 Recife 2 0.50
- Total 4 1.00
Temos na Figura 1 o gra´fico de setor (Pizza), onde as ”fatias”sa˜o proporcionais a`s frequeˆncias
relativas das cidades.
Medidas de Posic¸a˜o
Moda - A classe modal e´ aquela que apresenta a maior frequeˆncia absoluta (ou relativa). Po-
demos perceber enta˜o que a classe modal e´ a de Recife. Logo, a moda do conjunto de
dados e´ Recife e, de acordo com essa medida de posic¸a˜o, pode-se inferir que qualquer
aluno sorteado aleatoriamente da turma mais provavelmente sera´ de Recife.
Mediana - Como os dados observados sa˜o qualitativos e nominais, na˜o podendo ser ordenados,
na˜o e´ poss´ıvel extrair a mediana.
Me´dia - A exemplo da Mediana, a Me´dia na˜o deve ser aplicada a varia´veis nominais. De fato,
elas sa˜o restritas apenas a varia´veis quantitativas. Logo, na˜o cabe o uso da me´dia para a
varia´vel ”cidade de origem”.
Medidas de Dispersa˜o
IQV - E´ a raza˜o entre a quantidade de variac¸a˜o observada nos dados e a ma´xima variac¸a˜o
poss´ıvel, baseando-se na distribuic¸a˜o de frequeˆncias.
IQV =
k
(
n2 −
k∑
i=1
n2i
)
n2(k − 1)
k = 3 – numero de classes envolvidas na distribuic¸a˜o;
n = 4 – tamanho da amostra;
2
Figura 1: Gra´fico de setor (Pizza) que representa a frequeˆncia relativa de pessoas por cidade na
amostra.
ni(n1 = 1, n2 = 1, n3 = 2) – frequeˆncia absoluta da classe i;
IQVcidade origem =
3 · (42 − (12 + 12 + 22))
42 · (3− 1) =
3 · (16− 6)
16 · 2 = 0.9375
Como podemos observar, a variabilidade das pessoas acerca da sua cidade de origem e´
relativamente elevada. Isto, por exemplo, dificulta previso˜es sobre a cidade de origem de
um aluno sorteado aleatoriamente e reflete a distribuic¸a˜o dispersa desta varia´vel.
1.4) Como o pro´posito do exerc´ıcio e´ a ana´lise da proporc¸a˜o de recifenses na populac¸a˜o,
iremos fazer isto atrave´s da amostra que geramos.
Sejam n, r respectivamente o tamanho da amostra e o nu´mero de recifenses na amostra. Estima-
se a partir da amostra e sob uma abordagem frequentista que a proporc¸a˜o de recifenses na turma
sera´ algo em torno de:
pˆ =
r
n
=
2
4
= 50%.
Como estamos baseando esta hipo´tese em uma amostra, podemos naturalmente estar enga-
nados. Trata-se do risco que corremos por tentar inferir sobre um paraˆmetro a partir de uma
amostra. Vale ressaltar que para este caso conhecemos o valor do paraˆmetro; isto e´, a proporc¸a˜o
de recifenses na populac¸a˜o (a turma de alunos) e´ de 37 = 0.42. Assim, nossa estimativa na˜o seria
um chute nem ta˜o ruim nem ta˜o bom assim.
1.5) As suposic¸o˜es sa˜o condic¸o˜es impostas a` abordagem estat´ıstica devido a uma necessidade
pra´tica. Elas sa˜o adotadas para a resoluc¸a˜o do problema em questa˜o e por vezes tratam-se
de limitac¸o˜es que distanciam a modelagem estat´ıstica da realidade. Nesta questa˜o, todas as
infereˆncias foram baseadas na amostra, supo˜e-se que a amostra adotada, envolvendo apenas
4 indiv´ıduos, e´ representativa da populac¸a˜o. Supo˜e-se ainda que a proporc¸a˜o de recifenses se
3
mante´m constante ao longo dos indiv´ıduos. A partir de tal suposic¸a˜o e´ que infere-se sobre a
origem de qualquer dos indiv´ıduos no quesito 1.3). Desta forma, destaque-se que a suposic¸a˜o
quanto a` independeˆncia entre as origens dos indiv´ıduos na˜o e´ levada em conta, uma vez que na˜o
foi demandada para a abordagem estat´ıstica do problema.
Exerc´ıcio 2 Recorra a sua calculadora para montar uma amostra aleato´ria sistema´tica envol-
vendo (n=) 4 colegas de classe. O propo´sito sera´ estudar a proporc¸a˜o de recifenses na turma.
1. Como aplicar um experimento sistema´tico?
0.2 [17-18] Estimadores
Exerc´ıcio 2 Recorra a sua calculadora para montar treˆs amostras aleato´rias simples envol-
vendo (n=) 4 colegas de classe, cada uma. O propo´sito sera´ estudar a varia´vel “proporc¸a˜o
amostral de recifenses”.
1. Qual amostra de proporc¸o˜es voceˆ obteve?
2. Qual e´ a me´dia desta amostra?
3. Qual e´ a proporc¸a˜o de recifenses da amostra envolvendo todos os colegas selecionados?
Nossa populac¸a˜o em estudo continuara´ sendo a que trabalhamos no in´ıcio deste gabarito.
Resoluc¸a˜o Exerc´ıcio 2 Consideremos que as amostras aleato´rias simples geradas foram:
1a) 2, 4, 1, 6;
2a) 1, 6, 2, 5;
3a) 7, 5, 4, 2.
2.1) A soluc¸a˜o para essa questa˜o e´ listar a proporc¸a˜o de recifenses de cada amostra:1a) pˆ1 =
1
4
= 0.25
2a) pˆ2 =
2
4
= 0.5
3a) pˆ3 =
1
4
= 0.25
2.2) Como ja´ calculamos na questa˜o anterior a proporc¸a˜o de recifenses de cada amostra,
nessa questa˜o iremos calcular a me´dia dessas proporc¸o˜es.
x =
(14 +
2
4 +
1
4)
3
= 0.33
Logo, temos como me´dia das proporc¸o˜es amostrais de recifenses algo em torno de 33%.
2.3) A amostra de todos os selecionados e´ dada pelo conjunto 1, 2, 4, 5, 6, 7. Assim:
p̂ =
2
6
= 0.333
4
0.3 [17-18] Estimadores Me´dia & TCL
Exerc´ıcio 3
1. Suponha que a proporc¸a˜o de mulheres em uma turma seja de 50%. Qual e´ a probabilidade
de que, em uma amostra de 25 alunos da turma, a proporc¸a˜o amostral de mulheres seja:
(a) Inferior a 30%? (b) Superior a 40%? (c) Algo entre 60% e 70%?
2. Suponha que a porcentagem de brasileiros que votam em B seja de 46%. Qual e´ a proba-
bilidade de que, em uma amostra de 3265 eleitores, a proporc¸a˜o de votantes em B seja:
(a) Inferior a 30%? (b) Superior a 40%? (c) Algo entre 60% e 70%?
3. O governo de um pa´ıs assegura que, em me´dia, o custo da cesta ba´sica e´ de R$ 300.00, sob
um desvio-padra˜o de R$ 50.00. Qual e´ a probabilidade de que o custo me´dio da cesta de
uma amostra com 30 cidades seja: (a) Superior a R$ 400.00? (b) Menor que R$ 200.00?
(c) Entre R$ 100.00 e R$ 350.00?
4. Um frabricante de laˆmpadas assegura que o tempo de vida destas segue uma distribuic¸a˜o
normal com media de 6000 horas e desvio-padra˜o de 1000 horas. Qual e´ a probabilidade
de que o tempo de vida me´dio de uma amostra com 100 laˆmpadas seja: (a) Inferior a 4000
horas? (b) Superior a 8000 horas? (c) Algo entre 5000 horas e 7000 horas?
5. Quais suposic¸o˜es embasam as ana´lises acima?
Resoluc¸a˜o Exerc´ıcio 3
1) Seja:
n ≡ O tamanho da amostra;
p ≡ A proporc¸a˜o de mulheres na populac¸a˜o (na turma).
P̂ ≡ A proporc¸a˜o de mulheres na amostra a ser obtida (varia´vel aleato´ria).
n = 25 e p = 0.5.
P̂ ∼ N
(
µ
P̂
= p, σ2
P̂
=
p · (1− p)
n
)
; P̂ ∼ N
(
µ
P̂
= 0.5, σ2
P̂
=
0.25
25
= 0.01
)
a) Para esta questa˜o, busca-se a probabilidade de que em uma amostra contendo 25
pessoas, a proporc¸a˜o de mulheres seja menor que 30%, sendo que a proporc¸a˜o de
mulheres da turma (o paraˆmetro enfatizado) e´ de 50% e a variaˆncia e´ dada por
σ2
P̂
=
p(1− p)
n
= 0.01.
P (P̂ < 0.3) = P
(
P̂ − µ
P̂
σ
P̂
<
0.3− µ
P̂
σ
P̂
)
= P
(
Z <
0.3− 0.5
0.1
)
= P (Z < −2)
= 0.0228 = 2.28%
Assim, a probabilidade de que a proporc¸a˜o amostral de mulheres seja inferior a 30%,
em uma amostra envolvendo 25 pessoas de uma populac¸a˜o onde a real proporc¸a˜o de
mulheres e´ de 50%, e´ de 2.28%. Em outros termos, embora que seja poss´ıvel (ja´ que
5
P(P̂ < 0.3) > 0), e´ pouco prova´vel que tal evento ocorra. Mas e se, de fato, este evento
tiver ocorrido? Como proceder? A princ´ıpio, devemos lembrar que o paraˆmetro en-
fatizado (a proporc¸a˜o populacional neste caso) e´ usualmente questiona´vel diante de
amostras que o contradigam. Mesmo porque em muitas situac¸o˜es a u´nica coisa que
teremos em ma˜os sera´, de fato, a amostra.
b) Deseja-se obter P (X), onde X ≡ ”P̂ > 0.40”. Destaque-se que, a depender da tabela
adotada, pode-se calcular P (X) a partir de P (Y), onde Y ≡ ”P̂ ≤ 0.40”.
Destaque-se tambe´m que esses eventos sa˜o mutuamente exclusivos (disjuntos) e, se-
guindo os axiomas da probabilidade, P (X∪Y ) = P (X)+P (Y ) = 1, pois os eventos X
e Y mapeam todos os eventos poss´ıveis acerca de P̂ , ou seja, {X∪Y } = Ω
P̂
, onde Ω
P̂
representa o espac¸o de possibilidades de P̂ . Assim temos que P (Ω
P̂
)−P (X) = P (Y ).
P (P̂ ≤ 0.4) = P
(
P̂ − µ
P̂
σ
P̂
<
0.4− µ
P̂
σ
P̂
)
= P
(
Z ≤ 0.4− 0.5
0.1
)
= P (Z < −1)
= 0.1587 = 15.87%
P (P̂ > 0.4) = P (Ω
P̂
)− P (P̂ ≤ 0.4)
= 1− 0.1587
= 0.8413 = 84.13%
Assim, a probabilidade de termos uma proporc¸a˜o amostral de mulheres maior que
40% em uma amostra de 25 pessoas da turma e´ relativamente elevada. Logo, este
evento pode ser considerado algo normal considerando que p = 0.5.
c) Para esta questa˜o, pode-se recorrer ao fato de que
P (0.6 ≤ P̂ ≤ 0.7) = P (P̂ ≤ 0.7) - P (P̂ < 0.6). Assim,
P (0.6 ≤ P̂ ≤ 0.7) = P (P̂ ≤ 0.7)− P (P̂ < 0.6)
P (P̂ ≤ 0.7) = P
(
P̂ − µ
P̂
σ
P̂
≤ 0.7− µP̂
σ
P̂
)
= P
(
Z ≤ 0.7− 0.5
0.1
)
= P (Z ≤ 2)
= 0.9772 = 97.7%
P (P̂ < 0.6) = P
(
Z <
0.6− µ
P̂
σ
P̂
)
= P
(
Z <
0.6− 0.5
0.1
)
= P (Z < 1)
= 0.8413 = 84.13%
P (0.6 ≤ P̂ ≤ 0.7) = 0.9772− 0.8413 = 0.1359 = 13.59%
6
Logo, temos que 13.59% representa a probabilidade de que a proporc¸a˜o de mulheres
da amostra assuma valores entre 60% e 70%.
As questo˜es 2), 3), 4) ficam a cargo do aluno.
Dica: Para resolver as questo˜es 2), 3) e 4):
Nas questo˜es 1) e 2) a variaˆncia da proporc¸a˜o amostral e´ dada por σ2
P̂
=
p(1− p)
n
.
Nas questo˜es 3) e 4) a variaˆncia da me´dia amostral e´ dada por σ2
X
=
σ2
n
.
5) Para a 1a questa˜o, a principal suposic¸a˜o que se faz e´ a de que o estimador P̂ segue
uma distribuic¸a˜o Normal para o tamanho amostral adotado. Tal suposic¸a˜o fundamenta-se
no Teorema do Limite Central, que assegura que P̂ se distribuira´ normalmente para um
tamanho amostral razoavelmente grande. Uma outra suposic¸a˜o subjacente e´ a de que os
indiv´ıduos a compor as amostras sa˜o independentes entre si. Na 1a questa˜o, isto implica na
suposic¸ao de que o geˆnero de uma pessoa na˜o interfere no de outra, algo bastante plaus´ıvel
de maneira geral. Caso a suposic¸a˜o de independeˆncia na˜o fosse satisfeita, a adequada
formulac¸a˜o para a variaˆncia envolveria maiores sofisticac¸o˜es. Por fim, supo˜e-se que houve
esforc¸os para a elaborac¸a˜o de uma amostra representativa, sob o princ´ıpio da aleatoriedade.
0.4 [17-18] Estimadores: Me´dia & Distribuic¸a˜o t-Student
Exerc´ıcio 4
1. Um frabricante assegura que o tempo de vida me´dio de suas laˆmpadas e´ de 6000 horas.
A partir de uma amostra com 25 laˆmpadas, estima-se um desvio-padra˜o de 1000 horas e
questiona-se sobre a probabilidade de que o tempo de vida me´dio (de uma amostra com
25 laˆmpadas) seja: (a) Inferior a 4000 horas? (b) Superior a 8000 horas? (c) Algo entre
5000 horas e 7000 horas?
2. Estuda-se o custo da cesta ba´sica de dado estado. De uma amostra aleato´ria de 30 cidades,
obteve-se um desvio-padra˜o de R$ 50.00. O governo assegura que, em me´dia, o custo da
cesta ba´sica e´ de R$ 300.00. Qual e´ a probabilidade de que o custo me´dio de uma amostra
com 30 cidades seja: (a) Superior a R$ 400.00? (b) Menor que R$ 200.00? (c) Entre R$
100.00 e R$ 350.00?
3. Quais suposic¸o˜es embasam as ana´lises acima?
Resoluc¸a˜o Exerc´ıcio 4 Destaque-se que nestes casos, a variaˆncia foi sempre estimada a partir
da amostra. Isto introduz maior incerteza no estudo e, por isso, conduz a me´dias amostrais
que, quando normalizadas pela sua me´dia e desvio-padra˜o amostral, seguem uma distribuic¸a˜o
t− Student ao inve´s da Normal padra˜o (se a varia´vel em questa˜o seguir uma normal). Esta e´,
de fato, a principal dica para se saber quando recorrer a` t-Student: o uso da variaˆncia amostral.
4.1.a) Pede-se a probabilidade de que o tempo de vida em uma amostra de 25 laˆmpadas seja
menor 4000h.
Sejam,
n = 25 lampadas,
Xi ≡ ”O tempo consumido ate´ a falha da ia laˆmpada”, onde supo˜e-se que
Xi ∼ Normal(µ = 6000h, σ desconhecido), i = 1, 2, · · · , 25.
s = 1000h, onde s ≡ ”estimativa do desvio-padra˜o dos tempos ate´ a falha obtida da amos-
tra de 25 laˆmpadas”.
7
X − µX
s√
n
= Tn−1 ∼ t-Student com n− 1 graus de liberdade.
Pede-se P(X < 4000h).
P (X < 4000) = P
X − µXs√
n
<
4000− µX
s√
n

= P
Tn−1 < 4000− µ1000√
25

= P
(
Tn−1 <
4000− 6000
200
)
= P (Tn−1 < −10)
= P (Tn−1 > 10)
' 0⇒ 0%
Logo, e´ muitopouco prova´vel que ocorra de uma amostra envolvendo 25 laˆmpadas apre-
sentar um tempo de vida me´dio menor que 4000 horas se, de fato, µ = 6000.
4.1.b) Pede-se P(X > 8000h)=1-P(X ≤ 8000h).
P (X ≤ 8000) = P
X − µs√
n
≤ 8000− µs√
n

= P
Tn−1 ≤ 8000− µ1000√
25

= P
(
Tn−1 <
8000− 6000
200
)
= P (Tn−1 < 10)
' 1 = 100%
P (X > 8000) = 1− P (X ≤ 8000)
' 0⇒ 0%
4.1.c) Pede-se P(5000 ≤ X ≤ 7000).
8
P (5000 ≤ X ≤ 7000) = P (X ≤ 7000)− P (X < 500)
P (X ≤ 7000) = P
X − µs√
n
≤ 7000− µs√
n

= P
Tn−1 ≤ 7000− µ1000√
25

= P
(
Tn−1 ≤ 7000− 6000
200
)
= P (Tn−1 < 5)
' 1 = 100%
P (X < 5000) = P
X − µs√
n
<
5000− µ
s√
n

= P
Tn−1 < (5000− µ)1000√
25

= P
(
Tn−1 <
5000− 6000
200
)
= P (Tn−1 < −5)
= P (Tn−1 > 5)
' 0 = 0%
P (5000 ≤ X ≤ 7000) = P (X ≤ 7000)− P (X < 500)
= 1− 0
= 1 = 100%
0.5 [19-20] Estimadores - Me´dia & TCL: Tamanho da Amostra
Exerc´ıcio 5
1. Deseja-se estimar o custo me´dio da cesta ba´sica em dado pa´ıs. Supondo que o desvio-
padra˜o relacionado seja de R$50.00, qual deve ser o tamanho de uma amostra de cidades
(n) para o qual a probabilidade de o custo me´dio da cesta ba´sica amostral divergir do
custo me´dio da cesta ba´sica do pa´ıs em, no ma´ximo, R$110.00 seja igual a 95%?
2. Considere que a variaˆncia nominal definida para o tempo de vida de uma bateria (X)
seja σ2 = 10000 horas. Qual deve ser o tamanho de uma amostra, n, para o qual a
probabilidade de o tempo me´dio de vida amostral divergir do tempo me´dio de vida da
populac¸a˜o de baterias em horas (σ) em, no ma´ximo, 100 horas seja igual a 90%?
9
3. A previsa˜o para a temperatura me´dia em dado dia e´ baseada em uma amostra envolvendo
dias semelhantes. Considerando um desvio-padra˜o de σ = 4oC, divulga-se que a tempe-
ratura me´dia estara´ em tornode 28oC, com um erro de 2oC para mais ou para menos.
Divulga-se ainda que a probabilidade desta margem de erro na˜o ser respeitada e´ de 1%.
Qual tamanho amostral teria embasado esta estimativa?
4. Ainda sobre o problema da previsa˜o do tempo (sob σ = 4oC e um erro de 2oC), baseando-
se em uma amostra envolvendo 200 dias semelhantes, divulga-se que a temperatura estara´
em torno de 28oC. Qual e´ a probabilidade de o erro ma´ximo pre´-estabelecido na˜o ser
respeitado?
5. Quais suposic¸o˜es embasam suas ana´lises?
Resoluc¸a˜o Exerc´ıcio 5
5.1) Sejam,
σ = R$50.00
α = 5%
ε = R$110.00
n =?(cidades)
Deseja-se estimar o tamanho da amostra (n) de forma que, com probabilidade de
95%, o custo me´dio da cesta ba´sica na amostra se distancie do respectivo custo me´dio
na populac¸a˜o em, no ma´ximo, R$ 110.00
P (|X − µX | ≤ ε) = 1− α = P (|X − µX | ≤ 110) = 95%
n =
(
Z1−α/2 · σ
ε
)2
=
(
Z97.5% · 50
110
)2
=
(
1.96 · 50
110
)2
= 0.793
Aqui, tem-se que um n = 1 e´ suficiente para satisfazer a margem de erro adotada
(R$110.00) a um n´ıvel de confianc¸a de 95%. De fato, trata-se de mais uma in-
cumbeˆncia do analista sugerir ao tomador de decisa˜o que atribua uma margem de
erro com magnitude relativamente menor que o desvio-padra˜o da varia´vel de inte-
resse. Em outros termos, pequenas amostras sera˜o suficientes nos casos em que ε
na˜o for relativamente inferior a σ, podendo dar a falsa ideia de adequada decisa˜o sob
incerteza. De qualquer forma, esse nu´mero (n) poderia ainda ser maior, caso o n´ıvel
de confianc¸a fosse aumentado.
10

Outros materiais