04_ExerciciosResolvidos_InferenciaIndutiva_02_IntervalosdeConfianca

•

UFC

2

1

2

1

0

Thiago Luiz

25/02/2015

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Probabilidade e Estatística

29.919 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO
DEPARTAMENTO DE ESTATI´STICA E INFORMA´TICA - DEInfo
ESTATI´STICA EXPLORATO´RIA B
Resoluc¸a˜o dos exerc´ıcios das listas 21-22
Monitor: Nielson Avelino de Santana
Orientador: Paulo Renato Alves Firmino
6 de outubro de 2014
Suma´rio
0.1 Intervalo de Confianc¸a para Me´dia, variaˆncia conhecida . . . . . . . . . . . . . . 1
0.2 Intervalo de Confianc¸a para Me´dia, variaˆncia desconhecida . . . . . . . . . . . . . 2
0.3 Intervalo de Confianc¸a para a proporc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . 4
Intervalo de Confianc¸a
0.1 Intervalo de Confianc¸a para Me´dia, variaˆncia conhecida
Exerc´ıcio 1
1. A variabilidade acerca do valor da cesta ba´sica de uma regia˜o e´ dada por um desvio-padra˜o
de R$ 50.00. Qual e´ a estimativa intervalar para o valor me´dio da cesta ba´sica na regia˜o
a um n´ıvel de confianc¸a de 90%, dado que o custo me´dio da cesta de uma amostra com 30
cidades foi de R$250,00? E para um n´ıvel de confianc¸a de 99%?
2. A variabilidade acerca do tempo de vida de laˆmpadas e´ dada por um desvio-padra˜o de
1000 horas. Qual e´ a estimativa intervalar para o tempo me´dio de vida do modelo de
laˆmpadas sob um n´ıvel de confianc¸a de 95%, dado que o tempo me´dio de vida de uma
amostra com 100 laˆmpadas e´ de 4000h? E para um n´ıvel de confianc¸a de 99.5%?
3. A previsa˜o para a temperatura me´dia em dado dia e´ baseada em uma amostra envolvendo
dias semelhantes. A variabilidade da temperatura me´dia ao longo de dias semelhantes
pode ser representada por um desvio-padra˜o de σ = 4oC. De uma amostra envolvendo
64 dias semelhantes, obte´m-se uma me´dia de 28oC.Qual e´ a estimativa intervalar para a
temperatura me´dia do dia sob estudo a um n´ıvel de confianc¸a de: (a) 96%, (b) 99.9%?
4. Quais suposic¸o˜es embasam as ana´lises acima?
Resoluc¸a˜o Exerc´ıcio 1
1) Nesta questa˜o, deseja-se inferir sobre a me´dia, a partir da um intervalo com determinado
n´ıvel de confianc¸a.
Temos que o desvio-padra˜o da populac¸a˜o e´ σ = R$ 50.00. Ja´ para a amostra aleato´ria,
temos que n = 30, xobs = R$250.00.
A partir dos dados observados na amostra (n=30 e xobs = 250), tem-se como estimativa
intervalar para µ, sob um n´ıvel de confianc¸a de 1-α:
IC(µ, 1− α) =
[
xobs − σ√
n
· z1−α
2
, xobs +
σ√
n
· z1−α
2
]
=
[
250− 50√
30
· z1−α
2
, 250 +
50√
30
· z1−α
2
]
,
1
onde z1−α
2
e´ o valor da normal-padra˜o que acumula ate´ ele uma a´rea de 1− α2 .
Pede-se os intervalos de 90% e 99% de confianc¸a para a me´dia populacional. Para,
IC(µ, 90%), temos que α = 10%, z95% = 1.64 e
IC(µ, 99%), temos que α = 1%, z99.5% = 2.57.
Assim, temos os seguintes intervalos:
IC(µ, 90%) =
[
250− 50√
30
1.64 , 250 +
50√
30
1.64
]
= [235.03 , 264.97]
IC(µ, 99%) =
[
250− 50√
30
2.57 , 250 +
50√
30
2.57
]
= [226.54 , 273.46]
Logo, tem-se que o valor me´dio da cesta ba´sica da regia˜o estara´ entre R$ 235.03 e R$
264.97, sob um n´ıvel de confianc¸a de 90% (a probabilidade de estarmos errados e´ de 10%).
Perceba que quanto mais aumentarmos nosso n´ıvel de confianc¸a, maior sera´ nosso intervalo,
como de fato e´ vis´ıvel para o n´ıvel de confianc¸a 99%.
2) A cargo do aluno.
3) A cargo do aluno.
4) A principal suposic¸a˜o para estas questo˜es e´ que X ∼ N
(
µ,
σ2
n
)
. Assim, considera-se que o
tamanho amostral adotado (n) e´ suficientemente grande para que se verifique normalidade
da me´dia amostral (de acordo com o teorema do limite central). Por outro lado, supo˜e-
se que os valores amostrados sa˜o independentes entre si. Apenas assim, teremos que a
variaˆncia de X equivalera´ a
σ2
n
. Para o primeiro exerc´ıcio, por exemplo, supo˜e-se que o
valor da cesta ba´sica de uma cidade e´ independente do de outra. Veja que esta suposic¸a˜o
sera´ facilmente quebrada caso o pesquisador visite supermercados pertencentes a` mesma
rede ou mesmo caso na˜o se desloque o suficiente em cada localidade ou ainda em situac¸o˜es
de cartel.
0.2 Intervalo de Confianc¸a para Me´dia, variaˆncia desconhecida
Exerc´ıcio 2
1. De uma amostra com 30 cidades, estima-se que o desvio-padra˜o e a me´dia do valor da
cesta ba´sica de uma regia˜o e´ de R$50.00 e R$250,00, respectivamente. Qual e´ a estimativa
intervalar para o valor me´dio da cesta ba´sica na regia˜o a um n´ıvel de confianc¸a de 90%?
E para um n´ıvel de confianc¸a de 99%? E se o desvio-padra˜o, ao inve´s de uma estimativa,
fosse populacional?
2. De uma amostra com 100 laˆmpadas, estima-se que o desvio-padra˜o e a me´dia do tempo
de vida de um modelo de laˆmpadas e´ de 1000 horas e 4000h, respectivamente. Qual e´ a
estimativa intervalar para o tempo me´dio de vida do modelo de laˆmpadas sob um n´ıvel de
confianc¸a de 95%? E para um n´ıvel de confianc¸a de 99.9%? E se o desvio-padra˜o, ao inve´s
de uma estimativa, fosse populacional?
3. A previsa˜o para a temperatura me´dia em dado dia e´ baseada em uma amostra envolvendo
dias semelhantes. De uma amostra envolvendo 64 dias semelhantes, obte´m-se uma me´dia
de 28oC e um desvio-padra˜o de 4oC para a temperatura. Qual e´ a estimativa intervalar
para a temperatura me´dia do dia sob estudo a um n´ıvel de confianc¸a de: (a) 95%, (b)
99.9%?
2
4. Quais suposic¸o˜es embasam as ana´lises acima
Resoluc¸a˜o Exerc´ıcio 2
1) Nesta questa˜o, apesar da semelhanc¸a com a primeira questa˜o do Exerc´ıcio 1, vale salientar
que ela na˜o nos fornece o desvio-padra˜o da populac¸a˜o. Desta forma usaremos a distribuic¸a˜o
t-Student. Temos para a amostra aleato´ria selecionada que a estimativa para o desvio-
padra˜o e´ s=R$ 50, n = 30 e xobs = 250.
A partir dos dados observados na amostra (n = 30, xobs = 250, s = 50), tem-se como
estimativa intervalar para µ (o valor me´dio da cesta ba´sica na regia˜o).
IC(µ, 1− α) =
[
xobs − s√
n
· t(n−1,1−α2 ) , xobs +
s√
n
· t(n−1,1−α2 )
]
=
[
250− 50√
30
· t(29,1−α2 ) , 250 +
50√
30
· t(29,1−α2 )
]
Pede-se os intervalos de 90% e 99% de confianc¸a para a me´dia populacional. Para,
IC(µ, 90%), temos que α = 10%, t(29,95%) = 1.699 e para
IC(µ, 99%), temos que α = 1%, t(29,99.5%) = 2.756
Assim, temos os seguintes intervalos:
IC(µ, 90%) =
[
250− 50√
30
1.699 , 250 +
50√
30
1.699
]
= [234.49 , 265.51]
IC(µ, 99%) =
[
250− 50√
30
2.756 , 250 +
50√
30
2.756
]
= [224.84 , 275.16]
Logo, tem-se que o valor me´dio da cesta ba´sica da regia˜o estara´ entre R$ 234.49 e R$
265.51, sob um n´ıvel de confianc¸a de 90% (a probabilidade de estarmos errados e´ de 10%).
Veja que, embora as medidas estat´ısticas sejam semelhantes a`s da abordagem envolvendo
uma variaˆncia conhecida (Exerc´ıcio 1.1), agora temos um intervalo de confianc¸a de maior
comprimento. Isto decorre do fato de estarmos utilizando uma estimativa da variaˆncia
no presente problema, o que eleva nosso n´ıvel de incerteza em comparac¸a˜o ao caso em
que na˜o precisar´ıamos inferir sobre ela. Na modelagem isto e´ refletido ao substituirmos
a distribuic¸ao normal pela t-Student. Veja que para o mesmo valor de α temos sempre
valores mais expressivos da t-Student em relac¸ao a` normal.
Se tivessemos um desvio-padra˜o da populac¸a˜o, deveriamos ter utilizado a distribuic¸a˜o
Normal, visto que na˜o existiria incerteza sobre a variabilidade. Ale´m disso, a t-Student,
assume uma maior variabilidade.
2) A cargo do aluno.
3) A cargo do aluno.
4) As suposic¸o˜es para estas questo˜es tambe´m se baseiam em normalidade e independeˆncia
das varia´veis envolvidas. Destaque-se que sendo a varia´vel de interesse normalmete distri-
buida, sua me´dia amostral tambe´m sera´. Assim, sendo, a tranformac¸ao
X − µ
s/
√
n
seguira´ a
distribuic¸a˜o t-Student com (n−1) graus de liberdade. Destaque-se, assim, o envolvimento
de uma estimativa para a variaˆncia da populac¸a˜o.
30.3 Intervalo de Confianc¸a para a proporc¸a˜o
Exerc´ıcio 3
1. De uma amostra com 3000 eleitores de um pa´ıs, a proporc¸a˜o de votantes em B foi de 46%.
Qual e´ a estimativa intervalar para a proporc¸a˜o de votantes em B no pa´ıs a um n´ıvel de
confianc¸a de 94%? E para um n´ıvel de confianc¸a de 98%?
2. De uma amostra com 100 laˆmpadas, 6 falharam antes de completar 8000 horas de operac¸a˜o.
Qual e´ a estimativa intervalar para a probabilidade de uma laˆmpada falhar antes de com-
pletar 8000 horas de funcionamento, sob um n´ıvel de confianc¸a de 96%? E para um n´ıvel
de confianc¸a de 97%?
3. Deseja-se calcular uma estimativa intervalar para a probabilidade de que uma especulac¸a˜o
financeira configure-se concretamente. De um banco de dados histo´ricos envolvendo 64
especulac¸o˜es, ele verificou que 28 se tornaram verdade. Qual n´ıvel de confianc¸a voceˆ
adotaria? Por que? Qual e´ a estimativa intervalar associada?
4. Quais suposic¸o˜es embasam as ana´lises acima?
Resoluc¸a˜o Exerc´ıcio 2
2) Nesta questa˜o, o paraˆmetro de interesse e´ a probabilidade de uma laˆmpada falhar antes
de completar 8000 horas de funcionamento (p). Do enunciado, tem-se que
n (tamanho da amostra adotada) = 100 laˆmpadas;
pˆobs (a proporc¸ao de laˆmpadas que falharam antes de 8000 horas de operac¸ao) = 0.06.
Para um dado n´ıvel de confianc¸a de 1 − α e considerando o maior n´ıvel de variabilidade
poss´ıvel (quando σ = p · (1− p) = 1/4), o intervalo de confianc¸a para p e´ dado por
IC(p, 1− α) =
[
pˆobs − σ√nz1−α2 , pˆobs +
σ√
n
z1−α
2
]
=
[
pˆobs − 0.5√nz1−α2 , pˆobs +
0.5√
n
z1−α
2
]
=
[
0.06− 0.5√
100
z1−α
2
, 0.06 + 0.5√
100
.z1−α
2
]
Vale destacar que no intervalo acima adota-se 0.5 como sendo o maior valor a ser assumido
pelo desvio-padra˜o de Pˆ , o estimador de p. Por sua vez, z1−α
2
representa o valor da normal-
padra˜o que acumula uma a´rea de 1− α2 de probabilidade. Assim, se 1−α = 0.96, z1− 0.042 =
z0.98 ≈ 2.05 e se 1− α = 0.97, z1− 0.03
2
= z0.985 = 2.17. Desta forma,
IC(p, 0.96) = [0.06− 0.05× 2.05 , 0.06 + 0.05× 2.05] = [−0.0425, 0.1625]
IC(p, 0.97) = [0.06− 0.05× 2.17 , 0.06 + 0.05× 2.17] = [−0.0485, 0.1685]
Logo, o intervalo de confianc¸a para a probabilidade de que uma laˆmpada falhe durante
8000 horas de funcionamento (p), sob um n´ıvel de confianc¸a de 96%, envolve valores entre
-0.0425 e 0.1625. Perceba-se que como p na˜o assume valores negativos, o limite inferior do
intervalo deve ser substitu´ıdo por 0.0.
Por outro lado, considerando como estimativa para a variaˆncia populacional (σ2) a amos-
tral (s2 = pˆobs · (1− pˆobs) = 0.06 · (1− 0.06) = 0.056):
4
IC(p, 1− α) =
[
pˆobs − s√nz1−α2 , pˆobs +
s√
n
z1−α
2
]
=
[
0.06− 0.237√
100
z1−α
2
, 0.06 + 0.237√
100
z1−α
2
]
Seguindo,
IC(p, 0.96) = [0.06− 0.0237× 2.05 , 0.06 + 0.0237× 2.05] = [0.0114, 0.1086]
IC(p, 0.97) = [0.06− 0.0237× 2.17 , 0.06 + 0.0237× 2.17] = [0.0086, 0.1114].
Assim, recorrendo a` variaˆncia amostral temos intervalos bem mais estreitos em relac¸a˜o
a`queles de variaˆncia ma´xima; isto porque a proporc¸a˜o amostral foi bem menor que 0.5
(o valor que reflete a maior variabilidade poss´ıvel). Note-se que quando se envolve a
proporc¸a˜o, a variaˆncia amostral na˜o nos conduz a` distribuic¸a˜o t-Student, principalmente
devido a`s incertezas sobre a variaˆncia existirem exclusivamente devido a desconhecermos
o valor de p: σ2 = p · (1 − p). Assim, uma vez conhecido o valor de p, σ2 sera´ tambe´m
conhecido. Por outro lado, quando estudamos a me´dia de maneira geral, µ, ao inve´s da
proporc¸a˜o p, as incertezas sobre σ2 envolvem outros fatores ale´m de µ: σ2 =
∑N
i=1
(xi−µ)2
N ,
dando margem a` distribuic¸a˜o t-Student.
5