Buscar

Prévia do material em texto

universidade federal de pernambuco
centro de ciências exatas e da natureza
departamento de estatística
soluções do EXAME FINAL 2017.1 — et101
1 I a) SendoX1 eX2 os resultados dos dados, consideremos os eventos:E1 := (X1 < 3, X2 > 4) eE2 := (Y = 7) em que Y := X1 +X2.
Obtemos então:X1 < 3⇒ X1 ∈ {1, 2} eX2 > 4⇒ X2 ∈ {5, 6}. Logo: E1 = {(1, 5), (1, 6), (2, 5), (2, 6)}.
Para o eventoE2, tem-se os pares: E2 = {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}.
b) As variáveis de interesse agora sãoU := Min(X1, X2) e V := Max(X1, X2).
Listamos os eventos (U = 2) e (V = 5):
(U = 2) = {(2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 2), (4, 2), (5, 2), (6, 2)}.
(V = 5) = {(5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (1, 5), (2, 5), (3, 5), (4, 5)}.
As probabilidade podem ser calculadas usando a contagemdonúmero de casos favoráveis dividido pelo número
total de casos no espaço amostral – tendo em vista que todos os pares são igualmente equiprováveis. Logo:
P (U = 2) = 936 = 0.25; P (V = 5) =
9
36 = 0.25. Valem 25% em cada caso.
2 I Foramdados quep = 1800 e quehá4.000 computadores. Assim adistribuição da contagemdonúmerodecomputadores danificados pela tempestadeX é uma variável aleatória que segue uma distribuição binomial
(cada um dos computadores na lista tem probabilidade 1/800 de ser danificado e 1 − 1/800 de não sê-lo –
Bernoulli). Assume-se, portanto, queX ∼ Bin(4000, 1800).
a) os valores médio e variância para uma distribuição Binomial são conhecidos: E(X) = np e var(X) =
n.p.(1− p). LogoE(X) = n.p = 4000800 = 5 e var(X) ≈ n.p = 5.
b) Para avaliarP (X ≤ 3), tem-se: P (X ≤ 3) =∑3k=0 (4000k ) ( 1800)k (1− 1800)4000−k. Como tais cálculos
são complicados quando n é grande, poderemos usar uma aproximação assintotica, seja via Teorema de De
Moiमre-Laplace ou seja via Teorema de Poisson. Como n → ∞, p → 0, dá-lhe, Poisson! Para λ = n.p = 5,
usaremosX ∼ Poi(5). Claro, P (X = k) = λkk! e−λ. Assim, P (X ≤ 3) =
∑3
k=0
5k
k! e
−5 = 1183 e
−5 =
0.265026, ou seja, praticamente 26,5% (Melhor resposta).
N.B.Nesta região, tambémpoderia ser aplicada uma aproximação, assumindoX ∼ normal(5, 5). Para avaliar
P (X ≤ 3) teríamos (com a correção da continuidade): P (X ≤ 3+0.5) = P (Z ≤ 3.5−5√
5
) = 1−φ(0.67) =
1 − 0.7686 = 0, 2514. Cerca de 25%. (compare com a estimativa anterior). Porém, aqueles que estimaram a
probabilidade sem usar a correção de continuidade (não cobrada neste curso), obtiveramP (X ≤ 3) = P (Z ≤
−0, 8944) = 1− φ(0.89) = 0, 1867, i.e. circa 19 %, resultado igualmente aceito.
3 I a) Deseja-se encontrar o tamanho n da amostra tal que o estimador pˆ resulte em P (| pˆ− p |≤ 0.02) =0.92. O teorema central do limite pode ser aplicado, pois se trata de vistoria de veículos fabricados nos últimos
dez anos, e n deve ser bastante grande. Assim, tem-se que Z := pˆ−p√
p.(1.p)
n
∼ normal(0, 1). Expressando a
probabilidade imposta em termos do escoreZ , P (| Z |≤ 0.02√
p.(1.p)
n
) = 0.92.
1/4
universidade federal de pernambuco
centro de ciências exatas e da natureza
departamento de estatística
soluções do EXAME FINAL 2017.1 — et101
Tem-se Z∗ = φ−1(0.96) = 1.75, ou seja, 0.02√
p.(1.p)
n
= 1.75. A dificuldade aqui é que o valor de p é
desconhecido. Porém... Podemos obter uma estimativa conservadora, i.e., aquela demaior variância, lembrando
que p.(1− p) ≤ 1/4. Tem-se: n = (1.750.02)2 p.(1.p) ≤ (1.750.02)2 .14 = 1925. Tomemos n = 1925.
b) Agora sabendo que p ≤ 0.3, a estimativa pode ser melhorada; usar-se-á: p.(1 − p) ≤ 0.3 × 0.7 = 0.21
ao invés de p.(1 − p) ≤ 14 ; resultando agora em: n ≤
(
1.75
0.02
)2
.0.21 = 1617. Poderíamos adotar n = 1671.
Sim, há redução (de 16%) no tamanho mínimo requerido para a amostra.
c) A estimativa pontual é de pˆ = 2961850 = 0.16, ou 16%. Para calcular o Intervalo de Confiança a 95%, usa-se
uma figura similar aquela anterior para encontrar que a área acumulada na curva normal é de 0.975 (intervalo
bilateral) e zα/2 = φ−1(0.975) = 1.96. Pode ser utilizado curva normal pois o número de amostras én ≥ 30.
O intervalo de confiança será:
IC(µ; 95%) = pˆ± z0.025
√
pˆ.(1− pˆ)
n
.
O resultado é IC = [0.16± 0.0167], ou seja, IC(µ; 95%) = [0.1433, 0.1767].
A proporção verdadeira (na população) de veículos commais de 10 anos com emissão irregular de poluentes está
2/4
universidade federal de pernambuco
centro de ciências exatas e da natureza
departamento de estatística
soluções do EXAME FINAL 2017.1 — et101
nos limites 14% e 18%, com 95% de confiabilidade.
4 I Os dados fornecidos conduzem as seguintes estimativas amostrais, para µ e σ:
X¯ :=
1
n
20∑
k=1
Xk = 30.05,
s :=
√√√√ 1
n− 1
20∑
k=1
(Xk − X¯)2 ≈ 1.9324.
a) As hipóteses para verificar as suspeitas do gerente deveriam ser:
H0 : µ = 30min
H1 : µ > 30min.
Trata-se de realizar um teste monocaudal à direita (unilateral).
b) O valor crítico usado para definir a região crítica RC é:
µCRIT = 30 + t19;0.05
s√
20
.
Veja que ao nível de significância α = 5%, tem-se t19;0.05 = 1.7291 e a região crítica fica definida por:
RC := {X¯ | X¯ > 30.74}.
Como X¯ = 30.05 /∈ RC , então H0 não pode ser rejeitada no nível de significância 5%. Os dados não
fornecem evidências suficientes para afirmar que o tempo médio de eঀera para atendimento é superior a 30
minutos. Adesconfiançado gerentenãoprocede. Dopontode vista estatístico, os dadosnão fornecemevidência
no nível de significância 5% para rejeitar H0 e a hipótese que o tempo seja igual ou inferior a 30 minutos não
pode ser descartada.
De modo alternativo, o teste poderia ser realizado apenas usando a estatística t:
Observa-se que o tCRIT = 1.7291. A região crítica (figura anterior) pode ser definida em termos da variável
normalizada t, e seriaRC = tcalc | tcalc > 1.7291. Calculando agora o valor de t (i.e. tcalc ou tobs):
tcalc =
X¯ − 30
s/
√
n
=
30.05− 30
1.9234/
√
20
= 0.1157.
Como tcalc /∈ RC , as mesmas conclusões segueriam (i.e.,H0 não pode ser refutada).
3/4
universidade federal de pernambuco
centro de ciências exatas e da natureza
departamento de estatística
soluções do EXAME FINAL 2017.1 — et101
4/4

Mais conteúdos dessa disciplina