Prévia do material em texto
universidade federal de pernambuco centro de ciências exatas e da natureza departamento de estatística soluções do EXAME FINAL 2017.1 — et101 1 I a) SendoX1 eX2 os resultados dos dados, consideremos os eventos:E1 := (X1 < 3, X2 > 4) eE2 := (Y = 7) em que Y := X1 +X2. Obtemos então:X1 < 3⇒ X1 ∈ {1, 2} eX2 > 4⇒ X2 ∈ {5, 6}. Logo: E1 = {(1, 5), (1, 6), (2, 5), (2, 6)}. Para o eventoE2, tem-se os pares: E2 = {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}. b) As variáveis de interesse agora sãoU := Min(X1, X2) e V := Max(X1, X2). Listamos os eventos (U = 2) e (V = 5): (U = 2) = {(2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 2), (4, 2), (5, 2), (6, 2)}. (V = 5) = {(5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (1, 5), (2, 5), (3, 5), (4, 5)}. As probabilidade podem ser calculadas usando a contagemdonúmero de casos favoráveis dividido pelo número total de casos no espaço amostral – tendo em vista que todos os pares são igualmente equiprováveis. Logo: P (U = 2) = 936 = 0.25; P (V = 5) = 9 36 = 0.25. Valem 25% em cada caso. 2 I Foramdados quep = 1800 e quehá4.000 computadores. Assim adistribuição da contagemdonúmerodecomputadores danificados pela tempestadeX é uma variável aleatória que segue uma distribuição binomial (cada um dos computadores na lista tem probabilidade 1/800 de ser danificado e 1 − 1/800 de não sê-lo – Bernoulli). Assume-se, portanto, queX ∼ Bin(4000, 1800). a) os valores médio e variância para uma distribuição Binomial são conhecidos: E(X) = np e var(X) = n.p.(1− p). LogoE(X) = n.p = 4000800 = 5 e var(X) ≈ n.p = 5. b) Para avaliarP (X ≤ 3), tem-se: P (X ≤ 3) =∑3k=0 (4000k ) ( 1800)k (1− 1800)4000−k. Como tais cálculos são complicados quando n é grande, poderemos usar uma aproximação assintotica, seja via Teorema de De Moiमre-Laplace ou seja via Teorema de Poisson. Como n → ∞, p → 0, dá-lhe, Poisson! Para λ = n.p = 5, usaremosX ∼ Poi(5). Claro, P (X = k) = λkk! e−λ. Assim, P (X ≤ 3) = ∑3 k=0 5k k! e −5 = 1183 e −5 = 0.265026, ou seja, praticamente 26,5% (Melhor resposta). N.B.Nesta região, tambémpoderia ser aplicada uma aproximação, assumindoX ∼ normal(5, 5). Para avaliar P (X ≤ 3) teríamos (com a correção da continuidade): P (X ≤ 3+0.5) = P (Z ≤ 3.5−5√ 5 ) = 1−φ(0.67) = 1 − 0.7686 = 0, 2514. Cerca de 25%. (compare com a estimativa anterior). Porém, aqueles que estimaram a probabilidade sem usar a correção de continuidade (não cobrada neste curso), obtiveramP (X ≤ 3) = P (Z ≤ −0, 8944) = 1− φ(0.89) = 0, 1867, i.e. circa 19 %, resultado igualmente aceito. 3 I a) Deseja-se encontrar o tamanho n da amostra tal que o estimador pˆ resulte em P (| pˆ− p |≤ 0.02) =0.92. O teorema central do limite pode ser aplicado, pois se trata de vistoria de veículos fabricados nos últimos dez anos, e n deve ser bastante grande. Assim, tem-se que Z := pˆ−p√ p.(1.p) n ∼ normal(0, 1). Expressando a probabilidade imposta em termos do escoreZ , P (| Z |≤ 0.02√ p.(1.p) n ) = 0.92. 1/4 universidade federal de pernambuco centro de ciências exatas e da natureza departamento de estatística soluções do EXAME FINAL 2017.1 — et101 Tem-se Z∗ = φ−1(0.96) = 1.75, ou seja, 0.02√ p.(1.p) n = 1.75. A dificuldade aqui é que o valor de p é desconhecido. Porém... Podemos obter uma estimativa conservadora, i.e., aquela demaior variância, lembrando que p.(1− p) ≤ 1/4. Tem-se: n = (1.750.02)2 p.(1.p) ≤ (1.750.02)2 .14 = 1925. Tomemos n = 1925. b) Agora sabendo que p ≤ 0.3, a estimativa pode ser melhorada; usar-se-á: p.(1 − p) ≤ 0.3 × 0.7 = 0.21 ao invés de p.(1 − p) ≤ 14 ; resultando agora em: n ≤ ( 1.75 0.02 )2 .0.21 = 1617. Poderíamos adotar n = 1671. Sim, há redução (de 16%) no tamanho mínimo requerido para a amostra. c) A estimativa pontual é de pˆ = 2961850 = 0.16, ou 16%. Para calcular o Intervalo de Confiança a 95%, usa-se uma figura similar aquela anterior para encontrar que a área acumulada na curva normal é de 0.975 (intervalo bilateral) e zα/2 = φ−1(0.975) = 1.96. Pode ser utilizado curva normal pois o número de amostras én ≥ 30. O intervalo de confiança será: IC(µ; 95%) = pˆ± z0.025 √ pˆ.(1− pˆ) n . O resultado é IC = [0.16± 0.0167], ou seja, IC(µ; 95%) = [0.1433, 0.1767]. A proporção verdadeira (na população) de veículos commais de 10 anos com emissão irregular de poluentes está 2/4 universidade federal de pernambuco centro de ciências exatas e da natureza departamento de estatística soluções do EXAME FINAL 2017.1 — et101 nos limites 14% e 18%, com 95% de confiabilidade. 4 I Os dados fornecidos conduzem as seguintes estimativas amostrais, para µ e σ: X¯ := 1 n 20∑ k=1 Xk = 30.05, s := √√√√ 1 n− 1 20∑ k=1 (Xk − X¯)2 ≈ 1.9324. a) As hipóteses para verificar as suspeitas do gerente deveriam ser: H0 : µ = 30min H1 : µ > 30min. Trata-se de realizar um teste monocaudal à direita (unilateral). b) O valor crítico usado para definir a região crítica RC é: µCRIT = 30 + t19;0.05 s√ 20 . Veja que ao nível de significância α = 5%, tem-se t19;0.05 = 1.7291 e a região crítica fica definida por: RC := {X¯ | X¯ > 30.74}. Como X¯ = 30.05 /∈ RC , então H0 não pode ser rejeitada no nível de significância 5%. Os dados não fornecem evidências suficientes para afirmar que o tempo médio de eঀera para atendimento é superior a 30 minutos. Adesconfiançado gerentenãoprocede. Dopontode vista estatístico, os dadosnão fornecemevidência no nível de significância 5% para rejeitar H0 e a hipótese que o tempo seja igual ou inferior a 30 minutos não pode ser descartada. De modo alternativo, o teste poderia ser realizado apenas usando a estatística t: Observa-se que o tCRIT = 1.7291. A região crítica (figura anterior) pode ser definida em termos da variável normalizada t, e seriaRC = tcalc | tcalc > 1.7291. Calculando agora o valor de t (i.e. tcalc ou tobs): tcalc = X¯ − 30 s/ √ n = 30.05− 30 1.9234/ √ 20 = 0.1157. Como tcalc /∈ RC , as mesmas conclusões segueriam (i.e.,H0 não pode ser refutada). 3/4 universidade federal de pernambuco centro de ciências exatas e da natureza departamento de estatística soluções do EXAME FINAL 2017.1 — et101 4/4