Prévia do material em texto
Estatística Teste �nal � Resolução 14 de janeiro de 2019 � Duração: 90 minutos Utilize apenas as folhas do enunciado para responder às questões. Caso necessite de espaço adicional poderá utilizar a última página do enunciado. Não desagrafe as folhas. Nome: Número: 1. A quantia diária depositada num mealheiro por um jovem preocupado com o seu futuro é uma (6.0) variável aleatória normalmente distribuída com média igual a 120 euros e variância igual a 64 euros2. (a) Determine a percentagem de dias em que esta pessoa deposita entre 105 e 135 euros no seu (1.0) mealheiro. P (105 < X < 135) = P (X < 135)− P (X < 105) = P ( Z < 135− 120 8 ) − P ( Z < 105− 120 8 ) = Φ(1.88)− Φ(−1.88) = 0.9699− (1− 0.9699) = 0.9398 (b) Determine a probabilidade da quantia depositada ser superior à média, nos dias em que essa (1.5) quantia é inferior a 125 euros. P (X > 120|X < 125) = P (120 < X < 125) P (X < 125) = Φ(0.63)− Φ(0) Φ(0.625) = 0.7357− 0.5 0.7357 = 0.3204 (c) Determine o limite inferior da quantia depositada em 90% dos dias. (2.0) P (X > `) = 0.9⇔ P ( Z < `− 120 8 ) = 0.1 ⇔ `− 120 8 = −1.28 ⇔ ` = 109.76 (d) Assuma que o jovem só deposita dinheiro durante a semana de trabalho (5 dias) para o (1.5) gastar durante o �m de semana. Determine a média e a variância do total dos depósitos feitos semanalmente. Pela aditividade da distribuição Normal, o total dos depósitos é uma variável aleatória com parâmetros: µ = 5× 120 = 600 σ2 = 5× 64 = 320 2. Uma cadeia de supermercados tenciona abrir uma nova loja num bairro onde vivem aproximada- (7.0) mente 10000 pessoas. Antes de se tomar a decisão de abrir a nova loja foi feito um estudo no qual 400 pessoas foram entrevistadas. Destas, 310 indicaram que poderiam vir a ser clientes habituais do novo supermercado. (a) Construa um intervalo de con�ança a 95% para a proporção de pessoas que poderão vir a (5.5) ser clientes regulares do supermercado. • Variável aleatória fulcral Pretende-se determinar um intervalo de con�ança para uma proporção, logo X̄ − θ√ X̄(1−X̄) n a∼ N (0, 1) • Quantis de probabilidade aα = −bα = −1.96 • Inversão das desigualdades P aα < X̄ − θ√ X̄(1−X̄) n < bα = 0.95⇔ P ( aα √ X̄(1− X̄) n < X̄ − θ < bα √ X̄(1− X̄) n ) = 0.95⇔ P ( aα √ X̄(1− X̄) n − X̄ < −θ < bα √ X̄(1− X̄) n − X̄ ) = 0.95⇔ P ( X̄ − bα √ X̄(1− X̄) n < θ < X̄ − aα √ X̄(1− X̄) n ) = 0.95 • Concretização IC95%(θ) = ] 310 400 ± 1.96 √ 0.775(1− 0.775) 400 [ =]0.7341, 0.8159[ (b) Utilize o intervalo anterior para construir um intervalo de con�ança a 95% para o número (1.5) de pessoas que utilizarão regularmente o supermercado. Sabendo que no bairro vivem 10000 pessoas, o intervalo pretendido obtém-se multipli- cando o intervalo anterior por 10000, ou seja, IC95%(N) =]7341, 8159[ 3. Num ensaio clínico para avaliar a e�cácia de um novo medicamento para a hipertensão, administrou- (7.0) se o novo medicamento a um grupo de 100 pacientes. Para esta amostra obteve-se uma tensão arterial sistólica média de 13.96. Admite-se que a tensão arterial sistólica num indivíduo é uma variável aleatória normalmente distribuída com desvio padrão igual a 1.04. (a) Sabendo que a tensão arterial sistólica é considerada normal quando inferior a 14, o que (4.5) pode concluir acerca da e�cácia do novo medicamento para um nível de signi�cância de 5%? • Hipóteses H0 : µ = 14 H1 : µ < 14 • Estatística de teste Estamos na presença de uma distribuição Normal com variância conhecida logo, X̄ − µ σ/ √ n ∼ N (0, 1) • Valor observado da estatística de teste tobs = 13.96− 14 1.04/ √ 100 = −0.3846 • Região crítica RC =]−∞,−.1645] • Decisão Visto que −0.3846 6∈ RC, não rejeitamos H0 para α = 5%, ou seja, o novo medi- camento não parece reduzir signi�cativamente a tensão arterial sistólica. (b) Qual o valor-p do teste anterior? Interprete o resultado. (2.5) Tratando-se de um teste unilateral à esquerda, p = P ( X̄ − µ σ/ √ n < −0.3846 ) = 1− Φ(0.38) = 0.352 A hipótese H0 só seria rejeitada para níveis de signi�cância acima de 35.2%, ou seja, para os níveis usuais podemos a�rmar que o medicamento não é e�caz. Formulário • Estatística Descritiva � Regra de Sturges: ∗ Número de classes: k tal que 2k > n ∗ Amplitude das classes: h = max(xj)−min(xj) k � Medidas de localização: ∗ Média: · Dados não agrupados: x̄ = 1 n ∑n j=1 xj · Dados agrupados: x̄ = 1 n ∑m j=1 Fjxj · Dados agrupados em classes: x̄ = 1 n ∑m j=1 Fjx ′ j ∗ Moda: · Dados agrupados em classes: m∗ = liminf + Fm∗ − Fm∗,ant 2Fm∗ − (Fm∗,ant + Fm∗,post) × h ∗ Mediana: · Dados não agrupados: M = x(n+1 2 ) se n é ímpar( x(n2 ) + x(n+1 2 )) /2 se n é par · Dados agrupados em classes: M = liminf + 0.5− f∗M,ant fM × h ∗ Quantis: · Dados agrupados em classes: qα = liminf + α− f∗qα,ant fqα × h � Medidas de dispersão: ∗ Amplitude do intervalo de variação: AIV = x(n) − x(1) ∗ Amplitude do intervalo interquartis: AIQ = q0.75 − q0.25 ∗ Variância: · Dados não agrupados: s2 = 1 n ∑n j=1(xj − x̄)2 = 1 n ∑n j=1 x 2 j − x̄2 · Dados agrupados: s2 = 1 n ∑m j=1 Fj(xj − x̄)2 = 1 n ∑m j=1(Fjxj 2)− x̄2 · Dados agrupados em classes: s2 = 1 n ∑m j=1 Fj(x ′ j − x̄)2 = 1 n ∑m j=1(Fjx ′ j2 )− x̄2 ∗ Variância corrigida: · Dados não agrupados: s′2 = 1 n−1 ∑n j=1(xj − x̄)2 = 1 n−1 (∑n j=1 x 2 j − nx̄2 ) · Dados agrupados: s′2 = 1 n−1 ∑m j=1 Fj(xj − x̄)2 = 1 n−1 (∑n j=1 Fjxj2 − nx̄2 ) · Dados agrupados em classes: s′2 = 1 n−1 ∑m j=1 Fj(x ′ j − x̄)2 = 1 n−1 (∑n j=1 Fjx ′ j2 − nx̄2 ) ∗ Desvio padrão: s = + √ s2 ∗ Desvio padrão corrigido: s′ = + √ s′2 ∗ Coe�ciente de variação: CV = s x̄ � Outliers: ∗ Outlier severo: xj < q0.25 − 3×AIQ ou xj > q0.75 + 3×AIQ ∗ Outlier moderado: xj < q0.25 − 1.5×AIQ ou xj > q0.75 + 1.5×AIQ • Noções básicas de probabilidade � Cálculo combinatório: ∗ Ank = n! (n− k)! ∗ αnk = n k ∗ (n k ) = n! k!(n−k)! � Leis de De Morgan: ∗ A ∪B = A ∩B ∗ A ∩B = A ∪B � Propriedades de uma medida de probabilidade: ∗ P (A) ≥ 0 ∗ P (Ω) = 1 ∗ P (∅) = 0 ∗ P (A) = 1− P (A) ∗ Se A ⊂ B então P (A) ≤ P (B) ∗ P (B −A) = P (B)− P (A ∩B) ∗ P (A ∪B) = P (A) + P (B)− P (A ∩B) � Probabilidade condicionada: P (A|B) = P (A∩B) P (B) , se P (B) > 0 � Teorema da probabilidade total: Dada uma partição de Ω, {A1, A2, ..., Am}, tem-se para qualquer acontecimento B, P (B) = ∑m j=1 P (Aj)P (B|Aj) � Teorema de Bayes: Dados dois acontecimentos A e B de�nidos no mesmo espaço de resultados tais que P (A) > 0 e P (B) > 0, tem-se que P (B|A) = P (A|B)P (B) P (A) • Variáveis aleatórias � Função (densidade) de probabilidade: ∗ V.a. discretas: fX(x) ≥ 0; ∑ x fX(x) = 1 ∗ V.a. contínuas: fX(x) ≥ 0; ∫+∞ −∞ fX(x) dx = 1 � Função de distribuição: ∗ V.a. discretas: FX(x) = P (X ≤ x) = ∑ j≤x fX(j) ∗ V.a. contínuas: FX(x) = P (X ≤ x) = ∫ x −∞ fX(t) dt � Valor esperado: ∗ V.a. discretas: E(X) = ∑ x xfX(x) ∗ V.a. contínuas: E(X) = ∫+∞ −∞ xfX(x) dx ∗ E(k) = k,∀k ∈ R ∗ E(aX + b) = aE(X) + b, ∀a, b ∈ R ∗ Se X e Y forem duas v.a., E(X + Y ) = E(X) + E(Y ) ∗ Se X e Y forem duas v.a. independentes, E(XY ) = E(X)E(Y ) � Variância: ∗ V ar(X) = E(X2)− E2(X) ∗ V ar(k) = 0, ∀k ∈ R ∗ V ar(X) ≥ 0 ∗ V ar(aX + b) = a2V ar(X),∀a, b ∈ R ∗ Se X e Y forem duas v.a. independentes, V ar(X + Y ) = V ar(X) + V ar(Y ) • Distribuições � Distribuição Binomial: ∗ fX(x) = (n x ) θx(1− θ)n−x, x = 0, 1, 2, ..., n ∗ E(X) = nθ ∗ V ar(X) = nθ(1− θ) � Distribuição Binomial negativa: ∗ fX(x) = (x− 1 r − 1 ) θr(1− θ)x−r, x = r, r + 1, r + 2, ... ∗ E(X) = r θ ∗ V ar(X) = r(1− θ) θ2 � Distribuição de Poisson: ∗ fX(x) = e −λλx x! , x = 0, 1, 2, ... ∗ E(X) = λ ∗ V ar(X) = λ � Distribuição Exponencial: ∗ fX(x) = λe−λx, x ≥ 0 ∗ FX(x) = 1− e−λx ∗ E(X) = 1 λ ∗ V ar(X) = 1 λ2 � Distribuição Normal: ∗ E(X) = µ ∗ V ar(X) = σ2 ∗ Se X ∼ N (µ, σ2) então X − µ σ ∼ N (0, 1) ∗ Dado z > 0, Φ(−z) = 1− Φ(z) ∗ Teorema da aditividade da distribuição normal: Dadas n v.a. independentes tais que Xi ∼ N (µi, σ2i ), S = n∑ i=1 αiXi ∼ N (µS , σ2S)onde µS = ∑n i=1 αiµi e σ 2 S = ∑n i=1 α 2 i σ 2 i . ∗ Corolários: Se as v.a. forem i.i.d. então S = ∑n i=1 Xi ∼ N (nµ, nσ2) e X̄ = 1 n ∑n i=1Xi ∼ N (µ, σ2/n) � Teorema do limite central: Dada uma sucessão de v.a. i.i.d. X1, X2, ..., Xn com valor esperado µ e variância σ2, então, quando n ≥ 30, S = ∑n i=1 Xi a∼ N (nµ, nσ2) e X̄ a∼ N (µ, σ2/n) • Distribuições por amostragem � População normal com σ2 conhecida: X̄−µ σ/ √ n ∼ N (0, 1) � População normal com σ2 desconhecida: X̄−µ S′/ √ n ∼ tn−1 � População não normal com σ2 conhecida (n ≥ 30): X̄−µ σ/ √ n a∼ N (0, 1) (caso particular da distribuição de Bernoulli: X̄−θ√ θ(1−θ)/ √ n a∼ N (0, 1)) � População não normal com σ2 desconhecida (n ≥ 30): X̄−µ S′/ √ n a∼ N (0, 1) (caso particular da distribuição de Bernoulli: X̄−θ√ X̄(1−X̄)/ √ n a∼ N (0, 1)) � População normal: (n−1)S′2 σ2 ∼ χ2n−1 • Primitivas imediatas: � ∫ k dx = kx+ C � ∫ f ′(x).f(x)k dx = f(x) k+1 k+1 + C, k 6= −1 � ∫ f ′(x).ef(x) dx = ef(x) + C � ∫ f ′(x).af(x) dx = a f(x) ln(a) + C � ∫ f ′(x) f(x) dx = ln|f(x)|+ C � ∫ f ′(x)sen [f(x)] dx = −cos [f(x)] + C � ∫ f ′(x)cos [f(x)] dx = sen [f(x)] + C