Prévia do material em texto
Estatística Teste �nal � Resolução 21 de janeiro de 2019 � Duração: 90 minutos Utilize apenas as folhas do enunciado para responder às questões. Caso necessite de espaço adicional poderá utilizar a última página do enunciado. Não desagrafe as folhas. Nome: Número: 1. O Professor Eleutério desloca-se todos os dias de autocarro para a universidade. Infelizmente (6.0) o percurso feito pelo autocarro tem muitas vezes trânsito, resultando num atraso no horário de chegada. Este atraso pode ser de�nido por uma variável aleatória com distribuição Normal de valor esperado 12 minutos e desvio padrão 5. (a) Determine a percentagem de dias em o Professor Eleutério chega mais de 10 minutos atra- (1.5) sado. P (X > 10) = 1− P (X ≤ 10) = 1− Φ ( 10− 12 5 ) = 1− Φ(−0.4) = 0.6554 (b) Determine a probabilidade do atraso ser inferior a 15 minutos, num dia em que o autocarro (2.0) partiu pelo menos 5 minutos atrasado. P (X < 15|X ≥ 5) = P (5 ≤ X < 15) P (X ≥ 5) = Φ(0.6)− Φ(−1.4) 1− Φ(−1.4) = 0.7257− (1− 0.9192) 0.9192 = 0.7016 (c) Ao �nal do dia, o Professor volta para casa também de autocarro. Nessa altura o trânsito (2.5) está mais calmo e os atrasos podem ser de�nidos como uma variável aleatória Normal de valor esperado 3 minutos e desvio padrão 0.5. Qual a probabilidade de num determinado dia, o percurso total feito pelo Professor sofrer um atraso superior a 20 minutos? Pela aditividade da distribuição Normal, o atraso total do dia é também uma variável aleatória (T ) com distribuição normal de valor esperado µ = 12 + 3 = 15 e variância σ2 = 52 + 0.52 = 25.25. Logo, P (T > 20) = 1− Φ ( 20− 15√ 25.25 ) = 1− Φ(1) = 1− 0.8413 = 0.1587 2. É já sabido que toda a gente adora o Professor Eleutério! A sua popularidade entre alunos e (7.0) colegas levou-o a ser candidato à presidência do Conselho Pedagógico da universidade. Para conhecer as suas hipóteses de ganhar, o Professor levou a cabo um pequeno estudo junto de 30 dos seus colegas tendo veri�cado que, destes, 17 iriam seguramente dar-lhe o seu voto. (a) Construa um intervalo de con�ança a 90% para a proporção de votos que o Professor irá (4.5) receber na eleição. • Variável aleatória fulcral Pretende-se determinar um intervalo de con�ança para uma proporção, logo X̄ − θ√ X̄(1−X̄) n a∼ N (0, 1) • Quantis de probabilidade aα = −bα = −1.645 • Inversão das desigualdades P aα < X̄ − θ√ X̄(1−X̄) n < bα = 0.9⇔ P ( aα √ X̄(1− X̄) n < X̄ − θ < bα √ X̄(1− X̄) n ) = 0.9⇔ P ( aα √ X̄(1− X̄) n − X̄ < −θ < bα √ X̄(1− X̄) n − X̄ ) = 0.9⇔ P ( X̄ − bα √ X̄(1− X̄) n < θ < X̄ − aα √ X̄(1− X̄) n ) = 0.9 • Concretização IC95%(θ) = ] 17 30 ± 1.645 √ 0.567(1− 0.567) 30 [ =]0.4178, 0.7155[ (b) Determine o número de colegas que deveria ter sido inquirido pelo Professor para que a sua (2.5) eleição fosse garantida, isto é, para que fosse receber pelo menos 50% dos votos. Queremos determinar n tal que o limite inferior do intervalo de con�ança seja pelo menos 0.5: 17 30 − 1.645 √ 0.567(1− 0.567) n ≥ 0.5⇔ −0.8152√ n ≥ 0.5− 17 30 ⇔ √ n ≥ 12.2262 ⇔ n ≥ 149.481 Deveriam ser inquiridos pelo menos 150 professores. 3. O Professor Eleutério é agora o presidente do Conselho Pedagógico! Na primeira semana de (7.0) trabalho quis inteirar-se dos problemas que mais incomodavam os alunos e veri�cou que um deles era o preço das refeições na cantina. Ao reunir com o responsável da cantina, foi informado que os alunos conseguiam fazer uma refeição completa por, no máximo 7 euros. Este valor foi imediatamente contestado pelos representantes da associação de estudantes que a�rmaram que no último mês, um grupo de 51 alunos gastou em média, em cada refeição 8.3 euros. (a) Assumindo que o valor pago por uma refeição na cantina é uma variável aleatória Normal de (4.5) variância 4.3. O que pode concluir acerca das queixas dos alunos a um nível de signi�cância de 1%? • Hipóteses H0 : µ = 7 H1 : µ > 7 • Estatística de teste Estamos na presença de uma distribuição Normal com variância conhecida logo, X̄ − µ σ/ √ n ∼ N (0, 1) • Valor observado da estatística de teste tobs = 8.3− 7√ 4.3/51 = 4.48 • Região crítica RC = [2.326,+∞[ • Decisão Visto que 4.48 ∈ RC, rejeitamos H0 para α = 1%, ou seja, os alunos têm razões para reclamar. (b) O valor-p do teste anterior é aproximadamente 0. O que pode concluir com base neste valor? (2.5) O valor-p é o nível mínimo de signi�cância que leva à rejeição deH0. Neste caso, podemos concluir que iremos sempre rejeitar H0, ou seja, os alunos têm mesmo razão. Formulário • Estatística Descritiva � Regra de Sturges: ∗ Número de classes: k tal que 2k > n ∗ Amplitude das classes: h = max(xj)−min(xj) k � Medidas de localização: ∗ Média: · Dados não agrupados: x̄ = 1 n ∑n j=1 xj · Dados agrupados: x̄ = 1 n ∑m j=1 Fjxj · Dados agrupados em classes: x̄ = 1 n ∑m j=1 Fjx ′ j ∗ Moda: · Dados agrupados em classes: m∗ = liminf + Fm∗ − Fm∗,ant 2Fm∗ − (Fm∗,ant + Fm∗,post) × h ∗ Mediana: · Dados não agrupados: M = x(n+1 2 ) se n é ímpar( x(n2 ) + x(n+1 2 )) /2 se n é par · Dados agrupados em classes: M = liminf + 0.5− f∗M,ant fM × h ∗ Quantis: · Dados agrupados em classes: qα = liminf + α− f∗qα,ant fqα × h � Medidas de dispersão: ∗ Amplitude do intervalo de variação: AIV = x(n) − x(1) ∗ Amplitude do intervalo interquartis: AIQ = q0.75 − q0.25 ∗ Variância: · Dados não agrupados: s2 = 1 n ∑n j=1(xj − x̄)2 = 1 n ∑n j=1 x 2 j − x̄2 · Dados agrupados: s2 = 1 n ∑m j=1 Fj(xj − x̄)2 = 1 n ∑m j=1(Fjxj 2)− x̄2 · Dados agrupados em classes: s2 = 1 n ∑m j=1 Fj(x ′ j − x̄)2 = 1 n ∑m j=1(Fjx ′ j2 )− x̄2 ∗ Variância corrigida: · Dados não agrupados: s′2 = 1 n−1 ∑n j=1(xj − x̄)2 = 1 n−1 (∑n j=1 x 2 j − nx̄2 ) · Dados agrupados: s′2 = 1 n−1 ∑m j=1 Fj(xj − x̄)2 = 1 n−1 (∑n j=1 Fjxj2 − nx̄2 ) · Dados agrupados em classes: s′2 = 1 n−1 ∑m j=1 Fj(x ′ j − x̄)2 = 1 n−1 (∑n j=1 Fjx ′ j2 − nx̄2 ) ∗ Desvio padrão: s = + √ s2 ∗ Desvio padrão corrigido: s′ = + √ s′2 ∗ Coe�ciente de variação: CV = s x̄ � Outliers: ∗ Outlier severo: xj < q0.25 − 3×AIQ ou xj > q0.75 + 3×AIQ ∗ Outlier moderado: xj < q0.25 − 1.5×AIQ ou xj > q0.75 + 1.5×AIQ • Noções básicas de probabilidade � Cálculo combinatório: ∗ Ank = n! (n− k)! ∗ αnk = n k ∗ (n k ) = n! k!(n−k)! � Leis de De Morgan: ∗ A ∪B = A ∩B ∗ A ∩B = A ∪B � Propriedades de uma medida de probabilidade: ∗ P (A) ≥ 0 ∗ P (Ω) = 1 ∗ P (∅) = 0 ∗ P (A) = 1− P (A) ∗ Se A ⊂ B então P (A) ≤ P (B) ∗ P (B −A) = P (B)− P (A ∩B) ∗ P (A ∪B) = P (A) + P (B)− P (A ∩B) � Probabilidade condicionada: P (A|B) = P (A∩B) P (B) , se P (B) > 0 � Teorema da probabilidade total: Dada uma partição de Ω, {A1, A2, ..., Am}, tem-se para qualquer acontecimento B, P (B) = ∑m j=1 P (Aj)P (B|Aj) � Teorema de Bayes: Dados dois acontecimentos A e B de�nidos no mesmo espaço de resultados tais que P (A) > 0 e P (B) > 0, tem-se que P (B|A) = P (A|B)P (B) P (A) • Variáveis aleatórias � Função (densidade) de probabilidade: ∗ V.a. discretas: fX(x) ≥ 0; ∑ x fX(x) = 1 ∗ V.a. contínuas: fX(x) ≥ 0; ∫+∞ −∞ fX(x) dx = 1 � Função de distribuição: ∗ V.a. discretas: FX(x) = P (X ≤ x) = ∑ j≤x fX(j) ∗ V.a. contínuas: FX(x) = P (X ≤ x) = ∫ x −∞ fX(t) dt � Valor esperado: ∗ V.a. discretas: E(X) = ∑ x xfX(x) ∗ V.a. contínuas: E(X) = ∫+∞ −∞ xfX(x) dx ∗ E(k) = k,∀k ∈ R ∗ E(aX + b) = aE(X) + b, ∀a, b ∈ R ∗ Se X e Y forem duas v.a., E(X + Y ) = E(X) + E(Y ) ∗ Se X e Y forem duas v.a. independentes, E(XY ) = E(X)E(Y ) � Variância: ∗ V ar(X) = E(X2)− E2(X) ∗ V ar(k) = 0, ∀k ∈ R ∗ V ar(X) ≥ 0 ∗ V ar(aX + b) = a2V ar(X),∀a, b ∈ R ∗ Se X e Y forem duas v.a. independentes, V ar(X + Y ) = V ar(X) + V ar(Y ) • Distribuições � Distribuição Binomial: ∗ fX(x) = (n x ) θx(1− θ)n−x, x = 0, 1, 2, ..., n ∗ E(X) = nθ ∗ V ar(X) = nθ(1− θ) � Distribuição Binomial negativa: ∗ fX(x) = (x− 1 r − 1 ) θr(1− θ)x−r, x = r, r + 1, r + 2, ... ∗ E(X) = r θ ∗ V ar(X) = r(1− θ) θ2 � Distribuição de Poisson: ∗ fX(x) = e −λλx x! , x = 0, 1, 2, ... ∗ E(X) = λ ∗ V ar(X)= λ � Distribuição Exponencial: ∗ fX(x) = λe−λx, x ≥ 0 ∗ FX(x) = 1− e−λx ∗ E(X) = 1 λ ∗ V ar(X) = 1 λ2 � Distribuição Normal: ∗ E(X) = µ ∗ V ar(X) = σ2 ∗ Se X ∼ N (µ, σ2) então X − µ σ ∼ N (0, 1) ∗ Dado z > 0, Φ(−z) = 1− Φ(z) ∗ Teorema da aditividade da distribuição normal: Dadas n v.a. independentes tais que Xi ∼ N (µi, σ2i ), S = n∑ i=1 αiXi ∼ N (µS , σ2S) onde µS = ∑n i=1 αiµi e σ 2 S = ∑n i=1 α 2 i σ 2 i . ∗ Corolários: Se as v.a. forem i.i.d. então S = ∑n i=1 Xi ∼ N (nµ, nσ2) e X̄ = 1 n ∑n i=1Xi ∼ N (µ, σ2/n) � Teorema do limite central: Dada uma sucessão de v.a. i.i.d. X1, X2, ..., Xn com valor esperado µ e variância σ2, então, quando n ≥ 30, S = ∑n i=1 Xi a∼ N (nµ, nσ2) e X̄ a∼ N (µ, σ2/n) • Distribuições por amostragem � População normal com σ2 conhecida: X̄−µ σ/ √ n ∼ N (0, 1) � População normal com σ2 desconhecida: X̄−µ S′/ √ n ∼ tn−1 � População não normal com σ2 conhecida (n ≥ 30): X̄−µ σ/ √ n a∼ N (0, 1) (caso particular da distribuição de Bernoulli: X̄−θ√ θ(1−θ)/ √ n a∼ N (0, 1)) � População não normal com σ2 desconhecida (n ≥ 30): X̄−µ S′/ √ n a∼ N (0, 1) (caso particular da distribuição de Bernoulli: X̄−θ√ X̄(1−X̄)/ √ n a∼ N (0, 1)) � População normal: (n−1)S′2 σ2 ∼ χ2n−1 • Primitivas imediatas: � ∫ k dx = kx+ C � ∫ f ′(x).f(x)k dx = f(x) k+1 k+1 + C, k 6= −1 � ∫ f ′(x).ef(x) dx = ef(x) + C � ∫ f ′(x).af(x) dx = a f(x) ln(a) + C � ∫ f ′(x) f(x) dx = ln|f(x)|+ C � ∫ f ′(x)sen [f(x)] dx = −cos [f(x)] + C � ∫ f ′(x)cos [f(x)] dx = sen [f(x)] + C