2019-01-14 Estatística Teste Final D - Resolução

Estatistica Basica I

•

UNIDERP - ANHANGUERA

Lwana Hugo

07/07/2021

Prévia do material em texto

Estatística
Teste �nal � Resolução
14 de janeiro de 2019 � Duração: 90 minutos
Utilize apenas as folhas do enunciado para responder às questões. Caso necessite de espaço
adicional poderá utilizar a última página do enunciado. Não desagrafe as folhas.
Nome: Número:
1. A quantia diária depositada num mealheiro por um jovem preocupado com o seu futuro é uma (6.0)
variável aleatória normalmente distribuída com média igual a 120 euros e variância igual a 64
euros2.
(a) Determine a percentagem de dias em que esta pessoa deposita entre 105 e 135 euros no seu (1.0)
mealheiro.
P (105 < X < 135) = P (X < 135)− P (X < 105)
= P
(
Z <
135− 120
8
)
− P
(
Z <
105− 120
8
)
= Φ(1.88)− Φ(−1.88)
= 0.9699− (1− 0.9699)
= 0.9398
(b) Determine a probabilidade da quantia depositada ser superior à média, nos dias em que essa (1.5)
quantia é inferior a 125 euros.
P (X > 120|X < 125) = P (120 < X < 125)
P (X < 125)
=
Φ(0.63)− Φ(0)
Φ(0.625)
=
0.7357− 0.5
0.7357
= 0.3204
(c) Determine o limite inferior da quantia depositada em 90% dos dias. (2.0)
P (X > `) = 0.9⇔ P
(
Z <
`− 120
8
)
= 0.1
⇔ `− 120
8
= −1.28
⇔ ` = 109.76
(d) Assuma que o jovem só deposita dinheiro durante a semana de trabalho (5 dias) para o (1.5)
gastar durante o �m de semana. Determine a média e a variância do total dos depósitos
feitos semanalmente.
Pela aditividade da distribuição Normal, o total dos depósitos é uma variável aleatória
com parâmetros:
µ = 5× 120
= 600
σ2 = 5× 64
= 320
2. Uma cadeia de supermercados tenciona abrir uma nova loja num bairro onde vivem aproximada- (7.0)
mente 10000 pessoas. Antes de se tomar a decisão de abrir a nova loja foi feito um estudo no qual
400 pessoas foram entrevistadas. Destas, 310 indicaram que poderiam vir a ser clientes habituais
do novo supermercado.
(a) Construa um intervalo de con�ança a 95% para a proporção de pessoas que poderão vir a (5.5)
ser clientes regulares do supermercado.
• Variável aleatória fulcral
Pretende-se determinar um intervalo de con�ança para uma proporção, logo
X̄ − θ√
X̄(1−X̄)
n
a∼ N (0, 1)
• Quantis de probabilidade
aα = −bα = −1.96
• Inversão das desigualdades
P
aα < X̄ − θ√
X̄(1−X̄)
n
< bα
 = 0.95⇔
P
(
aα
√
X̄(1− X̄)
n
< X̄ − θ < bα
√
X̄(1− X̄)
n
)
= 0.95⇔
P
(
aα
√
X̄(1− X̄)
n
− X̄ < −θ < bα
√
X̄(1− X̄)
n
− X̄
)
= 0.95⇔
P
(
X̄ − bα
√
X̄(1− X̄)
n
< θ < X̄ − aα
√
X̄(1− X̄)
n
)
= 0.95
• Concretização
IC95%(θ) =
]
310
400
± 1.96
√
0.775(1− 0.775)
400
[
=]0.7341, 0.8159[
(b) Utilize o intervalo anterior para construir um intervalo de con�ança a 95% para o número (1.5)
de pessoas que utilizarão regularmente o supermercado.
Sabendo que no bairro vivem 10000 pessoas, o intervalo pretendido obtém-se multipli-
cando o intervalo anterior por 10000, ou seja,
IC95%(N) =]7341, 8159[
3. Num ensaio clínico para avaliar a e�cácia de um novo medicamento para a hipertensão, administrou- (7.0)
se o novo medicamento a um grupo de 100 pacientes. Para esta amostra obteve-se uma tensão
arterial sistólica média de 13.96. Admite-se que a tensão arterial sistólica num indivíduo é uma
variável aleatória normalmente distribuída com desvio padrão igual a 1.04.
(a) Sabendo que a tensão arterial sistólica é considerada normal quando inferior a 14, o que (4.5)
pode concluir acerca da e�cácia do novo medicamento para um nível de signi�cância de 5%?
• Hipóteses
H0 : µ = 14 H1 : µ < 14
• Estatística de teste
Estamos na presença de uma distribuição Normal com variância conhecida logo,
X̄ − µ
σ/
√
n
∼ N (0, 1)
• Valor observado da estatística de teste
tobs =
13.96− 14
1.04/
√
100
= −0.3846
• Região crítica
RC =]−∞,−.1645]
• Decisão
Visto que −0.3846 6∈ RC, não rejeitamos H0 para α = 5%, ou seja, o novo medi-
camento não parece reduzir signi�cativamente a tensão arterial sistólica.
(b) Qual o valor-p do teste anterior? Interprete o resultado. (2.5)
Tratando-se de um teste unilateral à esquerda,
p = P
(
X̄ − µ
σ/
√
n
< −0.3846
)
= 1− Φ(0.38)
= 0.352
A hipótese H0 só seria rejeitada para níveis de signi�cância acima de 35.2%, ou seja,
para os níveis usuais podemos a�rmar que o medicamento não é e�caz.
Formulário
• Estatística Descritiva
� Regra de Sturges:
∗ Número de classes: k tal que 2k > n
∗ Amplitude das classes: h = max(xj)−min(xj)
k
� Medidas de localização:
∗ Média:
· Dados não agrupados: x̄ = 1
n
∑n
j=1 xj
· Dados agrupados: x̄ = 1
n
∑m
j=1 Fjxj
· Dados agrupados em classes: x̄ = 1
n
∑m
j=1 Fjx
′
j
∗ Moda:
· Dados agrupados em classes: m∗ = liminf +
Fm∗ − Fm∗,ant
2Fm∗ − (Fm∗,ant + Fm∗,post)
× h
∗ Mediana:
· Dados não agrupados: M =

x(n+1
2
) se n é ímpar(
x(n2 )
+ x(n+1
2
)) /2 se n é par
· Dados agrupados em classes: M = liminf +
0.5− f∗M,ant
fM
× h
∗ Quantis:
· Dados agrupados em classes: qα = liminf +
α− f∗qα,ant
fqα
× h
� Medidas de dispersão:
∗ Amplitude do intervalo de variação: AIV = x(n) − x(1)
∗ Amplitude do intervalo interquartis: AIQ = q0.75 − q0.25
∗ Variância:
· Dados não agrupados: s2 = 1
n
∑n
j=1(xj − x̄)2 =
1
n
∑n
j=1 x
2
j − x̄2
· Dados agrupados: s2 = 1
n
∑m
j=1 Fj(xj − x̄)2 =
1
n
∑m
j=1(Fjxj
2)− x̄2
· Dados agrupados em classes: s2 = 1
n
∑m
j=1 Fj(x
′
j − x̄)2 =
1
n
∑m
j=1(Fjx
′
j2
)− x̄2
∗ Variância corrigida:
· Dados não agrupados: s′2 = 1
n−1
∑n
j=1(xj − x̄)2 =
1
n−1
(∑n
j=1 x
2
j − nx̄2
)
· Dados agrupados: s′2 = 1
n−1
∑m
j=1 Fj(xj − x̄)2 =
1
n−1
(∑n
j=1 Fjxj2 − nx̄2
)
· Dados agrupados em classes: s′2 = 1
n−1
∑m
j=1 Fj(x
′
j − x̄)2 =
1
n−1
(∑n
j=1 Fjx
′
j2
− nx̄2
)
∗ Desvio padrão: s = +
√
s2
∗ Desvio padrão corrigido: s′ = +
√
s′2
∗ Coe�ciente de variação: CV =
s
x̄
� Outliers:
∗ Outlier severo: xj < q0.25 − 3×AIQ ou xj > q0.75 + 3×AIQ
∗ Outlier moderado: xj < q0.25 − 1.5×AIQ ou xj > q0.75 + 1.5×AIQ
• Noções básicas de probabilidade
� Cálculo combinatório:
∗ Ank =
n!
(n− k)!
∗ αnk = n
k
∗
(n
k
)
= n!
k!(n−k)!
� Leis de De Morgan:
∗ A ∪B = A ∩B
∗ A ∩B = A ∪B
� Propriedades de uma medida de probabilidade:
∗ P (A) ≥ 0
∗ P (Ω) = 1
∗ P (∅) = 0
∗ P (A) = 1− P (A)
∗ Se A ⊂ B então P (A) ≤ P (B)
∗ P (B −A) = P (B)− P (A ∩B)
∗ P (A ∪B) = P (A) + P (B)− P (A ∩B)
� Probabilidade condicionada: P (A|B) = P (A∩B)
P (B)
, se P (B) > 0
� Teorema da probabilidade total: Dada uma partição de Ω, {A1, A2, ..., Am}, tem-se para qualquer acontecimento
B, P (B) =
∑m
j=1 P (Aj)P (B|Aj)
� Teorema de Bayes: Dados dois acontecimentos A e B de�nidos no mesmo espaço de resultados tais que P (A) > 0
e P (B) > 0, tem-se que P (B|A) =
P (A|B)P (B)
P (A)
• Variáveis aleatórias
� Função (densidade) de probabilidade:
∗ V.a. discretas: fX(x) ≥ 0;
∑
x fX(x) = 1
∗ V.a. contínuas: fX(x) ≥ 0;
∫+∞
−∞ fX(x) dx = 1
� Função de distribuição:
∗ V.a. discretas: FX(x) = P (X ≤ x) =
∑
j≤x fX(j)
∗ V.a. contínuas: FX(x) = P (X ≤ x) =
∫ x
−∞ fX(t) dt
� Valor esperado:
∗ V.a. discretas: E(X) =
∑
x xfX(x)
∗ V.a. contínuas: E(X) =
∫+∞
−∞ xfX(x) dx
∗ E(k) = k,∀k ∈ R
∗ E(aX + b) = aE(X) + b, ∀a, b ∈ R
∗ Se X e Y forem duas v.a., E(X + Y ) = E(X) + E(Y )
∗ Se X e Y forem duas v.a. independentes, E(XY ) = E(X)E(Y )
� Variância:
∗ V ar(X) = E(X2)− E2(X)
∗ V ar(k) = 0, ∀k ∈ R
∗ V ar(X) ≥ 0
∗ V ar(aX + b) = a2V ar(X),∀a, b ∈ R
∗ Se X e Y forem duas v.a. independentes, V ar(X + Y ) = V ar(X) + V ar(Y )
• Distribuições
� Distribuição Binomial:
∗ fX(x) =
(n
x
)
θx(1− θ)n−x, x = 0, 1, 2, ..., n
∗ E(X) = nθ
∗ V ar(X) = nθ(1− θ)
� Distribuição Binomial negativa:
∗ fX(x) =
(x− 1
r − 1
)
θr(1− θ)x−r, x = r, r + 1, r + 2, ...
∗ E(X) =
r
θ
∗ V ar(X) =
r(1− θ)
θ2
� Distribuição de Poisson:
∗ fX(x) = e
−λλx
x!
, x = 0, 1, 2, ...
∗ E(X) = λ
∗ V ar(X) = λ
� Distribuição Exponencial:
∗ fX(x) = λe−λx, x ≥ 0
∗ FX(x) = 1− e−λx
∗ E(X) = 1
λ
∗ V ar(X) = 1
λ2
� Distribuição Normal:
∗ E(X) = µ
∗ V ar(X) = σ2
∗ Se X ∼ N (µ, σ2) então
X − µ
σ
∼ N (0, 1)
∗ Dado z > 0, Φ(−z) = 1− Φ(z)
∗ Teorema da aditividade da distribuição normal: Dadas n v.a. independentes tais que Xi ∼ N (µi, σ2i ),
S =
n∑
i=1
αiXi ∼ N (µS , σ2S)onde µS =
∑n
i=1 αiµi e σ
2
S =
∑n
i=1 α
2
i σ
2
i .
∗ Corolários: Se as v.a. forem i.i.d. então S =
∑n
i=1 Xi ∼ N (nµ, nσ2) e X̄ =
1
n
∑n
i=1Xi ∼ N (µ, σ2/n)
� Teorema do limite central: Dada uma sucessão de v.a. i.i.d. X1, X2, ..., Xn com valor esperado µ e variância σ2,
então, quando n ≥ 30, S =
∑n
i=1 Xi
a∼ N (nµ, nσ2) e X̄ a∼ N (µ, σ2/n)
• Distribuições por amostragem
� População normal com σ2 conhecida: X̄−µ
σ/
√
n
∼ N (0, 1)
� População normal com σ2 desconhecida: X̄−µ
S′/
√
n
∼ tn−1
� População não normal com σ2 conhecida (n ≥ 30): X̄−µ
σ/
√
n
a∼ N (0, 1)
(caso particular da distribuição de Bernoulli: X̄−θ√
θ(1−θ)/
√
n
a∼ N (0, 1))
� População não normal com σ2 desconhecida (n ≥ 30): X̄−µ
S′/
√
n
a∼ N (0, 1)
(caso particular da distribuição de Bernoulli: X̄−θ√
X̄(1−X̄)/
√
n
a∼ N (0, 1))
� População normal:
(n−1)S′2
σ2
∼ χ2n−1
• Primitivas imediatas:
�
∫
k dx = kx+ C
�
∫
f ′(x).f(x)k dx = f(x)
k+1
k+1
+ C, k 6= −1
�
∫
f ′(x).ef(x) dx = ef(x) + C
�
∫
f ′(x).af(x) dx = a
f(x)
ln(a)
+ C
�
∫ f ′(x)
f(x)
dx = ln|f(x)|+ C
�
∫
f ′(x)sen [f(x)] dx = −cos [f(x)] + C
�
∫
f ′(x)cos [f(x)] dx = sen [f(x)] + C