Buscar

3ª LISTA - ESTATÍSTICA 2 - 2017/1 - PROF. RICARDO TAVARES

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

1
UNIVERSIDADE FEDERAL DE OURO PRETO – ICEB / DEEST 
CURSO DE ESTATÍSTICA 
 
Disciplina: EST002 – Estatística II 
Professor: Ricardo Tavares 
 
Matrícula e Nome: ______________________________________________________________ 
 
3ª Lista de Exercícios 
 
1) Em um experimento para verificar a relação entre crises de asma e incidência de gripe, 150 
crianças foram escolhidas, ao acaso, dentre aquelas acompanhadas pelo posto de saúde do bairro. 
Os dados referentes a uma semana são apresentados na tabela abaixo. 
Asma \ Gripe Sim Não 
Sim 27 34 
Não 42 47 
(A) Qual das versões do teste qui-quadrado é adequado nessa situação? Justifique. 
(B) Realize o teste apropriado considerando um erro tipo I de 5%. 
 
2) A opinião sobre o atendimento de pacientes com AIDS em hospitais públicos foi estudada em 
duas cidades. Na cidade A, sorteou-se 150 usuários e, em B, 200. Com os resultados apresentados 
na tabela abaixo: 
(A) Qual a versão do teste Qui-quadrado é mais apropriada neste caso? 
(B) Considerando um nível de significância de 5%, você diria que a opinião do tipo boa é a mesma 
nas duas cidades? 
Cidade \ Atendimento Bom Regular Ruim 
A 73 37 40 
B 94 61 45 
 
 
3) Realizou-se um estudo tipo coorte para investigar a associação entre o nível de catecolamina no 
sangue e a incidência posterior de doença coronariana. Para isto, 609 homens com idade entre 40 e 
76 anos foram acompanhados no período de 1960 a 1989. O nível de catecolamina foi determinado 
em 1960 e classificado como alto ou baixo. Os resultados são apresentados na tabela abaixo: 
 
Doença 
coronariana 
Nível inicial de catecolamina 
Total 
Alto Baixo 
Presente 27 44 71 
Ausente 95 443 538 
Total 122 487 609 
Teste a existência de associação entre as duas variáveis em estudo a um nível de 5% e 3%. 
 2
 
4) Com o objetivo de comparar uma vacina padrão com uma nova vacina contra o tétano, foi 
ministrada a vacina padrão em 14 pacientes e a nova vacina a outros 16. Dos 14 pacientes que 
receberam a vacina padrão, 10 contraíram o tétano e dos 16 pacientes que receberam a nova vacina, 
5 contraíram o tétato. Pergunta-se: as duas vacinas são igualmente eficazes? 
Vacina 
Tétano 
Total 
Contraiu Não Contraiu 
Padrão 10 4 14 
Nova 5 11 16 
Total 15 15 30 
 
5) Quatro máquinas de grande porte trabalham de forma independente e ao fim da jornada de 
trabalho são vistoriadas pelo controle de qualidade e, caso necessitem, serão ajustadas. Das 
informações arquivadas pela empresa, sorteamos 22 dias e anotamos o número de máquinas que 
sofreram ajuste nesses dias. Os dados são apresentados na tabela abaixo. O Engenheiro de 
manutenção pretende verificar se é adequado o modelo Binomial com n=4 e probabilidade de ajuste 
p=0,1. Use um nível de significância de 4%. 
 
Ajustes diários 0 1 2 3 4 
Freqüência 13 6 2 1 0 
 
6) Os dados abaixo se referem ao peso (gramas) e a idade (semanas), de codornas: 
 
Idade (X1) 1 2 3 4 5 6 7 8 9 10 
Peso (Y) 60 100 120 150 200 210 310 320 330 360 
 
Admita que as suposições necessárias sejam válidas e resolva os itens abaixo: 
a) construa o diagrama de dispersão e discutir sua tendência; 
b) determine e interprete o coeficiente de correlação; 
c) determine a equação de regressão linear de Y em X; 
d) proceda à análise de variância da regressão; 
e) determine e interprete o coeficiente de determinação; 
f) represente graficamente a reta no diagrama de dispersão; 
g) estime o valor médio de Y para X igual ao seu valor médio. 
 
7) Um investigador deseja estudar a possível relação entre o salário (em anos completos) e o tempo 
de experiência (em mil reais) no cargo de gerente de agências bancárias de uma grande empresa. Os 
dados coletados são mostrados no Quadro 1 abaixo. 
 
 
 
 3
a. Faça o diagrama de dispersão do salário versus experiência e analise a relação entre as duas 
variáveis. Esta relação é significativa? 
 
 
 
 
 Pearson's product-moment correlation 
 
data: exper and salar 
t = 21.3018, df = 25, p-value < 2.2e-16 
alternative hypothesis: true correlation is not equal to 0 
95 percent confidence interval: 
 0.942046 0.988026 
sample estimates: 
 cor 
0.9735413 
 
 
 
b. Escreva a equação do modelo de regressão linear com experiência como variável explicativa. 
Liste as suposições deste modelo. 
> ajuste=lm(salar ~ exper) 
> ajuste 
Call: 
lm(formula = salar ~ exper) 
Coefficients: 
(Intercept) exper 
 1.83070 0.09982 
 
c. Analise o modelo de regressão linear. A variável experiência é significativa para explicar variável 
salário? Esboce a reta estimada no gráfico do item (a). 
> summary(ajuste) 
Call: 
lm(formula = salar ~ exper) 
Residuals: 
 Min 1Q Median 3Q Max 
-0.59637 -0.07929 0.03977 0.14499 0.26523 
Coefficients: 
 Estimate Std. Error t value Pr(>|t|) 
(Intercept) 1.830696 0.076062 24.07 <2e-16 *** 
exper 0.099819 0.004686 21.30 <2e-16 *** 
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
Residual standard error: 0.2 on 25 degrees of freedom 
Multiple R-squared: 0.9478, Adjusted R-squared: 
0.9457 
F-statistic: 453.8 on 1 and 25 DF, p-value: < 2.2e-16 
 
 
d. Interprete os valores estimados dos coeficientes de regressão. 
 
Veja item (c) 
 
 4
e. Construa e Interprete a Tabela de Análise de Variância. Qual a estimativa para a variância dos 
erros? 
 
> anova(ajuste) 
Analysis of Variance Table 
Response: salar 
 Df Sum Sq Mean Sq F value Pr(>F) 
exper 1 18.1539 18.1539 453.77 < 2.2e-16 *** 
Residuals 25 1.0002 0.0400 
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
 
f. Calcule e interprete o valor do coeficiente de determinação R2. 
 
Veja item (c) 
 
g. Assumindo que as suposições necessárias estão satisfeitas, calcule e interprete o intervalo de 
confiança para os coeficientes do modelo. 
 
> confint(ajuste) 
 2.5 % 97.5 % 
(Intercept) 1.67404277 1.9873489 
exper 0.09016774 0.1094694 
 
h. Calcule os valores ajustados do salário pelo modelo para cada indivíduo da amostra. Faça e 
analise o diagrama de dispersão dos valores ajustados versus os valores observados. 
> ajuste$fitted.values 
 1 2 3 4 5 6 7 8 
1.830696 3.527611 2.329789 3.327974 2.729063 3.327974 2.629244 2.329789 
 9 10 11 12 13 14 15 16 
3.128337 3.827067 2.928700 1.930514 2.429607 2.529426 4.126523 3.827067 
 17 18 19 20 21 22 23 24 
3.627430 4.525797 2.928700 2.828881 4.725434 4.126523 2.229970 4.026704 
 25 26 27 
4.326160 2.729063 4.326160 
 
Figura: Valores observados x Valores ajustados. 
 5
i. Forneça uma estimativa pontual e um intervalo de confiança de 95% para a média de salário de 
gerentes com experiência igual a 14; 
 # Veja os itens (b) e (g) 
j. Calcule os resíduos do modelo ajustado para cada indivíduo da amostra. Faça a análise dos 
resíduos, verificando as suposições listadas no item (2) através dos seguintes gráficos. 
 
(g1) resíduos versus valores ajustados 
 
(g2) resíduos versus variável explicativa. 
 
(g3) probabilidade normal dos resíduos. 
 6
#Pessoal, para eliminar possíveis dúvidas quanto a suposição de homogeneidade, podemos dividir 
#o conjunto de dados em duas partes, utilizando a mediana, por exemplo, e realizar um teste para 
#comparar as variâncias de cada subconjunto, ok. 
 
> mediana=median(exper) 
> mediana 
[1] 13 
> var.test(residuals(ajuste)[exper>mediana],residuals(ajuste)[exper<mediana])F test to compare two variances 
 
data: residuals(ajuste)[exper > mediana] and residuals(ajuste)[exper < mediana] 
F = 5.4334, num df = 12, denom df = 12, p-value = 0.006408 
alternative hypothesis: true ratio of variances is not equal to 1 
95 percent confidence interval: 
 1.657891 17.806654 
sample estimates: 
ratio of variances 
 5.433369 
 
# Em relação a normalidade, aparentemente esta suposição violada, porque? Vamos realizar o 
Teste de Normalidade de Shapiro Wilk: 
 
> shapiro.test(residuals(ajuste)) 
 Shapiro-Wilk normality test 
data: residuals(ajuste) 
W = 0.9025, p-value = 0.01531 
 
#Pessoal, analise estes resultados e faça seus comentários #quanto a análise dos resíduos, ok. 
 
k. O modelo ajustado parece ser adequado? Justifique. 
 
 
 
8) Considere um grupo de 60 pacientes com hipertensão arterial. Foram medidas duas variáveis em 
cada paciente: a idade (em anos) e a pressão arterial sistólica (em mmHg). Considerando os 
resultados abaixo, responda: 
(A) Existe associação entre essas duas medidas? Ela pode ser descartada? Justifique. 
(B) Qual o modelo que descreve esse relacionamento? Ele está bem ajustado ou precisa de 
alterações? Justifique. 
(C) Interprete o que acontece com a pressão sistólica para cada aumento de um ano de idade. 
(D) Para um paciente com 65 anos de idade, qual a previsão de sua pressão sistólica? 
(E) Construa e interprete um Intervalo de 97% de confiança para essa sua previsão. 
(F) Qual a interpretação do coeficiente de determinação? 
 
Análise de regressão linear simples no R [LADO A] 
>summary(lm(pressao~idade,data=dados)) 
Coeficientes: 
 Estimativa EP t Valor p IC[coef ; 97%] 
Constante 129,71 2,17 59,77 < 2e-16 (124,9 ; 134,5) 
Idade 0,27 0,04 6,894 4,42e-09 (0,183 ; 0,357) 
 
R2: 0,4504; 
Estatística F: 47,52 com 1 e 58 g.l.; valor p: 4,419e-09 
Análise de correlação de Pearson no R [LADO B] 
>cor.test(idade, pressao,method="pearson") 
 
t = 6,8938; gl = 58; valor p = 4,42e-09 
hipótese alternativa: a verdadeira correlação é diferente de zero 
intervalo de 95% de confiança: 
 0,503 0,790 
 
Estimativa da correlação amostral: 
0,671 
 
Bom Trabalho!

Outros materiais