Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 UNIVERSIDADE FEDERAL DE OURO PRETO – ICEB / DEEST CURSO DE ESTATÍSTICA Disciplina: EST002 – Estatística II Professor: Ricardo Tavares Matrícula e Nome: ______________________________________________________________ 3ª Lista de Exercícios 1) Em um experimento para verificar a relação entre crises de asma e incidência de gripe, 150 crianças foram escolhidas, ao acaso, dentre aquelas acompanhadas pelo posto de saúde do bairro. Os dados referentes a uma semana são apresentados na tabela abaixo. Asma \ Gripe Sim Não Sim 27 34 Não 42 47 (A) Qual das versões do teste qui-quadrado é adequado nessa situação? Justifique. (B) Realize o teste apropriado considerando um erro tipo I de 5%. 2) A opinião sobre o atendimento de pacientes com AIDS em hospitais públicos foi estudada em duas cidades. Na cidade A, sorteou-se 150 usuários e, em B, 200. Com os resultados apresentados na tabela abaixo: (A) Qual a versão do teste Qui-quadrado é mais apropriada neste caso? (B) Considerando um nível de significância de 5%, você diria que a opinião do tipo boa é a mesma nas duas cidades? Cidade \ Atendimento Bom Regular Ruim A 73 37 40 B 94 61 45 3) Realizou-se um estudo tipo coorte para investigar a associação entre o nível de catecolamina no sangue e a incidência posterior de doença coronariana. Para isto, 609 homens com idade entre 40 e 76 anos foram acompanhados no período de 1960 a 1989. O nível de catecolamina foi determinado em 1960 e classificado como alto ou baixo. Os resultados são apresentados na tabela abaixo: Doença coronariana Nível inicial de catecolamina Total Alto Baixo Presente 27 44 71 Ausente 95 443 538 Total 122 487 609 Teste a existência de associação entre as duas variáveis em estudo a um nível de 5% e 3%. 2 4) Com o objetivo de comparar uma vacina padrão com uma nova vacina contra o tétano, foi ministrada a vacina padrão em 14 pacientes e a nova vacina a outros 16. Dos 14 pacientes que receberam a vacina padrão, 10 contraíram o tétano e dos 16 pacientes que receberam a nova vacina, 5 contraíram o tétato. Pergunta-se: as duas vacinas são igualmente eficazes? Vacina Tétano Total Contraiu Não Contraiu Padrão 10 4 14 Nova 5 11 16 Total 15 15 30 5) Quatro máquinas de grande porte trabalham de forma independente e ao fim da jornada de trabalho são vistoriadas pelo controle de qualidade e, caso necessitem, serão ajustadas. Das informações arquivadas pela empresa, sorteamos 22 dias e anotamos o número de máquinas que sofreram ajuste nesses dias. Os dados são apresentados na tabela abaixo. O Engenheiro de manutenção pretende verificar se é adequado o modelo Binomial com n=4 e probabilidade de ajuste p=0,1. Use um nível de significância de 4%. Ajustes diários 0 1 2 3 4 Freqüência 13 6 2 1 0 6) Os dados abaixo se referem ao peso (gramas) e a idade (semanas), de codornas: Idade (X1) 1 2 3 4 5 6 7 8 9 10 Peso (Y) 60 100 120 150 200 210 310 320 330 360 Admita que as suposições necessárias sejam válidas e resolva os itens abaixo: a) construa o diagrama de dispersão e discutir sua tendência; b) determine e interprete o coeficiente de correlação; c) determine a equação de regressão linear de Y em X; d) proceda à análise de variância da regressão; e) determine e interprete o coeficiente de determinação; f) represente graficamente a reta no diagrama de dispersão; g) estime o valor médio de Y para X igual ao seu valor médio. 7) Um investigador deseja estudar a possível relação entre o salário (em anos completos) e o tempo de experiência (em mil reais) no cargo de gerente de agências bancárias de uma grande empresa. Os dados coletados são mostrados no Quadro 1 abaixo. 3 a. Faça o diagrama de dispersão do salário versus experiência e analise a relação entre as duas variáveis. Esta relação é significativa? Pearson's product-moment correlation data: exper and salar t = 21.3018, df = 25, p-value < 2.2e-16 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.942046 0.988026 sample estimates: cor 0.9735413 b. Escreva a equação do modelo de regressão linear com experiência como variável explicativa. Liste as suposições deste modelo. > ajuste=lm(salar ~ exper) > ajuste Call: lm(formula = salar ~ exper) Coefficients: (Intercept) exper 1.83070 0.09982 c. Analise o modelo de regressão linear. A variável experiência é significativa para explicar variável salário? Esboce a reta estimada no gráfico do item (a). > summary(ajuste) Call: lm(formula = salar ~ exper) Residuals: Min 1Q Median 3Q Max -0.59637 -0.07929 0.03977 0.14499 0.26523 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.830696 0.076062 24.07 <2e-16 *** exper 0.099819 0.004686 21.30 <2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.2 on 25 degrees of freedom Multiple R-squared: 0.9478, Adjusted R-squared: 0.9457 F-statistic: 453.8 on 1 and 25 DF, p-value: < 2.2e-16 d. Interprete os valores estimados dos coeficientes de regressão. Veja item (c) 4 e. Construa e Interprete a Tabela de Análise de Variância. Qual a estimativa para a variância dos erros? > anova(ajuste) Analysis of Variance Table Response: salar Df Sum Sq Mean Sq F value Pr(>F) exper 1 18.1539 18.1539 453.77 < 2.2e-16 *** Residuals 25 1.0002 0.0400 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 f. Calcule e interprete o valor do coeficiente de determinação R2. Veja item (c) g. Assumindo que as suposições necessárias estão satisfeitas, calcule e interprete o intervalo de confiança para os coeficientes do modelo. > confint(ajuste) 2.5 % 97.5 % (Intercept) 1.67404277 1.9873489 exper 0.09016774 0.1094694 h. Calcule os valores ajustados do salário pelo modelo para cada indivíduo da amostra. Faça e analise o diagrama de dispersão dos valores ajustados versus os valores observados. > ajuste$fitted.values 1 2 3 4 5 6 7 8 1.830696 3.527611 2.329789 3.327974 2.729063 3.327974 2.629244 2.329789 9 10 11 12 13 14 15 16 3.128337 3.827067 2.928700 1.930514 2.429607 2.529426 4.126523 3.827067 17 18 19 20 21 22 23 24 3.627430 4.525797 2.928700 2.828881 4.725434 4.126523 2.229970 4.026704 25 26 27 4.326160 2.729063 4.326160 Figura: Valores observados x Valores ajustados. 5 i. Forneça uma estimativa pontual e um intervalo de confiança de 95% para a média de salário de gerentes com experiência igual a 14; # Veja os itens (b) e (g) j. Calcule os resíduos do modelo ajustado para cada indivíduo da amostra. Faça a análise dos resíduos, verificando as suposições listadas no item (2) através dos seguintes gráficos. (g1) resíduos versus valores ajustados (g2) resíduos versus variável explicativa. (g3) probabilidade normal dos resíduos. 6 #Pessoal, para eliminar possíveis dúvidas quanto a suposição de homogeneidade, podemos dividir #o conjunto de dados em duas partes, utilizando a mediana, por exemplo, e realizar um teste para #comparar as variâncias de cada subconjunto, ok. > mediana=median(exper) > mediana [1] 13 > var.test(residuals(ajuste)[exper>mediana],residuals(ajuste)[exper<mediana])F test to compare two variances data: residuals(ajuste)[exper > mediana] and residuals(ajuste)[exper < mediana] F = 5.4334, num df = 12, denom df = 12, p-value = 0.006408 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 1.657891 17.806654 sample estimates: ratio of variances 5.433369 # Em relação a normalidade, aparentemente esta suposição violada, porque? Vamos realizar o Teste de Normalidade de Shapiro Wilk: > shapiro.test(residuals(ajuste)) Shapiro-Wilk normality test data: residuals(ajuste) W = 0.9025, p-value = 0.01531 #Pessoal, analise estes resultados e faça seus comentários #quanto a análise dos resíduos, ok. k. O modelo ajustado parece ser adequado? Justifique. 8) Considere um grupo de 60 pacientes com hipertensão arterial. Foram medidas duas variáveis em cada paciente: a idade (em anos) e a pressão arterial sistólica (em mmHg). Considerando os resultados abaixo, responda: (A) Existe associação entre essas duas medidas? Ela pode ser descartada? Justifique. (B) Qual o modelo que descreve esse relacionamento? Ele está bem ajustado ou precisa de alterações? Justifique. (C) Interprete o que acontece com a pressão sistólica para cada aumento de um ano de idade. (D) Para um paciente com 65 anos de idade, qual a previsão de sua pressão sistólica? (E) Construa e interprete um Intervalo de 97% de confiança para essa sua previsão. (F) Qual a interpretação do coeficiente de determinação? Análise de regressão linear simples no R [LADO A] >summary(lm(pressao~idade,data=dados)) Coeficientes: Estimativa EP t Valor p IC[coef ; 97%] Constante 129,71 2,17 59,77 < 2e-16 (124,9 ; 134,5) Idade 0,27 0,04 6,894 4,42e-09 (0,183 ; 0,357) R2: 0,4504; Estatística F: 47,52 com 1 e 58 g.l.; valor p: 4,419e-09 Análise de correlação de Pearson no R [LADO B] >cor.test(idade, pressao,method="pearson") t = 6,8938; gl = 58; valor p = 4,42e-09 hipótese alternativa: a verdadeira correlação é diferente de zero intervalo de 95% de confiança: 0,503 0,790 Estimativa da correlação amostral: 0,671 Bom Trabalho!
Compartilhar