Baixe o app para aproveitar ainda mais
Prévia do material em texto
Lista 5 Professora Ma´rcia Barbian Disciplina: Estat´ıstica econoˆmica (1) Um pesquisador esta´ interessado em analisar a relac¸a˜o entre o peso reportado (Y) por pacientes e seu peso verdadeiro (X). Ale´m disto, gostaria de saber se ha´ diferenc¸as quando sa˜o levados em conta homens e mulheres separadamente. A varia´veis a serem utilizadas sa˜o: • “weight” - peso do paciente; • “repwt” - peso reportado pelo paciente; • “sex” - sexo do paciente. a): A Figura 1 apresenta o diagrama de dispersa˜o do peso reportado versus peso real usando marcadores diferentes para cada sexo. Analise e compare a relac¸a˜o entre as duas varia´veis para cada sexo. 40 45 50 55 60 65 70 75 40 50 60 70 Peso Real Pe so R ep or ta do Feminino Masculino Figura 1. Gra´fico referente a` Questa˜o 01 letra a. b): Escreva o modelo de regressa˜o linear do peso reportado em func¸a˜o do peso real e sexo, com interac¸a˜o entre as duas varia´veis explicativas. c): A seguir encontra-se a sa´ıda em R do modelo mencionado no item anterio. Call: lm(formula = repwt ~ weight + sex + sex * weight, data = Davis.data) Residuals: Min 1Q Median 3Q Max -29.2230 -2.3247 -0.1325 2.0741 15.5783 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 41.32276 2.16785 19.062 < 2e-16 *** weight 0.26446 0.03632 7.282 1.01e-11 *** sexM -39.96412 3.92932 -10.171 < 2e-16 *** weight:sexM 0.72536 0.05598 12.957 < 2e-16 *** --- Residual standard error: 4.661 on 179 degrees of freedom (17 observations deleted due to missingness) 1 2 Multiple R-squared: 0.8874, Adjusted R-squared: 0.8856 F-statistic: 470.4 on 3 and 179 DF, p-value: < 2.2e-16 Escreva os modelos ajustados para cada um dos sexos e interprete os coeficientes. Os ho- mens ou as mulheres sa˜o mais honestos ao reportar o peso? d): Fac¸a o teste F da signicaˆncia da regressa˜o. (Escreva as hipo´teses nula e alternativa, fac¸a o teste e conclua). e): Qual o valor do coeficiente de determinac¸a˜o ajustado? Interprete o resultado obtido. (2) Um pesquisador esta´ interessado em analisar um indicador social (“moral”) calculado para 43 cidades dos EUA. As varia´veis explicativas sa˜o as seguintes: • “mobility” - porcentagem de residentes que entram e saem da cidade • “region” - regia˜o onde a cidade esta´ localizada, os n´ıveis da varia´vel sa˜o: E Northeast (Nordeste); MW Midwest (Centro-Oeste); S Southeast (Sudeste); W West (Oeste). Ajustou-se um modelo de regressa˜o linear mu´ltipla sem interac¸a˜o. A seguir encontram-se os resultados obtidos utilizando o software R. Escreva a equac¸a˜o do modelo completo e as equac¸o˜es das retas separadas para cada uma das regio˜es. Call: lm(formula = moral ~ mobility + region) Residuals: Min 1Q Median 3Q Max -4.2689 -1.5899 0.4398 1.6902 3.6415 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 15.221808 1.119334 13.599 3.53e-16 *** mobility 0.009111 0.052266 0.174 0.86254 regionMW -3.180633 1.098006 -2.897 0.00622 ** regionS -7.781798 1.293313 -6.017 5.40e-07 *** regionW -5.045878 1.633554 -3.089 0.00375 ** --- Residual standard error: 2.25 on 38 degrees of freedom Multiple R-squared: 0.6411, Adjusted R-squared: 0.6033 F-statistic: 16.97 on 4 and 38 DF, p-value: 4.62e-08 (3) Considere a construc¸a˜o de um modelo de regressa˜o linear com efeitos puramente aditivos para o qual se tem quatro varia´veis (X1, X2, X3 e X4) candidatas a preditoras da varia´vel resposta Y e uma amostra com n = 13 observac¸o˜es. A Figura 1 mostra os diagramas de dispersa˜o, coeficientes de correlac¸a˜o linear de Pearson para todos os pares de varia´veis e os resultados de estimac¸a˜o de 11 modelos de regressa˜o para estes dados. Encontre, com base nesses resultados, todas as indicac¸o˜es de presenc¸a de multicolinearidade que se apresentem. 3 Figura 2. Ajuste de modelos e resultados referentes a` questa˜o 3.
Compartilhar