Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL DE MATO GROSSO INSTITUTO DE CIÊNCIAS EXATAS E DA TERRA DEPARTAMENTO DE ESTATÍSTICA Lista número 2 Disciplina: Análise de regressão I. Curso: Estatística. Professor: Dr. Mariano Martinez Espinosa. Semestre: Primeiro. Ano: 2018. 1. Um engenheiro florestal realizou uma pesquisa com dados de povoamentos de Eucaliptus grandis no Estado de São Paulo com uma amostra aleatória de 60 arvores. O objetivo da pesquisa foi identificar o efeito da idade, região e capacidade [a capacidade produtiva de um local refere-se ao potencial desse lugar para produzir madeira ou outro tipo de produto, sob a condição ambiental existente (clima e solo) e técnicas silviculturais empregadas. A interação entre esses fatores expressa a qualidade do local para uma espécie ou grupo de espécies, sendo um indicador da produtividade potencial] no diâmetro da altura ao peito das árvores pesquisadas. Os dados desta pesquisa são apresentados na Tabela 1.1. Na qual a variável resposta ou dependente é o diâmetro em cm ( y ) e as variáveis explicativas foram: a idade ( 1x ) medida em anos; a região ( 2x ), considerando 6 regiões diferentes denominadas por R1, R2, R3, R4, R5 e R6 e a capacidade, observar que neste exercício apenas foram consideradas duas capacidades (baixa e alta). Estimar os efeitos dessas três variáveis no diâmetro utilizando a análise de regressão. Os dados obtidos na pesquisa são apresentados parcialmente na Tabela 1.1 e a base completa na planilha anexa com nome: dados exercício 1 lista 2_primeiro semestre 2018. Tabela 1.1 Arvore, diâmetro, idade, região e capacidade de uma amostra aleatória de 60 árvores, pesquisadas em São Carlos, São Paulo, Brasil, 2017. Arvore Diâmetro ( y ) Idade ( 1x ) Região ( 2x ) Capacidade ( 3x ) 1 13,00 3 R1 Alta 2 11,00 3 R1 Baixa 59 25,00 10 R6 Baixa 60 25,20 9,5 R6 Alta Considerando os dados da Tabela 1.1 e utilizando o MINITAB: a) Codificar as variáveis categóricas, considerando como referencia a região 1 (R1) na variável Região e a categoria baixa na variável capacidade, por favor, apresente a tabela com a codificação utilizada. b) Expresse a reta de regressão linear múltipla da variável diâmetro em cm ( y ) em função das três variáveis independentes: idade ( 1x ), região ( 2x ) e capacidade ( 3x ). c) Verifique a adequação do modelo de regressão fazendo uma análise residual, com as técnicas apresentadas nos Capítulos 3 e 4 e também fazendo um teste de normalidade e de variância constante. d) Caso o modelo não seja adequado o que você faria para adequar o modelo e porque? e) Com o modelo adequado final, faça inferências para os parâmetros deste modelo (Teste de hipóteses e construía intervalos de confianças). f) Faça conclusões sobre os parâmetros do modelo. g) Estime o diâmetro de uma arvore com uma idade de 12 anos, da região 6 (R6) e para uma capacidade alta e construía um intervalo de confiança de 95% para este valor estimado. 2. Os dados da planilha dados exercício 2 lista 2_primeiro semestre 2018 são de um estudo do tipo caso-controle, aninhado em uma coorte, no qual foram considerados casos, todas as crianças que apresentaram pelo menos um episódio diarreico nos primeiros seis meses de vida e controle todas as crianças que não apresentaram episódio diarreico durante os seis meses de observação. Foram analisadas todas as crianças recrutadas para o estudo (397), das quais 239 (60,2%) apresentaram pelo menos um episódio diarreico e 158 (39,8%) não apresentaram diarreia durante o período de observação. Assim a variável resposta foi crianças com e sem diarreia (caso e controle), segundo os fatores aleitamento materno (menos de seis meses (meq6m) e 6 meses ou mais (maiq6m)), geladeira (Não e Sim), escolaridade materna em anos (0 a 4 anos, 5 a 8 anos e 9 ou mais anos), peso ao nascer (menos de 2500 gramas (meq2500g) e maior ou igual que 2500 gramas (maiq2500g)), Salario do chefe da família (menor ou igual que um salário mínimo (meiq1sm) e mais de um salário mínimo (maisq1sm)) e abastecimento de agua (sem canalização e canalizada). Estes dados foram adaptados utilizando os dados do artigo dos autores: Da Silva, GAP, Lira, PI, Lima MC. Fatores de risco para doença diarreica no lactente: um estudo caso-controle. Cad. Saúde Pública, Rio de Janeiro, 20(2):589-595, 2004. Com os dados desta planilha e utilizando o programa MINITAB: a) Categorize os dados, utilizando os códigos 0 e 1 e faça uma análise bivariada, de acordo ao planejamento utilizado; b) Categorize os dados utilizando os códigos 0 e 1 a faça uma análise múltipla utilizando uma regressão logística múltipla; c) Apresente o modelo final da regressão logística múltipla e faça inferências para os parâmetros deste modelo (Teste de hipóteses e construía intervalos de confianças). d) Faça suas conclusões. Observação: Neste exercício, por favor, considerar a última categoria em todas as variáveis como categoria de referência.
Compartilhar