Buscar

Lista 2_Tema6e7_2018_01_24_09_2018_Alunos

Prévia do material em texto

UNIVERSIDADE FEDERAL DE MATO GROSSO 
INSTITUTO DE CIÊNCIAS EXATAS E DA TERRA 
DEPARTAMENTO DE ESTATÍSTICA 
 
Lista número 2 
 
Disciplina: Análise de regressão I. Curso: Estatística. 
Professor: Dr. Mariano Martinez Espinosa. Semestre: Primeiro. Ano: 2018. 
 
1. Um engenheiro florestal realizou uma pesquisa com dados de povoamentos de 
Eucaliptus grandis no Estado de São Paulo com uma amostra aleatória de 60 arvores. O 
objetivo da pesquisa foi identificar o efeito da idade, região e capacidade [a capacidade 
produtiva de um local refere-se ao potencial desse lugar para produzir madeira ou outro 
tipo de produto, sob a condição ambiental existente (clima e solo) e técnicas 
silviculturais empregadas. A interação entre esses fatores expressa a qualidade do local 
para uma espécie ou grupo de espécies, sendo um indicador da produtividade potencial] 
no diâmetro da altura ao peito das árvores pesquisadas. Os dados desta pesquisa são 
apresentados na Tabela 1.1. Na qual a variável resposta ou dependente é o diâmetro em 
cm ( y ) e as variáveis explicativas foram: a idade ( 1x ) medida em anos; a região ( 2x ), 
considerando 6 regiões diferentes denominadas por R1, R2, R3, R4, R5 e R6 e a 
capacidade, observar que neste exercício apenas foram consideradas duas capacidades 
(baixa e alta). Estimar os efeitos dessas três variáveis no diâmetro utilizando a análise 
de regressão. Os dados obtidos na pesquisa são apresentados parcialmente na Tabela 1.1 
e a base completa na planilha anexa com nome: dados exercício 1 lista 2_primeiro 
semestre 2018. 
 
Tabela 1.1 Arvore, diâmetro, idade, região e capacidade de uma amostra aleatória de 60 
árvores, pesquisadas em São Carlos, São Paulo, Brasil, 2017. 
Arvore Diâmetro 
( y ) 
Idade ( 1x ) Região ( 2x ) Capacidade 
( 3x ) 
1 13,00 3 R1 Alta 
2 11,00 3 R1 Baixa 
    
59 25,00 10 R6 Baixa 
60 25,20 9,5 R6 Alta 
 
Considerando os dados da Tabela 1.1 e utilizando o MINITAB: 
 
a) Codificar as variáveis categóricas, considerando como referencia a região 1 (R1) na 
variável Região e a categoria baixa na variável capacidade, por favor, apresente a 
tabela com a codificação utilizada. 
b) Expresse a reta de regressão linear múltipla da variável diâmetro em cm ( y ) em 
função das três variáveis independentes: idade ( 1x ), região ( 2x ) e capacidade ( 3x ). 
c) Verifique a adequação do modelo de regressão fazendo uma análise residual, com 
as técnicas apresentadas nos Capítulos 3 e 4 e também fazendo um teste de 
normalidade e de variância constante. 
d) Caso o modelo não seja adequado o que você faria para adequar o modelo e 
porque? 
e) Com o modelo adequado final, faça inferências para os parâmetros deste modelo 
(Teste de hipóteses e construía intervalos de confianças). 
f) Faça conclusões sobre os parâmetros do modelo. 
g) Estime o diâmetro de uma arvore com uma idade de 12 anos, da região 6 (R6) e 
para uma capacidade alta e construía um intervalo de confiança de 95% para este 
valor estimado. 
 
2. Os dados da planilha dados exercício 2 lista 2_primeiro semestre 2018 são de um 
estudo do tipo caso-controle, aninhado em uma coorte, no qual foram considerados 
casos, todas as crianças que apresentaram pelo menos um episódio diarreico nos 
primeiros seis meses de vida e controle todas as crianças que não apresentaram episódio 
diarreico durante os seis meses de observação. Foram analisadas todas as crianças 
recrutadas para o estudo (397), das quais 239 (60,2%) apresentaram pelo menos um 
episódio diarreico e 158 (39,8%) não apresentaram diarreia durante o período de 
observação. Assim a variável resposta foi crianças com e sem diarreia (caso e controle), 
segundo os fatores aleitamento materno (menos de seis meses (meq6m) e 6 meses ou 
mais (maiq6m)), geladeira (Não e Sim), escolaridade materna em anos (0 a 4 anos, 5 
a 8 anos e 9 ou mais anos), peso ao nascer (menos de 2500 gramas (meq2500g) e maior 
ou igual que 2500 gramas (maiq2500g)), Salario do chefe da família (menor ou igual 
que um salário mínimo (meiq1sm) e mais de um salário mínimo (maisq1sm)) e 
abastecimento de agua (sem canalização e canalizada). Estes dados foram adaptados 
utilizando os dados do artigo dos autores: Da Silva, GAP, Lira, PI, Lima MC. Fatores 
de risco para doença diarreica no lactente: um estudo caso-controle. Cad. Saúde 
Pública, Rio de Janeiro, 20(2):589-595, 2004. Com os dados desta planilha e utilizando 
o programa MINITAB: 
a) Categorize os dados, utilizando os códigos 0 e 1 e faça uma análise bivariada, de 
acordo ao planejamento utilizado; 
b) Categorize os dados utilizando os códigos 0 e 1 a faça uma análise múltipla 
utilizando uma regressão logística múltipla; 
c) Apresente o modelo final da regressão logística múltipla e faça inferências para os 
parâmetros deste modelo (Teste de hipóteses e construía intervalos de confianças). 
d) Faça suas conclusões. 
 
Observação: Neste exercício, por favor, considerar a última categoria em todas as 
variáveis como categoria de referência.

Continue navegando