Buscar

3 Analise de regressao multipla

Prévia do material em texto

Modelos de Regressão 
Aplicados em Epidemiologia 
Profa. Dra. Maria do Rosário D O Latorre
Profa. Dra. Gleice M S Conceição
Regressão Linear Múltipla
De todos os métodos estatísticos, a análise de regressão múltipla é um dos mais amplamente utilizados.
Às vezes, uma única variável explicativa no modelo pode fornecer uma descrição inadequada, uma vez que diversas variáveis-chave afetam um mesmo fenômeno de maneiras importantes e distintas. 
Frequentemente, as previsões da variável resposta com base em um modelo contendo apenas uma única variável explicativa são muito imprecisas para serem úteis. 
Um modelo mais complexo, contendo variáveis explicativas adicionais pode ser mais útil para fornecer previsões suficientemente precisas da variável de resposta.
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Regressão Linear Múltipla
Permite modelar os efeitos de várias variáveis explicativas na resposta simultaneamente
Variável resposta é quantitativa
Variáveis explicativas podem ser quantitativas ou qualitativas.
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Regressão Linear Múltipla
Análise descritiva
Descrever a relação entre a variável resposta e cada uma das variáveis explicativas
Descrever a relação entre as variáveis explicativas
Ajuste do modelo
Quantificar o efeito de cada variável explicativa na resposta, controlando para as demais variáveis
Deve considerar a existência de interações entre as variáveis explicativas
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
onde 
i = 1, ..., n
é o valor da variável resposta na i-ésima observação
0 , 1 , ..., p são os parâmetros a serem estimados
X1i , X2i , ..., Xpi são os valores das p variáveis explicativas (constantes conhecidas) na i-ésima observação
i é um erro aleatório não observável i-ésima observação; 
i ~ N(0, 2); (i , j) são independentes para todo i, j.
Regressão Linear Múltipla
O modelo de regressão linear múltipla pode ser escrito como:
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Regressão Linear Múltipla
O que equivale a:
independentes
i = 1, ..., n
Para facilitar a compreensão, a partir daqui, vamos omitir o índice i na equação acima, ficando com: 
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Regressão Linear Múltipla
Uma variável explicativa X (regressão linear simples)
Y em função de X é representado por uma reta.
Y
X
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Regressão Linear Múltipla
Duas variáveis explicativas 
Y em função de é representado por um plano.
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Regressão Linear Múltipla
A interpretação dos coeficientes do modelo é semelhante a do modelo de regressão linear simples:
 é o valor esperado de Y quando todas as variáveis explicativas são iguais a zero.
 é o aumento esperado em Y quando aumentamos de uma unidade, mantendo as demais variáveis explicativas constantes.
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Regressão Linear Múltipla
Se e 
 é o valor esperado ou médio de Y quando todas as variáveis explicativas são iguais a zero.
Pode ou não ser interpretável.
Por exemplo, em um modelo com duas variáveis explicativas:
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Regressão Linear Múltipla
Aumentando de uma unidade e mantendo constante:
 é o valor esperado ou médio em Y quando aumentamos de uma unidade, independentemente das demais variáveis.
Por exemplo, em um modelo com duas variáveis explicativas:
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Regressão Linear Múltipla
Aumentando de uma unidade e mantendo constante:
 é o valor esperado de Y quando aumentamos de uma unidade, independentemente das demais variáveis.
Por exemplo, em um modelo com duas variáveis explicativas:
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Quadro de Análise de Variância
	Fonte de variação	g.l.	SQ	QM		p-valor
	Regressão	p	SQM	QMM		 
	Resíduo	n-p-1	SQR	QMR	 	 
	Total	n-1	SQT	 	 	 
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Regressão Linear Múltipla
O coeficiente de determinação () é obtido da mesma forma:
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Testes de hipóteses para o modelo
Para testar se existe relação entre Y e o conjunto de variáveis explicativas (X1 , X2 , ..., Xp):
	
	 (j=1,...,p) são iguais a zero
Estatística do teste:
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Testes de hipóteses para cada coeficiente
Para testar se cada coeficiente individualmente é igual a zero ou não (se cada variável explicativa é ou não significativa):
	
	
Estatística do teste:
	
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Modelo só com altura
	Fonte de variação	g.l.	SQ	QM		p-valor
	Regressão
(altura)					
	Resíduo					
	Total					
Exemplo: amostra de crianças
Quadro de Análise de Variância
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Modelo só com altura
	Fonte de variação	g.l.	SQ	QM		p-valor
	Regressão
(altura)	1	588,92	588,92	19,675	0,001263
	Resíduo	10	299,33	29,93	 	 
	Total	11	888,25	 	 	 
Exemplo: amostra de crianças
Quadro de Análise de Variância
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Modelo com altura e idade
 
	Fonte de variação	g.l.	SQ	QM		p-valor
	Regressão
(altura + idade)					
	Resíduo					
	Total					
Exemplo: amostra de crianças
Quadro de Análise de Variância
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Modelo com altura e idade
 
	Fonte de variação	g.l.	SQ	QM		p-valor
	Regressão
(altura + idade)	2	692,82	346,41	15,95	0,0011
	Resíduo	9	195,43	21,71	 	 
	Total	11	888,25	 	 	 
Exemplo: amostra de crianças
Quadro de Análise de Variância
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
	Fonte de variação	g.l.	SQ	QM		p-valor
	Regressão
(altura)	1	588,92	588,92	19,675	0,001263
	Resíduo	10	299,33	29,93	 	 
	Total	11	888,25	 	 	 
 )
	Fonte de variação	g.l.	SQ	QM		p-valor
	Regressão
(altura + idade)	2	692,82	346,41	15,96	0,0011
	Resíduo	9	195,43	21,71	 	 
	Total	11	888,25	 	 	 
299,33 – 195,43 = 103,90
692,82 – 588,92 = 103,90
Uma Soma de Quadrado Adicional mede o aumento marginal na soma de quadrados do modelo quando uma ou mais variáveis explicativas são incluídas em um modelo que já continha outras variáveis.
Somas de Quadrados Adicionais
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
	Fonte de variação	g.l.	SQ	QM		p-valor
	Regressão
(altura)	1	588,92	588,92	19,675	0,001263
	Resíduo	10	299,33	29,93	 	 
	Total	11	888,25	 	 	 
 )
	Fonte de variação	g.l.	SQ	QM		p-valor
	Regressão
(altura + idade)	2	692,82	346,41	15,96	0,0011
	Resíduo	9	195,43	21,71	 	 
	Total	11	888,25	 	 	 
Somas de Quadrados Adicionais
Analogamente, uma Soma de Quadrado Adicional mede a redução marginal na soma de quadrados do resíduo quando uma ou mais variáveis explicativas são incluídas em um modelo que já continha outras variáveis.
299,33 – 195,43 = 103,90
692,82 – 588,92 = 103,90
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
	Fonte de variação	g.l.	SQ	QM		p-valor
	Regressão
(altura)	1	588,92	588,92	19,675	0,001263
	Resíduo	10	299,33	29,93	 	 
	Total	11	888,25	 	 	 
 
	Fonte de variação	g.l.	SQ	QM		p-valor
	Regressão
(altura + idade)	2	692,82	346,41	15,96	0,0011
	Resíduo	9	195,43	21,71	 	 
	Total	11	888,25	 	 	 
Somas de Quadrados Adicionais
Note que
299,33 – 195,43 = 103,90
692,82 – 588,92 = 103,90
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Decomposição da SQ do Modelo em 
Somas de Quadrados adicionais
Por exemplo, em um modelo com 3 variáveis explicativas, 
, é possível decompor a SQM em 3 partes:
Reorganizando a expressão acima
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
)
Reorganizando a expressão acima
Decomposição da SQ do Resíduo em 
Somas de Quadrados adicionais
Por exemplo, em um modelo com 3 variáveis explicativas, 
, é possível decompor a SQR em3 partes:
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Teste F-parcial
	Fonte de variação	g.l.	 SQ	 QM	 	p-valor
	Regressão	3	SQM()	QMM()		
	 					 
	 					
	 | 					
	Resíduo	n-4	 SQR	 QMR	 	 
	Total	n-1	 SQT	 	 	 
Em um modelo com 3 variáveis explicativas
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Teste F-parcial
	Fonte de variação	g.l.	 SQ	 QM	 	p-valor
	Regressão	3	SQM()	QMM()		
	 	1	SQM()			 
	 	1	SQM()			
	 | 	1	SQM( | )			
	Resíduo	n-4	 SQR	 QMR	 	 
	Total	n-1	 SQT	 	 	 
Em um modelo com 3 variáveis explicativas
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Teste F-parcial
	Fonte de variação	g.l.	 SQ	 QM	 	p-valor
	Regressão	3	SQM()	QMM()		
	 	1	SQM()	QMM()		 
	 	1	SQM()	QMM()		
	 | 	1	SQM( | )	QMM( | )		
	Resíduo	n-4	 SQR	 QMR	 	 
	Total	n-1	 SQT	 	 	 
Em um modelo com 3 variáveis explicativas
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Teste F-parcial
	Fonte de variação	g.l.	 SQ	 QM	 	p-valor
	Regressão	3	SQM()	QMM()		
	 	1	SQM()	QMM()		 
	 	1	SQM()	QMM()		
	 | 	1	SQM( | )	QMM( | )		
	Resíduo	n-4	 SQR	 QMR	 	 
	Total	n-1	 SQT	 	 	 
Em um modelo com 3 variáveis explicativas
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Quadro de Análise de Variância
	Fonte de variação	g.l.	SQ	QM		p-valor
	Altura					
	Idade | Altura					
	Resíduo					
	Total					
Exemplo: amostra de crianças
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Quadro de Análise de Variância
	Fonte de variação	g.l.	SQ	QM		p-valor
	Altura	1	588,92	588,92	27,12	0,00056
	Idade | Altura	1	103,9	103,9	4,7849	0,0565
	Resíduo	9	195,43	21,71	 	 
	Total	11	888,25	 	 	 
Exemplo: amostra de crianças
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Teste F-parcial
Para avaliar a inclusão de uma nova variável em um modelo que já contem outras variáveis, isto é, para avaliar se o modelo com a nova variável é melhor do que o modelo sem ela:
 modelo só com é melhor - 
 modelo com é melhor - 
Formalmente, a estatística do teste é definida com base nos resíduos: 
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Teste F-parcial
No exemplo Amostra de Crianças:
 modelo só com altura é melhor - 
 modelo com altura e idade é melhor - 
Estatística do teste: 
P-valor = 0,05648
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Teste F-parcial
Forma geral: 
Para avaliar a inclusão de uma (ou mais) nova(s) variável(eis) em um modelo que já contem outras variáveis :
 modelo reduzido (com k variáveis) é melhor
 modelo completo (com k + l variáveis) é melhor
Estatística do teste: 
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Análise de resíduos
Para avaliar se o modelo está bem ajustado
Fundamental em qualquer análise!
Procedimentos semelhantes aos descritos anteriormente, quando vimos o modelo de regressão linear simples
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Métodos de seleção de variáveis
Grande número de variáveis explicativas
Métodos stepwise
Método stepwise forward 
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Método stepwise forward 
Conduzir a análise univariada
A partir da análise univariada, selecionar as variáveis que apresentaram p-valor menor do 0,2 ou 0,25, por exemplo. 
As variáveis explicativas são introduzidas uma a uma no modelo, da mais importante para a menos importante. 
Ordem de "importância" definida segundo o valor do coeficiente de correlação de Pearson
A cada passo do procedimento, uma nova variável é incluída no modelo e deve-se decidir se ela deve permanecer ou não. 
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Critérios para decidir se uma determinada variável deve permanecer ou não no modelo: 
o fato de o seu coeficiente ser significante ou marginalmente significante (por exemplo, p-valor <= 0.10) 
o fato de o modelo contendo esta variável ser significativamente “melhor” do que o modelo sem esta variável (teste F parcial, adotando um nível de significância de 0.10, por exemplo)
o fato de esta variável ser uma “variável de ajuste”, e 
o bom senso, naturalmente! 
Uma vez que a variável tenha satisfeito os critérios anteriores, ela permanece no modelo e não é retirada em passos posteriores. 
Método stepwise forward 
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Após o procedimento stepwise, avaliar a presença de interações entre as variáveis que permaneceram no modelo, desde que a interação faça sentido para o pesquisador 
Manter apenas as interações que se mostraram significantes.
Fazer a análise de resíduos do modelo final.
Apresentar o modelo final ajustado.
Método stepwise forward 
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Regressão Linear Múltipla
Exemplo:
Um pesquisador conduziu um estudo para avaliar a relação entre a pressão arterial sistólica (Y) com a idade, o índice de Quetelet e o hábito de fumar. Os dados estão no arquivo “PAS.xls”, que contém as variáveis:
pas: pressão arterial sistólica (em mmHg)
quet: índice de Quetelet 
age: idade (em anos)
smk: 1 - fumante; 0 - não fumante
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Regressão Linear Múltipla
A modelo para a pressão sistólica com todas as variáveis explicativas pode ser escrito como
Interprete os coeficientes das variáveis quantitativas
Vamos entender como interpretar o coeficiente da variável smk 
Para facilitar as interpretações, podemos omitir o índice i ...
... e substituir os termos Xi pelos respectivos nomes das variáveis
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Variáveis que assumem apenas dois valores: 0 e 1.
Variáveis indicadoras ou “dummy”
A variável X4 será representada da seguinte forma:
 	
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Variáveis indicadoras ou “dummy”
Se fumante
Então é o acréscimo no valor esperado de Y (pressão sistólica) em indivíduos que fumam, quando comparados aos que não fumam. 
Interpretação do coeficiente da variável indicadora “smk”
Se não fumante
Para introduzirmos o conceito de variáveis indicadoras, inicialmente, vamos considerar um modelo com apenas smk como variável explicativa:
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Variáveis indicadoras ou “dummy”
Interpretação do coeficiente de variável indicadora smk 
Agora vamos considerar um modelo com duas variáveis explicativas, age e skm
Se fumante
Se não fumante
Então é o acréscimo no valor esperado de Y (pressão sistólica média) em indivíduos que fumam, quando comparados aos que não fumam, independentemente da idade. 
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Variáveis indicadoras ou “dummy”
Interpretação do coeficiente de variável indicadora smk 
Agora vamos considerar um modelo com duas variáveis explicativas, age e skm
Se fumante
Se não fumante
Essas duas equações representam retas paralelas com diferentes interceptos:
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
não fumante	1	2	2	4	fumante	1	2	6	8	age
pas
Variáveis indicadoras ou “dummy”
Interpretação do coeficiente de variável indicadora smk 
No modelo com todas as variáveis explicativas, a interpretação é a mesma
Se fumante
Se não fumante
Então é o acréscimo no valor esperado de Y (pressão sistólica média) em indivíduos que fumam, quando comparados aos que não fumam, independentemente das demais variáveis. 
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Variáveis indicadoras ou “dummy”
Variável explicativa qualitativa com mais do que duas categorias
Em geral, representamos uma variável qualitativa com c categorias por meio de c-1 variáveis indicadoras.
Por exemplo, se a variável hábito de fumar assumir os valores “nunca fumou”, “ex-fumante” ou “fumante”, poderíamos pensar, à princípio, em 3 variáveis indicadoraspara representa-la:		
	
	
	
Entretanto, note que qualquer uma dessas variáveis indicadoras pode ser obtida a partir das outras duas (preencha a tabela), de modo que bastam apenas duas variáveis para representar o hábito de fumar.
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Variáveis indicadoras ou “dummy”
Variável explicativa qualitativa com mais do que duas categorias
Em geral, representamos uma variável qualitativa com c categorias por meio de c-1 variáveis indicadoras.
Por exemplo, se a variável hábito de fumar assumir os valores “nunca fumou”, “ex-fumante” ou “fumante”, poderíamos pensar, à princípio, em 3 variáveis indicadoras para representa-la:		
	
	
Entretanto, note que qualquer uma dessas variáveis indicadoras pode ser obtida a partir das outras duas (preencha a tabela), de modo que bastam apenas duas variáveis para representar o hábito de fumar.
	indivíduo	Smk	nunca fumou	ex-fumante	fumante
	1	nunca fumou			
	2	ex-fumante			
	3	fumante			
	...				
	
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Variáveis indicadoras ou “dummy”
Variável explicativa qualitativa com mais do que duas categorias
Em geral, representamos uma variável qualitativa com c categorias por meio de c-1 variáveis indicadoras.
Por exemplo, se a variável hábito de fumar assumir os valores “nunca fumou”, “ex-fumante” ou “fumante”, poderíamos pensar, à princípio, em 3 variáveis indicadoras para representa-la:		
	
	
Entretanto, note que qualquer uma dessas variáveis indicadoras pode ser obtida a partir das outras duas (preencha a tabela), de modo que bastam apenas duas variáveis para representar o hábito de fumar.
	indivíduo	Smk	nunca fumou	ex-fumante	fumante
	1	nunca fumou	1	0	0
	2	ex-fumante	0	1	0
	3	fumante	0	0	1
	...				
	
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Variáveis indicadoras ou “dummy”
Variável explicativa qualitativa com mais do que duas categorias
Em geral, representamos uma variável qualitativa com c categorias por meio de c-1 variáveis indicadoras.
Por exemplo, se a variável hábito de fumar assumir os valores “nunca fumou”, “ex-fumante” ou “fumante”, poderíamos pensar, à princípio, em 3 variáveis indicadoras para representa-la:		
	
	
Entretanto, note que qualquer uma dessas variáveis indicadoras pode ser obtida a partir das outras duas (preencha a tabela), de modo que bastam apenas duas variáveis para representar o hábito de fumar.
	indivíduo	Smk	nunca fumou	ex-fumante	fumante
	1			0	0
	2			1	0
	3			0	1
	...				
	
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Variáveis indicadoras ou “dummy”
Variável explicativa qualitativa com mais do que duas categorias
Em geral, representamos uma variável qualitativa com c categorias por meio de c-1 variáveis indicadoras.
Por exemplo, se a variável hábito de fumar assumir os valores “nunca fumou”, “ex-fumante” ou “fumante”, poderíamos pensar, à princípio, em 3 variáveis indicadoras para representa-la:		
	
	
	
Entretanto, note que qualquer uma dessas variáveis indicadoras pode ser obtida a partir das outras duas (preencha a tabela), de modo que bastam apenas duas variáveis para representar o hábito de fumar.
De fato, não seria possível ajustar um modelo com as três variáveis, uma vez que elas são linearmente dependentes.
	indivíduo	Smk	nunca fumou	ex-fumante	fumante
	1	nunca fumou	1	0	0
	2	ex-fumante	0	1	0
	3	fumante	0	0	1
	...				
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Variáveis indicadoras ou “dummy”
Por exemplo, se ajustarmos o modelo com as indicadoras “ex-fumante” e “fumante”, deixando de fora “não fumante”, o modelo será:
Nunca fumou
Ex-fumante
Fumante
Interpretação dos coeficientes
Então é o acréscimo no valor esperado de Y (pressão sistólica média) em indivíduos ex-fumantes, quando comparados aos que nunca fumaram. 
Então é o acréscimo no valor esperado de Y (pressão sistólica média) em indivíduos fumantes, quando comparados aos que nunca fumaram. 
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Interação em modelos de regressão
Modelo de efeitos aditivos (sem interação):
Modelo com efeito de interação entre e :
Dizemos que existe interação entre duas variáveis quando o efeito de uma depende dos valores da outra e vice-versa.
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Interação em modelos de regressão
IMPORTANTE:
O significado dos coeficientes de regressão e aqui não é o mesmo apresentado anteriormente devido ao termo de interação 
Os coeficientes de regressão e não indicam mais a mudança na resposta média com um aumento de uma unidade na variável explicativa, quando as demais variáveis explicativas são mantidas constantes
Interpretação dos coeficientes na presença de interação
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Interação em modelos de regressão
Vamos considere o modelo anterior com age e skm (sim ou não)
e inserir um termo de interação entre age e skm
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Interpretação dos coeficientes na presença de interação
Importante: Lembre-se que o significado dos coeficientes de regressão e não é o mesmo devido ao termo de interação 
Se fumante
Se não fumante
Aumentando a idade de uma unidade:
Então, o acréscimo na pressão sistólica média para um aumento de uma unidade na idade depende do fato de o individuo ser ou não ser fumante!
Idade
1 quantitativa
1 qualitativa
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
não fumante	1	2	2	4	fumante	1	2	4	9	age
pas
Interpretação dos coeficientes na presença de interação
Importante: Lembre-se que o significado dos coeficientes de regressão e não é o mesmo devido ao termo de interação 
Se fumante
Se não fumante
 
Essas duas equações representam duas retas com interceptos diferentes e inclinações diferentes.
Hábito de fumar
Então, o acréscimo no valor esperado de Y (pressão sistólica média) em indivíduos que fumam, quando comparados aos que não fumam, depende da idade. 
1 quantitativa
1 qualitativa
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
não fumante	1	2	2	4	fumante	1	2	4	9	age
pas
Interação em modelos de regressão
Algumas situações possíveis na presença de interação
1 quantitativa
1 qualitativa
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
não fumante	1	2	2	4	fumante	1	2	4	9	age
pas
não fumante	1	2	2	2	fumante	1	2	4	9	age
pas
não fumante	1	2	3	1	fumante	1	2	4	9	age
pas
Interação em modelos de regressão
Vamos comparar os seguintes modelos de regressão:
Interpretação dos coeficientes na presença de interação entre duas variáveis quantitativas (complicado!!)
	modelo aditivo, sem interação
	modelo com interação
	modelo com interação
2 quantitativas
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Interação em modelos de regressão
Interpretação dos coeficientes na presença de interação entre duas variáveis quantitativas (complicado!!)
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Modelo de Regressão Polinomial
 
Modelo de regressão linear (1ª ordem): 	
Modelo de regressão quadrático (2ª ordem):	 
Modelo de regressão de 3ª ordem:	
Etc...
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Modelo de Regressão Polinomial
	Fonte de variação	g.l.	SQ	QM		p-valor
	X	1				 
	X2|X	1				
	X3|X, X2	1				
	...					
	Resíduo	n-p-1	SQR	QMR	 	 
	Total	n-1	SQT	 	 	 
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Tipos de Resíduos
1. Semistudentized residuals
Uma vez que o desvio padrão dos resíduos é , faz sentido considerar a padronização:
2. Studentized residuals
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Lembrando:
Se2 não é um estimador de e2, porque os erros eij não são independentes. 
A variância dos eij , e2, é complexa e varia para os diferentes resíduos eij . 
QMR é apenas uma aproximação da variância dos eij .
Por isto eij* é chamado de resíduos estudentizado.64
Interação em modelos de regressão
O acréscimo na resposta média com um aumento unitário em quando é mantida constante será 
Interpretação dos coeficientes na presença de interação
O acréscimo na resposta média com um aumento unitário em quando é mantida constante será 
Veja se isto é verdade!
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Interação em modelos de regressão
O acréscimo na resposta média com um aumento unitário em quando é mantida constante será 
Interpretação dos coeficientes na presença de interação
O acréscimo na resposta média com um aumento unitário em quando é mantida constante será 
Veja se isto é verdade!
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Quadro de Análise de Variância – errado?
	Fonte de variação	 gl	SQ	QM	F parciais 	p-valor
	X1					
	X2|X1					
	X3|X1 ,X2 					 
	 	 	 	 	 	
	Resíduo	 n-p	 SQR	 QMR	 	 
	Total	 n-1	 SQT	 	 	 
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP
Teste F-parcial
Para avaliar a inclusão de uma nova variável em um modelo que já contem outras variáveis, isto é, para avaliar se o modelo com a nova variável é melhor do que o modelo sem ela:
 modelo só com é melhor - 
 modelo com é melhor - 
Formalmente, a estatística do teste é definida com base nos resíduos: 
Gleice M S Conceição
Maria do rosário D D latorre
FSP - USP

Continue navegando