A maior rede de estudos do Brasil

Grátis
Regressão Linear

Pré-visualização | Página 1 de 1

*
Estatística: Aplicação ao Sensoriamento Remoto
ANO 2010
Camilo Daleles Rennó
camilo@dpi.inpe.br
http://www.dpi.inpe.br/~camilo/estatistica/
*
“método estatístico que utiliza a relação entre duas ou mais variáveis de modo que uma variável pode ser estimada (ou predita) a partir da outra ou das outras”
Regressão Linear Simples
Análise de Regressão
relação
Neter, J. et al. Applied Linear Statistical Models. McGraw Hill, 1996
*
Relação funcional x Relação estatística
As variáveis podem possuir dois tipos de relações:
Funcional: a relação é expressa por uma fórmula matemática: Y = f(X)
Ex: relação entre o perímetro (P) e o lado de um quadrado (L)
Todos os pontos caem na curva da relação funcional 
*
Relação funcional x Relação estatística
Estatística: não há uma relação perfeita como no caso da relação funcional.
	As observações em geral não caem exatamente na curva da relação.
Ex: relação entre o peso (P) e a altura (A) de uma pessoa
A existência de uma relação estatística entre a variável dependente Y e a variável independente X não implica que Y dependa de X, ou que exista uma relação de causa-efeito entre X e Y.
Gráfico1
		73
		66
		64
		94
		79
		72
		62
		64
		90
		81
Altura (cm)
Peso (kg)
Plan1
		174		73				73		0.0057471264				73		1.4				73		0.9				73		26
		161		66				66		0.0062111801				66		1.7				66		1.2				66		25
		170		64				64		0.0058823529				60		1.5				60		1.5				60		21
		180		94				94		0.0055555556				94		1				80		0.98				80		25
		182		79				79		0.0054945055				79		1.5				79		1.5				78		27
		164		72				72		0.006097561				72		1.2				72		1.2				72		28
		156		62				62		0.0064102564				62		1.7				62		1				62		23
		168		64				78		0.005952381				78		1.1				78		1.1				78		25
		176		90				90		0.0056818182				90		1.3				90		1.3				90		21
		175		81				81		0.0057142857				81		1.4				81		1.4				81		26
														87		1				87		1				88		23
														92		1.2				57		1.15				57		21
														103		1				90		1				90		20
														85		1.5				85		1.5				85		25
														99		1.3				58		1.3				58		22
														111		1				70		1				70		26
														102		0.9				85		0.9				85		23
														65		1.4				70		1.4				68		27
														72		1.5				72		1.6				62		25
														84		1.2				84		1.2				84		24
Plan1
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
Altura (cm)
Peso (kg)
Plan2
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
X
Y
Plan3
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
		0
X
Y
		26
		25
		21
		25
		27
		28
		23
		25
		21
		26
		23
		21
		20
		25
		22
		26
		23
		27
		25
		24
X
Y
		
		
*
Medida de Associação
Coeficiente de Correlação (de Pearson)
	mede o grau de relação linear entre X e Y
r = 0,9
r = 0,3
r = 0
r = - 0,9
*
Coeficiente de Correlação
Interpretações errôneas dos coeficientes de correlação
Um alto coeficiente de correlação nem sempre indica que a equação de regressão estimada está bem ajustada aos dados. 
X
Y
*
Coeficiente de Correlação
Interpretações errôneas dos coeficientes de correlação
Um coeficiente de correlação próximo de zero nem sempre indica que X e Y não são relacionadas.
*
Análise de Regressão
Determinar como duas ou mais variáveis se relacionam.
Estimar a função que determina a relação entre as variáveis.
Usar a equação ajustada para prever valores da variável dependente.
Regressão Linear Simples
Yi = 0 + 1Xi + i
*
Modelo de Regressão Linear Simples
X
Y
 b0 
1 
Coeficiente
angular
E(Y) = 0 + 1 X
*
Em geral não se conhece os valores de 0, 1 e 2 
Eles podem ser estimados através de dados obtidos por amostras. 
O método utilizado na estimação dos parâmetros é o método dos mínimos quadrados, o qual considera os desvios dos Yi de seu valor esperado:
i = Yi – (0 + 1 Xi)
Em particular, o método dos mínimos quadrados requer que consideremos a soma dos n desvios quadrados, denotado por Q:
Estimação dos parâmetros
*
Estimação dos parâmetros
De acordo com o método dos mínimos quadrados, os estimadores de 0 e 1 são aqueles, denotados por b0 e b1, que tornam mínimo o valor de Q.
Derivando
(resíduo)
Igualando-se essas equações a zero obtém-se os valores b0 e b1 que minimizam Q:
*
1)
2) é mínima
3)
4) A reta de regressão passa sempre pelo ponto 
Propriedades da equação de regressão
*
A variância dos erros i,, denotada por 2, é um parâmetro do modelo de regressão, e necessita ser estimada. 
A variância de uma v.a. qualquer é calculada pela soma dos desvios quadráticos dividido pelo no de graus de liberdade. O cálculo da variância 2 é feito da mesma maneira. 
É importante notar que a variância dos Yi é também 2. Entretanto, cada Yi vêm de distribuições de probabilidade diferentes, com diferentes médias dependendo do nível de Xi.
Estimação da Variância do Erro (2)
*
Estimação da Variância do Erro (2)
Soma de quadrados dos resíduos (SQRes):
A soma dos quadrados dos resíduos tem n – 2 graus de liberdade, pois 2 graus de liberdade foram perdidos por estimar b0 e b1. 
Portanto, o estimador de 2, denominado de Quadrado Médio do Resíduo (QMRes), é dado pela razão entre a soma dos quadrados dos resíduos e (n – 2):
 
Pode ser demonstrado que:
*
Inferência em Análise de Regressão
Considere o modelo: 
Yi = 0 + 1 Xi + i
 ~ N(0; 2) e COV (i,j)= 0
se H0 verdadeira E(t) = 0
se H0 falso E(t) <<<< 0
IC para 0 e 1
IC para Ynovo
0 = 0 ? 1 = 0 ? (teste de hipótese)
*
Abordagem da Análise de Variância na Análise de Regressão
X
Y
SQTo = SQReg + SQRes
Coeficiente de determinação
0  R2  1
Interpretação: R2 mede a fração da variação total de Y explicada pela regressão.
*
Abordagem da Análise de Variância na Análise de Regressão
se H0 verdadeiro E(F) = 1
se H0 falso E(F) >>>> 1
*
Análise de Regressão no EXCEL
OBS: Para regressão linear simples: teste F = teste t bilateral
					F = t2
*
Modelos Linearizáveis
Modelo Padrão: Yi = 0 + 1Xi + i
exponencial
potencial
logaritmo
potência
inverso
*
Análise de Resíduos
*
Análise de Resíduos
*
Análise de Resíduos
*
Regressão passando pela origem (0 = 0)
(R2 pode ser negativo!)