Buscar

NOTAS DE AULA 07 REGRESSÃO LINEAR 2014.1

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

*
José de Souza Neto, Prof. PhD
E-mail: jsneto@pq.cnpq.br
jsneto.pro@hotmail.com
*
*
1.	Representação de algum fenomeno
2.	Modelo Matematico é uma expressão matematica de algum fenomeno
3.	Geralmente descreve relações entre variaveis
4.	Tipos
Modelos Deterministicos
Modelos Probabilisticos
*
1.	Exato Relacionamento entre variaveis
2.	Aplicaveis quando dispensamos o termo aleatorio
*
1.	2 Componentes
Deterministico
Termo Erro ou Aleatorio
2.	Exemplo: Volume de vendas é 10 vezes o gasto com propaganda + Erro
Y = 10X + 
Erro pode ser devido a fatores outros que não a propaganda
*
Process
Decision
Modelos
Probabilisticos 
Modelos de Correlação 
Outros Modelos
Modelos de Regressão
*
Process
Decision
Modelos Probabilisticos
Modelos de Correlação 
Outros Modelos
Modelos de Regressão
*
1.	Procura responder “ qual é a relação entre as variaveis? ”
2.	Equação Usada
1 Variavel Dependente (Resposta) Numerica
O que é para ser estimado ou predito
1 ou mais Variaveis Numericas ou Categoricas, Variaveis Independente (Explicativas).
3.	Usados principalmente para fins de Predição e Estimação
*
1.	Define Variaveis
Conceitual ( Propaganda, Preço, Renda, Lucro, etc)
Empirico ( Coleta Preços, Quantidades…) 
Unidades de medida (R$, Unidades)
2.	Estuda a Natureza das relações
Efeitos esperados (Sinais dos Coeficientes)
Forma Funcional (Linear ou Não-Linear)
Interações
*
1.	Teoria (Sociologia, Economia, Agronomia…)
2.	Matematica
3.	Pesquisa 
4. “Senso Comum”
X-Axis
Y-Axis
Propaganda
Vendas
X-Axis
Y-Axis
Text
Propaganda
Vendas
X-Axis
Y-Axis
Propaganda
Vendas
X-Axis
Y-Axis
Text
Introductory
Stage
Growth
Stage
Maturity
Stage
Decline Stage
Total
Market
Sales
Time
Propaganda
Vendas
*
*
Modelos de 
Regressão
*
Modelos de 
Regressão
Simples
1 Variavel
Explicativa
*
Modelos de 
Regressão
2 ou + Variaveis 
Explicativas
Simples
Multipla
1 Variavel 
Explicativa
*
Regressão
Modelos de 
Linear
Simples
Multipla
1 Variavel 
Explicativa
2 ou + Variaveis 
Explicativas
*
Modelos de 
Regressão 
Linear
Não-
Linear
Simples
Multipla
1 Variavel 
Explicativa
2 ou + Variaveis 
Explicativas
*
 Modelos de 
Regressão 
Linear
Não-
Linear
Simples
Multipla
Linear
1 Variavel 
Explicativa
2 ou + Variaveis 
Explicativas
*
 Modelos de 
Regressão
Linear
Não-
Linear
Simples
Multipla
Linear
Não-
Linear
1 Variavel 
Explicativa
2 ou + Variaveis 
Explicativas
*
*
X-Axis
Y-Axis
Variação em Y
Variação em X
b = Inclin.
a = Y- intercepto
Y
Y = a + bX
X
*
Y
X
i
i
i






0
1
1.	Relação entre variaveis segue uma função linear
Variavel Dependente (Resposta)
Variavel Independente (Explicativa)
Inclinação
 Y-Intercepto
Erro
*
Valores observados
Valores Observados
i = Erro
X-Axis
Y-Axis
Y
X
*
*
0
20
40
60
0
20
40
60
X
Y
1.	Plote todos os pares de pontos (Xi, Yi)
2.	Sugira qual o melhor modelo
*
Como você poderia traçar um reta através dos pontos? Como determinar que reta seria melhor ajustada ?
*
Como você poderia traçar um reta através dos pontos? Como determinar que reta seria melhor ajustada ? 
*
Como você poderia traçar um reta através dos pontos? Como determinar que reta seria melhor ajustada?
*
Como você poderia traçar um reta através dos pntos? Como determinar que reta seria melhor ajustada
*
Como você poderia traçar um reta através dos pontos? Como determinar que reta seria melhor ajustada ?
*
Como você poderia traçar um reta através dos pontos? Como determinar que reta seria melhor ajustada ?
*
Como você poderia traçar um reta através dos pontos? Como determinar que reta seria melhor ajustada ?
*
1.	‘Melhor Ajustamento’ Significa que esperamos ter diferenças minimas entre os valores observados (Y) e valores preditos (Y ) pelo modelo. 
Diferenças com valores positivos e negativos 
MQO minimiza a soma das diferenças dos quadrados (SSE)
*
X-Axis
Y-Axis
2
Y
X
1
3
4
^
^
^
^
*
Coeficiente Angular
(Inclinação )
Coeficiente Linear (Intercepto)
Equação
Xi�
Yi�
Xi2�
Yi2�
XiYi�
�
X1�
Y1�
X12�
Y12�
X1Y1�
�
X2�
Y2�
X22�
Y22�
X2Y2�
�
:�
:�
:�
:�
:�
�
Xn�
Yn�
Xn2�
Yn2�
XnYn�
�
SXi�
SYi�
SXi2�
SYi2�
SXiYi�
�
*
*
1.	Inclinãção (1)
Variações em Y devidas a 1 , quando fazemos X variar de uma unidade adicional 
Se 1 = 2, então Vendas (Y) aumenta por 2 para cada de acrescimo em Propaganda (X), por exemplo.
^
^
^
*
1.	Inclinação (1)
Variações em Y devidas a 1 , quando fazemos X variar de uma unidade adicional 
Se 1 = 2, então Vendas (Y) aumenta por 2 para cada de acrescimo em Propaganda (X), por exemplo.
^
^
^
*
1.	Inclinação (1)
Variações em Y devidas a 1 , quando fazemos X variar de uma unidade adicional 
Se 1 = 2, então Vendas (Y) aumenta por 2 para cada de acrescimo em Propaganda (X), por exemplo.
^
^
^
*
1.	Inclinãção (1)
Variações em Y devidas a 1 , quando fazemos X variar de uma unidade adicional 
2.	Intercepto (0)
Valor Médio de Y Quando X = 0
Se 0 = 4, então em média, Venda (Y) é esperada ser 4 quando Propaganda (X) for igual a 0 (zero).
^
^
^
^
 Baseado nos dados de Propaganda e Vendas, qual a relação entre os mesmos ?
 Progaganda (R$) Vendas Quant. 	 1			1 	 2			1 	 3			2 	 4			2 	 5			4
*
Vendas
Propaganda
Xi�
Yi�
Xi2�
Yi2�
XiYi�
�
1�
1�
1�
1�
1�
�
2�
1�
4�
1�
2�
�
3�
2�
9�
4�
6�
�
4�
2�
16�
4�
8�
�
5�
4�
25�
16�
20�
�
15�
10�
55�
26�
37�
�
*
Qual a equação estimada ? 
*
*
1.	Inclinação (Coef Angular) (1)
Volume de Vendas (Y) é esperado aumentar de 0,7 unidades para cada unidade R$1 gasto em Propaganda (X)
^
*
1.	Inclinação (Coef Angular) (1)
Volume de Vendas (Y) é esperado aumentar de 0,7 unidades para cada unidade R$1 gasto em Propaganda (X)
2.	Intercepto (Coef. Linear) (0)
Volume médio de vandas (Y) é -.10 unidade quando Propaganda (X) for 0 (zero)
^
^
*
			 Coeficientes Estimados
 Coeficiente Erro T for H0:
 Variavel DF Estimado Padrão Coef=0 Prob>|T|
 INTERCEPTO 1 -0.1000 0.6350 -0.157 0.8849
 PROPAG. 1 0.7000 0.1914 3.656 0.0354
0
^
1
^
k
^
Você é um administrador de uma empresa agropecuaria. Você coleta os seguintes dados:
		 Fertilizante (kg.) Produção (kg.) 	 	 4		 3.0 	 	6		 5.5 		10		 6.5 		12		 9.0
Qual é a relação entre fertilizante e produção 
de milho?
*
Produção (lb.)
Fertilizante (kg.)
Xi�
Yi�
Xi2�
Yi2�
XiYi�
�
 4�
3.0�
 16�
 9.00�
 12�
�
 6�
5.5�
 36�
30.25�
 33�
�
10�
6.5�
100�
42.25�
 65�
�
12�
9.0�
144�
81.00�
108�
�
32�
24.0�
296�
162.50�
218�
�
*
*
*
1.	Inclinação (1)
Produção (Y) é esperada aumentar de 0,65 kg. para cada uma unidade (1 kg) de aumento em fertilizante (X)
^
*
1. Inclinação (1)
Produção (Y) é esperada aumentar de 0,65 kg. para cada uma unidade (1 kg) de aumento em fertilizante (X)
2.	Intercepto (0)
Produção Média de Milho (Y) é esperada ser 0.8 kg . quando não for utilizado nada de fertilizante (X) ou seja quando (X = 0)
^
^
*
1.	Soma Total dos Quadrados (SSyy)
Medida de variação dos valores observados Yi em torno da média de Y (Y)
2.	Variação Explicada (SSR)
Variação devida ao relacionamento entre as variaveis X e Y
3.	Variação não explicada (SSE)
Variação devida a outros fatores
*
Variação Total
(Yi -Y)2 
Variação explicada 
(Yi -Yi)2 
^
Variação não explicada (Yi -Y)2 
^
Yi 
X-Axis
Y-Axis
Y
Xi
Y
X
*
1.	Proporção da Variação Explicada pela Relação entre X e Y.
Interprete o coeficiente de 
 determinação de 0.8167.
0  r2  1
r2 = 1
r2 = 1
r2 = .8
r2 = 0
X-Axis
Y-Axis
Y
X
X-Axis
Y-Axis
Y
X
X-Axis
Y-Axis
Y
X
X-Axis
Y-Axis
Y
X
*
 
 Root MSE 0.60553 R-square 0.8167
 Dep Mean 2.00000 Adj R-sq 0.7556
 C.V. 30.27650 
 
r2 ajustado para o numero de variaveis independentes (explicativas) e tamanho da amostra.
S
r2
*
		Xi
		Yi
		Xi2
		Yi2
		XiYi
		1
		1
		1
		1
		1
		2
		1
		4
		1
		2
		3
		2
		9
		4
		6
		4
		2
		16
		4
		8
		5
		4
		25
		16
		20
		15
		10
		55
		26
		37
*
*
 Parameter Estimates
 Parameter Standard T for H0:
 Variable DF Estimate Error Param=0 Prob>|T|
 INTERCEP 1 -0.1000 0.6350 -0.157 0.8849
 PROPAG 1 0.7000 0.1914 3.656 0.0354
 
t = k / S
P-Value
S
k
k
k
^
^
^
^
*
1.	Responde “como é forte a relação linear entre duas variaveis”
2.	Coeficiente de Correlação 
Valores variam de -1 a +1
Mede o grau de associação entre duas variaveis
3.	Usado principalmente para entendimento das relações entre variaveis.
*
1.	Conhecido como Coeficiente de Correlação de Pearson, r:
*
-1.0
+1.0
0
-.5
+.5
*
-1.0
+1.0
0
-.5
+.5
Nenhuma Correlação
*
-1.0
+1.0
0
Aumentando o grau de correlação negativa
-.5
+.5
Nenhuma Correlação
*
-1.0
+1.0
0
-.5
+.5
Perfeita CorrelaçãoNegativa
Nenhuma Correlação
*
-1.0
+1.0
0
-.5
+.5
Aumentando o grau de correlação positiva
Perfeita CorrelaçãoNegativa
Nenhuma Correlação
Coeficiente de Correlação - Valores
*
-1.0
+1.0
0
Perfeita Correlação
-.5
+.5
Nenhuma Correlação
Perfeita CorrelaçãoNegativa
r = 1
r = -1
r = .89
r = 0
*
1.	Mostra se existe uma relação linear entre duas variaveis numericas
2.	Conclusão a respeito do coeficiente angular (intercepto) 1
3.	Hipoteses 
H0:  = 0 (Nenhuma Correlação) 
Ha:   0 (Correlação) 
3
.
7
7
17
With positive linear relationship, sales increases infinitely.
Discuss concept of ‘relevant range’.
18
This teleology is based on the number of explanatory variables & nature of relationship between X & Y.
19
This teleology is based on the number of explanatory variables & nature of relationship between X & Y.
20
This teleology is based on the number of explanatory variables & nature of relationship between X & Y.
21
This teleology is based on the number of explanatory variables & nature of relationship between X & Y.
22
This teleology is based on the number of explanatory variables & nature of relationship between X & Y.
23
This teleology is based on the number of explanatory variables & nature of relationship between X & Y.
24
This teleology is based on the number of explanatory variables & nature of relationship between X & Y.
24
This teleology is based on the number of explanatory variables & nature of relationship between X & Y.
26
28
35
40
42
43
44
45
46
47
48
49
52
53
54
57
58
59
62
65
66
67
78
79
80
106
108
‘Standard Error’ is the estimated standard deviation of the sampling distribution, sbP.
132
134
135
136
137
138
139
141

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais