Buscar

Aulas 3 e 4 Regressão Linear Simples (1)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Aulas 3 e 4: Regressão Linear Simples (1)
Grande parte da análise econométrica começa com a seguinte premissa: y e x são duas variáveis que representam alguma população e, estamos interessados em explicar y em termos de x ou em estudar como y varia com as variações em x. Alguns exemplos: y é a produção de soja e x e a quantidade de fertilizantes, y é o salário e x representa os anos de educação, y é uma taxa de criminalidade em uma comunidade e x é o número de policiais.
Ao escrever um modelo que explicará y em termos de x, defrontamo-nos com três questões. Primeiro, como nunca há uma relação exata entre duas variáveis, como consideraremos outros fatores que afetam y? Segundo, qual é a relação funcional entre x e y? Terceiro, como poderemos estar certos de que estamos capturando uma relação ceteris paribus entre y e x?
Podemos resolver essas ambiguidades escrevendo uma equação que relaciona y a x. Uma equação simples é:
y = β0 + β1.x + u	
A equação acima, que supostamente é válida para a população de interesse, define o modelo de regressão linear simples. Quando relacionadas por essa expressão y é chamada de variável dependente ou explicada e x é chamada de variável independente ou explicativa.
O termo u é o termo de erro ou perturbação, também chamado de termo aleatório ou resíduo e representa outros fatores, além de x, que afetam y. Uma análise de regressão simples trata, efetivamente, todos os fatores, além de x, que afetam y como não observados.
A equação de regressão também trata da relação funcional entre y e x. Se os outros fatores em u são mantidos fixos, de modo que a variação em u é zero (Δu = 0), então x tem um efeito linear sobre y:
Δy = β1.Δx
Assim, a função de regressão é uma função linear de x. A linearidade significa que o aumento de uma unidade em x faz com que o valor esperado de y varie segundo a magnitude β1.
Exemplo: produção de soja e fertilizantes
Suponha que a produção de soja seja determinada pelo modelo 
produção = β0 + β1.fertilizante + u
de modo que y = produção e x = fertilizante. O pesquisador agrícola está interessado no efeito dos fertilizantes sobre a produção, mantendo outros fatores fixos. Esse efeito é dado por β1. O termo u contém fatores como qualidade da terra e da semente, chuva, etc. O coeficiente β1 mede o efeito dos fertilizantes sobre a produção, mantendo outros fatores fixos.
Vamos agora fazer algumas considerações sobre o termo u. Primeiro, o valor médio de u é igual a zero, ou seja, na equação de regressão haverá tantos erros positivos quanto negativos de forma que sua média será sempre nula. Assim, podemos escrever:
E(u) = 0
Além disso, devemos enfatizar que o valor de u não depende de x, ou seja, u é independente de x.
Estimativas de mínimos quadrados ordinários
Trataremos agora da importante questão de como estimar os parâmetros β0 e β1 da equação de regressão linear. Para tanto, necessitamos de uma amostra da população. Vamos considerar {(xi, yi): i = 1, 2, ..., n} com o uma amostra aleatória de tamanho n da população. Podemos então escrever:
yi = β0 + β1.xi + ui	(i)
Com exemplo, xi poderia ser a renda anual e yi a poupança anual para a família i durante um determinado ano. Se coletarmos dados de 15 famílias, então n = 15. Um gráfico de tal conjunto de dados é mostrado abaixo, juntamente com a função de regressão populacional (nesse caso, fictícia).
Como se pode ver na figura acima, os pontos do gráfico indicam os valores reais das variáveis, mas a reta de regressão não necessariamente intercepta esses pontos. Assim, o valor de y dado pela reta tem uma diferença em relação ao y real. Essa diferença é indicada pelo termo ui. Na figura a seguir, podemos ver uma representação de uma equação de regressão, com a indicação do yi real e do yi estimado pela equação, que será indicado por .
Assim, temos que: 
 	(ii)
no qual os acentos circunflexos indicam estimativas.
O objetivo da estimação pelo método dos mínimos quadrados é o de obter estimativas dos parâmetros β0 e β1 com base em uma amostra de valores de y e x, de modo que os erros ou resíduos sejam mínimos.
Da equação (i), temos que: 
ui = yi – β0 – β1.xi
ou ainda:
Como já vimos, a média dos erros é zero, o que quer dizer que Σui = 0. Para que os erros sejam mínimos, é então necessário que o somatório dos quadrados dos erros, ou seja
seja um mínimo. Assim, desejamos minimizar a expressão:
Essa minimização pode ser obtida fazendo-se a derivada parcial da expressão acima em relação a β0 e a β1, igualando essas derivadas a zero. Assim, omitindo o índice i, temos:
 
De (iii), segue-se que:
				
	(v)
De (iv) segue-se que:
substituindo (v), temos:
 (vi)
As equações (v) e (vi) definem, pelo método dos mínimos quadrados ordinários (MMQO), o cálculo dos parâmetros da regressão .
O coeficiente β1 também pode ser dado por:
Que é simplesmente a covariância amostral entre x e y, dividida pela variância amostral de x. Uma implicação imediata dessa relação é que se x e y são positivamente correlacionados na amostra, então β1 será positivo; se x e y são negativamente correlacionados, então β1 será negativo.
Propriedades do MMQO
O MMQO tem algumas propriedades numéricas importantes. São as propriedades que se sustentam em consequência do uso dos mínimos quadrados ordinários, quaisquer que sejam as formas pelas quais os dados foram gerados:
1) Os estimadores de MMQO são expressos unicamente em termos de quantidades observáveis (isto é, amostras) como X e Y. Portanto, podem ser calculados com facilidade.
2) São estimadores pontuais, isto é, dada a amostra, cada estimador proporciona apenas um único valor do parâmetro populacional relevante.
3) Uma vez obtidas as estimativas de MMQO para os dados amostrais, a linha de regressão amostral pode ser facilmente obtida. Essa linha de regressão tem as seguintes propriedades:
a) Passa pelas médias amostrais de Y e X.
b) O valor médio de Y estimado é igual ao valor médio do Y observado.
c) O valor médio dos resíduos é igual a zero.
d) Os resíduos não estão correlacionados ao Y previsto.
e) Os resíduos não estão correlacionados ao X.
Exercício
Com os dados da tabela abaixo, obtenha a equação de regressão de Y em função de X pelo modelo linear, usando o MMQO. Para o cálculo dos parâmetros β0 e β1, utilize a HP-12C, o Excel e o E-Views e compare os resultados. Adicionalmente, verifique as propriedades listadas no item 3 acima para os dados da tabela:
	Despesas familiares de consumo semanal Y e renda familiar semanal X
	Y (em US$)
	X (em US$)
	70
	80
	95
	100
	90
	120
	95
	140
	110
	160
	115
	180
	120
	200
	140
	220
	155
	240
	150
	260
	Fonte: GUJARATI (2006), p. 71
Solução:
No Excel
No eViews
Colar X e Y do exel no eViews
Escrever em Command: “ls y x x” e dar enter
Clicar em View – Representation
Y = 38.2727272727 + 0.445454545455*X
Clicar em View – Estimation Output
	Dependent Variable: Y
	
	
	Method: Least Squares
	
	
	Date: 03/09/18 Time: 10:03
	
	
	Sample: 1 10
	
	
	
	Included observations: 10
	
	
	
	
	
	
	
	
	
	
	
	
	Variable
	Coefficient
	Std. Error
	t-Statistic
	Prob.  
	
	
	
	
	
	
	
	
	
	
	C
	38.27273
	6.913027
	5.536320
	0.0005
	X
	0.445455
	0.038525
	11.56280
	0.0000
	
	
	
	
	
	
	
	
	
	
	R-squared
	0.943542
	    Mean dependent var
	114.0000
	Adjusted R-squared
	0.936485
	    S.D. dependent var
	27.76889
	S.E. of regression
	6.998376
	    Akaike info criterion
	6.906090
	Sum squared resid
	391.8182
	    Schwarz criterion
	6.966607
	Log likelihood
	-32.53045
	    Hannan-Quinn criter.
	6.839703
	F-statistic
	133.6984
	    Durbin-Watson stat
	2.268635
	Prob(F-statistic)
	0.000003

Continue navegando

Outros materiais