ECONOMETRIA VIOLAÇÕES DO MLG

•
UFRRJ

Daniel Maldonado
19.09.2013
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
*
*
*
ECONOMETRIA	1
MULTICOLINEARIDADE
AUTOCORRELAÇÃO
HETEROCEDASTICIDADE
EQUAÇÕES SIMULTÂNEAS
*
*
*
Econometria
Hipóteses sobre a Regressão
*
*
*
Econometria 1
Particularmente, as quatro últimas hipóteses, as vezes não se verificam, por isso, identificaremos o tratamento a ser seguido quando cada uma delas é violada.
Relaxando a hipótese VI: A Multicolinearidade
Ex:
Quando isso ocorre, 100% da variação destas decorre da variação de outra. No primeiro caso, qq variação de X2 implicará na variação de X3. Sendo impossível distinguir qual a influência de uma ou outra para Y, logo, é impossível estimar um modelo em que há a presença de Multicolinearidade.
*
*
*
Econometria
O termo Multicolinearidade passou a resignar alta correlação, alta, mas não necessariamente igual a 1, em modulo, situação em que é possível estimar o modelo, porem há problemas associados.
Ex:  Função consumo
*
*
*
 Econometria
ECONOMETRIA
*
*
*
Econometria
Para α = 10% de significância e GL = 13
 (para SQR Gl=n – k -1 = 16 – 2 – 1).
O valor t tabelado = 1.77, ou seja, apenas r é significante.
Para α = 5% de significância, t tab. = 2.16 todos os coeficientes não são significantes.
Este resultado, é no mínimo estranho, dizer que Ct não depende de Yt. Um pesquisador mais rigoroso eliminaria as duas variáveis do modelo ou faria um novo modelo.
Um mais atento, notaria a estatística F. Note que Ftab =3.81 
( c/GLn = 2 e GLd= 13) a 5% de significância, como Fcal=17.64 conclui-se que o modelo é válido. 
*
*
*
Econometria
Se a regressão foi validada por Fcal, porque os dois parâmetros não são significantes a 5% e o que deu errado no teste t?
- Isso se deve ao fato de que r influencie y
Se calcularmos a correlação amostral entre r e y encontraremos -0.86, sendo esta muito alta (próximo de 1), causando problemas de multicolinearidade.
*
*
*
Econometria 
O ideal seria que não houvesse correlação entre as variáveis?
Ainda que não exista corr. Populacional entre as variáveis do modelo, é pouco provável, que não exista nenhuma corr. Amostral. Aliás, senão houvesse nenhuma correlação entre as variáveis, nem sequer precisaríamos utilizar a regressão múltipla, pois os resultados das regressões simples, em separado, seriam os mesmos.
Há ainda a alternativa de não se fazer nada. Pois, lembremos que os estimador de mínimos quadrados mantém as propriedades desejáveis de um estimador ( não – viesado, eficiente e consistente), mesmo na presença de multicolinearidade. Se o objetivo for, fazer previsões a respeito da variável explicada, a retirada de variáveis correlacionadas só vai reduzir a eficiência das previsões.
*
*
*
Econometria 
Consequências da multicolinearidade
Testes t insignificantes ainda que as variáveis sejam relevantes. 
	Isso ocorre porque a variância dos coeficientes estimados se 
	eleva quando ocorre multicolinearidade e daí o motivo para os testes t apresentarem pouca ou nenhuma significância.
Vejamos:
 
Se o for próximo de 1 (-1) o valor do determinante da matriz X ( em consequência (X´X) ) será pequeno – No caso de multicolinearidade exata, o determinante da matriz X assim como (X´X) , seria zero, logo, nenhuma dela poderia ser invertida – logo, levando a grandes variâncias em
	daí a pequenos valores nos testes t. 
*
*
*
Econometria
Mas note-se: isso não significa que os testes t sejam inválidos. A variância dos coeficientes estimados de fato é muito grande na presença de multicolinearidade. 
Podemos até ser levados a conclusões erradas do ponto de vista econômico, mas, do ponto de vista estatístico, o valor do coeficiente, se insignificante, não pode ser considerado diferente de 0 em função de sua alta variância.
E como a variância dos é muito grande, podemos ter ainda que:
Os sinais dos coeficientes podem ser o inverso daqueles esperados; além do mais, seus valores ficam muito sensíveis quando se acrescenta ou se retira uma variável do modelo, ou quando há pequenas mudanças na amostra.
*
*
*
Econometria
Com relação as propriedades dos , no entanto, mesmo na presença de multicolinearidade, são mantidas as propriedades usuais do estimador de MQO, isto é, continuam não viesados, eficientes e consistentes.
Como consequências, as previsões feitas a partir de um modelo com multicolinearidade também tem essas mesmas propriedades.
*
*
*
Econometria
Como identificar a multicolinearidade
Uma maneira de identificar a multicolinearidade, ou pelo menos, suspeitar fortemente que ela existe, é obter um teste F bastante significante (ou R² alto), acompanhado de estatísticas t para os coeficientes pouco significantes, ou até mesmo não significantes. 
Sinais dos coeficientes diferentes do esperado, já são pelo menos uma forte evidência de multicolinearidade.
O cálculo da correlação, pode não funcionar muito bem quando temos mais do que duas variáveis no modelo. Quando calculamos a correlação entre duas variáveis, duas a duas, se encontramos uma correlação próxima de 1 em valores absolutos para qualquer par de variáveis, então certamente há multicolinearidade.
*
*
*
ECONOMETRIA
A recíproca, no entanto, não é verdadeira pois pode haver não um par de variáveis correlacionadas entre si mas três ou mais variáveis correlacionadas simultaneamente, cujo o valor de correlação, tomando-as duas a duas, não indique um valor muito alto.
Nesse caso, uma solução é observar o comportamento dos coeficientes quando adicionamos ou retiramos variáveis ou quando há mudanças na amostra. 
Se ocorrerem mudanças muito drásticas, inclusive nos sinais de tais coeficientes, temos ai uma evidência de que há multicolinearidade no modelo.
*
*
*
ECONOMETRIA
Há ainda a alternativa de não se fazer nada. Há sempre de se lembrar que o estimador de MQO mantém as propriedades desejáveis de um estimador, ou seja, não viesado, consistente e eficiente, mesmo na presença de multicolinearidade.
*
*
*
ECONOMETRIA
O que fazer quando há multicolinearidade
A providencia óbvia é retirar variáveis correlacionadas do modelo .
O critério por trás da retirada de variáveis é que, sendo elas altamente correlacionadas com a variável restante, ela já capta os efeitos das alterações na variável retirada.
Muitas vezes é possível reduzir os efeitos da multicolinearidade por meio do aumento de n. Isso porque a correlação alta observada pode ser decorrente da própria amostra, isto é, essa correlação pode não existir na população e o aumento nas observações poderia refletir melhor este fato, ou ainda, a correlação pode ser resultado de algum tipo de política econômica transitória.
*
*
*
Econometria
Relaxando a Hipótese V: Autocorrelação
Significa a correlação de uma variável com valores defasados (diferenças no tempo) dela mesma. Se Xt tem correlação sistemática com seu valor no ano anterior, a autocorrelação entre Xt e X t -1 não é nula. Dizemos, então, que Xt é uma variável autocorrelacionada.
Esta hipótese faz menção a Autocorrelação dos erros. Supõe-se que não existam,o que é bastante razoável, pois estamos imaginando que o erro não é uma variável especificamente, mas um conjunto de diversas influências que por sua própria natureza, são difíceis de serem medidas, mas não exercem influência uma sobre a outra.
*
*
*
Econometria
Mas se exercerem, uma variável relevante está sendo omitida e, tal omissão joga sua influência p/o termo de erro, levando a autocorrelação nos erros. 
A má especificação funcional do modelo, por exemplo: o modelo é linear e assumimos que este é exponencial leva a autocorrelação. Uma possível maneira de representar um modelo de regressão em que haja autocorrelação seria:
Em que: 
*
*
*
Econometria
Sendo:
 o coeficiente de correlação e;
 um termo de erro com as hipótese do modelo de regressão ( ou seja, sem autocorrelação).
Se o erro segue um processo como o descrito anteriormente, é dito um processo Auto-Regressivo de Ordem 1, ou simplesmente
AR(1).
Um processo AR(2):
 ou 
*
*
*
Econometria
Conseqüências da autocorrelação
A hipótese de não-existência de autocorrelação nos erros é um pré – requisito na demonstração do teorema de Gauss – Markov, com o qual se mostra que o estimador de MQO da regressão linear é um B.L.U.E.(MELNV). Portanto, na presença de autocorrelação o estimador de MQO não é mais aquele que apresenta a menor variância possível entre todos os estimadores.
Mesmo assim, podemos notar, que o estimador continua com as características de ser não-tendencioso e consistente, logo, mesmo que não tenha a menor variância, o estimador ainda detém estas duas características mesmo na presença de autocorrelação.
*
*
*
Econometria
As exceções são os modelos que incluem entre os regressores, defasagens da variável dependente, como no caso a seguir:
Vamos supor um processo do tipo AR(1):
*
*
*
Econometria
Para que o estimador fosse não – viesado:
 o que não ocorre, pois:
Embora, por hipótese, e não sejam correlacionados, o mesmo não ocorre com e , o que fica óbvio se tomarmos uma defasagem da primeira expressão: 
*
*
*
Econometria
Portanto, e são correlacionados e, assim, e, consequentemente, .Como é uma variável dependente do modelo, este se torna um caso em que a existência da autocorrelação implica viés do estimador de MQO.
Alem disso, temos de lembrar que os estimadores para a variância dos coeficientes foram calculados supondo que não há autocorrelação entre os erros, isto é, supondo que ( em Notação matricial), , 
	o que não é verdade. Os estimadores das variâncias serão (sempre) viesados, o que invalida os testes de hipóteses realizados na presença de autocorrelação.
*
*
*
Econometria
Como identificar a autocorrelação?
A maneira mais comum de identificar a existência de autocorrelação é através do Teste de Durbin-Watson:
*
*
*
Econometria
Para entendermos seu significado, desenvolveremos a expressão:
*
*
*
Econometria
Se a amostra for suficientemente grande, a diferença entre a soma de e é muito pequena, assim como é muito pequena a diferença entre somar de 1 a n ou de 2 a n. Então, podemos dizer que essas somas são (quase) iguais:
 
Obviamente o primeiro termo é igual a 1. O segundo é um estimador para o coeficiente de correlação dos erros.
*
*
*
Econometria
Com 
Se
Se
[valores de DW(razoavelmente) abaixo de 2] 
Se
 [isto é, valores DW (razoavelmente) acima de 2]
*
*
*
Econometria
Observações sobre DW:
1- Existe um intervalo onde DW é inconclusivo.
Ex: n = 20, k = 2 e α = 5% encontramos
 di = 1.1 e ds = 1.54. 
Logo, se DW < 1.1  rejeitamos a hipótese nula de não – autocorrelação, isto é, concluímos que existe autocorrelação.
Se 1.54 < DW < 2  Concluímos que não há autocorrelação, ou seja, aceitamos a hipótese nula. 
Se 1.10 < DW < 1.54  O teste torna –se inconclusivo, isto é, não podemos afirmar se existe ou não autocorrelação.
*
*
*
ECONOMETRIA
2 – A tabela é montada para autocorrelações positivas (DW < 2). Se encontrarmos um DW > 2, indicando autocorrelação negativa, basta que façamos DW* = 4 – DW e o valor DW* pode ser comparado com os valores da tabela.
 
*
*
*
Econometria 
Exemplo: c =f (y); n = 15, k =1 e α = 5%
*
*
*
Econometria
Os resultados desta regressão:
*
*
*
Econometria
Para estatística DW:
0,0066
*
*
*
Econometria
A soma de e de
Portanto, a estatística DW: 
Como o limite inferior da tabela DW é, para 5% de significância, 15 observações e k=1, temos di =1.08. Verificamos, então que neste intervalo o teste DW é inconclusivo, não podemos afirmar se podemos rejeitar a hipótese nula de não-autocorrelação.
 
*
*
*
Econometria
Além da existência de um intervalo do teste que é inconclusivo, o teste não é válido se:
1- A regressão não incluir o intercepto
2- A regressão incluir, como variáveis explicativas, defasagens da variável dependente
3- Como é claro pela própria formulação do teste, ele é feito para testar apenas correlações de primeira ordem.
*
*
*
Econometria
O que fazer quando há Autocorrelação?
Devemos saber qual é a causa da autocorrelação:
1 – Se o problema for de especificação, ele pode ser corrigido com a inclusão de mais variáveis ou alterando a forma funcional.
2 – Se esse não é o caso, então, a autocorrelação é parte integrante do modelo e a correção passa pelo conhecimento prévio de como é a estrutura da autocorrelação. Com isso, vamos supor um modelo com uma variável explicativa:
 								(1)
*
*
*
Econometria
Em que existe autocorrelação e ela é de 1ª ordem (AR(1)):
Suponhamos ainda que o coeficiente seja conhecido. Se multiplicarmos a expressão (1) defasada por , temos:
 				(2)
Subtraindo (2) de (1):
 	(3) 
Mas sabemos que:
*
*
*
Econometria
E se fizermos com que:
Reduziremos a um modelo que será:
 				(4)
Que é um modelo sem autocorrelação ( que pode, portanto, ser estimado sem problemas por MQO) e, importante, pois, apresenta o mesmo coeficiente do modelo original.
*
*
*
Econometria
No entanto, ainda resta o problema de como conhecer o coeficiente .
Uma estimativa pode ser encontrada, entretanto, por meio do próprio valor de DW, já que:
 
Então:
*
*
*
Econometria
Refazendo a estimação via correção para autocorrelação (CORC).
As variáveis corrigidas cuja regressão não apresentará autocorrelação:
*
*
*
Econometria
Os resultados desta nova regressão são:
*
*
*
Econometria
Comandos no eviews:
File  Workfile.
Definir: estrutura, tamanho e freqüência da estimação;
File  import 
Definir variáveis: no nosso caso, lny e lnc.
Quick  Estimate Equation ; digitando: lnc c lny. e clicar ok.
Aparecerá o sub-quadro definindo NLS and ARMA( que é o método para se estimar em MQO), clique OK.
Neste ponto, se apresentarão os resultados da regressão, determinando os valores dos coeficientes, as estatísticas t e F, o p-valor, os critérios de informação (CIA e CIS), SQR, e a estatística de DW (1.367). Esta última tendo serventia para o CORC (Correção da autocorrelação). Sabemos que podemos achar o valor de ρ de maneira direta no eviews.
Para o CORC, atenderemos aos seguintes comandos:
Quick  generate series  resid1 = resid. Este procedimento abrirá uma nova pasta para os resíduos.
Repetir o procedimento 9 e fazer  resid2 = resid(-1)
Ir em Quick  estimate equation; digitando: resid1 c resid2 e clicar ok.
O coeficiente de resid 2 fornece, então, o valor de ρ.
read – lotus – excel
*
*
*
Econometria
(Continuação) comandos no eviews:
O valor de ρ = 0.683, conforme mostra a regressão. A partir daí remontamos o processo, só que agora estabelecendo com este valor para y* e c* de suas variáveis defasadas em uma ordem para corrigir o problema da autocorrelação, estabelecendo os comandos:
Quick  Generate series; digitando: c1 = lnc – 0.683lnc(-1).
Repetindo o passo 15 e digitando: y1= lny – 0683lny(-1).
Quick  Estimate equation; digitando c1 c y1 e clicar OK.
O passo final é fazer a verificação dos valores apresentados nesta nova regressão, com a eliminação do problema através da CORC atentando para o valor da estatística DW.
*
*
*
Econometria
Relaxando a Hipótese 4: Heterocedasticidade.
A hipótese  Homocedasticidade.
Ex: Homocedasticidade  Altura das pessoas. Não há, por que, no entanto, acreditar que a variância desse erro de medição para diferentes grupos de pessoas (Altas ou Baixas)
Ex: Heterocedasticidade  
Onde a = anos de estudo
 w = salário.
*
*
*
Econometria
Na situação onde :
Quando a é alto, reflete em maior w , na média.
Mas a situação muda muito no que se refere ao erro. Para aqueles com pouco ou nenhum ano de estudo a variância de w será pequena. 
Mas para as pessoas com elevado a, as probabilidades são mais amplas, pois podem ter indivíduos que não avancem em sua carreira e outro que se torne presidente de empresa, o que torna maior a variância de w. 
*
*
*
Econometria
Conseqüências da Heterocedasticidade.
Esta hipótese é necessária para a demonstração do teorema de Gauss – Markov. Assim sendo, as conseqüências são basicamente as mesmas da presença de Autocorrelação:
 Os estimadores de MQO continuam não-tendenciosos, mas já não são aqueles de menor variância. As variâncias dos estimadores são viesadas, invalidando, portanto o Teste de hipóteses.
 As estatísticas t habituais dos estimadores de MQO não tem distribuições t na presença de heterocedasticidade, e o problema não será resolvido com o uso de amostras de tamanho grande. ( O mesmo serve para o teste F)
Obs:
A exceção ocorre quando há autocorrelação nos casos em que usamos defasagens da variável dependente como variáveis explicativas, o que torna o estimador de MQO tendencioso, coisa que não ocorre na presença de heterocedasticidade.
*
*
*
ECONOMETRIA
Como identificar a Heterocedasticidade?
Em nosso curso especificaremos dois testes que identificam a heterocedasticidade.
1) O Teste de Goldfeld e Quandt
2) Testes de White
 
*
*
*
Econometria
1) Teste de Goldfeld e Quandt  Consiste em separar a regressão em duas: uma com valores menores de X, e outra com valores maiores e fazer um teste para comparar a variância em cada regressão (Teste F). Havendo diferenças nas variâncias:
H0: Hipótese Nula: Homocedasticidade
H1: Hipótese Alternativa: Heterocedasticidade.
 Rejeita-se H0 e aceita-se H1 (Heterocedasticidade) , que deve ser corrigida. 
*
*
*
Econometria 1
Ex1:
*
*
*
ECONOMETRIA
Exercício:
A)Fazer a regressão.
B)Separar a regressão em duas partes:
B.1) indivíduos com mais de 14 anos
B.2) indivíduos com menos de 5 anos de estudo.
B.3) Fazer novas regressões para os dois grupos separadamente.
B.4) Comparar as variâncias através do Teste F.
 
*
*
*
Econometria
Resultados item A:
*
*
*
Econometria
Resíduos da regressão:
*
*
*
Econometria
Gráf1
		397.1250103691
		184.2934467026
		471.2618830361
		-552.1696806304
		-487.001244297
		-194.401244297
		-238.6959352966
		-302.2959352966
		927.4725010369
		-600.8221899627
		199.7778100373
		338.7462463708
		1020.9146827043
		-829.3168809623
		-864.1168809623
		-704.1484446288
		-529.4115719618
		1762.7884280382
Variável X 1
Resíduos
Variável X 1 Plotagem de resíduos
Plan22
		RESUMO DOS RESULTADOS
		
		Estatística de regressão
		R múltiplo		0.83809568
		R-Quadrado		0.7024043689
		R-quadrado ajustado		0.683804642
		Erro padrão		3964.7671198229
		Observações		18
		
		ANOVA
				gl		SQ		MQ		F		F de significação
		Regressão		1		593630220.3929336		593630220.3929336		37.7642301444		0.0000140955
		Resíduo		16		251510053.03086644		15719378.314429153
		Total		17		845140273.4238
		
				Coeficientes		Erro padrão		Stat t		valor-P		95% inferiores		95% superiores		Inferior 95,0%		Superior 95,0%
		Interseção		-4401.5021362316		1885.1811531532		-2.3347900168		0.0329104057		-8397.90762629		-405.0966461733		-8397.90762629		-405.0966461733
		Variável X 1		1000.5781129954		162.8210986679		6.1452607873		0.0000140955		655.4128053933		1345.7434205976		655.4128053933		1345.7434205976
		
		
		
		RESULTADOS DE RESÍDUOS
		
		Observação		Y previsto		Resíduos
		1		-3400.9240232362		3803.5440232362
		2		-2400.3459102408		2896.3359102408
		3		-1399.7677972454		2044.6677972454
		4		-399.18968425		1121.51968425
		5		601.3884287454		250.0515712546
		6		601.3884287454		311.8215712546
		7		3603.1227677317		-2503.8027677317
		8		3603.1227677317		-2054.1227677317
		9		4603.7008807271		-2681.3708807271
		10		7605.4352197133		-4471.5652197133
		11		7605.4352197133		-2615.9852197133
		12		8606.0133327087		-1712.7533327087
		13		9606.5914457041		-558.4214457041
		14		10607.1695586995		-3947.9395586995
		15		10607.1695586995		3956.1204413005
		16		11607.7476716949		-3909.1976716949
		17		13608.9038976858		-1211.9238976858
		18		16610.638236672		11283.021763328
Plan22
		1
		2
		3
		4
		5
		5
		8
		8
		9
		12
		12
		13
		14
		15
		15
		16
		18
		21
Variável X 1
Resíduos
Variável X 1 Plotagem de resíduos
Plan23
		RESUMO DOS RESULTADOS
		
		Estatística de regressão
		R múltiplo		0.9519303868
		R-Quadrado		0.9061714614
		R-quadrado ajustado		0.9003071777
		Erro padrão		1150.7811256115
		Observações		18
		
		ANOVA
				gl		SQ		MQ		F		F de significação
		Regressão		1		204635450.24518102		204635450.24518102		154.5238111127		0.0000000012
		Resíduo		16		21188755.185019		1324297.1990636876
		Total		17		225824205.43020004
		
				Coeficientes		Erro padrão		Stat t		valor-P		95% inferiores		95% superiores		Inferior 95,0%		Superior 95,0%
		Interseção		-1897.3864799026		547.177381128		-3.4675893875		0.0031734952		-3057.3507020773		-737.4222577278		-3057.3507020773		-737.4222577278
		Variável X 1		587.4669427527		47.2591306212		12.4307606812		0.0000000012		487.2820619766		687.6518235288		487.2820619766		687.6518235288
		
		
		
		RESULTADOS DE RESÍDUOS
		
		Observação		Y previsto		Resíduos
		1		-1309.9195371498		1712.5395371498
		2		-722.4525943971		1218.4425943971
		3		-134.9856516443		779.8856516443
		4		452.4812911084		269.8487088916
		5		1039.9482338611		-188.5082338611
		6		1039.9482338611		-126.7382338611
		7		2802.3490621194		-1703.0290621194
		8		2802.3490621194		-952.3890621194
		9		3389.8160048721		-1467.4860048721
		10		5152.2168331303		-2018.3468331303
		11		5152.2168331303		-1162.7668331303
		12		5739.6837758831		153.5762241169
		13		6327.1507186358		-278.9807186358
		14		6914.6176613886		-255.3876613886
		15		6914.6176613886		648.6723386114
		16		7502.0846041413		1196.4653958587
		17		8677.0184896468		719.9615103532
		18		10439.419317905		1454.240682095
Plan23
		1
		2
		3
		4
		5
		5
		8
		8
		9
		12
		12
		13
		14
		15
		15
		16
		18
		21
Variável X 1
Resíduos
Variável X 1 Plotagem de resíduos
Plan24
		RESUMO DOS RESULTADOS
		
		Estatística de regressão
		R múltiplo		0.9700464492
		R-Quadrado		0.9409901136
		R-quadrado ajustado		0.9373019957
		Erro padrão		604.9256900454
		Observações		18
		
		ANOVA
				gl		SQ		MQ		F		F de significação
		Regressão		1		93365047.27236953		93365047.27236953		255.1410064301		0
		Resíduo		16		5854961.447630469		365935.0904769043
		Total		17		99220008.72
		
				Coeficientes		Erro padrão		Stat t		valor-P		95% inferiores		95% superiores		Inferior 95,0%		Superior 95,0%
		Interseção		82.7649020894		287.6321547942		0.2877456526		0.777235152		-526.9880230415		692.5178272203		-526.9880230415		692.5178272203
		Variável X 1		396.812330179		24.8424844358		15.9731338951		0		344.148616127		449.4760442309		344.148616127		449.4760442309
		
		
		
		RESULTADOS DE RESÍDUOS
		
		Observação		Y previsto		Resíduos
		1		479.5772322683		340.4227677317
		2		876.3895624473		141.4104375527
		3		1273.2018926263		442.1981073737
		4		1670.0142228052		-567.4142228052
		5		2066.8265529842		-488.4265529842
		6		2066.8265529842		-195.8265529842
		7		3257.263543521		-198.663543521
		8		3257.263543521		-262.263543521
		9		3654.0758737		981.3241263
		10		4844.5128642369		-505.5128642369
		11		4844.5128642369		295.0871357631
		12		5241.3251944158		447.8748055842
		13		5638.1375245948		1143.8624754052
		14		6034.9498547737		-692.5498547737
		15		6034.9498547737		-727.3498547737
		16		6431.7621849527		-553.5621849527
		17		7225.3868453106		-351.1868453106
		18		8415.8238358475		750.5761641525
Plan24
		1
		2
		3
		4
		5
		5
		8
		8
		9
		12
		12
		13
		14
		15
		15
		16
		18
		21
Variável X 1
Resíduos
Variável X 1 Plotagem de resíduos
Plan25
		RESUMO DOS RESULTADOS
		
		Estatística de regressão
		R múltiplo		0.9542123798
		R-Quadrado		0.9105212658
		R-quadrado ajustado		0.9049288449
		Erro padrão		744.902711377
		Observações		18
		
		ANOVA
				gl		SQ		MQ		F		F de significação
		Regressão		1		90341927.92933223		90341927.92933223		162.8134369298		0.0000000008
		Resíduo		16		8878080.790667772		554880.0494167358
		Total		17		99220008.72
		
				Coeficientes		Erro padrão		Stat t		valor-P		95% inferiores		95% superiores		Inferior 95,0%		Superior 95,0%
		Interseção		12.2434259643		363.4602291661		0.0336857378		0.9735444124		-758.2578347913		782.74468672		-758.2578347913		782.74468672
		Variável X 1		410.6315636665		32.1815684538		12.7598368692		0.0000000008		342.4096866166		478.8534407165		342.4096866166		478.8534407165
		
		
		
		RESULTADOS DE RESÍDUOS
		
		Observação		Y previsto		Resíduos
		1		422.8749896309		397.1250103691
		2		833.5065532974		184.2934467026
		3		1244.1381169639		471.2618830361
		4		1654.7696806304		-552.1696806304
		5		2065.401244297		-487.001244297
		6		2065.401244297		-194.401244297
		7		3297.2959352966		-238.6959352966
		8		3297.2959352966		-302.2959352966
		9		3707.9274989631		927.4725010369
		10		4939.8221899627		-600.8221899627
		11		4939.8221899627		199.7778100373
		12		5350.4537536292		338.7462463708
		13		5761.0853172957		1020.9146827043
		14		6171.7168809623		-829.3168809623
		15		6171.7168809623		-864.1168809623
		16		6582.3484446288		-704.1484446288
		17		7403.6115719618		-529.4115719618
		18		7403.6115719618		1762.7884280382
Plan25
		1
		2
		3
		4
		5
		5
		8
		8
		9
		12
		12
		13
		14
		15
		15
		16
		18
		18
Variável X 1
Resíduos
Variável X 1 Plotagem de resíduos
Plan1
		a		w
		1				820.22
		2				1042.8
		3				1715.4
		4				1102.6
		5				1578.4
		5				1871
		8				3058.6
		8				2995
		9				4635.4
		12				4339
		12				5139.6
		13				5689.2
		14				6782
		15				5342.4
		15				5307.6
		16				5878.2
		18				6874.2
		18				9166.4
Plan2
		a		w
		1		410		820		820
		2		508.9		1017.8		1017.8
		3		857.7		1715.4		1715.4
		2		551.3		1102.6		1102.6
		3		789.2		1578.4		1578.4
		4		935.5		1871		1871
		7		1529.3		3058.6		3058.6
		8		1497.5		2995		2995
		9		2317.7		4635.4		4635.4
		11		2169.5		4339		4339
		11		2569.8		5139.6		5139.6
		13		2844.6		5689.2		5689.2
		13		3391		6782		6782
		14		2671.2		5342.4		5342.4
		16		2653.8		5307.6		5307.6
		16		2939.1		5878.2		5878.2
		17		3437.1		6874.2		6874.2
		18		4583.2		9166.4		9166.4
		19		3559.7		7119.4
		19		4896.3		9792.6
Plan5
		RESUMO DOS RESULTADOS
		
		Estatística de regressão
		R múltiplo		0.9531885817
		R-Quadrado		0.9085684723
		R-quadrado ajustado		0.903488943
		Erro padrão		417.6696375941
		Observações		20
		
		ANOVA
				gl		SQ		MQ		F		F de significação
		Regressão		1		31203262.320975892		31203262.320975892		178.8686343621		0.0000000001
		Resíduo		18		3140062.6710241134		174447.9261680063
		Total		19		34343324.992000006
		
				Coeficientes		Erro padrão		Stat t		valor-P		95% inferiores		95% superiores		Inferior 95,0%		Superior 95,0%
		Interseção		137.9893931184		183.8289488069		0.7506401686		0.4625699483		-248.2208964429		524.1996826797		-248.2208964429		524.1996826797
		Variável X 1		205.5952045516		15.3725489648		13.3741778948		0.0000000001		173.2986776688		237.8917314344		173.2986776688		237.8917314344
		
		
		
		RESULTADOS DE RESÍDUOS
		
		Observação		Y previsto		Resíduos
		1		343.58459767		66.41540233
		2		549.1798022216		-40.2798022216
		3		754.7750067732		102.9249932268
		4		549.1798022216		2.1201977784
		5		754.7750067732		34.4249932268
		6		960.3702113248		-24.8702113248
		7		1577.1558249797		-47.8558249797
		8		1782.7510295313		-285.2510295313
		9		1988.3462340829		329.3537659171
		10		2399.5366431861		-230.0366431861
		11		2399.5366431861		170.2633568139
		12		2810.7270522894		33.8729477106
		13		2810.7270522894		580.2729477106
		14		3016.322256841		-345.122256841
		15		3427.5126659442		-773.7126659442
		16		3427.5126659442		-488.4126659442
		17		3633.1078704958		-196.0078704958
		18		3838.7030750474		744.4969249526
		19		4044.298279599		-484.598279599
		20		4044.298279599		852.001720401
Plan5
		1
		2
		3
		2
		3
		4
		7
		8
		9
		11
		11
		13
		13
		14
		16
		16
		17
		18
		19
		19
Variável X 1
Resíduos
Variável X 1 Plotagem de resíduos
Plan3
		
*
*
*
Econometria
Fazendo o item b.1:
*
*
*
Econometria
Resultados G1:
*
*
*
Econometria
SQR = 6036278,27
S²1 = SQR = 6.036.278,27 = 1.509.069,56
 n – 2 	 4 
*
*
*
Econometria 
Tabela G2: 
*
*
*
Econometria
Resultados para G2:
*
*
*
Econometria
SQR = 440.791,32
S²2 = SQR = 440.791,32 = 110197,83
 n – 2 	 4 
*
*
*
ECONOMETRIA
Resolvendo o item B.4:
Comparemos, portanto, as variâncias das duas regressões em um teste F e, para isso, dividiremos uma variância pela outra:
S²1 = 1.509.069,56 = 13.69
S²2 110.197,83
Como o valor – limite na tabela F, com 5% de significância, para 4 G.L para o numerador e 4 G.L para o denominador é 6.39, ficamos:
 Rejeitamos H0: Variâncias iguais.(Homocedasticidade)
 Aceitamos H1: Variâncias desiguais (O modelo contem a presença de Heterocedasticidade).
 
*
*
*
Econometria
2) Teste de White (1980): Consiste em , a partir de um modelo de regressão qualquer:
È feita uma regressão auxiliar em que a variável dependente é o resíduo ao quadrado (não-autocorrelacionado) e os regressores são os regressores da regressão original, seus quadrados e seus produtos cruzados, desta forma:
*
*
*
Econometria
Um R² elevado nesta regressão auxiliar mostra indícios de heterocedasticidade. 
O Teste de White é a estatística F para testarmos todos os sejam zero menos o intercepto. Mais precisamente, pode-se demonstrar n.R², sendo n o numero de observações segue uma distribuição com o numero de G.L equivalente ao numero de regressores da regressão auxiliar(exceto o intercepto).
*
*
*
Econometria
Ex: Consumo de Energia para 17 cidades em função da tarifa e da renda.
*
*
*
Econometria
Dependent Variable: CT				
Method: Least Squares				
Date: 05/19/08 Time: 14:38				
Sample: 1 17				
Included observations: 17				
				
Variable	 Coefficient Std. Error t-Statistic Prob. 
				
C	 154.4571 169.4225	 0.911668	 0.3774
TARF	 	 6.719405	 65.32551	 0.102860	 0.9195
YT	 	 0.371291	 0.204393	 1.816554	 0.0908
				
R-squared	 0.191180	 Mean dependent var	385.5765
Adjusted R-squared 0.075635	 S.D. dependent var	151.2492
S.E. of regression 145.4169	 Akaike info criterion	12.95587
Sum squared resid 296045.0	 Schwarz criterion		13.10291
Log likelihood	 -107.1249	 F-statistic	 1.654587
Durbin-Watson stat 1.368711	 Prob (F-statistic)		 0.226445
				 
*
*
*
ECONOMETRIA
O Coeficiente da renda foi significante apenas a 10% e o coeficiente da tarifa assim como do intercepto não foi significante (sinal do coeficiente da tarifa de energia seria supostamente negativo). 
Além disso, o teste F (1.65) indica que a regressão não é valida. Entretanto, essas conclusões só são válidas se não existir heterocedasticidade, o que ainda não sabemos.
 
*
*
*
ECONOMETRIA
Gráfico dos resíduos: 
*
*
*
ECONOMETRIA
O Gráfico exposto acima mostra :
No eixo horizontal, o numero1 corresponde a cidade A, o 2 à B e assim por diante.
Uma discrepância na dispersão dos erros: parecendo maior para as últimas cidade da tabela do que para as primeiras. Para uma idéia mais precisa usaremos o Teste de White. Os dados para a regressão auxiliar são mostrados na seguinte tabela.
 
*
*
*
Econometria
Dados para
 2ª regressão: 
*
*
*
ECONOMETRIA
Dependent Variable: RESID1					
Method: Least Squares					
Date: 05/19/08 Time: 23:34					
Sample: 1 17					
Included observations: 17
Variable	 Coefficient	Std. Error		t-Statistic	 Prob.  					
C	 -41106.88	46462.86		-0.88472 0.3952	
YT	 -67.30777	127.1550		-0.529336 0.6071	
TARF	 81023.92	46659.85		1.736480	 0.1104	
YT1	 0.379896	0.109872		3.457617 0.0054	
TARF1	 9511.886	10013.56		0.949901	 0.3626	
YTARF -212.4283	40.44686	 -5.252035	 0.0003	
			
R-squared	 0.794170	    Mean dependent var		17414.41	
Adjusted R-squared	0.700611	    S.D. dependent var		23364.56	
S.E. of regression	12784.26	    Akaike info criterion		22.02038	
Sum squared resid	1.80E+09	    Schwarz criterion		 22.31446	
Log likelihood	 -181.1732	    F-statistic			8.488433	
Durbin-Watson stat	1.595274	    Prob(F-statistic)		 0.001657	
					
 
*
*
*
ECONOMETRIA
O valor de R² foi relativamente alto, o que indica mesmo a heterocedasticidade. No entanto o teste definitivo será feito multiplicando-se o R² pelo numero de observações:
n x R² = 17 x 0.7941 = 13.57
Como o valor limite (limite superior) da distribuição com 5 G.L e 5% de significância (na tabela lemos na coluna de 95%) é de 11.07, rejeitamos H0: homocedasticidade, isto é, concluímos que o modelo possui heterocedasticidade.
*
*
*
Econometria 
Procedimento para correção da Heterocedasticidade
Havendo a presença de heterocedasticidade no modelo, a metodologia de correção é mais simplificada se suspeitarmos qual é o padrão da heterocedasticidade.
Retomemos o mesmo modelo anterior com k=2:
Vamos supor que seja conhecida a variância dos erros:
*
*
*
Econometria
O exemplo citado acima mostra uma variância não – constante, que na verdade, é multiplicada por uma constante zi. Se conseguíssemos eliminar a variável z da variância, teríamos, então, uma variância constante e ai estaríamos livres do problema de heterocedasticidade.
Para tal resolução devemos transformar em uma variância .
	Para isto, devemos dividir esta variância que não é constante por 
	Enfim, a solução é dividir todo o modelo de regressão por .
	
	 (5)
*
*
*
Econometria
Logo a variância desse novo termo de erro será dada por:
Quando estimamos o modelo transformado por mínimos quadrados, o método ganha um novo sobrenome: ele é chamado de Mínimos Quadrados Ponderados(MQP).
 
*
*
*
Econometria
O método de mínimos quadrados ponderados também pode ser usado quando o padrão conhecido é o desvio padrão:
E, nesse caso, é simplesmente dividir o modelo por :
E o desvio – padrão do erro desse modelo será dado por:
Com isso, eliminamos a heterocedasticidade do modelo.
*
*
*
Econometria
Corrigindo o Problema da Heterocedasticidade
Estimemos, então, novamente a regressão do exemplo entre a e w, corrigindo o problema da heterocedasticidade. 
Supostamente, a causa da heterocedasticidade naquele exemplo é de que a variação dos salários é mais discrepante quanto maior são os anos de estudo. Seria possível imaginar que a variância ou o desvio – padrão sejam proporcionais ao tempo de estudo. Se considerarmos, logo, tal hipótese, a solução indicada é dividir toda a equação pelos anos de estudo. Nesse caso, no entanto, a variável a ser dividida é a própria variável dependente do modelo. Ou seja, o modelo inicial:
*
*
*
Econometria
Sendo w os salários e a os anos de estudo, torna-se: 
 (6)
Portanto, para estimar os coeficientes e sem o problema da heterocedasticidade, devemos estimar uma regressão simples em que a variável dependente é a razão w/a e a variável independente é o inverso dos anos de estudo 1/a.
*
*
*
Econometria
Dados de w e a:
*
*
*
ECONOMETRIA
Dependent Variable: WA				
Method: Least Squares				
Date: 05/26/08 Time: 01:03				
Sample: 1 20				
Included observations: 20				
				
Variable Coefficient Std. Error t-Statistic	 Prob. 
				
C	 198.8699	 9.126321	 21.79080	 0.0000
A	 188.7405	 29.71646	 6.351378	 0.0000
				
R-squared	 0.691464	 Mean dependent var		237.0615
Adjusted R-squared	0.674323	 S.D. dependent var		53.79967
S.E. of regression	30.70246	 Akaike info criterion		9.781202
Sum squared resid	16967.54	 Schwarz criterion		 9.880776
Log likelihood	 -95.81202	 F-statistic			40.34000
Durbin-Watson stat	2.416386	 Prob (F-statistic)		 0.000006
				
 
*
*
*
Econometria
Os valores de e obtidos agora por mínimos quadrados ponderados, representam uma estimativa mais precisa dos dois coeficientes; alem disso, é possível confiar no teste de hipóteses tendo em vista que o processo é homocedástico. 
Mas para ter certeza absoluta, usamos um dos testes vistos, o teste de White. Antes disso veremos sua dispersão no gráfico em seguida.
*
*
*
Econometria
*
*
*
ECONOMETRIA
Como mostra o diagrama a dispersão dos resíduos se mostram mais equilibrados. De fato, como mostra o resultado no teste de White a seguir: 
Dependent Variable: RESID1					
Method: Least Squares					
Date: 03/26/09 Time: 01:54					
Sample: 1 20					
Included observations: 20							
Variable	Coefficient	Std. Error	 t-Statistic	Prob.  				
C		1172.609		337.8424	 3.470877	0.0029	
A		-2547.070		2502.246	 -1.017914	0.3230	
A1		2026.827		2615.820	 0.774834	0.4491
R-squared	 0.075801	    Mean dependent var		848.3772	
Adjusted R-squared	-0.032928	    S.D. dependent var		808.7148	
S.E. of regression 	821.9218	    Akaike info criterion		16.39865	
Sum squared resid	11484442	    Schwarz criterion		16.54801	
Log likelihood	 -160.9865	    F-statistic		 0.697153	
Durbin-Watson stat	2.486159	    Prob(F-statistic)		0.511690	
*
*
*
ECONOMETRIA
Utilizando da metodologia do teste, temos:
R² = 0.0758
n x R² = 20 x 0.0758 = 1.52
Como o valor – limite, a 5% de significância, com 2 G.L, na distribuição
	é de 5.99, aceitamos a hipótese nula de homocedasticidade para este modelo.
Quando não conhecemos o padrão da heterocedasticidade, as formas de correção são um pouco mais complexas. Uma opção que se apresenta de forma alternativa é estimar o modelo com as variáveis em logaritmo e testar novamente para a heterocedasticidade.
*
*
*
ECONOMETRIA
Violando a Hipótese 3: a Simultaneidade
O abrandamento desta hipótese, já vista, estabelece que, se uma (ou mais) variável independente for estocástica, é preciso que, pelo menos, ela não tenha correlação com o termo de erro. 
Mas se houver? E o que levaria tal variável a ter correlação com o termo de erro?
*
*
*
ECONOMETRIA
SIMULTÂNEIDADE 
 O problema das simultaneidade é presentemente freqüente em economia. Ex:
Modelo de determinação de preços na economia – Oferta e Demanda:
Ótica da oferta  O produtor irá produzir mais quanto maior for o preço.
Ótica da demanda  O consumidor ira demandar mais quanto menor for o preço.
Logo as variáveis preço e quantidade se determinam mutuamente.
*
*
*
ECONOMETRIA
Suponhamos uma quantidade a ser produzida, chamada de quantidade ofertada, sendo esta função do preço:
 (1)
Já quanto aos consumidores, digamos que além do preço, levem em conta a sua renda na decisão de consumo. Logo para a quantidade demandada:
 (2)
 
*
*
*
ECONOMETRIA
No equilíbrio de mercado, , e o termo que é observado são as quantidades de equilíbrio, com isso podemos chamar ambas as equações de Q. temos, então, um sistema de duas equações:
	 	
  Eq. de oferta
  Eq. de demanda
Como as variáveis Q e P se determinam mutuamente nesse modelo, elas são chamadas de variáveis endógenas. Já R é, realmente uma variável independente do modelo; seu valor já predeterminado chamamos de variável exógena.
 
*
*
*
ECONOMETRIA
A estimação por MQO dessas equações leva a estimadores viesados e inconsistentes, já que um dos regressores é uma variável endógena, determinada pelo próprio modelo descrito pelas equações e, portanto, está correlacionada com o termo de erro. Notando:
Se R aumenta, eleva a demanda por Q, que eleva P, mas com o P maior faz com que se estimule uma maior produção, Q. 
 
*
*
*
ECONOMETRIA
Questão da Identificação
Partindo do sistema de equações colocado acima, isolaremos as variáveis endógenas. Fazendo a igualdade , teremos:
 (3)
Encontramos uma equação que coloca o preço em função apenas de variáveis exógenas (uma só neste caso). Observamos, que fica clara a correlação do preço com (dois) termos de erro.
 
*
*
*
ECONOMETRIA
Substituindo a equação do preço que acabamos de encontrar na equação de oferta teremos:
Que a resolução após algumas operações:
 (4)
 
*
*
*
ECONOMETRIA
A equação também coloca uma das variáveis endógenas (Q) em função da variável exógena R. Geramos, assim, um novo sistema de equações que isola as variáveis endógenas em cada equação, e essas equações são chamadas de equações na forma reduzida. O sistema original de equações é chamado de forma estrutural do modelo.
As equações na forma reduzida são:
 					(5)
 								(6) 
*
*
*
ECONOMETRIA
 Este sistema pode ser escrito de maneira mais simples:
 					 (7)
 						(8) 
Em que:
 
*
*
*
ECONOMETRIA
Notemos que as equações na forma reduzida não têm mais o problema de que um ou mais regressores são correlacionados com o termo de erro e, então, elas podem perfeitamente ser estimadas por MQO. Só que, estimando as equações na forma reduzida, encontraremos os π e não os α e β. Fica o problema de, dados os parâmetros da forma reduzida, encontrar os da forma estrutural. Da equação de oferta:
Substituindo pelas equações da forma reduzida e omitindo os termos de erro:
 			 (9)
 			 (10) 
*
*
*
ECONOMETRIA
Lembrando que os estimadores já foram obtidos das equações na forma reduzida por MQO, nossas incógnitas são os . Para manter a igualdade, teremos de ter os coeficientes puros iguais em cada lado, bem como os coeficientes da renda:
 						 (11)
 						 (12)
Que é um sistema de 2 equações e duas incógnitas que, não só tem solução, como nesse caso é até fácil encontrá – la, pois da segunda equação temos:
 
*
*
*
ECONOMETRIA
E fazendo a substituição:
 					 (13)
 					 (14)
Portanto, é perfeitamente possível encontrar os coeficientes da oferta a partir dos coeficientes obtidos da estimação na forma reduzida. Vejamos se o mesmo ocorre para a demanda:
*
*
*
ECONOMETRIA
Refazendo o mesmo procedimento, isto é, substituindo pelas equações na forma reduzida e omitindo os termos de erro:
 								 (15)
 								 (16)
Que gera as equações:
 						 (17)
 						 (18)
Agora temos 3 incógnitas e apenas 2 equações. Não é possível encontrar os coeficientes da demanda a partir dos coeficientes estimados na forma reduzida.
 
*
*
*
ECONOMETRIA
Uma outra maneira de dizer isso é que não se pode identificar a equação de demanda, ou simplesmente, que a equação da demanda apresentada é Subidentificada.
A Equação da oferta, inversamente, é possível ser identificada. Dizemos que a equação de oferta é Exatamente Identificada.
Como existe a renda na equação de demanda, mudanças naquela implicam deslocamento da curva de demanda. Deslocando a curva de demanda, podemos encontrar vários pontos na curva de oferta e, assim, é possível identificá – la.
 
*
*
*
ECONOMETRIA
A figura abaixo mostra uma curva de oferta e diferentes curvas de demanda( para diferentes níveis de renda) fazendo com que vários pontos da curva de oferta sejam identificados.
 
Graficamente:
P
Q
D1
D2
D3
O
*
*
*
ECONOMETRIA
Note que, se, além da renda, a equação da demanda contemplasse, também o preço de um bem substituto como variável, seria mais uma variável que poderia deslocar a demanda e identificar a oferta. Nesse caso, a equação de oferta estaria Superidentificada.
 A regra então é: Se temos duas variáveis endógenas em cada equação, para equação ser identificada, temos de ter uma variável exógena fora da equação. Estendendo tal raciocínio para três variáveis endógenas, precisaríamos de duas exógenas fora da equação e assim por diante. 
*
*
*
ECONOMETRIA
Generalizando:
*
*
*
ECONOMETRIA
No entanto, devemos prestar atenção: a situação acima descreve apenas a condição necessária para identificação, também conhecida como questão de ordem.
No exemplo anterior, vemos que a equação de oferta é exatamente identificada, desde que a renda de fato exista na equação de demanda, ou seja, que o coeficiente . Uma condição mais geral pode ser vista no exemplo a seguir.
 
*
*
*
ECONOMETRIA
Dado o sistema:
Onde:
Y = renda nacional; C = consumo; I = investimento; G = gastos do governo; r = taxa de juros e m = emissão de moeda. Sendo que o governo controla G e m. Verifiquemos a condição de identificação para cada uma das equações. 
*
*
*
ECONOMETRIA
(1) é uma identidade, não tem coeficiente a serem estimados, portanto não cabe a questão da identificação.
(2), (3) e (4) cabe a questão da identificação. Porem ficaremos restritos a equação (2).
Como o governo estipula G e m, logo, tais variáveis são exógenas. As demais variáveis são endógenas, porem, quando tomamos valores defasados dessa variáveis, elas já estão, obviamente, predeterminadas; assim, elas tem o mesmo comportamento das variáveis exógenas, então:
Variáveis Endógenas:
Variáveis Exógenas: 
 
*
*
*
ECONOMETRIA
No caso da equação (2), temos:
Variáveis endógenas incluídas = 3
Variáveis exógenas excluídas = 2
A equação, pela condição de ordem, é exatamente identificada. Mas temos de verificar a condição suficiente, o que é mais complicado agora porque temos várias equações. Para isso, vamos montar uma tabela com as várias equações, a qual preencheremos com uns e zeros para o caso de a variável ser ou não incluída na equação.
 
*
*
*
ECONOMETRIA
Tabela de variáveis incluídas ou não na equação.
*
*
*
ECONOMETRIA
Montando uma matriz a partir dessa tabela com a seguinte regra: excluir a linha correspondente à equação que estamos estudando e incluir as colunas correspondentes as variáveis excluídas da equação (I, G e m). Teremos a matriz 3x3 mostrada abaixo:
Não há nenhuma linha ou coluna cujos elementos sejam todos iguais a zero, então, a equação está de fato identificada. Essa condição também é conhecida como Condição de Posto. Se tal condição não fosse verificada a equação seria Subidentificada. 
*
*
*
ECONOMETRIA
Como estimar um modelo de equações simultâneas
Um método já foi explicitado na seção anterior: estimam – se os parâmetros da forma reduzida. Conhecida a relação entre os parâmetros da forma reduzida e da forma estrutural, podemos encontrar estes últimos. Esse método é conhecido como Mínimos Quadrados Indiretos (MQI).
Mas isso só pode ser feito para equações exatamente identificadas. Se a equação for subidentificada, não dá para estimar mesmo. Se a equação for superidentificada ( o que em princípio é bom, pois há mais
informações), não dá para encontrar uma relação proporcional (um p/um) entre os parâmetros da forma estrutural e reduzida que nos dê uma única solução.
*
*
*
ECONOMETRIA
Um método que pode ser estendido a equações superidentificadas é o dos Mínimos Quadrados de Dois Estágios, que consiste em estimar as equações da forma reduzida. A partir daí, encontrar valores estimados para as variáveis endógenas. Como são valores estimados, não incluem os resíduos e, portanto, não tem correlação com o termo de erro. Então, usam – se esses valores estimados como substitutos das variáveis endógenas, que, no modelo estrutural, aparecem no lado direito das equações.
 
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*