Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
* * * ECONOMETRIA 1 MULTICOLINEARIDADE AUTOCORRELAÇÃO HETEROCEDASTICIDADE EQUAÇÕES SIMULTÂNEAS * * * Econometria Hipóteses sobre a Regressão * * * Econometria 1 Particularmente, as quatro últimas hipóteses, as vezes não se verificam, por isso, identificaremos o tratamento a ser seguido quando cada uma delas é violada. Relaxando a hipótese VI: A Multicolinearidade Ex: Quando isso ocorre, 100% da variação destas decorre da variação de outra. No primeiro caso, qq variação de X2 implicará na variação de X3. Sendo impossível distinguir qual a influência de uma ou outra para Y, logo, é impossível estimar um modelo em que há a presença de Multicolinearidade. * * * Econometria O termo Multicolinearidade passou a resignar alta correlação, alta, mas não necessariamente igual a 1, em modulo, situação em que é possível estimar o modelo, porem há problemas associados. Ex: Função consumo * * * Econometria ECONOMETRIA * * * Econometria Para α = 10% de significância e GL = 13 (para SQR Gl=n – k -1 = 16 – 2 – 1). O valor t tabelado = 1.77, ou seja, apenas r é significante. Para α = 5% de significância, t tab. = 2.16 todos os coeficientes não são significantes. Este resultado, é no mínimo estranho, dizer que Ct não depende de Yt. Um pesquisador mais rigoroso eliminaria as duas variáveis do modelo ou faria um novo modelo. Um mais atento, notaria a estatística F. Note que Ftab =3.81 ( c/GLn = 2 e GLd= 13) a 5% de significância, como Fcal=17.64 conclui-se que o modelo é válido. * * * Econometria Se a regressão foi validada por Fcal, porque os dois parâmetros não são significantes a 5% e o que deu errado no teste t? - Isso se deve ao fato de que r influencie y Se calcularmos a correlação amostral entre r e y encontraremos -0.86, sendo esta muito alta (próximo de 1), causando problemas de multicolinearidade. * * * Econometria O ideal seria que não houvesse correlação entre as variáveis? Ainda que não exista corr. Populacional entre as variáveis do modelo, é pouco provável, que não exista nenhuma corr. Amostral. Aliás, senão houvesse nenhuma correlação entre as variáveis, nem sequer precisaríamos utilizar a regressão múltipla, pois os resultados das regressões simples, em separado, seriam os mesmos. Há ainda a alternativa de não se fazer nada. Pois, lembremos que os estimador de mínimos quadrados mantém as propriedades desejáveis de um estimador ( não – viesado, eficiente e consistente), mesmo na presença de multicolinearidade. Se o objetivo for, fazer previsões a respeito da variável explicada, a retirada de variáveis correlacionadas só vai reduzir a eficiência das previsões. * * * Econometria Consequências da multicolinearidade Testes t insignificantes ainda que as variáveis sejam relevantes. Isso ocorre porque a variância dos coeficientes estimados se eleva quando ocorre multicolinearidade e daí o motivo para os testes t apresentarem pouca ou nenhuma significância. Vejamos: Se o for próximo de 1 (-1) o valor do determinante da matriz X ( em consequência (X´X) ) será pequeno – No caso de multicolinearidade exata, o determinante da matriz X assim como (X´X) , seria zero, logo, nenhuma dela poderia ser invertida – logo, levando a grandes variâncias em daí a pequenos valores nos testes t. * * * Econometria Mas note-se: isso não significa que os testes t sejam inválidos. A variância dos coeficientes estimados de fato é muito grande na presença de multicolinearidade. Podemos até ser levados a conclusões erradas do ponto de vista econômico, mas, do ponto de vista estatístico, o valor do coeficiente, se insignificante, não pode ser considerado diferente de 0 em função de sua alta variância. E como a variância dos é muito grande, podemos ter ainda que: Os sinais dos coeficientes podem ser o inverso daqueles esperados; além do mais, seus valores ficam muito sensíveis quando se acrescenta ou se retira uma variável do modelo, ou quando há pequenas mudanças na amostra. * * * Econometria Com relação as propriedades dos , no entanto, mesmo na presença de multicolinearidade, são mantidas as propriedades usuais do estimador de MQO, isto é, continuam não viesados, eficientes e consistentes. Como consequências, as previsões feitas a partir de um modelo com multicolinearidade também tem essas mesmas propriedades. * * * Econometria Como identificar a multicolinearidade Uma maneira de identificar a multicolinearidade, ou pelo menos, suspeitar fortemente que ela existe, é obter um teste F bastante significante (ou R² alto), acompanhado de estatísticas t para os coeficientes pouco significantes, ou até mesmo não significantes. Sinais dos coeficientes diferentes do esperado, já são pelo menos uma forte evidência de multicolinearidade. O cálculo da correlação, pode não funcionar muito bem quando temos mais do que duas variáveis no modelo. Quando calculamos a correlação entre duas variáveis, duas a duas, se encontramos uma correlação próxima de 1 em valores absolutos para qualquer par de variáveis, então certamente há multicolinearidade. * * * ECONOMETRIA A recíproca, no entanto, não é verdadeira pois pode haver não um par de variáveis correlacionadas entre si mas três ou mais variáveis correlacionadas simultaneamente, cujo o valor de correlação, tomando-as duas a duas, não indique um valor muito alto. Nesse caso, uma solução é observar o comportamento dos coeficientes quando adicionamos ou retiramos variáveis ou quando há mudanças na amostra. Se ocorrerem mudanças muito drásticas, inclusive nos sinais de tais coeficientes, temos ai uma evidência de que há multicolinearidade no modelo. * * * ECONOMETRIA Há ainda a alternativa de não se fazer nada. Há sempre de se lembrar que o estimador de MQO mantém as propriedades desejáveis de um estimador, ou seja, não viesado, consistente e eficiente, mesmo na presença de multicolinearidade. * * * ECONOMETRIA O que fazer quando há multicolinearidade A providencia óbvia é retirar variáveis correlacionadas do modelo . O critério por trás da retirada de variáveis é que, sendo elas altamente correlacionadas com a variável restante, ela já capta os efeitos das alterações na variável retirada. Muitas vezes é possível reduzir os efeitos da multicolinearidade por meio do aumento de n. Isso porque a correlação alta observada pode ser decorrente da própria amostra, isto é, essa correlação pode não existir na população e o aumento nas observações poderia refletir melhor este fato, ou ainda, a correlação pode ser resultado de algum tipo de política econômica transitória. * * * Econometria Relaxando a Hipótese V: Autocorrelação Significa a correlação de uma variável com valores defasados (diferenças no tempo) dela mesma. Se Xt tem correlação sistemática com seu valor no ano anterior, a autocorrelação entre Xt e X t -1 não é nula. Dizemos, então, que Xt é uma variável autocorrelacionada. Esta hipótese faz menção a Autocorrelação dos erros. Supõe-se que não existam,o que é bastante razoável, pois estamos imaginando que o erro não é uma variável especificamente, mas um conjunto de diversas influências que por sua própria natureza, são difíceis de serem medidas, mas não exercem influência uma sobre a outra. * * * Econometria Mas se exercerem, uma variável relevante está sendo omitida e, tal omissão joga sua influência p/o termo de erro, levando a autocorrelação nos erros. A má especificação funcional do modelo, por exemplo: o modelo é linear e assumimos que este é exponencial leva a autocorrelação. Uma possível maneira de representar um modelo de regressão em que haja autocorrelação seria: Em que: * * * Econometria Sendo: o coeficiente de correlação e; um termo de erro com as hipótese do modelo de regressão ( ou seja, sem autocorrelação). Se o erro segue um processo como o descrito anteriormente, é dito um processo Auto-Regressivo de Ordem 1, ou simplesmente AR(1). Um processo AR(2): ou * * * Econometria Conseqüências da autocorrelação A hipótese de não-existência de autocorrelação nos erros é um pré – requisito na demonstração do teorema de Gauss – Markov, com o qual se mostra que o estimador de MQO da regressão linear é um B.L.U.E.(MELNV). Portanto, na presença de autocorrelação o estimador de MQO não é mais aquele que apresenta a menor variância possível entre todos os estimadores. Mesmo assim, podemos notar, que o estimador continua com as características de ser não-tendencioso e consistente, logo, mesmo que não tenha a menor variância, o estimador ainda detém estas duas características mesmo na presença de autocorrelação. * * * Econometria As exceções são os modelos que incluem entre os regressores, defasagens da variável dependente, como no caso a seguir: Vamos supor um processo do tipo AR(1): * * * Econometria Para que o estimador fosse não – viesado: o que não ocorre, pois: Embora, por hipótese, e não sejam correlacionados, o mesmo não ocorre com e , o que fica óbvio se tomarmos uma defasagem da primeira expressão: * * * Econometria Portanto, e são correlacionados e, assim, e, consequentemente, .Como é uma variável dependente do modelo, este se torna um caso em que a existência da autocorrelação implica viés do estimador de MQO. Alem disso, temos de lembrar que os estimadores para a variância dos coeficientes foram calculados supondo que não há autocorrelação entre os erros, isto é, supondo que ( em Notação matricial), , o que não é verdade. Os estimadores das variâncias serão (sempre) viesados, o que invalida os testes de hipóteses realizados na presença de autocorrelação. * * * Econometria Como identificar a autocorrelação? A maneira mais comum de identificar a existência de autocorrelação é através do Teste de Durbin-Watson: * * * Econometria Para entendermos seu significado, desenvolveremos a expressão: * * * Econometria Se a amostra for suficientemente grande, a diferença entre a soma de e é muito pequena, assim como é muito pequena a diferença entre somar de 1 a n ou de 2 a n. Então, podemos dizer que essas somas são (quase) iguais: Obviamente o primeiro termo é igual a 1. O segundo é um estimador para o coeficiente de correlação dos erros. * * * Econometria Com Se Se [valores de DW(razoavelmente) abaixo de 2] Se [isto é, valores DW (razoavelmente) acima de 2] * * * Econometria Observações sobre DW: 1- Existe um intervalo onde DW é inconclusivo. Ex: n = 20, k = 2 e α = 5% encontramos di = 1.1 e ds = 1.54. Logo, se DW < 1.1 rejeitamos a hipótese nula de não – autocorrelação, isto é, concluímos que existe autocorrelação. Se 1.54 < DW < 2 Concluímos que não há autocorrelação, ou seja, aceitamos a hipótese nula. Se 1.10 < DW < 1.54 O teste torna –se inconclusivo, isto é, não podemos afirmar se existe ou não autocorrelação. * * * ECONOMETRIA 2 – A tabela é montada para autocorrelações positivas (DW < 2). Se encontrarmos um DW > 2, indicando autocorrelação negativa, basta que façamos DW* = 4 – DW e o valor DW* pode ser comparado com os valores da tabela. * * * Econometria Exemplo: c =f (y); n = 15, k =1 e α = 5% * * * Econometria Os resultados desta regressão: * * * Econometria Para estatística DW: 0,0066 * * * Econometria A soma de e de Portanto, a estatística DW: Como o limite inferior da tabela DW é, para 5% de significância, 15 observações e k=1, temos di =1.08. Verificamos, então que neste intervalo o teste DW é inconclusivo, não podemos afirmar se podemos rejeitar a hipótese nula de não-autocorrelação. * * * Econometria Além da existência de um intervalo do teste que é inconclusivo, o teste não é válido se: 1- A regressão não incluir o intercepto 2- A regressão incluir, como variáveis explicativas, defasagens da variável dependente 3- Como é claro pela própria formulação do teste, ele é feito para testar apenas correlações de primeira ordem. * * * Econometria O que fazer quando há Autocorrelação? Devemos saber qual é a causa da autocorrelação: 1 – Se o problema for de especificação, ele pode ser corrigido com a inclusão de mais variáveis ou alterando a forma funcional. 2 – Se esse não é o caso, então, a autocorrelação é parte integrante do modelo e a correção passa pelo conhecimento prévio de como é a estrutura da autocorrelação. Com isso, vamos supor um modelo com uma variável explicativa: (1) * * * Econometria Em que existe autocorrelação e ela é de 1ª ordem (AR(1)): Suponhamos ainda que o coeficiente seja conhecido. Se multiplicarmos a expressão (1) defasada por , temos: (2) Subtraindo (2) de (1): (3) Mas sabemos que: * * * Econometria E se fizermos com que: Reduziremos a um modelo que será: (4) Que é um modelo sem autocorrelação ( que pode, portanto, ser estimado sem problemas por MQO) e, importante, pois, apresenta o mesmo coeficiente do modelo original. * * * Econometria No entanto, ainda resta o problema de como conhecer o coeficiente . Uma estimativa pode ser encontrada, entretanto, por meio do próprio valor de DW, já que: Então: * * * Econometria Refazendo a estimação via correção para autocorrelação (CORC). As variáveis corrigidas cuja regressão não apresentará autocorrelação: * * * Econometria Os resultados desta nova regressão são: * * * Econometria Comandos no eviews: File Workfile. Definir: estrutura, tamanho e freqüência da estimação; File import Definir variáveis: no nosso caso, lny e lnc. Quick Estimate Equation ; digitando: lnc c lny. e clicar ok. Aparecerá o sub-quadro definindo NLS and ARMA( que é o método para se estimar em MQO), clique OK. Neste ponto, se apresentarão os resultados da regressão, determinando os valores dos coeficientes, as estatísticas t e F, o p-valor, os critérios de informação (CIA e CIS), SQR, e a estatística de DW (1.367). Esta última tendo serventia para o CORC (Correção da autocorrelação). Sabemos que podemos achar o valor de ρ de maneira direta no eviews. Para o CORC, atenderemos aos seguintes comandos: Quick generate series resid1 = resid. Este procedimento abrirá uma nova pasta para os resíduos. Repetir o procedimento 9 e fazer resid2 = resid(-1) Ir em Quick estimate equation; digitando: resid1 c resid2 e clicar ok. O coeficiente de resid 2 fornece, então, o valor de ρ. read – lotus – excel * * * Econometria (Continuação) comandos no eviews: O valor de ρ = 0.683, conforme mostra a regressão. A partir daí remontamos o processo, só que agora estabelecendo com este valor para y* e c* de suas variáveis defasadas em uma ordem para corrigir o problema da autocorrelação, estabelecendo os comandos: Quick Generate series; digitando: c1 = lnc – 0.683lnc(-1). Repetindo o passo 15 e digitando: y1= lny – 0683lny(-1). Quick Estimate equation; digitando c1 c y1 e clicar OK. O passo final é fazer a verificação dos valores apresentados nesta nova regressão, com a eliminação do problema através da CORC atentando para o valor da estatística DW. * * * Econometria Relaxando a Hipótese 4: Heterocedasticidade. A hipótese Homocedasticidade. Ex: Homocedasticidade Altura das pessoas. Não há, por que, no entanto, acreditar que a variância desse erro de medição para diferentes grupos de pessoas (Altas ou Baixas) Ex: Heterocedasticidade Onde a = anos de estudo w = salário. * * * Econometria Na situação onde : Quando a é alto, reflete em maior w , na média. Mas a situação muda muito no que se refere ao erro. Para aqueles com pouco ou nenhum ano de estudo a variância de w será pequena. Mas para as pessoas com elevado a, as probabilidades são mais amplas, pois podem ter indivíduos que não avancem em sua carreira e outro que se torne presidente de empresa, o que torna maior a variância de w. * * * Econometria Conseqüências da Heterocedasticidade. Esta hipótese é necessária para a demonstração do teorema de Gauss – Markov. Assim sendo, as conseqüências são basicamente as mesmas da presença de Autocorrelação: Os estimadores de MQO continuam não-tendenciosos, mas já não são aqueles de menor variância. As variâncias dos estimadores são viesadas, invalidando, portanto o Teste de hipóteses. As estatísticas t habituais dos estimadores de MQO não tem distribuições t na presença de heterocedasticidade, e o problema não será resolvido com o uso de amostras de tamanho grande. ( O mesmo serve para o teste F) Obs: A exceção ocorre quando há autocorrelação nos casos em que usamos defasagens da variável dependente como variáveis explicativas, o que torna o estimador de MQO tendencioso, coisa que não ocorre na presença de heterocedasticidade. * * * ECONOMETRIA Como identificar a Heterocedasticidade? Em nosso curso especificaremos dois testes que identificam a heterocedasticidade. 1) O Teste de Goldfeld e Quandt 2) Testes de White * * * Econometria 1) Teste de Goldfeld e Quandt Consiste em separar a regressão em duas: uma com valores menores de X, e outra com valores maiores e fazer um teste para comparar a variância em cada regressão (Teste F). Havendo diferenças nas variâncias: H0: Hipótese Nula: Homocedasticidade H1: Hipótese Alternativa: Heterocedasticidade. Rejeita-se H0 e aceita-se H1 (Heterocedasticidade) , que deve ser corrigida. * * * Econometria 1 Ex1: * * * ECONOMETRIA Exercício: A)Fazer a regressão. B)Separar a regressão em duas partes: B.1) indivíduos com mais de 14 anos B.2) indivíduos com menos de 5 anos de estudo. B.3) Fazer novas regressões para os dois grupos separadamente. B.4) Comparar as variâncias através do Teste F. * * * Econometria Resultados item A: * * * Econometria Resíduos da regressão: * * * Econometria Gráf1 397.1250103691 184.2934467026 471.2618830361 -552.1696806304 -487.001244297 -194.401244297 -238.6959352966 -302.2959352966 927.4725010369 -600.8221899627 199.7778100373 338.7462463708 1020.9146827043 -829.3168809623 -864.1168809623 -704.1484446288 -529.4115719618 1762.7884280382 Variável X 1 Resíduos Variável X 1 Plotagem de resíduos Plan22 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0.83809568 R-Quadrado 0.7024043689 R-quadrado ajustado 0.683804642 Erro padrão 3964.7671198229 Observações 18 ANOVA gl SQ MQ F F de significação Regressão 1 593630220.3929336 593630220.3929336 37.7642301444 0.0000140955 Resíduo 16 251510053.03086644 15719378.314429153 Total 17 845140273.4238 Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0% Interseção -4401.5021362316 1885.1811531532 -2.3347900168 0.0329104057 -8397.90762629 -405.0966461733 -8397.90762629 -405.0966461733 Variável X 1 1000.5781129954 162.8210986679 6.1452607873 0.0000140955 655.4128053933 1345.7434205976 655.4128053933 1345.7434205976 RESULTADOS DE RESÍDUOS Observação Y previsto Resíduos 1 -3400.9240232362 3803.5440232362 2 -2400.3459102408 2896.3359102408 3 -1399.7677972454 2044.6677972454 4 -399.18968425 1121.51968425 5 601.3884287454 250.0515712546 6 601.3884287454 311.8215712546 7 3603.1227677317 -2503.8027677317 8 3603.1227677317 -2054.1227677317 9 4603.7008807271 -2681.3708807271 10 7605.4352197133 -4471.5652197133 11 7605.4352197133 -2615.9852197133 12 8606.0133327087 -1712.7533327087 13 9606.5914457041 -558.4214457041 14 10607.1695586995 -3947.9395586995 15 10607.1695586995 3956.1204413005 16 11607.7476716949 -3909.1976716949 17 13608.9038976858 -1211.9238976858 18 16610.638236672 11283.021763328 Plan22 1 2 3 4 5 5 8 8 9 12 12 13 14 15 15 16 18 21 Variável X 1 Resíduos Variável X 1 Plotagem de resíduos Plan23 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0.9519303868 R-Quadrado 0.9061714614 R-quadrado ajustado 0.9003071777 Erro padrão 1150.7811256115 Observações 18 ANOVA gl SQ MQ F F de significação Regressão 1 204635450.24518102 204635450.24518102 154.5238111127 0.0000000012 Resíduo 16 21188755.185019 1324297.1990636876 Total 17 225824205.43020004 Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0% Interseção -1897.3864799026 547.177381128 -3.4675893875 0.0031734952 -3057.3507020773 -737.4222577278 -3057.3507020773 -737.4222577278 Variável X 1 587.4669427527 47.2591306212 12.4307606812 0.0000000012 487.2820619766 687.6518235288 487.2820619766 687.6518235288 RESULTADOS DE RESÍDUOS Observação Y previsto Resíduos 1 -1309.9195371498 1712.5395371498 2 -722.4525943971 1218.4425943971 3 -134.9856516443 779.8856516443 4 452.4812911084 269.8487088916 5 1039.9482338611 -188.5082338611 6 1039.9482338611 -126.7382338611 7 2802.3490621194 -1703.0290621194 8 2802.3490621194 -952.3890621194 9 3389.8160048721 -1467.4860048721 10 5152.2168331303 -2018.3468331303 11 5152.2168331303 -1162.7668331303 12 5739.6837758831 153.5762241169 13 6327.1507186358 -278.9807186358 14 6914.6176613886 -255.3876613886 15 6914.6176613886 648.6723386114 16 7502.0846041413 1196.4653958587 17 8677.0184896468 719.9615103532 18 10439.419317905 1454.240682095 Plan23 1 2 3 4 5 5 8 8 9 12 12 13 14 15 15 16 18 21 Variável X 1 Resíduos Variável X 1 Plotagem de resíduos Plan24 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0.9700464492 R-Quadrado 0.9409901136 R-quadrado ajustado 0.9373019957 Erro padrão 604.9256900454 Observações 18 ANOVA gl SQ MQ F F de significação Regressão 1 93365047.27236953 93365047.27236953 255.1410064301 0 Resíduo 16 5854961.447630469 365935.0904769043 Total 17 99220008.72 Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0% Interseção 82.7649020894 287.6321547942 0.2877456526 0.777235152 -526.9880230415 692.5178272203 -526.9880230415 692.5178272203 Variável X 1 396.812330179 24.8424844358 15.9731338951 0 344.148616127 449.4760442309 344.148616127 449.4760442309 RESULTADOS DE RESÍDUOS Observação Y previsto Resíduos 1 479.5772322683 340.4227677317 2 876.3895624473 141.4104375527 3 1273.2018926263 442.1981073737 4 1670.0142228052 -567.4142228052 5 2066.8265529842 -488.4265529842 6 2066.8265529842 -195.8265529842 7 3257.263543521 -198.663543521 8 3257.263543521 -262.263543521 9 3654.0758737 981.3241263 10 4844.5128642369 -505.5128642369 11 4844.5128642369 295.0871357631 12 5241.3251944158 447.8748055842 13 5638.1375245948 1143.8624754052 14 6034.9498547737 -692.5498547737 15 6034.9498547737 -727.3498547737 16 6431.7621849527 -553.5621849527 17 7225.3868453106 -351.1868453106 18 8415.8238358475 750.5761641525 Plan24 1 2 3 4 5 5 8 8 9 12 12 13 14 15 15 16 18 21 Variável X 1 Resíduos Variável X 1 Plotagem de resíduos Plan25 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0.9542123798 R-Quadrado 0.9105212658 R-quadrado ajustado 0.9049288449 Erro padrão 744.902711377 Observações 18 ANOVA gl SQ MQ F F de significação Regressão 1 90341927.92933223 90341927.92933223 162.8134369298 0.0000000008 Resíduo 16 8878080.790667772 554880.0494167358 Total 17 99220008.72 Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0% Interseção 12.2434259643 363.4602291661 0.0336857378 0.9735444124 -758.2578347913 782.74468672 -758.2578347913 782.74468672 Variável X 1 410.6315636665 32.1815684538 12.7598368692 0.0000000008 342.4096866166 478.8534407165 342.4096866166 478.8534407165 RESULTADOS DE RESÍDUOS Observação Y previsto Resíduos 1 422.8749896309 397.1250103691 2 833.5065532974 184.2934467026 3 1244.1381169639 471.2618830361 4 1654.7696806304 -552.1696806304 5 2065.401244297 -487.001244297 6 2065.401244297 -194.401244297 7 3297.2959352966 -238.6959352966 8 3297.2959352966 -302.2959352966 9 3707.9274989631 927.4725010369 10 4939.8221899627 -600.8221899627 11 4939.8221899627 199.7778100373 12 5350.4537536292 338.7462463708 13 5761.0853172957 1020.9146827043 14 6171.7168809623 -829.3168809623 15 6171.7168809623 -864.1168809623 16 6582.3484446288 -704.1484446288 17 7403.6115719618 -529.4115719618 18 7403.6115719618 1762.7884280382 Plan25 1 2 3 4 5 5 8 8 9 12 12 13 14 15 15 16 18 18 Variável X 1 Resíduos Variável X 1 Plotagem de resíduos Plan1 a w 1 820.22 2 1042.8 3 1715.4 4 1102.6 5 1578.4 5 1871 8 3058.6 8 2995 9 4635.4 12 4339 12 5139.6 13 5689.2 14 6782 15 5342.4 15 5307.6 16 5878.2 18 6874.2 18 9166.4 Plan2 a w 1 410 820 820 2 508.9 1017.8 1017.8 3 857.7 1715.4 1715.4 2 551.3 1102.6 1102.6 3 789.2 1578.4 1578.4 4 935.5 1871 1871 7 1529.3 3058.6 3058.6 8 1497.5 2995 2995 9 2317.7 4635.4 4635.4 11 2169.5 4339 4339 11 2569.8 5139.6 5139.6 13 2844.6 5689.2 5689.2 13 3391 6782 6782 14 2671.2 5342.4 5342.4 16 2653.8 5307.6 5307.6 16 2939.1 5878.2 5878.2 17 3437.1 6874.2 6874.2 18 4583.2 9166.4 9166.4 19 3559.7 7119.4 19 4896.3 9792.6 Plan5 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0.9531885817 R-Quadrado 0.9085684723 R-quadrado ajustado 0.903488943 Erro padrão 417.6696375941 Observações 20 ANOVA gl SQ MQ F F de significação Regressão 1 31203262.320975892 31203262.320975892 178.8686343621 0.0000000001 Resíduo 18 3140062.6710241134 174447.9261680063 Total 19 34343324.992000006 Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0% Interseção 137.9893931184 183.8289488069 0.7506401686 0.4625699483 -248.2208964429 524.1996826797 -248.2208964429 524.1996826797 Variável X 1 205.5952045516 15.3725489648 13.3741778948 0.0000000001 173.2986776688 237.8917314344 173.2986776688 237.8917314344 RESULTADOS DE RESÍDUOS Observação Y previsto Resíduos 1 343.58459767 66.41540233 2 549.1798022216 -40.2798022216 3 754.7750067732 102.9249932268 4 549.1798022216 2.1201977784 5 754.7750067732 34.4249932268 6 960.3702113248 -24.8702113248 7 1577.1558249797 -47.8558249797 8 1782.7510295313 -285.2510295313 9 1988.3462340829 329.3537659171 10 2399.5366431861 -230.0366431861 11 2399.5366431861 170.2633568139 12 2810.7270522894 33.8729477106 13 2810.7270522894 580.2729477106 14 3016.322256841 -345.122256841 15 3427.5126659442 -773.7126659442 16 3427.5126659442 -488.4126659442 17 3633.1078704958 -196.0078704958 18 3838.7030750474 744.4969249526 19 4044.298279599 -484.598279599 20 4044.298279599 852.001720401 Plan5 1 2 3 2 3 4 7 8 9 11 11 13 13 14 16 16 17 18 19 19 Variável X 1 Resíduos Variável X 1 Plotagem de resíduos Plan3 * * * Econometria Fazendo o item b.1: * * * Econometria Resultados G1: * * * Econometria SQR = 6036278,27 S²1 = SQR = 6.036.278,27 = 1.509.069,56 n – 2 4 * * * Econometria Tabela G2: * * * Econometria Resultados para G2: * * * Econometria SQR = 440.791,32 S²2 = SQR = 440.791,32 = 110197,83 n – 2 4 * * * ECONOMETRIA Resolvendo o item B.4: Comparemos, portanto, as variâncias das duas regressões em um teste F e, para isso, dividiremos uma variância pela outra: S²1 = 1.509.069,56 = 13.69 S²2 110.197,83 Como o valor – limite na tabela F, com 5% de significância, para 4 G.L para o numerador e 4 G.L para o denominador é 6.39, ficamos: Rejeitamos H0: Variâncias iguais.(Homocedasticidade) Aceitamos H1: Variâncias desiguais (O modelo contem a presença de Heterocedasticidade). * * * Econometria 2) Teste de White (1980): Consiste em , a partir de um modelo de regressão qualquer: È feita uma regressão auxiliar em que a variável dependente é o resíduo ao quadrado (não-autocorrelacionado) e os regressores são os regressores da regressão original, seus quadrados e seus produtos cruzados, desta forma: * * * Econometria Um R² elevado nesta regressão auxiliar mostra indícios de heterocedasticidade. O Teste de White é a estatística F para testarmos todos os sejam zero menos o intercepto. Mais precisamente, pode-se demonstrar n.R², sendo n o numero de observações segue uma distribuição com o numero de G.L equivalente ao numero de regressores da regressão auxiliar(exceto o intercepto). * * * Econometria Ex: Consumo de Energia para 17 cidades em função da tarifa e da renda. * * * Econometria Dependent Variable: CT Method: Least Squares Date: 05/19/08 Time: 14:38 Sample: 1 17 Included observations: 17 Variable Coefficient Std. Error t-Statistic Prob. C 154.4571 169.4225 0.911668 0.3774 TARF 6.719405 65.32551 0.102860 0.9195 YT 0.371291 0.204393 1.816554 0.0908 R-squared 0.191180 Mean dependent var 385.5765 Adjusted R-squared 0.075635 S.D. dependent var 151.2492 S.E. of regression 145.4169 Akaike info criterion 12.95587 Sum squared resid 296045.0 Schwarz criterion 13.10291 Log likelihood -107.1249 F-statistic 1.654587 Durbin-Watson stat 1.368711 Prob (F-statistic) 0.226445 * * * ECONOMETRIA O Coeficiente da renda foi significante apenas a 10% e o coeficiente da tarifa assim como do intercepto não foi significante (sinal do coeficiente da tarifa de energia seria supostamente negativo). Além disso, o teste F (1.65) indica que a regressão não é valida. Entretanto, essas conclusões só são válidas se não existir heterocedasticidade, o que ainda não sabemos. * * * ECONOMETRIA Gráfico dos resíduos: * * * ECONOMETRIA O Gráfico exposto acima mostra : No eixo horizontal, o numero1 corresponde a cidade A, o 2 à B e assim por diante. Uma discrepância na dispersão dos erros: parecendo maior para as últimas cidade da tabela do que para as primeiras. Para uma idéia mais precisa usaremos o Teste de White. Os dados para a regressão auxiliar são mostrados na seguinte tabela. * * * Econometria Dados para 2ª regressão: * * * ECONOMETRIA Dependent Variable: RESID1 Method: Least Squares Date: 05/19/08 Time: 23:34 Sample: 1 17 Included observations: 17 Variable Coefficient Std. Error t-Statistic Prob. C -41106.88 46462.86 -0.88472 0.3952 YT -67.30777 127.1550 -0.529336 0.6071 TARF 81023.92 46659.85 1.736480 0.1104 YT1 0.379896 0.109872 3.457617 0.0054 TARF1 9511.886 10013.56 0.949901 0.3626 YTARF -212.4283 40.44686 -5.252035 0.0003 R-squared 0.794170 Mean dependent var 17414.41 Adjusted R-squared 0.700611 S.D. dependent var 23364.56 S.E. of regression 12784.26 Akaike info criterion 22.02038 Sum squared resid 1.80E+09 Schwarz criterion 22.31446 Log likelihood -181.1732 F-statistic 8.488433 Durbin-Watson stat 1.595274 Prob(F-statistic) 0.001657 * * * ECONOMETRIA O valor de R² foi relativamente alto, o que indica mesmo a heterocedasticidade. No entanto o teste definitivo será feito multiplicando-se o R² pelo numero de observações: n x R² = 17 x 0.7941 = 13.57 Como o valor limite (limite superior) da distribuição com 5 G.L e 5% de significância (na tabela lemos na coluna de 95%) é de 11.07, rejeitamos H0: homocedasticidade, isto é, concluímos que o modelo possui heterocedasticidade. * * * Econometria Procedimento para correção da Heterocedasticidade Havendo a presença de heterocedasticidade no modelo, a metodologia de correção é mais simplificada se suspeitarmos qual é o padrão da heterocedasticidade. Retomemos o mesmo modelo anterior com k=2: Vamos supor que seja conhecida a variância dos erros: * * * Econometria O exemplo citado acima mostra uma variância não – constante, que na verdade, é multiplicada por uma constante zi. Se conseguíssemos eliminar a variável z da variância, teríamos, então, uma variância constante e ai estaríamos livres do problema de heterocedasticidade. Para tal resolução devemos transformar em uma variância . Para isto, devemos dividir esta variância que não é constante por Enfim, a solução é dividir todo o modelo de regressão por . (5) * * * Econometria Logo a variância desse novo termo de erro será dada por: Quando estimamos o modelo transformado por mínimos quadrados, o método ganha um novo sobrenome: ele é chamado de Mínimos Quadrados Ponderados(MQP). * * * Econometria O método de mínimos quadrados ponderados também pode ser usado quando o padrão conhecido é o desvio padrão: E, nesse caso, é simplesmente dividir o modelo por : E o desvio – padrão do erro desse modelo será dado por: Com isso, eliminamos a heterocedasticidade do modelo. * * * Econometria Corrigindo o Problema da Heterocedasticidade Estimemos, então, novamente a regressão do exemplo entre a e w, corrigindo o problema da heterocedasticidade. Supostamente, a causa da heterocedasticidade naquele exemplo é de que a variação dos salários é mais discrepante quanto maior são os anos de estudo. Seria possível imaginar que a variância ou o desvio – padrão sejam proporcionais ao tempo de estudo. Se considerarmos, logo, tal hipótese, a solução indicada é dividir toda a equação pelos anos de estudo. Nesse caso, no entanto, a variável a ser dividida é a própria variável dependente do modelo. Ou seja, o modelo inicial: * * * Econometria Sendo w os salários e a os anos de estudo, torna-se: (6) Portanto, para estimar os coeficientes e sem o problema da heterocedasticidade, devemos estimar uma regressão simples em que a variável dependente é a razão w/a e a variável independente é o inverso dos anos de estudo 1/a. * * * Econometria Dados de w e a: * * * ECONOMETRIA Dependent Variable: WA Method: Least Squares Date: 05/26/08 Time: 01:03 Sample: 1 20 Included observations: 20 Variable Coefficient Std. Error t-Statistic Prob. C 198.8699 9.126321 21.79080 0.0000 A 188.7405 29.71646 6.351378 0.0000 R-squared 0.691464 Mean dependent var 237.0615 Adjusted R-squared 0.674323 S.D. dependent var 53.79967 S.E. of regression 30.70246 Akaike info criterion 9.781202 Sum squared resid 16967.54 Schwarz criterion 9.880776 Log likelihood -95.81202 F-statistic 40.34000 Durbin-Watson stat 2.416386 Prob (F-statistic) 0.000006 * * * Econometria Os valores de e obtidos agora por mínimos quadrados ponderados, representam uma estimativa mais precisa dos dois coeficientes; alem disso, é possível confiar no teste de hipóteses tendo em vista que o processo é homocedástico. Mas para ter certeza absoluta, usamos um dos testes vistos, o teste de White. Antes disso veremos sua dispersão no gráfico em seguida. * * * Econometria * * * ECONOMETRIA Como mostra o diagrama a dispersão dos resíduos se mostram mais equilibrados. De fato, como mostra o resultado no teste de White a seguir: Dependent Variable: RESID1 Method: Least Squares Date: 03/26/09 Time: 01:54 Sample: 1 20 Included observations: 20 Variable Coefficient Std. Error t-Statistic Prob. C 1172.609 337.8424 3.470877 0.0029 A -2547.070 2502.246 -1.017914 0.3230 A1 2026.827 2615.820 0.774834 0.4491 R-squared 0.075801 Mean dependent var 848.3772 Adjusted R-squared -0.032928 S.D. dependent var 808.7148 S.E. of regression 821.9218 Akaike info criterion 16.39865 Sum squared resid 11484442 Schwarz criterion 16.54801 Log likelihood -160.9865 F-statistic 0.697153 Durbin-Watson stat 2.486159 Prob(F-statistic) 0.511690 * * * ECONOMETRIA Utilizando da metodologia do teste, temos: R² = 0.0758 n x R² = 20 x 0.0758 = 1.52 Como o valor – limite, a 5% de significância, com 2 G.L, na distribuição é de 5.99, aceitamos a hipótese nula de homocedasticidade para este modelo. Quando não conhecemos o padrão da heterocedasticidade, as formas de correção são um pouco mais complexas. Uma opção que se apresenta de forma alternativa é estimar o modelo com as variáveis em logaritmo e testar novamente para a heterocedasticidade. * * * ECONOMETRIA Violando a Hipótese 3: a Simultaneidade O abrandamento desta hipótese, já vista, estabelece que, se uma (ou mais) variável independente for estocástica, é preciso que, pelo menos, ela não tenha correlação com o termo de erro. Mas se houver? E o que levaria tal variável a ter correlação com o termo de erro? * * * ECONOMETRIA SIMULTÂNEIDADE O problema das simultaneidade é presentemente freqüente em economia. Ex: Modelo de determinação de preços na economia – Oferta e Demanda: Ótica da oferta O produtor irá produzir mais quanto maior for o preço. Ótica da demanda O consumidor ira demandar mais quanto menor for o preço. Logo as variáveis preço e quantidade se determinam mutuamente. * * * ECONOMETRIA Suponhamos uma quantidade a ser produzida, chamada de quantidade ofertada, sendo esta função do preço: (1) Já quanto aos consumidores, digamos que além do preço, levem em conta a sua renda na decisão de consumo. Logo para a quantidade demandada: (2) * * * ECONOMETRIA No equilíbrio de mercado, , e o termo que é observado são as quantidades de equilíbrio, com isso podemos chamar ambas as equações de Q. temos, então, um sistema de duas equações: Eq. de oferta Eq. de demanda Como as variáveis Q e P se determinam mutuamente nesse modelo, elas são chamadas de variáveis endógenas. Já R é, realmente uma variável independente do modelo; seu valor já predeterminado chamamos de variável exógena. * * * ECONOMETRIA A estimação por MQO dessas equações leva a estimadores viesados e inconsistentes, já que um dos regressores é uma variável endógena, determinada pelo próprio modelo descrito pelas equações e, portanto, está correlacionada com o termo de erro. Notando: Se R aumenta, eleva a demanda por Q, que eleva P, mas com o P maior faz com que se estimule uma maior produção, Q. * * * ECONOMETRIA Questão da Identificação Partindo do sistema de equações colocado acima, isolaremos as variáveis endógenas. Fazendo a igualdade , teremos: (3) Encontramos uma equação que coloca o preço em função apenas de variáveis exógenas (uma só neste caso). Observamos, que fica clara a correlação do preço com (dois) termos de erro. * * * ECONOMETRIA Substituindo a equação do preço que acabamos de encontrar na equação de oferta teremos: Que a resolução após algumas operações: (4) * * * ECONOMETRIA A equação também coloca uma das variáveis endógenas (Q) em função da variável exógena R. Geramos, assim, um novo sistema de equações que isola as variáveis endógenas em cada equação, e essas equações são chamadas de equações na forma reduzida. O sistema original de equações é chamado de forma estrutural do modelo. As equações na forma reduzida são: (5) (6) * * * ECONOMETRIA Este sistema pode ser escrito de maneira mais simples: (7) (8) Em que: * * * ECONOMETRIA Notemos que as equações na forma reduzida não têm mais o problema de que um ou mais regressores são correlacionados com o termo de erro e, então, elas podem perfeitamente ser estimadas por MQO. Só que, estimando as equações na forma reduzida, encontraremos os π e não os α e β. Fica o problema de, dados os parâmetros da forma reduzida, encontrar os da forma estrutural. Da equação de oferta: Substituindo pelas equações da forma reduzida e omitindo os termos de erro: (9) (10) * * * ECONOMETRIA Lembrando que os estimadores já foram obtidos das equações na forma reduzida por MQO, nossas incógnitas são os . Para manter a igualdade, teremos de ter os coeficientes puros iguais em cada lado, bem como os coeficientes da renda: (11) (12) Que é um sistema de 2 equações e duas incógnitas que, não só tem solução, como nesse caso é até fácil encontrá – la, pois da segunda equação temos: * * * ECONOMETRIA E fazendo a substituição: (13) (14) Portanto, é perfeitamente possível encontrar os coeficientes da oferta a partir dos coeficientes obtidos da estimação na forma reduzida. Vejamos se o mesmo ocorre para a demanda: * * * ECONOMETRIA Refazendo o mesmo procedimento, isto é, substituindo pelas equações na forma reduzida e omitindo os termos de erro: (15) (16) Que gera as equações: (17) (18) Agora temos 3 incógnitas e apenas 2 equações. Não é possível encontrar os coeficientes da demanda a partir dos coeficientes estimados na forma reduzida. * * * ECONOMETRIA Uma outra maneira de dizer isso é que não se pode identificar a equação de demanda, ou simplesmente, que a equação da demanda apresentada é Subidentificada. A Equação da oferta, inversamente, é possível ser identificada. Dizemos que a equação de oferta é Exatamente Identificada. Como existe a renda na equação de demanda, mudanças naquela implicam deslocamento da curva de demanda. Deslocando a curva de demanda, podemos encontrar vários pontos na curva de oferta e, assim, é possível identificá – la. * * * ECONOMETRIA A figura abaixo mostra uma curva de oferta e diferentes curvas de demanda( para diferentes níveis de renda) fazendo com que vários pontos da curva de oferta sejam identificados. Graficamente: P Q D1 D2 D3 O * * * ECONOMETRIA Note que, se, além da renda, a equação da demanda contemplasse, também o preço de um bem substituto como variável, seria mais uma variável que poderia deslocar a demanda e identificar a oferta. Nesse caso, a equação de oferta estaria Superidentificada. A regra então é: Se temos duas variáveis endógenas em cada equação, para equação ser identificada, temos de ter uma variável exógena fora da equação. Estendendo tal raciocínio para três variáveis endógenas, precisaríamos de duas exógenas fora da equação e assim por diante. * * * ECONOMETRIA Generalizando: * * * ECONOMETRIA No entanto, devemos prestar atenção: a situação acima descreve apenas a condição necessária para identificação, também conhecida como questão de ordem. No exemplo anterior, vemos que a equação de oferta é exatamente identificada, desde que a renda de fato exista na equação de demanda, ou seja, que o coeficiente . Uma condição mais geral pode ser vista no exemplo a seguir. * * * ECONOMETRIA Dado o sistema: Onde: Y = renda nacional; C = consumo; I = investimento; G = gastos do governo; r = taxa de juros e m = emissão de moeda. Sendo que o governo controla G e m. Verifiquemos a condição de identificação para cada uma das equações. * * * ECONOMETRIA (1) é uma identidade, não tem coeficiente a serem estimados, portanto não cabe a questão da identificação. (2), (3) e (4) cabe a questão da identificação. Porem ficaremos restritos a equação (2). Como o governo estipula G e m, logo, tais variáveis são exógenas. As demais variáveis são endógenas, porem, quando tomamos valores defasados dessa variáveis, elas já estão, obviamente, predeterminadas; assim, elas tem o mesmo comportamento das variáveis exógenas, então: Variáveis Endógenas: Variáveis Exógenas: * * * ECONOMETRIA No caso da equação (2), temos: Variáveis endógenas incluídas = 3 Variáveis exógenas excluídas = 2 A equação, pela condição de ordem, é exatamente identificada. Mas temos de verificar a condição suficiente, o que é mais complicado agora porque temos várias equações. Para isso, vamos montar uma tabela com as várias equações, a qual preencheremos com uns e zeros para o caso de a variável ser ou não incluída na equação. * * * ECONOMETRIA Tabela de variáveis incluídas ou não na equação. * * * ECONOMETRIA Montando uma matriz a partir dessa tabela com a seguinte regra: excluir a linha correspondente à equação que estamos estudando e incluir as colunas correspondentes as variáveis excluídas da equação (I, G e m). Teremos a matriz 3x3 mostrada abaixo: Não há nenhuma linha ou coluna cujos elementos sejam todos iguais a zero, então, a equação está de fato identificada. Essa condição também é conhecida como Condição de Posto. Se tal condição não fosse verificada a equação seria Subidentificada. * * * ECONOMETRIA Como estimar um modelo de equações simultâneas Um método já foi explicitado na seção anterior: estimam – se os parâmetros da forma reduzida. Conhecida a relação entre os parâmetros da forma reduzida e da forma estrutural, podemos encontrar estes últimos. Esse método é conhecido como Mínimos Quadrados Indiretos (MQI). Mas isso só pode ser feito para equações exatamente identificadas. Se a equação for subidentificada, não dá para estimar mesmo. Se a equação for superidentificada ( o que em princípio é bom, pois há mais informações), não dá para encontrar uma relação proporcional (um p/um) entre os parâmetros da forma estrutural e reduzida que nos dê uma única solução. * * * ECONOMETRIA Um método que pode ser estendido a equações superidentificadas é o dos Mínimos Quadrados de Dois Estágios, que consiste em estimar as equações da forma reduzida. A partir daí, encontrar valores estimados para as variáveis endógenas. Como são valores estimados, não incluem os resíduos e, portanto, não tem correlação com o termo de erro. Então, usam – se esses valores estimados como substitutos das variáveis endógenas, que, no modelo estrutural, aparecem no lado direito das equações. * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
Compartilhar