Baixe o app para aproveitar ainda mais
Prévia do material em texto
121 Econometria – Semestre 2010.01 121 P r o f e s s o r a M ô n i c a B a r r o s ENCE CAPÍTULO 12 ‐ AUTOCORRELAÇÃO 12.1. A NATUREZA DO PROBLEMA O objetivo deste capítulo é examinar as conseqüências da violação de uma das hipóteses fundamentais do modelo linear clássico, a hipótese de que os erros do modelo não são correlacionados. Este tipo de problema ocorre na prática quando fazemos regressão de séries temporais, e no restante do capítulo usaremos o subscrito t (ao invés de i) para explicitar a dependência dos dados no tempo. Também, por razões que deverão ficar claras ao longo do texto, os erros (correlacionados) serão denotados por u, enquanto os erros não correlacionados continuarão, como nos capítulos anteriores, a ser denotados por ε. Em primeiro lugar, é preciso definir o que entendemos por autocorrelação (ou correlação serial). A autocorrelação é a correlação que existe entre valores de uma série temporal observados em diferentes instantes de tempo. A autocorrelação pode também se referir a observações em diferentes pontos no espaço (correlação espacial), e o tratamento dado ao problema é basicamente o mesmo apresentado aqui, por isso nosso foco será apresentar o problema no contexto de séries temporais. No modelo clássico, uma das premissas é a inexistência de correlação entre os erros em instantes distintos. Isto é, supõe‐se que: E(ui.uj) = 0 para i ≠ j. Note que esta hipótese implica em Cov(ui, uj) = 0 para i ≠ j pois a média do erro é zero por hipótese. Em que situação esta premissa costuma ser violada? Considere, por exemplo, um modelo para a venda mensal de TVs no varejo. No passado recente, houve a redução de imposto sobre produtos industrializados para combater a recessão, e isso incrementou as vendas. Também, em 2009, as 122 Econometria – Semestre 2010.01 122 P r o f e s s o r a M ô n i c a B a r r o s ENCE taxas de juros ao consumidor caíram. Agora, em 2010, estamos a um passo da Copa do Mundo que, sabidamente, tem um impacto positivo sobre as vendas de TVs. E os erros de um modelo, como ficam? Muito provavelmente, o erro do modelo num mês terá uma expressiva correlação com o erro do modelo em meses adjacentes. Ou seja, a hipótese de que erros em instantes diferentes são descorrelatados é falsa, ou seja, existe autocorrelação entre os erros. Isso quer dizer que as perturbações que ocorrem num instante de tempo afetam as que ocorrem em outro instante. Antes de descobrir por que existe autocorrelação, é essencial esclarecer algumas questões sobre nomenclatura. É prática comum tratar a autocorrelação e a correlação serial como sinônimos, mas alguns autores preferem distinguir os dois termos. Nós não faremos isso aqui – para nós, autocorrelação e correlação serial significam a mesma coisa. A Figura 12.1. a seguir exibe alguns padrões plausíveis para a presença e ausência de autocorrelação. Nela são plotados os erros (ou, na prática, os resíduos) contra o eixo dos tempos. A Figura 12.1a mostra um padrão cíclico. A Figura 12.1b sugere uma tendência ascendente nos erros, enquanto a Figura 12.1.c mostra um padrão linear descendente linear nos distúrbios. 12.1d mostra termos de tendência linear e quadrática nos distúrbios. Apenas a Figura 12.1.e não exibe um padrão sistemático, apoiando a hipótese de autocorrelação nula dos erros, que é a premissa do modelo clássico de regressão. FIGURA 12.1 123 Econometria – Semestre 2010.01 123 P r o f e s s o r a M ô n i c a B a r r o s ENCE A pergunta natural é: Por que a correlação serial ocorre? Há diversas razões, algumas mostradas a seguir. Inércia Séries temporais econômicas apresentam inércia ou lentidão. O PIB, índices de preços, produção, emprego e desemprego apresentam ciclos. A partir do fundo da recessão, começa a recuperação econômica e a maioria destas séries começar a se mover para cima. Neste movimento, o valor de uma série num ponto no tempo é maior do que seu valor anterior. Assim, há uma dinâmica que continua até que algo aconteça (por exemplo, o aumento na taxa de juros ou os impostos, ou ambos) para atrasá‐los. Por isso, nas regressões envolvendo séries temporais, observações sucessivas tendem a ser interdependentes. Viés de Especificação – variáveis excluídas Na prática o pesquisador muitas vezes começa com um modelo de regressão plausível que não podem ser o mais "perfeito''. Após a análise de regressão, o pesquisador examina os resultados 124 Econometria – Semestre 2010.01 124 P r o f e s s o r a M ô n i c a B a r r o s ENCE para descobrir se eles estão de acordo com as expectativas a priori e as premissas básicas dos modelos de mínimos quadrados. Por exemplo, o pesquisador pode plotar os resíduos obtidos a partir da regressão ajustada e observar padrões como os mostrados na Figura 12.1a a d. Esses resíduos podem sugerir que algumas variáveis que foram originalmente candidatas, mas não foram incluídas no modelo, devem ser incluídas. Este é o caso do viés de especificação da variável excluída. Muitas vezes, a inclusão dessas variáveis remove o padrão de correlação observado nos resíduos. Por exemplo, suponha que temos o modelo de demanda: Onde Y = quantidade demandada de carne de boi, X2 = preço da carne de boi, X3 = renda do consumidor, X4 = preço da carne de porco e t = tempo. No entanto, por alguma razão, ajustamos a regressão que se segue: Agora, se (12.1.2) é o modelo verdadeiro, mas ajustamos (12.1.3), isso equivale a fazer vt = β4.X4t + ut. E na medida que o preço da carne suína afeta o consumo de carne, o termo de erro ou distúrbio v irá refletir um padrão sistemático, criando assim uma (falsa) autocorrelação. Um teste simples disso seria executar os dois modelos (12.1.2) e (12.1.3) e ver se autocorrelação, observada no modelo (12.1.3) desaparece quando (12.1.2) é ajustado. A mecânica de detecção de autocorrelação será discutida na seção 12.6. Viés de Especificação – Forma Funcional Incorreta Suponha que o modelo verdadeiro é: Mas em vez deste, ajustamos o seguinte modelo: Ou seja, ajustamos uma forma funcional errada para a função custo marginal, que é a variável dependente no modelo. As curvas de custo marginal correspondentes ao modelo "verdadeiro'' e “ incorreto” são mostradas na Figura 12.2. 125 Econometria – Semestre 2010.01 125 P r o f e s s o r a M ô n i c a B a r r o s ENCE FIGURA 12.2. Como a Figura 12.2 mostra, entre os pontos A e B a curva de custo marginal linear estará sempre acima do verdadeiro custo marginal, enquanto que fora deste intervalo o oposto ocorre. Este resultado é esperado, pois o termo de erro vi em (12.1.5, o modelo errado) é, de fato, igual a Output2 + ui e, portanto, vai pegar o efeito sistemático do termo Output 2 no custo marginal. Neste caso, vi exibirá autocorrelação por causa da utilização de uma forma funcional errada. No capítulo 13, vamos considerar vários métodos para detectar o viés de especificação. Fenômeno Cobweb (Teia de Aranha) O fornecimento de muitos produtos agrícolas reflete o fenômeno chamado “teia de aranha”, onde a oferta reage ao preço com uma defasagem de um período de tempo, porque as decisões de oferta levam um certo tempo para serem implementadas (o período de gestação). Assim, no início do plantio da safra deste ano, os agricultores são influenciados pelo preço vigente no ano passado,e sua função de oferta é: Suponha que no final do período t, o preço Pt é inferior ao preço do amo passado, Pt‐1. No período t + 1 os agricultores podem decidir produzir menos do que eles fizeram no período t. Obviamente, nesta situação os distúrbios não deverão ser aleatórios, pois se os agricultores produzem demais no ano t, devem reduzir sua produção em t + 1, e assim por diante, levando a um padrão de teia de aranha. 126 Econometria – Semestre 2010.01 126 P r o f e s s o r a M ô n i c a B a r r o s ENCE Defasagens Em uma regressão de séries temporais das despesas de consumo sobre a renda, é comum observar que a despesa de consumo do período atual período depende, entre outras coisas, das despesas de consumo dos períodos anteriores. Por exemplo: Um modelo de regressão como (12.1.7) é conhecido como auto‐regressivo porque uma das variáveis explicativas é o valor defasado da variável dependente. (Estes modelos serão novamente estudados no capítulo 17.) A justificativa para um modelo como (12.1.7) é simples. Os consumidores não mudam seus hábitos de consumo facilmente por motivos psicológicos, tecnológicos ou institucionais. Agora, se nós negligenciarmos o termo defasado em (12.1.7), o termo de erro resultante refletirá um padrão sistemático devido à influência do consumo defasado sobre o consumo atual. Manipulação de dados Na análise empírica, os dados brutos são frequentemente "Manipulados''. Por exemplo, em regressões envolvendo séries trimestrais, os dados são às vezes obtidos a partir dos dados mensais simplesmente adicionando três observações mensais e dividindo a soma por 3. Esta média suaviza as flutuações do dados mensais, e o gráfico dos dados trimestrais parece muito mais suave do que o dos dados mensais, e essa mesma regularidade pode gerar um padrão sistemático nos termos de erro, introduzindo assim autocorrelação. Outra fonte de manipulação é interpolação ou extrapolação de dados. Por exemplo, o Censo de População é realizado a cada 10 anos. Se existe uma necessidade de obter dados para alguns anos no período intercensitários 1990‐2000 ou 2000‐2010, a prática comum é a interpolação com base em algum pressuposto “ad‐hoc”. Estas técnicas de “massagem” dos dados podem impor aos dados um padrão sistemático que pode não existir nos dados originais. 127 Econometria – Semestre 2010.01 127 P r o f e s s o r a M ô n i c a B a r r o s ENCE Transformação de dados Considere o seguinte modelo: Onde, por exemplo, Y = despesa de consumo e X = renda. Como (12.1.8) é válido em todos os períodos de tempo, ele é válido também no período anterior (t ‐ 1). Assim, podemos escrever (12.1.8) como: Yt‐1, Xt‐1, e ut‐1 são conhecidos como os valores defasados de Y, X, e U respectivamente. Neste caso a defasagem é de um período. Subtraindo (12.1.9) de (12.1.8), obtemos: Onde Δ é conhecido como o operador de primeira diferença. Assim, ΔYt = (Yt ‐ Yt‐1), ΔXt = (Xt ‐ Xt‐1) e ΔUt = (Ut ‐ Ut‐1). Podemos escrever (12.1.10) como: A equação (12.1.9) é conhecida como forma de nível e a equação (12.1.10) é conhecida como a forma de primeira diferença. Ambas as formas são frequentemente utilizadas em pesquisas empíricas. Por exemplo, se em (12.1.9) Y e X representam os logaritmos das despesas de consumo e renda, então em (12.1.10) ΔY e ΔX representam variações nos logaritmos das despesas de consumo e renda. Mas, uma variação no logaritmo é uma mudança relativa (percentual), se ela for multiplicada por 100. Assim, em vez de estudar relações entre as variáveis na forma de nível, podemos estar interessados em suas relações na forma de crescimento. Se o termo de erro em (12.1.8) satisfaz as hipóteses‐padrão MQO, especialmente a hipótese de não autocorrelação, pode‐se mostrar que o erro vt em (12.1.11) é autocorrelacionado. (A prova é dada no apêndice 12A, Seção 12A.1.) 128 Econometria – Semestre 2010.01 128 P r o f e s s o r a M ô n i c a B a r r o s ENCE Modelos como (12.1.11) são conhecidos como modelos de regressão dinâmica, ou seja, modelos que envolvem regressandos defasados. Eles serão estudados em profundidade no Capítulo 17. O que interessa no exemplo anterior é que às vezes a autocorrelação pode ser induzida como resultado da transformação do modelo original. Não‐estacionariedade Lembre‐se que uma série temporal é estacionária se suas características (por exemplo, média, variância e covariância) são invariantes no tempo, ou seja, eles não mudam ao longo do tempo. Se isso não acontecer, a série temporal é dita não estacionária. Como veremos na Parte V, em um modelo de regressão na forma do nível como (12.1.8) é possível que tanto Y e X sejam não‐ estacionárias e, portanto, o erro u também seja não‐estacionário, e irá exibir autocorrelação. Em resumo, existem diversas razões pelas quais o termo de erro em um modelo de regressão pode ser autocorrelacionado. No restante do capítulo, investigamos os problemas decorrentes da autocorrelação e que pode ser feito sobre isso. A autocorrelação pode ser positiva (Figura 12.3a) ou negativa, embora a maioria das séries temporais econômica geralmente apresente autocorrelação positiva. Isso acontece porque a maioria delas move‐se para cima ou para baixo durante longos períodos de tempo e não apresenta um movimento constante para cima e para baixo como o mostrado na Figura 12.3b. FIGURA 12.3. – AUTOCORRELAÇÃO POSITIVA (a) E NEGATIVA (b) 129 Econometria – Semestre 2010.01 129 P r o f e s s o r a M ô n i c a B a r r o s ENCE 12.2. ESTIMATIVA MQO NA PRESENÇA DE AUTOCORRELAÇÃO O que acontece com os estimadores de MQO e suas variâncias se os erros do modelo apresentam autocorrelação? Suponha agora que E (ut.ut + s) ≠ 0 para s ≠ 0 e que todas as outras hipóteses do modelo clássico são mantidas. Considere o modelo de regressão com duas variáveis: Yt = β1 + β2.Xt + ut. Suponha que os ruídos deste modelo têm agora a seguinte estrutura: Onde ρ (a letra grega rô) é o coeficiente de autocorrelação e εt é o erro estocástico que satisfaz as hipóteses usuais do modelo de mínimos quadrados, a saber: 130 Econometria – Semestre 2010.01 130 P r o f e s s o r a M ô n i c a B a r r o s ENCE Na literatura de engenharia, um termo de erro com as propriedades (12.2.2) é chamado de “ruído branco”. O que (12.2.1) postula é que a valor do termo de erro no período t é igual a ρ vezes o seu valor no período anterior, acrescido de um termo de erro puramente aleatório. O esquema (12.2.1) é conhecido como esquema autoregressivo de primeira ordem de Markov, ou simplesmente regime auto‐regressivo de primeira ordem, geralmente denotado como AR (1). O nome autoregressivo é apropriado porque (12.2.1) pode ser interpretado como a regressão de ut em sim mesmo defasado em um período. Diz‐se que é de primeira ordem porque ut e seu valor imediatamente anterior estão envolvidos, ou seja, o máximo atraso é 1. Se o modelo for ut = ρ1ut‐1 + ρ2 ut‐2 + εt, seria um AR (2), um modelo autoregressivo de segunda ordem. Pode‐se provar que, na situação de ruídos AR(1): Onde cov(ut,ut + s) indica a covariância entre os termos de erro separados por s instantes e cor(ut,ut + s) a correlação entre estes mesmos termos de erro. Note que cor(ut,ut) = 1 sempre, pois a correlação de uma variável com si mesma é sempre um. Por causa da propriedadede simetria de covariâncias e correlações, cov(ut,ut + s) = cov(ut,ut ‐ s) e o mesmo ocorre com as correlações. O coeficiente ρ é uma constante entre ‐1 e +1 e então (12.2.3) mostra que, sob o esquema AR (1), a variância de ut é ainda constante (ut é homocedástico), mas ut está correlacionado não só com o seu valor imediatamente anterior, mas também com seus valores em outros instantes do passado. É fundamental observar que |ρ|< 1, ou seja, o valor absoluto de ρ é menor que um. Se ρ = 1, as variâncias e covariâncias acima não estão definidas. Se |ρ| <1, dizemos que o processo AR (1) dado em (12.2.1) é estacionário, ou seja, sua média, variância e covariância não mudam ao longo do tempo. Se |ρ| é menor que um, então a covariância diminuirá à medida que avançamos no passado distante, ou seja, à medida que a diferença entre as defasagens (“lags”) aumenta. Se |ρ| 131 Econometria – Semestre 2010.01 131 P r o f e s s o r a M ô n i c a B a r r o s ENCE é MAIOR que um, o processo é não estacionário e tem um comportamento claramente “explosivo”. Gere uma sequência de erros iid {et} no Excel e ajuste o modelo ut = 1,2ut‐1 + et para verificar que isso acontece. Utilize qualquer valor inicial para u0. Se ρ = 1, o processo é descrito por ut = ut‐1 + et, e é um processo NÃO ESTACIONÁRIO bastante importante na prática, chamado de “random walk”, ou passeio aleatório. O fato interessante é que a primeira diferença de um passeio aleatório é um processo estacionário, pois ut ‐ ut‐1 = et, ou seja, Δut = et onde Δ é o operador 1a. diferença. Uma razão para usar o modelo AR (1) não é apenas por sua simplicidade em relação aos modelos AR de ordem superior, mas também porque, mostrou ser útil em aplicações práticas. Considere novamente o modelo de regressão de duas variáveis: Yt = β1 + β2.Xt + ut. No capítulo 3 vimos que o estimador MQO do coeficiente angular é: Cuja variância é dada por: Onde a letra minúscula indica que a variável é calculada como um desvio em relação à média. Sob a hipótese AR(1), pode‐se mostrar que a variância deste estimador é: Onde Var(β^2)AR1 indica a variância do estimador sob a hipótese de erros AR(1). A comparação de (12.2.8) e (12.2.7) mostra que a variância sob o esquema AR(1) tem uma coleção de termos adicionais (em relação à variância sob a hipótese de erros não correlacionados). Estes termos adicionais dependem de ρ e também das autocorrelações amostrais da variável explicativa X em vários períodos anteriores. 132 Econometria – Semestre 2010.01 132 P r o f e s s o r a M ô n i c a B a r r o s ENCE Além disso, em geral não podemos prever se a variância dada por (12.2.7) será maior ou menor que a dada por (12.2.8). É claro que se ρ = 0, as duas fórmulas coincidirão. Mas, como princípio geral, as duas variâncias não serão iguais. Para dar uma idéia da diferença entre as variâncias (12.2.7) e (12.2.8), suponha que o regressor X também siga um processo AR(1) com um coeficiente de autocorrelação r. Pode‐se mostrar que (12.2.8) se reduz a: Se, por exemplo, r = 0,6 e ρ = 0,8, utilizando (12.2.9) segue que Var(β^2)AR1 = 2,8461 Var(β^2)MQO. Dito de outra forma, Var(β^2)MQO = (1/ 2,8461) Var(β^2)AR1 = 0,3513 Var(β^2)AR1. Ou seja, a fórmula usual de MQO [(12.2.7)] subestimará a variância de β2 sob o esquema AR(1) por cerca de 65%. Em resumo: uma aplicação cega das fórmulas MQO usuais para calcular os desvios e os erros padrão dos estimadores MQO estimadores pode levar a resultados totalmente enganosos. Suponha que a gente insista em continuar usando o estimador MQO de β2 e que corrigimos a variância levando em conta a estrutura AR(1) para o erro. Quais as propriedades de β^2 ? Ele é ainda linear e não tendencioso, mas não é BLUE (ou seja, não é eficiente). Já tínhamos chegado a conclusões semelhantes quanto estudamos o problema da heterocedasticidade, e vimos que naquelas condições era possível encontrar um estimador eficiente através de mínimos quadrados generalizados. Na próxima seção veremos quais os passos necessários para encontrar estimadores BLUE sob a hipótese de erros AR(1). 12.3. O ESTIMADOR BLUE NA PRESENÇA DE AUTOCORRELAÇÃO Considere ainda o modelo de regressão com duas variáveis e suponha a existência de erros AR(1) como na seção anterior. Pode‐se mostrar que o estimador BLUE do coeficiente angular é dado por: 133 Econometria – Semestre 2010.01 133 P r o f e s s o r a M ô n i c a B a r r o s ENCE Onde C é um fator de correção que pode ser ignorado na prática. Note que em (12.3.1) o subscrito t vai de 2 até n (pois o estimador depende de y e x defasados em um instante). A variância deste estimador é dada por: Onde D é um outro fator de correção, que também pode ser ignorado na prática. O estimador β^2GLS , como o expoente sugere, é obtido pelo método de mínimos quadrados generalizados. Como observado no Capítulo 11, o método de mínimos quadrados generalizados quer incorporar quaisquer informações adicionais disponíveis (por exemplo, a natureza da heterocedasticidade ou a autocorrelação) diretamente no processo de estimação através da transformação das variáveis, enquanto que os mínimos quadrados ordinários esta informação não é diretamente levada em consideração. A fórmula do estimador de mínimos quadrados generalizados dado em (12.3.1) depende explicitamente do parâmetro de autocorrelação ρ enquanto o estimador MQO dado por (12.2.6) ignora esta informação. Intuitivamente, essa é a razão pela qual o estimador de mínimos quadrados generalizados é BLUE e não o estimador MQO. O estimador de mínimos quadrados generalizados usa toda a informação disponível, o que não ocorre com o estimador MQO. Se ρ = 0, não existem informações adicionais a serem consideradas, e, portanto, os estimadores por mínimos quadrados generalizados e mínimos quadrados ordinários são idênticos. 134 Econometria – Semestre 2010.01 134 P r o f e s s o r a M ô n i c a B a r r o s ENCE Em resumo, sob autocorrelação, é o estimador de mínimos quadrados generalizados dado em (12.3.1) que é BLUE e a variância mínima é agora dada por (12.3.2) e não por (12.2.8) ou (12.2.7). Você pode reescrever o estimador de mínimos quadrados generalizados de uma forma mais parecida com o estimador usual MQO. Sejam: 1 * 1 * . . − − −= −= ttt ttt yyy xxx ρ ρ Então, a equação (12.3.1) torna‐se: C x yx t ttGLS += ∑ ∑ 2* ** 2βˆ , que tem praticamente a mesma forma que a do estimador MQO, mas agora aplicado às variáveis ** e tt yx . Também é importante notar que em (12.3.1) e em (12.2.6) os estimadores estão expressos como funções das variáveis centradas em torno das suas médias (expressas por letras minúsculas). Nota técnica O Teorema de Markov fornece apenas uma condição suficiente para o estimador MQO ser BLUE. As condições necessárias e suficientes para que este estimador seja BLUE são dadas pelo teorema de Krushkal, mencionado no capítulo anterior. Logo, em alguns casos o estimador MQO pode se BLUE apesar da autocorrelação. Mas, estes casos não são comuns na prática. 12.4 O QUE ACONTECE SE USAMOS MQO E EXISTE AUTOCORRELAÇÃO? Lembre‐se: mesmo quando existe autocorrelação, os estimadores MQO são ainda não tendenciosos e lineares, além de consistentes e assintoticamente Normais. Mas, eles não são mais estimadores de variância mínima (ou seja, não são BLUE)! Suponha que continuamos a usar os estimadores MQO. Levaremos em conta duas situações.1) Estimação MQO levando em conta a autocorrelação Suponha que usamos o estimador usual MQO, dado por: 135 Econometria – Semestre 2010.01 135 P r o f e s s o r a M ô n i c a B a r r o s ENCE Mas, agora decidimos empregar sua variância corrigida para a autocorrelação, isto é: Se empregarmos esta variância (12.2.8) na construção de intervalos de confiança, os IC tendem a ser mais largos que os obtidos a partir dos estimadores de mínimos quadrados generalizados, e isto ocorre mesmo se aumentarmos indefinidamente o tamanho da amostra. Ou seja, na situação de autocorrelação dos erros, o estimador MQO não é assintoticamente eficiente. Em resumo: não use estimadores MQO na presença de autocorrelação, pois você estará tirando conclusões erradas, e aumentar o tamanho da amostra não melhorará a situação. 2) Estimação MQO sem levar em conta a autocorrelação A situação torna‐se ainda pior se, além de usarmos o estimador MQO na presença de autocorrelação, deixarmos de corrigir sua variância, isto é, continuamos a usar: Quais os problemas decorrentes desta decisão? A variância dos resíduos, dada por: 22 ˆ ˆ 2 2 −=−= ∑ n RSS n utσ será provavelmente menor que a variância real σ2. Isso nos leva a superestimar R2 e as estatísticas t. Mesmo que σ2 não seja subestimado, Var(β^2) poderá subestimar Var(β^2)AR1 dada pela equação (12.2.8), a variância do estimador MQO sob a premissa de autocorrelação dos resíduos de lag 1. Assim, os testes t e F construídos a partir de Var(β^2) levarão a conclusões erradas sobre a significância dos parâmetros na regressão. 136 Econometria – Semestre 2010.01 136 P r o f e s s o r a M ô n i c a B a r r o s ENCE Sob a premissa do modelo clássico (inexistência de autocorrelação dos resíduos), o estimador da variância 22 ˆ ˆ 2 2 −=−= ∑ n RSS n utσ é não tendencioso para σ2, isto é: ( ) 22ˆ σσ =E . Se a hipótese de inexistência de autocorrelação for violada e supormos que os erros seguem uma estrutura AR(1) então pode‐se mostrar que: Onde r é o coeficiente de correlação amostral entre valores sucessivos da variável explicativa X, dado por: Suponha que ambos ρ e r são positivos, o que é usual no caso de séries econômicas. Então, de (12.4.1) segue que ( ) 22ˆ σσ <E , ou seja, o estimador usual da variância subestimará a variância verdadeira. Além disso, Var(β^2) é um estimador tendencioso de Var(β^2)AR1, o que pode ser observado comparando‐se (12.2.7) e (12.2.8). Se ambos ρ e r são positivos segue que Var(β^2) < Var(β^2)AR1 e então a variância do estimador MQO subestima sua variância sob a premissa de erros AR(1). Então, ao usar o estimador MQO β^2 estamos supondo que ele tem uma precisão maior que a real (isto é, estamos subestimando seu erro padrão). Assim, ao calcular a estatística t para β2 estaremos “inflando” o valor desta estatística, que parecerá maior do que é, na verdade. Isso nos leva a acreditar que o parâmetro β2 é significante, quando, não verdade, não o é. Exemplo – simulação de Monte Carlo O objetivo deste exemplo é mostrar como o uso do estimador MQO na situação de erros AR(1) tende a subestimar σ2 e Var(β^2). Suponha que o modelo real é conhecido e dado por: ttt ttt uu uXY ε+= ++= −17,0 8,01 (12.4.3 e 12.4.5) Onde os εt são um ruído branco com média zero e variância 1. 137 Econometria – Semestre 2010.01 137 P r o f e s s o r a M ô n i c a B a r r o s ENCE Os εt ´s serão gerados aleatoriamente da distribuição N(0,1) (usando o Excel), e usamos como valor inicial ε0 = 0. Note que, a partir da geração dos εt ´s e de um valor inicial para u, por exemplo u0 =5, podemos usar a equação (12.4.5) para gerar uma sequência de ut que apresentam correlação serial de lag 1. Na tabela abaixo estão os εt ´s gerados aleatoriamente da distribuição N(0,1). instante (t) e(t) instante (t) e(t) instante (t) e(t) instante (t) e(t) instante (t) e(t) 0 0 11 -0,690 22 -0,370 33 0,539 44 -0,363 1 -0,300 12 -1,690 23 1,343 34 0,902 45 -0,032 2 -1,278 13 -1,847 24 -0,085 35 1,919 46 0,028 3 0,244 14 -0,978 25 -0,186 36 -0,085 47 -0,323 4 1,276 15 -0,774 26 -0,513 37 -0,524 48 2,195 5 1,198 16 -2,118 27 1,972 38 0,675 49 -1,742 6 1,733 17 -0,568 28 0,866 39 -0,381 50 -0,736 7 -2,184 18 -0,404 29 2,376 40 0,758 8 -0,234 19 0,135 30 -0,655 41 -1,444 9 1,095 20 -0,365 31 1,661 42 -0,847 10 -1,087 21 -0,327 32 -1,612 43 -1,522 A partir desta tabela podemos gerar os ut de acordo com a equação (12.4.5) e a condição inicial u0 = 5. Por exemplo: u1 = 0,7.u0 +ε1 = 0,7(5) + (‐0,300) = 3,200 u2 = 0,7.u1 +ε2 = 0,7(3,200) + (‐1,278) = 0,962 etc... A próxima figura mostra a evolução dos ut´s ao longo do tempo. u(t) = 0,7*u(t-1)+e(t) -6 -4 -2 0 2 4 6 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 138 Econometria – Semestre 2010.01 138 P r o f e s s o r a M ô n i c a B a r r o s ENCE Suponha agora que os valores de X são 1, 2, ..., 50. A partir deles e dos u´s gerados acima podemos, a partir da equação (12.4.3), obter os Yt. Então, Yt = 1 + 0,8.Xt + ut para t = 1,2, ..., 50. Específicamente, Y1 = 1 + 0,8 + u1 = 1,8 + u1 = 1,8 + 3,2 = 5 Y2 = 1 + 0,8(2) + u2 = 2,6 + u2 = 2,6 + 0,962 = 3,562, etc... A próxima tabela fornece os valores de ut e Yt para t = 1,2,...10. instante (t) e(t) u(t) = 0,7*u(t-1)+e(t) Y(t) = 1 + 0,8*t +u(t) 0 0 5 1 -0,300 3,200 5,000 2 -1,278 0,962 3,562 3 0,244 0,918 4,318 4 1,276 1,919 6,119 5 1,198 2,542 7,542 6 1,733 3,512 9,312 7 -2,184 0,275 6,875 8 -0,234 -0,042 7,358 9 1,095 1,066 9,266 10 -1,087 -0,341 8,659 O gráfico de Yt é mostrado a seguir (para t =1, 2,..., 50): Y(t) = 1 + 0,8*t +u(t) 0 5 10 15 20 25 30 35 40 45 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 No próximo passo ajustamos uma regressão aos primeiros 25 pares (Xt,Yt). Veremos que o resultado desta regressão não lembra nem um pouco a equação verdadeira E(Yt | Xt) = 1 + 0,8*Xt. 139 Econometria – Semestre 2010.01 139 P r o f e s s o r a M ô n i c a B a r r o s ENCE O resultado da regressão linear no Excel é: ANOVA gl SQ MQ F F de significação Regressão 1 521,03 521,03 148,91 0,00 Resíduo 23 80,48 3,50 Total 24 601,50 Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção 2,5160 0,7712 3,2623 0,0034 0,9206 4,1115 X 0,6331 0,0519 12,2029 0,0000 0,5258 0,7404 O R2 desta regressão é 86,6%. Note que a variância estimada 2σˆ é 3,50 (igual à RSS/(n‐2) = 80,48/23 =3,50), um valor MUITO diferente do real. Da tabela acima nota‐se que a equação estimada usando os primeiros 25 pares é: tt XY *633,0516,2ˆ += e ambos os coeficientes angular e linear são significantes, de acordo com as estatísticas t correspondentes. A próxima figura mostra os valores de Yt e as retas real (1 + 0,8Xt) e ajustada pelo modelo de regressão nos 25 primeiros pontos (2,516 + 0,633Xt). Valor Real de Y, reta estimada por MQO e reta verdadeira 0 4 8 12 16 20 24 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Y real Reta verdadeira (1 +0,8*X) Y Previsto MQO A figura anterior justifica porque o procedimento de MQO tende a subestimar a variância se existe autocorrelação dosresíduos. Note que os resíduos computados em relação à reta vermelha (reta MQO) tendem a ser menores que os resíduos calculados em relação à reta real (reta azul). Para verificar isso, basta selecionar um ponto Y qualquer e traçar a linha vertical entre Y e a reta 140 Econometria – Semestre 2010.01 140 P r o f e s s o r a M ô n i c a B a r r o s ENCE ajustada MQO (ou entre Y e a linha verdadeira – linha azul). Assim, os resíduos MQO não fornecem uma boa estimativa dos erros ui. Considere um outro experimento de Monte Carlo, usando os mesmos dados que antes, mas suponha que ρ = 0 na equação (12.4.5), e não mais 0,7 como suposto na experiência anterior. Então os ut são agora descorrelatados, u1 = ε1 = ‐0,300, u2 = ε2 = ‐1,278, etc... Daí: Y1 = 1 + 0,8 + u1 = 1,8 + u1 = 1,8 – 0,3 = 1,5 Y2 = 1 + 0,8(2) + u2 = 2,6 + u2 = 2,6 – 1,278 = 1,322 etc... A seguir ajustamos a reta por MQO para os primeiros 25 pares (Xt,Yt). Note que agora a hipótese de erros descorrelatados é válida e assim a reta ajustada deve se aproximar da reta verdadeira 1 + 0,8Xt. Os 25 valores de X e Y são mostrados na próxima tabela: X Y X Y 1 1,50 14 11,22 2 1,32 15 12,23 3 3,64 16 11,68 4 5,48 17 14,03 5 6,20 18 15,00 6 7,53 19 16,33 7 4,42 20 16,63 8 7,17 21 17,47 9 9,30 22 18,23 10 7,91 23 20,74 11 9,11 24 20,11 12 8,91 25 20,81 13 9,55 A equação estimada usando os primeiros 25 pares é: tt XY *790,0785,0ˆ += Note que o coeficiente linear da regressão não é significante (a 5%). O R2 desta regressão é 96,7% (no caso anterior era 86,6%). A variância estimada 2σˆ é 1,20 (vide tabela ANOVA), bem mais próxima do valor verdadeiro (1). 141 Econometria – Semestre 2010.01 141 P r o f e s s o r a M ô n i c a B a r r o s ENCE Modelo Simulado SEM Autocorrelação dos Resíduos - valores reais, reta teórica e reta ajustada por MQO 0 5 10 15 20 25 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Y Reta verdadeira (1 +0,8*X) Y Previsto MQO RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,9834 R-Quadrado 0,9672 R-quadrado ajustad 0,9657 Erro padrão 1,0951 Observações 25 ANOVA gl SQ MQ F F de significação Regressão 1 812,31 812,31 677,31 0,00 Resíduo 23 27,58 1,20 Total 24 839,89 Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção 0,785 0,452 1,739 0,095 -0,149 1,719 X 0,790 0,030 26,025 0,000 0,728 0,853 O gráfico a seguir apresenta os pares (X, Y) e as retas real e ajustada por MQO. 12.5. EXEMPLO ‐ RELAÇÃO ENTRE SALÁRIOS E PRODUTIVIDADE NOS EUA Os dados da tabela 12.4 apresentam índices de remuneração real por hora (Y) e produção por hora (X) em empresas dos EUA no período entre 1959 e 1998. A figura a seguir mostra estes dados. 142 Econometria – Semestre 2010.01 142 P r o f e s s o r a M ô n i c a B a r r o s ENCE Gujarati ajusta dois modelos, um linear e outro log‐linear, com os resultados mostrados a seguir. 1) Modelo linear Ode d é a estatística de Durbin‐Watson, que será discutida a seguir e se(.) indica o erro padrão do estimador. 2) Modelo log‐linear As questões que se colocam na prática são: Os modelos exibem resultados parecidos. Os coeficientes estimados, avaliados pelas estatísticas t, parecem altamente significantes. Mas, até que ponto os resultados das regressões (12.5.1) e (12.5.2) são confiáveis? A autocorrelação deve ser um problema aqui, pois ambas as séries evoluem no tempo, e nesta situação não podemos confiar nos erros padrão (e assim as estatísticas t produzidas também não são confiáveis). 143 Econometria – Semestre 2010.01 143 P r o f e s s o r a M ô n i c a B a r r o s ENCE Então a questão principal é: COMO DETECTAR A AUTOCORRELAÇÃO? 12.6. DETECTANDO A AUTOCORRELAÇÃO Lembre‐se que a ausência de autocorrelação é uma premissa feita sobre os erros do modelo, que não são observáveis – o melhor que temos para “inferir” sobre os erros são os resíduos do modelo, que podem ser calculados. Então o melhor que podemos fazer é usar os resíduos para verificar se a premissa de correlação zero dos erros está sendo violada (usamos este mesmo raciocínio para inferir sobre a heterocedasticidade, lembra‐se?). 1) Método Gráfico O gráfico dos resíduos (ou do quadrado dos resíduos) pode revelar a existência de autocorrelação. SE NÃO EXISTE AUTOCORRELAÇÃO, o gráfico dos resíduos ao longo do tempo deve ser puramente aleatório, com o seguinte aspecto: Volte ao exemplo da seção 12.5. e considere o modelo linear (12.5.1). O gráfico dos resíduos (e dos resíduos padronizados, i.e., divididos pelo erro padrão da regressão σˆ ) é mostrado a seguir: 144 Econometria – Semestre 2010.01 144 P r o f e s s o r a M ô n i c a B a r r o s ENCE Note que ambos os resíduos (“puro” e padronizado) exibem um padrão parecido com o da figura abaixo: Ou seja, os resíduos parecem seguir o padrão: uma sequência de valores negativos, uma sequência de valores positivos e uma sequência de valores negativos. Este padrão sugere que os resíduos não são puramente aleatórios, ou seja, há uma indicação de correlação entre os resíduos de diferentes instantes. Uma forma de tentar verificar isso é fazer o gráfico do resíduo no instante t contra o resíduo no instante anterior. Se este gráfico apresenta um padrão claramente não aleatório, há evidência de que o resíduo no instante t dependa do resíduo no instante anterior, ou seja, há evidência de autocorrelação de lag 1. O gráfico a seguir mostra os resíduos nos instantes t e t‐1 da regressão linear (12.5.1). O gráfico mostra um padrão linear bastante claro entre u^(t) e u^(t‐1). Isso indica uma forte correlação positiva entre os resíduos, e portanto há evidência de autocorrelação nos erros (não observáveis). 145 Econometria – Semestre 2010.01 145 P r o f e s s o r a M ô n i c a B a r r o s ENCE 2) O teste das carreiras (“runs test”) Nas páginas anteriores mostramos algumas maneiras de tentar detectar a autocorrelação nos erros a partir de gráficos dos resíduos. O problema é que estas análises, embora muito importantes, são bastante empíricas e subjetivas, não há uma “receita” infalível para dizer inequivocamente que a autocorrelação existe ou não. O teste das carreiras (também conhecido com teste de Geary ou teste de Wald‐Wolfowitz) é um teste de aleatoriedade, e será aplicado aos resíduos do modelo. Ele se baseia no sinal dos resíduos da regressão. Lembre‐se que os resíduos têm média zero, e assim o que o teste verifica é se os padrões de resíduos acima e abaixo da média (zero) são aleatórios. O teste pode ser estendido a séries com médias diferentes de zero, basta aplicar o teste à série com a média subtraída. No caso da regressão (12.5.1) existem 40 resíduos, que apresentam o seguinte padrão: 9 resíduos negativos 21 resíduos positivos 10 resíduos negativos Definição (“carreira”) Uma carreira (“run”) é uma sequência ininterrupta de resultados com o mesmo sinal. A extensão da carreira é o número de elementos que a compõem. No caso dos resíduos da regressão (12.5.1) existem 3 carreiras, a primeira de extensão (comprimento) 9, a segunda de comprimento 21 e a terceira de comprimento 10. Será que estas 3 carreiras se comportam mais ou menos da mesma forma que uma sequência de 3 carreiras de 40 observações aleatórias? Sejam: N = número total de observações = N1 + N2 N1 = número de sinais positivos N2 = númerode sinais negativos R = número de carreiras 146 Econometria – Semestre 2010.01 146 P r o f e s s o r a M ô n i c a B a r r o s ENCE Considere a hipótese nula de que os resultados sucessivos são independentes. Suponha que AMBOS N1 e N2 > 10. Nestas condições, o número de carreiras ® é assintoticamente Normal com média e variância: Sob a hipótese nula de aleatoriedade e usando um intervalo de confiança 95% então: { } 95,0.96,1)(.96,1)(Pr =+≤≤− RR RERRE σσ (12.6.3) Ou seja, R está no intervalo descrito acima com 95% de probabilidade. Logo, REJEITA‐SE A HIPÓTESE DE ALEATORIEDADE DAS CARREIRAS (COM NÍVEL 5%) SE O INTERVALO DESCRITO EM (12.6.3) NÃO CONTÉM R. No s resíduos da regressão (12.5.1), N1 = 21, N2 = 19, N = 21 19 = 40 e R = 3. Então: 95,201 40 )19)(21(2)( =+== REμ (ATENÇÃO – CORRIGIR O VALOR NO GUJARATI) ( )( )( ) ( ) ( ) ( ) 2 2 2 3,11349,6936 62400 604884 3940 40)19)(21(219212 ===−=rσ Logo, o IC 95% para R é: (20,95 – 1,96*3,11, 20,95 + 1,96*3,11) = (14,85, 27,05) que obviamente não inclui R = 3. Logo, rejeitamos a hipótese de que os resíduos da regressão (12.5.1) são aleatórios, ou sejam, eles apresentam algum tipo de comportamento sistemático. Nota O teste apresentado é válido quando ambos N1 e N2 > 10. Swed e Eisenhart elaboraram tabelas para valores menores que estes. As tabelas estão no apêndice D.6 de Gujarati e são reproduzidas a seguir. As tabelas D.6A e D.6B fornecem o número crítico n de carreiras. Se n é menor que o valor 147 Econometria – Semestre 2010.01 147 P r o f e s s o r a M ô n i c a B a r r o s ENCE em D.6A ou maior que o valor em D.6B, rejeita‐se a hipótese de aleatoriedade ao nível 5%. Por exemplo, suponha que existem N = 30 observações, das quais N1=20 são positivas e N2=10 são negativas. Então, se olharmos para as tabelas anteriores, rejeita‐se a hipótese de aleatoriedade se R <= 9 (tabela D.6A) ou R => 20 (tabela D.6B).
Compartilhar