Baixe o app para aproveitar ainda mais
Prévia do material em texto
Multicolinearidade 1 • a multicolinearidade se refere à quebra da suposição [S4], que afirma que as colunas de X são linearmente independentes. 2 • [Consequência 1]: em caso de multicolinearidade exata, não é possível calcular (X’X)-1 de forma única já que a matriz passa a ser singular. • Nesse caso, não é possível estimar os parâmetros separadamente. Nessa situação, é impossível rodar o modelo de regressão em qualquer software. • [Consequência 2]: quando a multicolinearidade é quase-exata é possível estimar os efeitos individuais, mas nossas estimativas passam a ser imprecisas. • [Consequência 3]: ainda na multicolinearidade quase-exata, muitas vezes não aceitamos as significâncias dos regressores individualmente via testes t, mas o teste F indica significância e o R2 é alto. • [Consequência 4]: Finalmente, nesse tipo de multicolinearidade, as estimativas são muito sensíveis à remoção ou adição de poucas observações. 3 Como detectar? • [Forma 1]: quando os coeficientes de regressão entre pares de regressores > 0,9; • [Forma 2]: considere regressões artificiais. Nesse caso, nós regredimos cada regressor nos demais. Nesse caso: • se R2 for alto, temos indícios de problemas; 4 Existe uma solução? • (Possibilidade 1): consiga variáveis melhores. 5 • O termo multicolinearidade foi cunhado por Ragnar Frish. Significava, originalmente a existência de uma “perfeita” (ou exata) relação linear entre algumas variáveis explicativas de um modelo de regressão. 6 • Se a multicolinearidade é perfeita, os coeficientes de regressão das variáveis X são indeterminados e seus erros-padrão são infinitos. Se a multicolinearidade é menos perfeita, os coeficientes da regressão, embora determinados, possuem erros padrão grandes (em relação aos próprios coeficientes), o que significa que os coeficientes não podem ser estimados com grande precisão ou exatidão. 7 Fontes da multicolinearidade • Método empregado para a coleta dos dados; • Restrições sobre o modelo ou a população que está sendo amostrada; • Especificação do modelo; • Modelo sobredeterminado 8 • (Economista, INEA, 2008, Cesgranrio) Na estimativa das regressões lineares múltiplas, o problema de multicolinearidade tende a ocorrer quando • a) duas variáveis independentes se correlacionam fortemente. • b) a variável dependente for correlacionada com alguma variável independente. • c) o coeficiente de determinação for muito baixo. • d) os dados da regressão forem transversais. • e) houver variáveis independentes binárias. 9 Exercícios 10 • (Caixa RS – Agência de Fomento, Técnico em esenvolvimento – Economista, AOCP, 2010) Relacione as colunas e, em seguida, assinale a alternativa que apresenta a sequência correta. • 1. Multicolinearidade. • 2. Heterocedasticidade. • 3. Autocorrelação. • A. Significa a existência de uma perfeita (ou exata) relação linear entre algumas ou todas variáveis explicativas de um modelo de regressão. • B. Forte dispersão dos dados em torno de uma reta. Uma dispersão dos dados perante um modelo econométrico regredido. • C. É uma medida que informa o quanto o valor de uma realização de uma variável aleatória é capaz de influenciar seus vizinhos. 11 • a) 1B - 2A - 3C. • b) 1A - 2B - 3C. • c) 1A - 2C - 3B. • d) 1C - 2B - 3A. • e) 1C - 2A - 3B. 12 • (Caixa RS – Agência de Fomento, Técnico em desenvolvimento – Economista, AOCP, 2010) Em relação aos problemas em análise de regressão, analise as assertivas e assinale a alternativa que aponta a(s) correta( s ). • I. A autocorrelação pode ocorrer por diversas razões, tais como inércia ou rigidez das séries temporais econômicas, viés de especificação resultante da exclusão de variáveis importantes do modelo ou do uso da forma funcional incorreta, dentre outros. • II. Surge o problema de Heterocedasticidade quando é violada a hipótese do modelo clássico de regressão linear de que são aleatórios os erros ou perturbações que entram no modelo. • III. Embora os estimadores de MQO permaneçam não-viesados e consistentes na presença de autocorrelação, eles deixam de ser eficientes. Como resultado, os testes de significância t e F usuais não podem ser legitimamente aplicados. 13 • IV. No modelo ARCH a variância condicional do termo de erro não se correlaciona serialmente com os valores passados do termo de erro elevados ao quadrado. Este modelo provou ser muito útil na modelagem e previsão de muitas variáveis financeiras tais como taxas de câmbio, taxas de inflação, etc. • a) Apenas I. • b) Apenas I e III. • c) Apenas II e III. • d) Apenas I, III e IV. • e) I, II, III e IV. 14 • (BANCO CENTRAL DO BRASIL, Analista Área 2, Cesgranrio, 2010) No modelo de análise de regressão y = X + , as variáveis X são chamadas independentes; as colunas de X são ditas linearmente independentes e os elementos de , por hipótese, são distribuídos independentemente. • Com relação aos significados de independência usados acima, pode-se afirmar que • I - os ’s são independentemente distribuídos para que se possam estimar os parâmetros pelo método de mínimos quadrados; • II - as variáveis X são ditas independentes porque não dependem de y; • III - as colunas de X são linearmente independentes para que essas variáveis não sejam correlacionadas. 15 • É correto o que se afirma em • (A) I, apenas. • (B) I e II, apenas. • (C) I e III, apenas. • (D) II e III, apenas. • (E) I, II e III. 16 • (ANPEC, 2012) Suponha que um pesquisador esteja interessado em investigar os determinantes da delinquência juvenil e tenha acesso aos seguintes dados provenientes de 100 cidades de um dado país: A, o número de internações por 1000 adolescentes; P, o número de residências por 1000 domicílios na cidade com renda abaixo da linha da pobreza; S, o número de residências por 1000 domicílios na cidade com apenas um dos pais. O pesquisador estima a seguinte regressão: 17 • ⓄA alta correlação populacional entre P e S dará origem ao problema conhecido como multicolineariedade. • ①Multicolineariedade não torna viesados os estimadores de mínimos quadrados ordinários dos coeficientes, mas faz com que eles sejam inconsistentes. • ②As estimativas dos desvios padrões serão viesadas e provavelmente subestimarão os valores verdadeiros. • ④Se ao invés de uma alta correlação populacional entre P e S, houvesse uma alta correlação populacional entre A e P ou entre A e S, o problema de multicolineariedade seria ainda pior. 18 • (ANPEC,2005) A respeito do modelo de regressão múltipla: • ①Se os erros são autocorrelacionados, ainda assim os estimadores de Mínimos Quadrados Ordinários de e são lineares e não tendenciosos. 19 • (ANPEC, 2008) • ② Quando os erros da regressão são autocorrelacionados, os estimadores de mínimos quadrados são eficientes. • ③ A omissão de uma variável relevante em um modelo de regressão linear pode gerar autocorrelação nos erros. 20 21 Séries Temporais 22 • Qual o objetivo de estudar séries temporais? 23 • Qual o objetivo de estudar séries temporais? • Resposta: O objetivo é prever o comportamento futuro de alguma variável que é observável ao longo do tempo. 24 Formas de previsão: • [Forma 1]: Algoritmos ad hoc • [Forma 2]: Modelos estocásticos 25 • Mas, por que prever o futuro? • [Resposta 1]: Curiosidade sobre o futuro; • [Resposta 2]: Para ter informações importantes para a tomada de decisão. 26 • Definição: uma série temporal é um conjunto de observações coordenadas no tempo 27 • Assim, podemos dizer que uma série temporal pode ser definida de seguinte forma: • Y(t,w), em que: • t é o tempo • w é o elemento de aleatoriedade 28 29 30 • Aplicação de séries temporais: • Série do PIB – Séries temporais– Cross section 31 Tipos de séries temporais • Bem comportadas • Mal comportadas 32 • A questão da estacionariedade... 33 Séries Temporais 34 35 36 37 Processos de destaque! 38 39 40 Séries Temporais 41 42 • E se a série não for estacionária? • Processos estocásticos homogêneos • Série não intrinsicamente estacionária 43 Caracterização das séries de tempo • Integradas de Ordem Zero; • O problema das séries não estacionárias: R2, seu mentiroso! 44 Testes de estacionariedade 45 • Séries estacionárias • Séries não estacionárias 46 • Correlograma – Já na análise do correlograma, para uma série estacionária a função de autocorrelação tende para zero abruptamente enquanto que para uma série não-estacionária a função declina de forma suave. 47 • Quando desenvolvemos um modelo de série temporal, nossa intenção é saber se o processo estocástico subjacente que gerou a série não se modifica com relação ao tempo. Se as características do processo estocástico variam com o tempo, ou seja, se o procedimento é não estacionário, muitas vezes será difícil representar a série temporal em intervalos de tempo passados e futuros através de um modelo algébrico simples. • De modo inverso se o processo estocástico é fixo no tempo, sendo estacionário é possível a modelação do processo utilizando uma equação com coeficientes fixos os quais poderão ser estimados a partir de dados passados. (Pindyck e Rubinfeld, 2004). 48 Como testar a estacionariedade? • Teste de Dickey – Fuller – baixa potência, embora seja um dos mais utilizados. – A explicação para isso é que o teste tende a aceitar a hipótese nula da raiz unitária com mais frequência do que seria justificável. Dentre os problemas apontados, destacamos a dificuldade deste teste em captar uma ruptura estrutural em uma série, causada por choques estruturais. • Teste de Phillips-Perron 49 • Teste Dickey Fuller Aumentado (ADF) – O ADF fornece um teste formal para a não- estacionariedade em uma série de dados. A ideia básica que está por trás da equação do ADF é testar a presença de raiz unitária no coeficiente da variável defasada (ou seja, se o meu modelo for dado por , o modelo medirá o valor de ) 50 Exemplo... • Raiz Unitária na taxa de câmbio • A distribuição do Teste ADF é a τ (tau), elaborada pelos próprios autores do teste. 51 52 53 Regressões Espúrias 54 Como saber se a regressão é espúria? • R2 e Durbin Watson! 55 Cointegração • A cointegração significa que, mesmo sendo individualmente não-estacionárias, uma combinação linear entre duas ou mais séries temporais pode ser estacionária. • Y é I(1) e W é I(1), mas α.Y + β.W é I(0) 56 Cointegração • A cointegração significa que, mesmo sendo individualmente não-estacionárias, uma combinação linear entre duas ou mais séries temporais pode ser estacionária. • Y é I(1) e W é I(1), mas α.Y + β.W é I(0) 57 Séries Temporais 58 Abordagem da previsão econômica • 1. Como modelamos uma série temporal estacionária? • 2. Como usamos o modelo ajustado para fins de previsão? 59 Abordagens da previsão econômica • 1. Modelos de regressão de equação única; – Função demanda por automóveis • 2. Modelos de regressão de equação simultâneas; – Perde força • 3. Modelos auto-regressivos integrados de média móvel (ARIMA); – Modelos ateóricos – Nos modelos de série temporal do tipo BJ, Yt pode ser explicado por valores passados (ou defasados) do próprio Y e dos termos de erro estocásticos. • 4. Modelos de auto-regressão vetorial (VAR) – Inexistem variáveis exógenas no modelo 60 Modelagem AR, MA e ARIMA • Um processo auto-regressivo (AR) 61 Modelagem AR, MA e ARIMA • Um processo de Média Móvel (MA) – Combinação linear dos termos de erro ruído branco. 62 Séries Temporais 63 Modelagem AR, MA e ARIMA • Um processo auto-regressivo e de média móvel (ARMA) 64 Modelagem AR, MA e ARIMA • Um processo auto-regressivo integrado e de média móvel (ARIMA) 65 Séries Temporais 66 A metodologia de Box-Jenkins • Etapa 1: Identificação – Descobrir os valores apropriados de p, d e q. – Ajuda do correlograma • Etapa 2: Estimativa – Estimação dos parâmetros dos termos auto-regressivos e de média móvel incluídos no modelo. – Esse cálculo pode ser realizado com mínimos quadrados simples. 67 • Etapa 3: Checagem de diagnóstico – Depois de escolher um modelo ARIMA em particular, e estimar os seus parâmetros, verifica-se se o modelo escolhido se ajusta aos dados. – Teste do modelo: Verificar se os resíduos estimados desse modelo são ruídos brancos. • Etapa 4: Previsão 68 Séries Temporais 69 Identificação • Função de Autocorrelação (FAC) • Função de Autocorrelação parcial (FACP) – Mede a correlação entre observações que sejam k períodos afastados, depois de controlar quanto às correlações nas defasagens intermediárias. • Correlogramas – Representações gráficas das FACs e FACPs 70 • Estimativa do Modelo ARIMA • Checagem do diagnóstico • Previsão 71 Teste para quebra estrutural 72 Séries Temporais 73 74 75 76 • No Gráfico I, o coeficiente de correlação linear de Pearson é aproximadamente igual a 1. • No gráfico II, existe forte correlação entre as variáveis representadas. • O gráfico III indica que a componente tendência não foi eliminada no modelo de série temporal ajustado. • Séries com média e variância constantes ao longo do tempo são denominadas estacionárias. 77 78 Bacen, Área 2, 2010, Cesgranrio • Sobre séries temporais, analise as proposições a seguir. • I - Se um processo MA(1) for estacionário, ele pode ser representado como um processo autorregressivo (AR) de ordem infinita. • II - Se um processo AR(1) for estacionário, ele pode ser representado por um processo de médias móveis (MA) de ordem infinita. • III - Uma série de tempo é um conjunto ordenado de variáveis aleatórias, isto é, um processo estocástico, portanto uma série de tempo y(t) pode ser representada pela função de densidade conjunta dos yt (t = 1, 2, ... n); assim, trabalhar com uma série de tempo é inferir sobre o processo estocástico com uma única realização desse processo. • É(São) correta(s) a(s) proposição(ões) • (A) I, apenas. (B) I e II, apenas. • (C) I e III, apenas. (D) II e III, apenas. • (E) I, II e III. 79 Séries Temporais 80 Revisão 1 • O que eu preciso saber sobre séries temporais para a Prova do Banco Central? 81 VAR 82 Regressões Espúrias 83 Como saber se a regressão é espúria? • R2 e Durbin Watson! 84 Regressões Espúrias • Séries estacionárias • Séries não estacionárias 85 Cointegração • A cointegração significa que, mesmo sendo individualmente não-estacionárias, uma combinação linear entre duas ou mais séries temporais pode ser estacionária. • Y é I(1) e W é I(1), mas α.Y + β.W é I(0) • β é chamado de parâmetro de cointegração 86 87 88 89 O vetor autorregressivo • O VAR consiste em um sistema de equações, em que cada uma das variáveis que compõem o sistema é função dos valores das demais variáveis no presente, dos seus valores e dos valores das demais variáveis defasadas no tempo, mais o termo de erro. 90 • A partir de algumas operações matemáticas, o modelo VAR pode ser transformado de modo que, nas equações, os valores do presente deixam de constar como variáveis explicativas. Esta é a forma conhecida como VAR reduzido Segundo Enders (2004), essa transformação é necessária, pois não é possível estimar o modelo em sua forma primitiva. A razão é que os valores presentes das variáveis do sistema são correlacionados com os termos de erro das equações. Assim, para encontrar o VAR primitivo, é preciso estimar a forma reduzida. 91 VAR reduzido de primeira ordem • Como sistema de equações: 92 tt t t t t t t t Aymy y a a a a m m y y y ε ε ε ++= + + = = − − − 1 2 1 1,2 1,1 22 12 21 11 2 1 2 1 tttt yayamy 11,2121,11111 ε+++= −− tttt yayamy 21,2221,12122 ε+++= −− VAR 93 • O teste de Causalidade desenvolvido por Granger é um teste F, no qual a hipótese nula afirma que não há relação de causalidade entre as variáveis testadas. Se for possível afirmar estatisticamente que uma variável X Granger causa uma variável Y, então valores defasados da variável X influenciam o comportamento da variável Y 94 • Somente após comprovação da existência dessa relação entre as variáveis, procede-se a estimação do modelo. Em seguida é necessário determinar o número de defasagens do VAR. 95 • A determinação do número de defasagens é realizada por meio de um teste assintótico, que consiste na comparação de modelos com ordens diferentes. A hipótese nula desse teste afirma que os modelos não possuem diferença, aceitando essa hipótese então o modelo escolhido é aquele que possui menor número de defasagens. Caso contrário, rejeitando, deve-se optar pelo modelo com maior número de defasagens. 96 • Outro teste importante para a identificação dos modelos é conhecido como Exogeneidade de Bloco. Segundo Enders (2004), esse teste é uma generalização do teste à causalidade de Granger, sendo útil para decidir se uma variável adicional deve ser incorporada ao modelo. 97 • Conhecidas as variáveis e a ordem do modelo, os parâmetros são estimados. Calculados os parâmetros do modelo, são estimadas a função Impulso-Resposta e a Decomposição da Variância 98 • Utilizando a função de impulso-resposta, é possível perceber como uma variação ocorrida em uma das variáveis do sistema repercute nas demais em um determinado horizonte de tempo. • Já a decomposição da variância, revela a proporção da variância do erro de previsão para uma das variáveis que se deve a ela mesma, e às demais 99 No caso da presença de cointegração: • O modelo VAR não é o método mais indicado para a análise das séries, pois seus resultados seriam estatisticamente inconsistentes. Nesses casos, deve-se usar o método dos Vetores com Correção de Erro (VEC) 100 VEC • Um modelo VEC é semelhante a um VAR, porém em todas as equações do primeiro está contido um vetor de correção de erro, que, como sugere o nome, tem como objetivo corrigir as relações de cointegração 101 1 1 k t i t i t t i x x a xβ β ε− − = ′∆ = ∆ + +∑ Dados em Painel 102 • Como utilizar os dados em painel? • Rendait = a + b*educaçãoit + eit • Pooled regression • Solução com o uso de dummies e a mudança nos interceptos. 103 • Regressão agrupada: o problema do viés da variável omitida. – estimador viesado e inconsistente 104 Econometria Número-Índice Índices • Números índices são números relativos que refletem a evolução, ao longo do tempo, do valor de uma variável de interesse com referência ao ocorrido em um determinado período, denominado período base. • Os índices mais usados destinam-se a medir variações ocorridas ao longo do tempo das variáveis preço, quantidade e valor. • Quando o índice indicar variações relativas em quantidades, preços ou valores de um único produto, é chamado de número índice simples. Se o índice é calculado para um grupo de produtos (pense na cesta básica, por exemplo), então é denominado número índice composto. • Lima, 2012 Índice de Sauerbeck • O índice de preço de Sauerbeck (S) é a média aritmética simples entre os relativos de cada um dos n produtos do grupo: Principais índices • Laspeyres • Paasche Índice de Laspeyres • Índice de Preços • Índice de Quantidades Índices de Paasche • Índice de Preços • Índice de Quantidades Exercício • (Bacen, Área 2, 2010, Cesgranrio) Analise as afirmações abaixo sobre números índices. • I - A importância dos números índices reside na possibilidade que esse instrumento oferece de se agregarem quantidades heterogêneas, bem como de separar variações de preços das de quantidades implícitas nas variações de valor. • II - Todo número índice é arbitrário, uma vez que o sistema de ponderação usado em sua construção, ainda que adequado ao objetivo do índice, decorre da escolha de seu criador. • III - Números índices servem para transportar valores ao longo do tempo. • É correto o que se afirma em • (A) I, apenas. (B) I e II, apenas. • (C) I e III, apenas. (D) II e III, apenas. • (E) I, II e III. • (BACEN/2001/ESAF). A tabela abaixo dá os valores dos preços Pti e quantidades Qti de quatro itens de consumo A, B, C e D nos tempos t1 < t2. Os preços estão em reais e as quantidades em unidades apropriadas. • Assinale a opção que dá o valor mais próximo do índice de preços de Paasche no tempo t2 com base em t1. • A) 136 • B) 137 • C) 138 • D) 139 • E) 136,5 119 120 • (AFTE-RS/2009/Fundatec). O índice de preços de Laspeyres, para um conjunto de produtos, é 120 e o de Paasche é 110. A afirmativa correta é: • A) O coeficiente de correlação entre preço e quantidade, para tais produtos, é negativo. • B) O aumento médio dos preços dos produtos foi de 15%. • C) A redução média nos preços dos produtos foi de 20%. • D) O coeficiente de correlação entre preço e quantidade, para tais produtos, é nulo. • E) O aumento médio dos preços dos produtos foi de 115%. 121 Índices de Fischer • Média Geométrica dos Índices de Laspeyres e Paasche 122 Índice de Preços de Marshall- Edgeworth 123 Deflacionamento de Séries 124 Exercícios 125 126 127 128 Tópicos avançados 129 Dados em Painel • A estrutura de uma regressão em Painel • • Estimativas constantes ao longo do tempo • O ingresso das variáveis “Dummy” • 130 • O problema da variável omitida – Estimador viesado e inconsistente • Dados em Painel: variáveis que distinguem cada unidade seccional, mas que são constantes ao longo do tempo. • Modelo em dois períodos: • Separando fatores constantes dos que variam ao longo do tempo... 131 • Efeito fixo / Efeito não observado / Heterogeneidade não observada • Erro idiossincrático. • Erro de composição – Efeito fixo correlacionado com as variáveis explicativas. 132 • Definindo equações para dois períodos: • Estimador de primeiras diferenças 133 134 135 • Estimador de efeitos fixos • Dados temporais reduzidos 136 Exercícios 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163
Compartilhar