Baixe o app para aproveitar ainda mais
Prévia do material em texto
Tópico 14 – Modelos de Cortes Transversais ao Longo do Tempo Método Simples de Dados em Painel Bibliografia: WOOLDRIDGE, J.M. Introdução à Econometria: uma abordagem moderna. 4ª ed. São Paulo: Pioneira Thomson Learning, 22015. (capítulo 13). Teste Chow Teste Chow (simplesmente um teste F): pode ser utilizado para determinar se uma função de regressão múltipla difere entre dois grupos. Podemos aplicar esse teste em dois períodos de tempo diferentes. Uma forma do teste é obter a soma dos quadrados dos resíduos (SQR) da estimação agrupada como a SQR restrita. A SQR sem restrições é a soma dos SQRs dos dois períodos de tempo estimadas separadamente (ver capítulo 7). Outra forma de calcular o teste para dois períodos de tempo. Também há uma versão da estatística robusta em relação à heterocedasticidade. Teste Chow Teste de Chow pode ser computada por mais de dois períodos de tempo. É geralmente mais interessante para permitir que os interceptos mudem ao longo do tempo e, em seguida, testar se o coeficientes de inclinação mudaram ao longo do tempo. Podemos testar a constância de inclinação coeficientes geralmente a interação de todas as dummies do período de tempo com uma, várias, ou todas as variáveis explicativas e verificar a significância conjunta dos termos de interação. Testar variações nos parâmetros de um modelo. Análise de decisão de políticas com agrupamentos de cortes transversais Cortes transversais agrupados podem ser muitos úteis para a avaliação do impacto de determinado evento ou decisão política. O próximo exemplo mostra como dois conjuntos de dados de cortes transversais, coletados antes e depois da ocorrência deum evento, podem ser usados para determinar seu efeito sobre resultados econômicos. Exemplo 13.3: Efeito da localização de um incinerador de lixo sobre os preços de imóveis Experimento Natural Experimento natural (ou um quase-experimento): ocorre quando algum evento exógeno - uma mudança na política do governo - altera o ambiente em que indivíduos, famílias ou empresas operam. Um experimento natural sempre tem: ➢Grupo de controle: não é afetado pela mudança de política, e; ➢Grupo de tratamento: é afetado pela mudança. Para controlar diferenças sistemáticas entre os grupos de controle e de tratamento, necessitamos de dois anos de dados: ➢Um período anterior a mudança na política; ➢Um período após a mudança na política. Experimento Natural Assim, nossa amostra será convenientemente dividida em quatro grupos: ➢Grupo de controle antes da mudança; ➢Grupo de controle após a mudança; ➢Grupo de tratamento antes da mudança; ➢Grupo de tratamento após a mudança. Experimento Natural Definindo: A= grupo de controle; B= grupo de tratamento; 𝑑𝐵 → dummy de tratamento (igual à unidade para os do grupo 𝐵 de tratamento e zero, caso contrário);e 𝑑2 → variável dummy para o segundo período de tempo (após a mudança política). Logo, a equação de interesse é: 𝑦 = 𝛽0 + 𝛿0𝑑2 + 𝛽1 𝑑𝐵 + 𝛿1𝑑2 ∗ 𝑑𝐵 + 𝑜𝑢𝑡𝑟𝑜𝑠 𝑓𝑎𝑡𝑜𝑟𝑒𝑠 Onde: 𝑦 é a variável de interesse resultante. 𝛿1 mede o efeito da decisão de política do governo (diff-in-diff) Experimento Natural Sem outros fatores na regressão, መ𝛿1 será o estimador de diferenças em diferenças: መ𝛿1 = ത𝑦2,𝐵 − ത𝑦2,𝐴 − (ത𝑦1,𝐵 − ത𝑦1,𝐴) Em que a barra significa a média, o primeiro subscrito representa o ano e o segundo subscrito representa o grupo. Antes Depois Diferença Controle 𝛽0 𝛽0 + 𝛿0 𝛿0 Tratamento 𝛽0 + 𝛽1 𝛽0 + 𝛿0 + 𝛽1 + 𝛿1 𝛿0 + 𝛿1 Diferença 𝛽1 𝛽1 + 𝛿1 𝛿1 Exemplo Efeito da localização de um incinerador de lixo sobre os preços de imóveis. Construção do novo incinerador: 1981-1985. Anos: 1978 e 1981 (preço dos imóveis). Hipótese: os preços dos imóveis localizados próximos do incinerador cairiam em relação aos preços dos imóveis mais distantes. Variáveis: rprice: preço dos imóveis; nerinc: dummy localização próximo ao incinerador (1= sim; 0 = caso contrário). Exemplo O preço médio de venda dos imóveis para o primeiro grupo era de 30.688,77 dólares a menos que para o segundo grupo. _cons 101307.5 3093.027 32.75 0.000 95192.43 107422.6 nearinc -30688.27 5827.709 -5.27 0.000 -42209.97 -19166.58 rprice Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 1.6367e+11 141 1.1608e+09 Root MSE = 31238 Adj R-squared = 0.1594 Residual 1.3661e+11 140 975815069 R-squared = 0.1653 Model 2.7059e+10 1 2.7059e+10 Prob > F = 0.0000 F( 1, 140) = 27.73 Source SS df MS Number of obs = 142 . reg rprice nearinc if year==1981 Exemplo O valor médio de um imóvel próximo do local era 18.824,37 dólares menor que o do outro distante do local (82.517,23 dólares). _cons 82517.23 2653.79 31.09 0.000 77280.09 87754.37 nearinc -18824.37 4744.594 -3.97 0.000 -28187.62 -9461.117 rprice Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 1.6696e+11 178 937979126 Root MSE = 29432 Adj R-squared = 0.0765 Residual 1.5332e+11 177 866239953 R-squared = 0.0817 Model 1.3636e+10 1 1.3636e+10 Prob > F = 0.0001 F( 1, 177) = 15.74 Source SS df MS Number of obs = 179 . reg rprice nearinc if year==1978 Exemplo Para verificar se a construção de um novo incinerador reduz os valores dos imóveis podemos verificar como o coeficiente de 𝑝𝑟𝑜𝑥𝑖𝑛𝑐𝑖𝑛 mudou entre 1978 a 1981. A diferença na média dos valores dos imóveis era maior em 1981 do que em 1978 (30.688,27 dólares contra 18.824,37 dólares). A diferença nos dois coeficientes de 𝑝𝑟𝑜𝑥𝑖𝑛𝑐𝑖𝑛 é: መ𝛿1 = −30.688,27 − (−18.824,37) = −11.863.903 Essa é a estimativa do efeito do incinerador sobre os valores dos imóveis próximos de sua localização. Em economia empírica, መ𝛿1 tornou-se conhecido como estimador de diferença em diferenças. መ𝛿1 = 𝑟𝑝𝑟𝑒ç𝑜81,𝑝𝑟 − 𝑟𝑝𝑟𝑒ç𝑜81,𝑎𝑓 − 𝑟𝑝𝑟𝑒ç𝑜78,𝑝𝑟 − 𝑟𝑝𝑟𝑒ç𝑜78,𝑎𝑓 Exemplo Em economia empírica, መ𝛿1 tornou-se conhecido como estimador de diferença em diferenças. መ𝛿1 = 𝑟𝑝𝑟𝑒ç𝑜81,𝑝𝑟 − 𝑟𝑝𝑟𝑒ç𝑜81,𝑎𝑓 − 𝑟𝑝𝑟𝑒ç𝑜78,𝑝𝑟 − 𝑟𝑝𝑟𝑒ç𝑜78,𝑎𝑓 "𝑝𝑟" significa "𝑝𝑟ó𝑥𝑖𝑚𝑜 𝑎𝑜 𝑙𝑜𝑐𝑎𝑙 𝑑𝑜 𝑖𝑛𝑐𝑖𝑛𝑒𝑟𝑎𝑑𝑜𝑟” "𝑎𝑓" significa "𝑎𝑓𝑎𝑠𝑡𝑎𝑑𝑜 𝑑𝑜 𝑙𝑜𝑐𝑎𝑙 𝑑𝑜 𝑖𝑛𝑐𝑖𝑛𝑒𝑟𝑎𝑑𝑜𝑟” Em outras palavras, መ𝛿1 é a diferença, ao longo do tempo, das diferenças das medidas dos preços dos imóveis nas duas localizações. Para testar se መ𝛿1 é estatisticamente diferente de zero, precisamos encontrar seu erro-padrão utilizando uma análise de regressão. Análise de dados em painel de dois períodos O que acontece se usarmos o corte transversal de 1987 e executarmos uma regressão de 𝑡𝑥𝑐𝑟𝑖𝑚sobre 𝑑𝑒𝑠𝑒𝑚𝑝? Obteremos 𝑡𝑥𝑐𝑟𝑖𝑚 = 128,38 − 4,16𝑑𝑒𝑠𝑒𝑚 20,76 3,42 𝑛 = 46, 𝑅2 = 0,033 Sinal de 𝛽1= “negativo”. Coeficiente não é significativo. Se interpretarmos a equação estimada de forma causal, ela implica um aumento na taxa de desemprego que reduz a taxa de criminalidade. A regressão acima possui problemas relativos à omissão de variáveis. Possíveis soluções: Maior número de controles. Controles dos fatores não-observáveis → constante em 𝑡 ou variando em 𝑡. Análise de dados em painel de dois períodos Os dados do painel pode ajudar a reduzir o problema de variáveis omitidas. 𝑦𝑖𝑡 = 𝛽0 + 𝛿0𝑑2𝑡 + 𝛽1 𝑥𝑖𝑡 + 𝑎𝑖 + 𝑢𝑖𝑡 𝑡 = 1,2 Na notação 𝑦𝑖𝑡, 𝑖 é a pessoa, empresa, cidade etc., e 𝑡 é o período de tempo. 𝑑2 =variável 𝑑𝑢𝑚𝑚𝑦 = 0 quando 𝑡 = 1 e 𝑑𝑢𝑚𝑚𝑦 = 1 quando 𝑡 = 2 (ela não muda ao longo de 𝑖, razão pela qual ela não tem o subscrito 𝑖). O intercepto de 𝑡 = 1 é 𝛽0, e o intercepto de 𝑡 = 2 é 𝛽0 + 𝛿0. Neste modelo, permite-se que o intercepto mude ao longo do tempo, o que é importante na maioria das aplicações. Análise de dados em painel de dois períodos 𝑦𝑖𝑡 = 𝛽0 + 𝛿0𝑑2𝑡 + 𝛽1 𝑥𝑖𝑡 + 𝑎𝑖 + 𝑢𝑖𝑡 𝑡 = 1,2 𝑎𝑖 captura todos os fatores não observados, constantes no tempo que afetam 𝑦𝑖𝑡 . Ele é chamado de efeito não observado ou efeito fixo ou heterogeneidade não observada. Este modelo é chamado de modelo de efeitos fixos. O 𝑢𝑖𝑡 é chamado de erro idiossincrático ou erro de variação temporal, porque ele representa fatores não observados que mudam ao longo do tempo e afetam 𝑦𝑖𝑡 . A principal razão para a recolha de dados em painel é permitir que o efeito não observado, 𝑎𝑖, seja correlacionado com as variáveis explicativas. Análise de dados em painel de dois períodos No modelo de crime: 𝑡𝑥𝑐𝑟𝑖𝑚𝑖𝑡 = 𝛽0 + 𝛿0𝑑87𝑡 + 𝛽1𝑑𝑒𝑠𝑒𝑚𝑝𝑖𝑡 + 𝑎𝑖 + 𝑢𝑖𝑡 Em que 𝑑87 é uma variável dummy para 1987. Como 𝑖 representa cidades diferentes, chamamos 𝒂𝒊 de efeito não observado da cidade ou efeito fixo da cidade (efeito específico da cidade). Efeitos fixos da cidade: Características geográficas (como a localização da cidade), idade, raça, educação, fatores históricos. Como estimar corretamente 𝛽1 a partir de dois anos de dados em painel? Agrupar os dois anos e usar MQO - 2 inconveniência:1) para MQO agrupado produzir estimadores consistentes de 𝛽1, teremos que assumir que 𝑎𝑖 não está correlacionado com 𝑥𝑖𝑡. 𝑦𝑖𝑡 = 𝛽0 + 𝛿𝑜𝑑2 + 𝛽1𝑥𝑖𝑡 + 𝑣𝑖𝑡 , 𝑡 = 1,2, Sendo: 𝑣𝑖𝑡 = 𝑎𝑖 + 𝑢𝑖𝑡 (termo de erro composto). Análise de dados em painel de dois períodos Para estimarmos 𝛽1 consistentemente, precisamos assumir 𝐶𝑜𝑣 𝑣𝑖𝑡, 𝑥𝑖𝑡 = 0 Mesmo se assumirmos que 𝐶𝑜𝑣 𝑣𝑖𝑡, 𝑥𝑖𝑡 = 0 , MQO agrupado será viesado e inconsistente se 𝐶𝑜𝑣 𝑎𝑖 , 𝑥𝑖𝑡 ≠ 0. O viés resultante no MQO agrupado algumas vezes é chamado de viés de heterogeneidade, mas na realidade é apenas uma viés causado pela omissão de uma variável constante no tempo. Exemplo Exemplo 3: Utilizando os dados CRIME2.RAW para estimar pelo MQO agrupado 46 cidades, 2 anos, 92 observações 𝑡𝑥𝑐𝑟𝑖𝑚 = 93,42 + 7,94𝑑87 + 0,427𝑑𝑒𝑠𝑒𝑚𝑝 (12,74) (7,98) (1,188) n=92, 𝑅2 = 0.12 Os coeficientes de 𝑑𝑒𝑠𝑒𝑚𝑝, embora positivo, tem uma estatística 𝑡muito pequena. Assim, o uso de MQO agrupado dos dois anos não mudou nada, substancialmente, em relação ao uso de um único corte transversal. 𝑑𝑒𝑠𝑒𝑚𝑝 continua sem significância. MQO agrupado não resolve o problema de variáveis omitidas. Os fatores não observados das cidades (𝑎𝑖) estão afetando 𝑑𝑒𝑠𝑒𝑚𝑝. Modelos de Efeitos Fixos Como 𝑎𝑖 é constante em 𝑡, podemos tirar a diferença dos dados entre os dois anos: 𝑦𝑖1 = 𝛽0 + 𝛽1𝑥𝑖1 + 𝑎𝑖 + 𝑢𝑖1 𝑡 = 1 𝑦𝑖2 = 𝛽0 + 𝛿0 + 𝛽1𝑥𝑖2 + 𝑎𝑖 + 𝑢𝑖2 𝑡 = 2 Subtraindo a segunda equação da primeira: 𝑦𝑖2 − 𝑦𝑖1 = 𝛿0 + 𝛽1 𝑥𝑖2 − 𝑥𝑖1 + 𝑢𝑖2 − 𝑢𝑖1 Ou ∆𝑦𝑖 = 𝛿0 + 𝛽1∆𝑥𝑖 + ∆𝑢𝑖 O efeito não observado, 𝑎𝑖, foi “descartado pela diferenciação”. O intercepto é, na realidade a mudança no intercepto de 𝑡 = 1 para 𝑡 = 2. Equação em primeiras diferenças: 𝐶𝑜𝑣 ∆𝑥𝑖 , ∆𝑢𝑖 = 0 em ambos os períodos 𝑡 = 1 e 𝑡 = 2. Exogneidade estrita. 𝛽1 é o estimador em primeiras diferenças. Modelos de Efeitos Fixos Equação de Primeiras Diferenças: ∆𝑦𝑖 = 𝛿0 + 𝛽1∆𝑥𝑖 + ∆𝑢𝑖 Onde ∆ representa a mudança de 𝑡 = 1 para 𝑡 = 2. O efeito não observado 𝑎𝑖 não aparece nesta equação, ele foi “descartado pela diferenciação”. Além disso, o intercepto passa a ser a mudança no intercepto de 𝑡 = 1 para 𝑡 = 2. Esta equação chamamos de Equação de Primeiras Diferenças. Ela é apenas uma equação única de corte transversal, mas cada variável é diferencia ao longo do tempo.
Compartilhar