Baixe o app para aproveitar ainda mais
Prévia do material em texto
Tópico 13 – Modelos de Cortes Transversais ao Longo do Tempo Método Simples de Dados em Painel Bibliografia: WOOLDRIDGE, J.M. Introdução à Econometria: uma abordagem moderna. 4ª ed. São Paulo: Pioneira Thomson Learning, 22015. (capítulo 13). Modelos de Cortes Transversais Agrupados(pooled Cross-Section) Dados cross-section: Consiste em uma amostra de dados coletados em um determinado ponto no tempo. Por exemplo, o conjunto de dados de corte transversal da PNAD para o ano de 2010 de trabalhadores. Dados pooled: alguns conjuntos de dados têm características de corte transversal e de séries de tempo. Por exemplo: um mesmo conjunto de variáveis é coletado em diferentes períodos do tempo, em distintas amostras aleatórias de uma mesma população (PNAD- 2009 e 2010). Isto é, os anos de 2009 e 2010 são empilhados no banco de dados. Modelos de Cortes Transversais Agrupados(pooled Cross-Section) Dados em painel (longitudinais): Um conjunto de dados de painel (ou dados longitudinais) consiste em uma série de tempo para cada membro do corte transversal do conjunto de dados. Uma medida no decorrer do tempo (T1, T2, T3…) ocorre para cada pessoa. Podem ser coletados para indivíduos, domicílios, instituições ou unidades geográficas. Comparação: são distintos dos dados de corte transversal agrupados, porque os mesmos indivíduos/empresas/unidades são acompanhadas ao longo de um determinado período. Modelos de Cortes Transversais Agrupados(pooled Cross-Section) Balanceado X Não Balanceado: Dados de painel são chamados de balanceados se a informação de cada pessoa é disponível para todos os períodos. Se há dados “missing” para alguns casos em certos pontos no tempo, os dados são não balanceados. Modelos de Cortes Transversais Agrupados (pooled Cross-Section) Definição do pooled: obtido por amostragem aleatória de uma grande população em diferentes pontos no tempo. Agrupando cortes transversais independentes em 𝑡: Amostras aleatórias da população em diferentes 𝑡. Não há correlação temporal do termo de erro entre diferentes observações. Objetivos de se agrupar Vantagens: Aumenta o tamanho da amostra; Estimadores e estatísticas dos testes mais precisos. Agrupar cortes transversais de diferentes anos é eficaz para analisar os efeitos de uma política pública. O ideal é coletar dados de anos anteriores e posteriores a uma importante mudança de política governamental. Objetivos de se agrupar Mas a relação entre a variável dependente e pelo menos algumas independentes deve ser mantida constante em 𝑡. Em geral, para refletir o fato de que a população pode ter distribuições diferentes em períodos de tempo diferente, permitimos que o intercepto difira ao longo dos períodos, normalmente nos anos. Isso é facilmente conseguido incluindo dummies de tempo → Permite que o intercepto varie entre os períodos (normalmente anos). O primeiro ano da amostra é habitualmente escolhido como o ano-base. A variância do erro também pode variar no tempo. Exemplo Exemplo 13.1→ Fertilidade feminina ao longo do tempo Objetivo: Explicar o número total de nascimento por mulheres (kids). Pergunta: Após controlar por outros fatores observáveis, o que acontece com a taxa de fertilidade ao longo do tempo? Anos: 1974, 1976,1978, 1980, 1982, 1984 Variáveis: anos de educação, idade, raça, região do país onde as mulheres residiam quando tinha 16 anos e ambiente em que viviam quando tinha essa mesma idade. Ano base é 1972 Estimando por MQO: reg kids educ age agesq black east northcen west farm othrural town smcity y74 y76 y78 y80 y82 y84 Dummy de anos indica uma queda da fertilidade. 1982 uma mulher teve , em, média 0.52 menos filhos do que em 1972. 100 mulheres em 1982 teriam 52 crianças a menos se comparada com 100 mulheres em 1972. Mulheres com mais anos de escolaridade têm menor número de filhos: 100 mulheres com curso superior terão, em média, 51 filhos a menos do que 100 mulheres com apenas ensino médio (0,128(4)=0,512). A idade tem um fator redutor sobre fertilidade. _cons -7.742457 3.051767 -2.54 0.011 -13.73033 -1.754579 y84 -.5451661 .1745162 -3.12 0.002 -.8875846 -.2027477 y82 -.5224842 .1724361 -3.03 0.003 -.8608214 -.184147 y80 -.0713053 .1827707 -0.39 0.697 -.42992 .2873093 y78 -.0686665 .1816837 -0.38 0.706 -.4251483 .2878154 y76 -.0973795 .1790456 -0.54 0.587 -.448685 .2539261 y74 .2681825 .172716 1.55 0.121 -.0707039 .6070689 smcity .2118791 .160296 1.32 0.187 -.1026379 .5263961 town .0843532 .124531 0.68 0.498 -.1599893 .3286957 othrural -.1628537 .175442 -0.93 0.353 -.5070887 .1813814 farm -.0525575 .14719 -0.36 0.721 -.3413592 .2362443 west .1976032 .1669134 1.18 0.237 -.1298978 .5251041 northcen .363114 .1208969 3.00 0.003 .125902 .6003261 east .217324 .1327878 1.64 0.102 -.0432192 .4778672 black 1.075658 .1735356 6.20 0.000 .7351631 1.416152 agesq -.005804 .0015643 -3.71 0.000 -.0088733 -.0027347 age .5321346 .1383863 3.85 0.000 .2606065 .8036626 educ -.1284268 .0183486 -7.00 0.000 -.1644286 -.092425 kids Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 3085.5093 1128 2.73538059 Root MSE = 1.5548 Adj R-squared = 0.1162 Residual 2685.89841 1111 2.41755033 R-squared = 0.1295 Model 399.610888 17 23.5065228 Prob > F = 0.0000 F( 17, 1111) = 9.72 Source SS df MS Number of obs = 1129 . reg kids educ age agesq black east northcen west farm othrural town smcity y74 y76 y78 y80 y82 y84 . * Estimando por MQO: Exemplo Exemplo Considerando eu as variáveis anuais de 1982 e 1984 são individualmente significantes. Com um grupo, as variáveis simuladas anuais são, conjuntamente, significantes. Rejeitamos a hipótese nula de que os coeficientes das variáveis dummies são simultaneamente (conjuntamente) iguais a zero. Ou seja, rejeitamos a hipótese conjunta de que o modelo excluindo as variáveis dummies é mais corretamente especificado do que o modelo completo. Exemplo Exemplo 13.2: Mudanças no retorno da educação e a diferença salarial por gênero Variáveis: lwage: logaritmo da renda Y85: dummy do ano 1985 (1 = 1985; 0 = caso contrário) educ: anos de educação y85educ: interação y85 e educ exper: experiência exper2: experiência ao quadrado union: dummy sindicalizado ( 1= sim; 0 = caso contrário) female: dummy gênero (1= mulher; 0= homem) y85fem: interação y85 e female pooled: anos 1978 e 1985 Exemplo Usar salarioh em lugar do log(salarioh), é importante usar o salário real e incluir uma dummy anual. log 𝑠𝑎𝑙á𝑟𝑖𝑜ℎ = 𝛽0 + 𝛿0𝑎85 + 𝛽1𝑒𝑑𝑢𝑐 + 𝛿1𝑎85 ∙ 𝑒𝑑𝑢𝑐 + 𝛽2𝑒𝑥𝑝𝑒𝑟 + 𝛽3𝑒𝑥𝑝𝑒𝑟 2 + 𝛽4𝑠𝑖𝑛𝑑𝑖𝑐𝑎𝑡𝑜 + 𝛽5𝑓𝑒𝑚𝑖𝑛𝑖𝑛𝑜 + 𝛿585 ∙ 𝑓𝑒𝑚𝑖𝑛𝑖𝑛𝑜+ 𝑢 Total 1,084 100.00 85 534 49.26 100.00 78 550 50.74 50.74 year Freq. Percent Cum. . tab year _cons .4589329 .0934485 4.91 0.000 .2755707 .642295 y85fem .085052 .051309 1.66 0.098 -.0156251 .185729 female -.3167086 .0366215 -8.65 0.000 -.3885663 -.244851 union .2021319 .0302945 6.67 0.000 .1426888 .2615749 expersq -.0003994 .0000775 -5.15 0.000 -.0005516 -.0002473 exper .0295843 .0035673 8.29 0.000 .0225846 .036584 y85educ .0184605 .0093542 1.97 0.049 .000106 .036815 educ .0747209 .0066764 11.19 0.000 .0616206 .0878212 y85 .1178062 .1237817 0.95 0.341 -.125075 .3606874 lwage Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 319.091167 1083 .29463635 Root MSE = .4127 Adj R-squared = 0.4219 Residual 183.099094 1075 .170324738 R-squared = 0.4262 Model 135.992074 8 16.9990092 Prob > F = 0.0000 F( 8, 1075) = 99.80 Source SS df MS Number of obs = 1084 . reg lwage y85 educ y85educ exper expersq union female y85fem O intercepto de 1978 é 𝛽0 e o intercepto de 1985 é 𝛽𝑜 + 𝛿0. O retorno da educação em 1978 é 𝛽1 e em 1985 é 𝛽1 + 𝛿1. Portanto, 𝛿1 mede como o retorno de mais um ano de estudo mudou ao longo do período de 7 anos. ▪ O retorno da educação em 1978 é estimado em torno de 7,5%; ▪ O retorno da educação em 1985 é cerca de 1,85% mais alto ou cerca de 9,35%. ▪ A diferença no retorno da educação é estatisticamente significante no nível de 5%. ▪ A diferença salarial: 1978, uma mulher ganhava cerca de 31,7% menos que um homem. ▪ 1985: a diferença em log(𝑠𝑎𝑙𝑎𝑟𝑖𝑜ℎ) é -0.317 (female) + 0.085 (y85female) = -0.232. ▪ A diferença salarial caiu de 78 para 85: 8,5% -> significante a 10%.
Compartilhar