Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Métodos para Dados em Painel yit = b0 + b1xit1 + . . . bkxitk + uit Painel 2 Cross-sections independentes acumuladas ao longo do tempo (pooling) • Dado que uma amostra aleatória é extraída em cada período, a acumulação das amostras resultantes fornece uma cross-section independentemente acumulada → como tal, podemo usar métodos MQO • Vantagem: aumentar o tamanho da amostra, permitindo obter estimativas mais precisas e estatísticas de teste com maior poder • Acumulação só é útil se a relação entre a variável dependente e ao menos uma das variáveis independentes permanece constante ao longo do tempo • Para refletir o fato de que a população pode ter diferentes distribuições em diferentes períodos, permite-se que o intercepto seja diferente entre os períodos (inclusão de dummies de períodos) • Dummies de período podem ser interagidas com outras variáveis explicativas para verificar se o efeito da variável mudou ao longo do tempo Painel 3 Cross-sections independentes acumuladas ao longo do tempo (pooling) • Dois tipos de fatores não observados que afetam a variável dependente: • Efeito não observado constante ao longo do tempo (efeito fixo) • Erro idiossincrático que varia ao longo do tempo • Desvantagem das cross-sections acumuladas: • Viés de heterogeneidade: assumindo que o erro idiossincrático uit não é correlacionado com xit, MQO empilhado (pooled) é viesado é inconsistente se ai e xit são correlacionados Painel 4 Heterogeneidade não-observada • Viés de variável omitida • Muitas características individuais não são observadas e podem variar entre indivíduos → heterogeneidade não observada • Se estas influenciam a variável de interesse, e são correlacionadas com as covariadas observadas, os efeitos estimados destas variáveis são viesados Painel 5 Estrutura básica de dados Indivíduo 1 Rodada 1 Rodada T Rodada 1 Rodada T Rodada 1 RodadaT Indivíduo 2 Indivíduo N Painel 6 Modelo Básico • Nesta série de slides, métodos para casos com grandes cross-sections e pequenas séries temporais • Para um i genérico na população yit = ηt + xitβ + αi + uit, t = 1, . . . ,T • onde ηt é um intercepto separado de período, xit é um vetor 1 x K de variáveis explicativas, αi é o efeito não observado constante no tempo, e uit são erros idiossincráticos • αi : aleatório ao longo das variáveis observadas Painel 7 Modelo Básico • Pressuposto: exogeneidade contemporânea condicional em αi : E(uit|xit, αi) = 0, t = 1, . . . ,T • Equação define β no sentido que, dados os pressupostos: E(yit|xit, αi) = ηt + xitβ + αi • Tal que os βj são efeitos parciais, mantendo αi fixo • Contudo, β não é identificado somente sob este pressuposto; necessário adicionar outro forte pressuposto → Cov(xit, αi) = 0 Painel 8 Modelo Básico • Permitindo alguma correlação entre xit e αi ao assumir exogeneidade estrita condicional em αi : E(uit|xi1, xi2, . . . , xiT, αi) = 0, t = 1, . . . ,T • Que pode ser expresso: E(yit|xi, αi) = E(yit|xit, αi) = ηt +βxit + αi • se βxit : t = 1, . . . ,T varia ao longo do tempo, β pode ser estimado de forma consistente por efeitos fixos (FE) ou por primeiras diferenças (FD) ou mínimos quadrados generalizados (GLS) ou método dos momentos generalizados (GMM) Painel 9 Modelo Básico • Pressuposto chave para efeitos aleatórios: E(αi|xi) = E(αi) • MQO empilhado (pooled OLS) ou qualquer procedimento GLS, incluindo o estimador de efeitos aleatórios, são consistentes • Inferência robusta está disponível para ambos Painel 10 Modelo Básico • Pressupostos do modelo de efeitos fixos: a) αi são tratados como parâmetros (ou seja, diferentes interceptos individuais) → abordagem de dummies b) αi são variáveis aleatórias correlacionadas com todos os regressores → EF Painel 11 Modelo de componentes do erro itkitkititit xxxy +++++= ...22110 itiit u+= Termo de erro compostoConstante entre indivíduos Erro com distribuição normal ),0(~ 2uit Nu Variáveis explicativas Painel 12 Um ou dois componentes do erro? itiit u+= Efeito Individual Erro aleatório Efeito de Período ititit u++= Painel 13 Tratamento dos efeitos individuais • Efeitos fixos: αi constantes • Efeitos aleatórios: αi extraídos independentemente da alguma distribuição de probabilidade Modelo com uma entrada → 2 opções para o tratamento dos efeitos individuais Painel 14 Estimação do modelo linear de efeitos fixos • para ilustrar a identificação e estimação a partir de dados de painéis, deve-se iniciar com a análise de um modelo linear simples com efeitos individuais fixos: yit =x´itβ + i + uit • i=1, …, N; t = 1, ..., T • onde β é o parâmetro de interesse; o indexador i se refere aos indivíduos e assume-se que o banco de dados é uma série de cross sections independentes, tal que observações sobre N indivíduos estão disponíveis a cada período (dado que diferentes indivíduos são observados em cada período, isto implica que i não vai de 1 a N em cada t) Painel 15 Estimação do modelo linear de efeitos fixos • se os efeitos individuais i não são correlacionados com as variáveis explicativas em xit, este modelo pode ser estimado a partir de cross sections repetidas ao agregar (pooling) todas as observações e utilizar MQO tratando i + uit como um termo de erro composto • o problema em se usar dados de cross sections repetidas é que a variância de i não pode ser identificada; além disto, o estimador resultante pode ser menos eficiente do que um banco de dados de painel genuíno Painel 16 Estimação do modelo linear de efeitos fixos • contudo, em várias aplicações, os efeitos individuais i tendem a ser correlacionados com as variáveis explicativas em xit, tal que procedimentos de estimação tratando i como extrações aleatórias de alguma distribuição (como no modelo de efeitos aleatórios) leva a estimadores inconsistentes, a menos que a correlação seja considerada explicitamente • quando dados de painel são disponíveis, este problema é solucionado tratando os i como parâmetros fixos desconhecidos; esta estratégia não se aplica se não há observações repetidas sobre os mesmos indivíduos Painel 17 Modelo de Efeitos Fixos ( ) itkitkititiit uxxxy ++++++= ...22110 Painel 18 0 10 20 30 40 50 60 -5 0 5 10 15 20 Diferente Constante para Cada Indivíduo Individual 1 Individual 2 Individual 3 Individual 4 Graficamente Painel 19 0 10 20 30 40 50 60 -5 0 5 10 15 20 Individual 1 Individual 2 Individual 3 Individual 4 Linear (Individual 1) Linear (Individual 2) Linear (Individual 3) Linear (Individual 4) A A B B A inclinação estimada é BB e não AA; inclinação de BB é a mesma para cada indivíduo, somente a constante varia Painel 20 Combinações Possíveis de Inclinações e Interceptos Inclinações constantes Interceptos variáveis Inclinações variáveis Interceptos variáveis Inclinações variáveis Intercepto constante Inclinações constantes Interceptos constantes Pressupostos exigidos para este modelo não são verificados Modelo de Efeitos Fixos Regressão separada para cada indivíduo Improvável Painel 21 Construção do modelo de efeitos fixos: eliminação da heterogeneidade não observada por primeiras diferenças ( ) ( ) ( ) ( ) itkitkititit ititkitkitk itititititit itkitkititi itkitkititiitit itkitkititiit uxxxy uuxx xxxxyy uxxx uxxxyy uxxxy ++++= −+−+ +−+−=− −−−−−−− ++++++=− ++++++= −− −−−− −−−− − ... ... ...... ... 2211 11 1222111111 111221110 221101 22110 Equação original Defasar um período e subtrair Equação transformada Constante e efeitos individuais eliminados Painel 22 Alternativa às Primeiras Diferenças: Desvios das Médias Individuais →Modelo de Efeitos Fixos Aplicação de mínimos quadrados fornece o estimador de primeiras diferenças: funciona quando há 2 períodos. Forma mais geral de eliminar os efeitos fixos quando há mais de 2 períodos → usar desvios das médias individuais. Seja x1i. a média da variável x1 para o indivíduo i, ao longo de todos os períodos. Calcular as médias para cada variável (incluindo y) e subtrair as médias: ( ) ( ) itkikitkiitiiiit uxxxxyy +−++−+−+−=− ..111.00. ... itkitkititit uxxxy ++++= ...2211 A constante e os efeitos individuais também são eliminados por esta transformação Painel 23 Estimação do Modelo de Efeitos Fixos Usar os desvios em relação às médias individuais e aplicar mínimos quadrados – efeitos fixos, LSDV ou estimador “within” ( ) ( ) itkikitkiitiit uxxxxyy +−++−=− ..111. ... Chamado de estimador “within” porque se baseia em variáveis intra-individuais, e não entre indivíduos. Há outro estimador que usa somente a informação sobre as médias individuais → estimador “between”. O modelo de efeitos aleatórios é uma combinação do estimador de efeitos fixos (“within”) e do estimador “between”. Painel 24 3 formas de estimação de β ( ) ... ... ' ' ' iii iitiitiit ititit xy xxyy xy += −+−=− += global within between Estimador global é uma média ponderada dos estimadores “within” e “between”; somente será eficiente se estes pesos estiverem corretos. Estimador de efeitos aleatórios usa os pesos corretos. Painel 25 Análise de Dados de Painéis em 2 Períodos • tipo mais simples de dados de painel: para uma cross-section de indivíduos, escolas, firmas, municípios, etc., temos 2 anos de dados; t = 1 e t = 2; estes anos não precisam ser adjacentes, mas t = 1 corresponde ao ano inicial • exemplo: dado sobre taxas de desemprego e taxas de criminalidade para municípios em 1982 (t=1) e 1987 (t=2); usando a cross section de 1987 e rodando uma regressão simples de crim sobre desempr: crimest = 128,38 – 4,16desempr • n = 46, R2 = 0,033 Painel 26 Análise de Dados de Painéis em 2 Períodos • interpretando a equação estimada de forma causal, implica que um aumento na taxa de desemprego diminui a taxa de criminalidade, o que não é o esperado • coeficiente de desempr não é estatisticamente significativo: não há associação entre as taxas de criminalidade e de desemprego • esta equação de regressão simples sofre dos problemas de variáveis omitidas • solução possível: controlar por mais fatores, tais como distribuição etária, por gênero, níveis educacionais, etc., em uma análise de regressão multivariada; mas vários fatores são difíceis de serem controlados; incluir a taxa de criminalidade de um ano anterior (1982) poderia ajudar a controlar o fato de que diferentes municípios têm historicamente diferentes taxas de criminalidade • esta é uma maneira de usar 2 anos de dados para estimar um efeito causal Painel 27 Análise de Dados de Painéis em 2 Períodos • maneira alternativa de usar dados de painel: ver fatores não observados que afetam a variável dependente como de 2 tipos - constantes e que variam ao longo do tempo • se i é a unidade cross-section e t o período, o modelo com uma variável explicativa observada é: yit = 0 + 0d2t + 1xit + ai + uit ; t = 1,2 • em yit, i denota uma pessoa, firma, município, etc. e t denota o período • a variável d2t é uma variável dummy igual a 0 se t =1 e 1 quando t=2, e que não muda entre os i • assim, o intercepto para t=1 é 0, e o intercepto para t=2 é 0 + 0 • tal como no uso de cross sections independentes acumuladas, permitir que o intercepto varie ao longo do tempo é importante na maioria das aplicações Painel 28 Análise de Dados de Painéis em 2 Períodos • variável ai capta todos os fatores constantes no tempo, não observados, que afetam yit; é chamada de efeito fixo (ou heterogeneidade não observada) • o erro uit é o erro idiossincrático ou que varia no tempo, porque representa fatores não observados que mudam ao longo do tempo e afetam yit • como o parâmetro de interesse, 1, seria estimado, dados 2 anos de dados de painel? Uma possibilidade é acumular os 2 anos e usar MQO; este método tem desvantagens Painel 29 Análise de Dados de Painéis em 2 Períodos • para MQO empilhado produzir um estimador consistente de 1, temos que assumir que o efeito não observado ai não é correlacionado com xit: yit = 0 + 0d2t + 1xit + vit • onde vit = ai + uit é oerro composto • devemos assumir que vit não é correlacionado com xit, onde t=1 ou 2, para MQO estimar consistentemente 1; • isto é verdade quando usamos uma cross section ou acumulamos 2 cross sections Painel 30 Análise de Dados de Painéis em 2 Períodos • assim, mesmo se assumimos que o erro idiossincrático uit não é correlacionado com xit, MQO acumulada é viesada e inconsistente se ai e xit são correlacionadas • viés resultante na MQO acumulada é chamado de viés de heterogeneidade, mas é realmente o viés causado pela omissão de uma variável constante no tempo • MQO empilhado não resolve o problema de variáveis omitidas Painel 31 Análise de Dados de Painéis em 2 Períodos • na maioria das aplicações, a principal razão para usar dados de painel é permitir que o efeito não observado, ai, seja correlacionado com as variáveis explicativas • no exemplo, seria permitir que fatores não mensurados do município em ai que afetam a taxa de criminalidade sejam também correlacionados com a taxa de desemprego • assim, porque ai é constante ao longo do tempo, podemos diferenciar os dados entre os 2 anos Painel 32 Análise de Dados de Painéis em 2 Períodos • para uma observação cross section i, os 2 anos seriam yi2 = (0 + 0) + 1xi2 + ai + ui2 yi1 = 0 + 1xi1 + ai + ui1 • e subtraindo a segunda equação da primeira (yi2 - yi1) = 0 + 1 (xi2 - xi1) + (ui2 - ui1) yi = 0 + 1xi + ui • onde denota a mudança de t = 1 para t = 2; o efeito não observado, ai, não aparece nesta última equação (foi diferenciado para fora); intercepto também é a mudança do intercepto de t = 1 para t = 2 Painel 33 Análise de Dados de Painéis em 2 Períodos • equação de primeiras diferenças é uma equação cross-section, mas cada variável é diferenciada ao longo do tempo • análise usando métodos MQO, dado que os pressupostos sejam satisfeitos; o mais importante é que ui não seja correlacionado com xi; este pressuposto se aplica se o erro idiossincrático em cada período t, uit, não é correlacionado com a variável explicativa em ambos os períodos, sendo uma versão do pressuposto de exogeneidade estrita • pressuposto elimina o caso em que xit é a variável dependente defasada yi,t-1; é permitido aqui que xit seja correlacionado com os não observáveis que são constantes no tempo; o estimador MQO de 1 é o estimador de 1ªs diferenças Painel 34 Análise de Dados de Painéis em 2 Períodos • outra condição: xi tem alguma variação entre os i, ou seja, não é verificada se a variável explicativa não muda ao longo do tempo para nenhuma observação cross-section, ou se muda pelo mesmo montante para todas as observações • Exemplo: se i denota um indivíduo e xit é uma variável dummy para gênero, xi = 0 para todos os i; claramente não é possível estimar a equação por MQO • intuição: dado que permitimos que ai seja correlacionado com xit, não podemos separar o efeito de ai em yit do efeitode qualquer variável que não mude ao longo do tempo Painel 35 Análise de Dados de Painéis em 2 Períodos • outra condição para usarmos MQO: a equação deve satisfazer o pressuposto de homocedasticidade; se não é verificada podemos testar e corrigir a heterocedasticidade • assumindo que a equação satisfaça a todos os pressupostos do modelo linear clássico, os estimadores MQO são não viesados e toda a inferência estatística é exata neste caso Painel 36 Análise de Dados de Painéis em 2 Períodos • mesmo não partindo do modelo de efeitos fixos, usar diferenças ao longo do tempo é intuitivo • ao invés de estimar uma relação cross section padrão, que poderia sofrer de variáveis omitidas, dificultando as conclusões ceteris paribus, a equação yi = 0 + 1xi + ui explicitamente considera como mudanças na variável explicativa ao longo do tempo afetam a mudança em y ao longo do mesmo período • ainda assim, é importante ter a equação yit = 0 + 0d2t + 1xit + ai + uit em mente, já que mostra como estimamos o efeito de xit sobre yit, mantendo ai constante Painel 37 Análise de Dados de Painéis em 2 Períodos •mesmo tendo coletado uma base de dados de painel, a diferenciação usada para eliminar ai pode reduzir muito a variação das variáveis explicativas; embora xit tenha uma variação substancial na cross section para cada t, xi pode não apresentar tanta variação, o que levaria a grandes erros padrões MQO • usar uma grande cross-section seria uma solução, assim como usar diferenças maiores ao longo do tempo Painel 38 Análise de Dados de Painéis em 2 Períodos • adicionar outras variáveis explicativas não traz dificuldades; no modelo de efeitos fixos: yit = 0 + 0d2t + 1xit1 + 2xit2 + … + kxitk + ai + uit • dados de painel também podem ser usados para estimar modelos com defasagem finita distribuída; mesmo se especificamos a equação para somente 2 anos, é necessário coletar mais anos de dados para obter as variáveis explicativas defasadas Painel 39 Estimação de Efeitos Fixos Painel 40 Estimação de Efeitos Fixos Painel 41 Estimação de Efeitos Fixos Painel 42 Estimação de Efeitos Fixos • adicionar mais variáveis explicativas à equação causa poucas mudanças: a partir do modelo original, apenas usamos os desvios de cada variável explicativa (incluindo as dummies de período) em relação a sua média, e rodamos uma regressão MQO acumulada usando todas as variáveis • sob o pressuposto de estrita exogeneidade das variáveis explicativas, o estimador de efeitos fixos não é viesado • o erro idiossincrático uit não deve ser correlacionado com as variáveis explicativas ao longo de todo o tempo estudado Painel 43 Estimação de Efeitos Fixos Painel 44 Estimação de Efeitos Fixos • há um ponto sutil na determinação dos graus de liberdade para o estimador de efeitos fixos • quando estimamos a equação dos desvios através de MQO empilhado, temos NT observações e k variáveis independentes, sendo o intercepto eliminado na transformação de efeitos fixos • assim, aparentemente teríamos NT-k graus de liberdade, mas não temos; para cada observação cross section i, perdemos 1 grau de liberdade devido à transformação em desvios; ou seja, para cada i, os erros üit somam 0 quando somados ao longo de t, tal que perdemos 1 grau de liberdade; assim, os graus de liberdade são NT-N-k = N(T-1)k Painel 45 Estimação de Efeitos Fixos • ao estimar um modelo de efeitos fixos, não é claro como é calculada uma medida de qualidade de ajuste do modelo; R2 se baseia na transformação interna, assim é interpretado como o montante de variação no tempo em yit que é explicado pela variação no tempo das variáveis explicativas • embora variáveis constantes no tempo não possam ser incluídas em um modelo de efeitos fixos, podem ser interagidas com variáveis que mudam ao longo do tempo, em particular com as dummies de período • Exemplo: na equação salarial em que educação é constante ao longo do tempo para cada indivíduo, podemos interagir educação com cada dummy de período e ver como o retorno à educação mudou ao longo do tempo; mas não podemos usar efeitos fixos para estimar o retorno à educação no período de referência, o que significa que não podemos estimar em qualquer período; podemos somente ver como o retorno à educação em cada ano difere daquele do período de referência Painel 46 Estimação de Efeitos Fixos • quando é incluída uma série completa de dummies de período, não podemos estimar o efeito de qualquer variável cuja mudança ao longo do tempo é constante • Por exemplo: anos de experiência em uma base de dados de painel, onde cada pessoa trabalha a cada ano, tal que a experiência sempre aumenta 1 a cada ano, para todos na amostra; a presença de ai considera as diferenças entre as pessoas em seus anos de experiência no período inicial; mas então o efeito de um ano de aumento na experiência não pode ser distinguido dos efeitos médios de período • Isto também ocorreria se fosse usada uma tendência linear no tempo ao invés de dummies de período: para cada pessoa, a experiência não pode ser distinguida de uma tendência linear Painel 47 Efeitos Fixos ou Primeira Diferenciação (EF ou PD)? • até aqui, 2 métodos para estimar modelos com efeitos não observados: (1) diferenciar os dados; (b) desvios em relação à média • como saber qual usar? • quando T=2, as estimativas EF e PD e todas as estatísticas de teste são idênticas; PD tem a vantagem de ser mais direta, e é mais fácil calcular estatísticas robustas à heterocedasticidade • quando T 3, os estimadores EF e PD não são iguais; dado que ambos são não viesados, não podemos usar o viés como critério; ambos são consistentes (com T fixo e N → ); para grandes N e pequenos T, a escolha deve se basear na eficiência relativa dos estimadores, que é determinada pela correlação serial dos erros uit (assumindo homocedasticidade) Painel 48 Efeitos Fixos ou Primeira Diferenciação (EF ou PD)? • quando os uit não são serialmente correlacionados, EF é mais eficiente; portanto, como o modelo de efeitos não observados é tipicamente reportado com erros não correlacionados, estimador EF é mais usado • contudo, este pressuposto pode ser falso, já que os fatores não observados que mudam ao longo do tempo tendem a ser serialmente correlacionados; se uit segue um passeio aleatório – o que significa que há correlação serial substancial e positiva – então a diferença uit não é serialmente correlacionada e PD é melhor Painel 49 Efeitos Fixos ou Primeira Diferenciação (EF ou PD)? • é difícil testar se uit são serialmente correlacionados após a estimação EF, já que estimamos os desvios dos erros, mas não os próprios uit • contudo, é possível testar se os erros diferenciados uit não apresentam correlação serial; se este é o caso, PD pode ser usado • se há correlação serial negativa e grande nos uit, EF é melhor Painel 50 Efeitos Fixos ou Primeira Diferenciação (EF ou PD)? • quando T é grande, e principalmente quando N não é grande, devemos ter cautela com o estimador EF; embora resultados distribucionais exatos se apliquem para qualquer N e T sob os pressupostos de efeitos fixos clássicos, inferência pode ser sensível a violações dos pressupostos quando T é grande e N não • inferência com o estimador EF é mais sensível à não normalidade, heterocedasticidade e correlação serial dos erros • por outro lado, EF é menos sensível à violação do pressuposto de estrita exogeneidade, principalmente com T grande; recomenda-se estimar modelos EF com variáveis dependentes defasadas Painel 51 Efeitos Fixos em Painéis Desbalanceados • com anos ou unidades faltantes na amostra, mecanismode estimação de EF: se Ti é o número de períodos para a unidade cross section i, estas Ti observações são usadas para calcular os desvios em relação à média • número total de observações é então T1 + T2 + ... + TN; novamente, um grau de liberdade é perdido para cada observação cross section • painel desbalanceado não causa problemas se a razão para os dados faltantes para algum i (atrição) não é correlacionado com os erros uit (fatores não observados que mudam ao longo do tempo e afetam yit) Painel 52 Efeitos Fixos em Painéis Desbalanceados • se é correlacionado: o problema de viés de seleção pode levar a estimadores viesados • entretanto, análise EF permite que a atrição seja correlacionada com ai, o efeito não observado, dado que, na amostragem inicial, algumas unidades tendem mais a sair da pesquisa, e isto é captado por ai Painel 53 Estimação de Efeitos Aleatórios Painel 54 Estimação de Efeitos Aleatórios Painel 55 Estimação de Efeitos Aleatórios Painel 56 Estimação de Efeitos Aleatórios Painel 57 Estimação de Efeitos Aleatórios Painel 58 Estimação de Efeitos Aleatórios • esta transformação permite variáveis explicativas que são constantes ao longo do tempo, e é uma vantagem dos EA sobre os EF ou PD • isto é possível porque EA assume que o efeito não observado não é correlacionado com todas as variáveis explicativas, fixas ao longo do tempo ou não • Exemplo: na equação salarial, incluímos uma variável como educação, mesmo que não mude ao longo do tempo; mas estamos assumindo que educação não é correlacionada com ai, que contém background familiar e habilidade • em várias aplicações, a razão para usar dados de painel é permitir que o efeito não observado seja correlacionado com as variáveis explicativas Painel 59 Estimação de Efeitos Aleatórios Painel 60 Modelo de Efeitos Aleatórios itikitkititit itkitkititit uxxxy xxxy ++++++= +++++= ... ... 22110 22110 Equação original αi como parte do termo de erro itiit u+= Lembrando Painel 61 A estrutura da variância nos efeitos aleatórios itktodosparaxE stEstE tiparatodosuEE uEEuE ikit isituit iiti uitiit ,,0)( ;,)(;)( ,0)(;)( ;)(;0)()( 2222 22 22 = ==+= == === No modelo de efeitos aleatórios, pressupomos que αi são parte do termo de erro composto eit. Para construir um estimador eficiente, é necessário avaliar a estrutura do erro e depois aplicar um estimador apropriado de mínimos quadrados generalizados para encontrar um estimador eficiente. Os seguintes pressupostos devem ser verificados se o estimador é eficiente: Pressuposto crucial para o modelo RE: é necessário para a consistência do modelo RE, mas não para FE. Pode ser testado com o teste de Hausman. Painel 62 A estrutura da variância nos efeitos aleatórios ( ) T tamanhode unitário vetorum1.....111' ' .. .... )( então );,...,( 22 2222 2 2222 22222 ' 21 ' éeeonde eeI E u u u u iiiTiii = =+= + + + == Derivar a matriz T x T que descreve a estrutura da variância de eit para o indivíduo i. Dado que li aleatoriamente extraído está presente em todos os períodos, há uma correlação entre cada par de períodos para este indivíduo. Painel 63 Efeitos Aleatórios (Estimação GLS) 22 2/1 -1= ' 1 u u T u T ondeee T I + −=− -1 ' 1 ' 1 1 1 ˆ = ( ) N N RE i i i i i i X X X y − − = = O estimador de efeitos aleatórios tem a forma padrão de mínimos quadrados generalizados somada ao longo de todos os indivíduos: Onde, dado : Painel 64 Efeitos Fixos (Estimação GLS) ' 1 onde )(=ˆ 1 ' -1T 1i ' ee T IMMyXMXX T T i iiiiFE −= == O estimador de efeitos fixos também pode ser expresso na forma GLS, que revela sua relação com o estimador RE: Pré-multiplicando uma matriz de dados X por M tem o efeito de construir uma nova matriz X*, composta por desvios em relação às médias individuais. O estimador FE usar M com a matriz de ponderação, ao invés de . Painel 65 Relação entre os modelos de efeitos aleatórios e fixos O estimador de efeitos aleatórios é uma combinação ponderada dos estimadores “within” e “between”. O estimador “between” é: .aleatório) erro ao relação em pequenos são sindividuai efeitos os (porque MQO a ecorrespond 0 .aleatórios erros aos nterelativame grande é sindividuai efeitos dos adevariabilid a quando ocorre Isto coincidem. FE e RE sestimadore os então1 se que forma de de depende ˆ)(ˆˆ → → −+= WithinKBetweenRE I Painel 66 Estimação de Efeitos Aleatórios • relacionando o estimador EA com os efeitos MQO empilhado e EF: →MQO acumulado é obtido quando = 0 e EF quando = 1 →na prática estimado nunca é 0 ou 1, mas próximo; →quando estimado é próximo de 0, as estimativas EA se aproximam das de MQO acumulado; este é o caso quando o efeito não observado ai não é relativamente importante (dada sua pequena variância em relação a 2u) →é mais comum que 2α seja grande em relação a 2 u, quando estimado é próximo de 1 →na medida que T aumenta, estimado tende a 1, tornando as estimativas EA e EF similares Painel 67 Estimação de Efeitos Aleatórios • mais intuições sobre os méritos relativos de EA vs. EF: vit - vi,med = (1-) αi + uit - ui,med • expressão mostra que os erros na equação transformada usada na estimação EA ponderam o efeito não observado por (1-) • embora a correlação entre ai e um ou mais xitj cause inconsistência na estimação EA, a correlação é atenuada por (1- ); na medida que tende para 1, o termo de viés tende a zero, porque o estimador EA tende ao de EF; se tende a 0, deixa-se uma grande fração do efeito não observado no termo de erro, e o viés assintótico do estimador EA será maior Painel 68 Pressupostos para EF Painel 69 Pressupostos para EF • Sob estes 4 pressupostos (idênticos para o estimador de 1ªs diferenças), o estimador EF não é viesado, sendo a chave a exogeneidade estrita, e o estimador EF é consistente com um T fixo na medida que N tende a infinito 5. var (uit|Xi, αi) = var (uit) = 2 u para todos os t=1,...,T 6. para todos os t s, os erros idiossincráticos não são correlacionados (condicional a todas as variáveis explicativas e ai): cov (uit, uis|Xi, αi) = 0 • Sob pressupostos 1 a 6, estimador EF dos j é o melhor estimador linear não viesado (BLUE); dado que o estimador de PD é linear e não viesado, é necessariamente pior que EF. O pressuposto que torna EF melhor é o 6, que implica que os erros são serialmente não correlacionados. Painel 70 Pressupostos para EF 7. condicional a Xi e αi, os uit são independente e identicamente distribuídos como N(0, 2u) • Este pressuposto implica 3, 5 e 6, mas é mais forte porque assume uma distribuição normal dos erros. Neste caso, o estimador tem distribuição normal, e as estatísticas t e F têm distribuições t e F exatas • Sem 7, podemos confiar em aproximações assintóticas, que requerem grandes N e pequenos T. Painel 71 Pressupostos para EA • Pressupostos ideais EA incluem os de EF 1, 2, 3, 5, 6; mas agora permitem variáveis constantes no tempo • Necessários pressupostos sobre como αi se relaciona com as variáveis explicativas. 3. valor esperado de αi, dadas as variáveis explicativas, constante: E(αi|Xi) = 0• Isto exclui a correlação entre o efeito não observado e as variáveis explicativas, e é a distinção chave entre EF e EA • Assumindo que αi não é correlacionado com todos os elementos de xit, possível incluir variáveis explicativas constantes no tempo • Permite-se uma esperança não zero para αi com este pressuposto, tal que o modelo sob os pressupostos EA contém um intercepto 0 Painel 72 Pressupostos para EA Painel 73 Efeitos Fixos ou Aleatórios? Vantagens dos efeitos aleatórios: • são eficientes • porque devemos assumir uma parte dos não observáveis como fixa e outra aleatória? • lida com regressores fixos entre indivíduos Desvantagens: É provável que haja correlação entre os efeitos não observáveis e as variáveis explicativas, o que implica em inconsistência devido a variáveis omitidas no modelo RE. Nesta situação, FE é ineficiente, mas consistente. Painel 74 EA ou EF? • decisão pode se basear em se os αi são vistos como parâmetros a serem estimados ou resultados de uma variável aleatória • quando não podemos considerar as observações como aleatórias a partir da população (e.g. municípios), faz sentido pensar em αi como parâmetros a estimar e usar o método EF (lembrando que usar EF é como permitir um intercepto diferente para cada observação, e é possível estimar estes interceptos incluindo variáveis dummies) • decidindo tratar αi como variáveis aleatórias, temos que decidir se αi não são correlacionados com as variáveis explicativas; assumir que αi é aleatório não significa automaticamente que EA é a estratégia apropriada de estimação Painel 75 EA ou EF? • se podemos assumir que αi não são correlacionados com todos os xit, o método EA é apropriado; mas, se αi são correlacionados com algumas variáveis explicativas, o método EF (ou PD) é necessário • comparar as estimativas EA e EF pode ser um teste para a correlação entre αi e xitj, assumindo que os erros e variáveis explicativas não são correlacionados ao longo dos períodos; teste de Hausman Painel 76 EA ou EF? • na medida em que os efeitos específicos são inseridos na equação estimada (explicitamente ou implicitamente através dos desvios em relação à média), a correlação entre esses efeitos e os regressores deixa de causar endogeneidade e passa a causar multicolinearidade • portanto, somente a variação temporal inerente a cada unidade é utilizada na estimação, ou seja, toda variação cross- section é eliminada; além disso, o estimador de efeitos aleatórios utiliza uma média ponderada da variação cross- section e da variação temporal, atribuindo à temporal um peso maior que o estimador de MQO, que ignora a distinção entre as dimensões; isto tem implicações sobre as propriedades desses estimadores: Painel 77 EA ou EF? • somente os regressores com alguma variação temporal podem ser incluídos na regressão, o que inviabiliza incluir variáveis como educação (após conclusão dos estudos), sexo e cor, em um modelo com efeitos fixos • a variação utilizada pelo modelo de efeitos fixos para estimar a relação de interesse é menor que a utilizada pelo estimador de efeitos aleatórios, o que diminui sua eficiência; isto é, o estimador de efeitos fixos estima N parâmetros (efeitos específicos), além dos K parâmetros associados às variáveis explicativas; por outro lado, o estimador de efeitos aleatórios utiliza o mesmo número de observações para estimar somente 2 parâmetros suplementares, os necessários para estimar a matriz de covariância das variáveis aleatórias Painel 78 Testes de Hipóteses • Acumulação dos dados (Teste de Chow) • Efeitos individuais e fixos (Breusch-Pagan) • Correlação entre Xit e li (Hausman) Painel 79 Teste para Acumulação dos Dados • Hipótese nula (irrestrita): regressões distintas para cada indivíduo • Hipótese alternativa (restrita): indivíduos têm os mesmos coeficientes, sem componentes do erro (erro simples) • Teste F: Chow Painel 80 Teste para Efeitos Individuais • Breusch-Pagan: • Distribuição 2 2 • Testes de efeitos individuais e temporais podem ser derivados, distribuídos como c1 2 2 2: 0oH = = Painel 81 Teste de Hausman Testa qual modelo é apropriado: FE ou RE H0: E(li|xit) = 0 Se não há correlação entre os regressores e os efeitos, ambos FE e RE são consistentes, mas FE é ineficiente. Se há correlação, FE é consistente e RE é inconsistente. Sob a hipótese nula de não haver correlação, não há diferenças entre os estimadores. Painel 82 Teste para independência entre li e xkit. A covariância de um estimador eficiente e sua diferença em relação ao estimador ineficiente deve ser zero. Assim, sob a hipótese nula, o teste é: )(~)(ˆ)'(=W 2RE 1 RE kFEFE −− − Se W é significante, não devemos usar o estimador RE. Teste de Hausman Painel 83 EA ou EF? • Teste de Hausman: H0: há efeitos aleatórios vs. H1: há efeitos fixos • sob H0, ambos os estimadores (EF, EA) são consistentes, mas EF é ineficiente • sob H1, o estimador de efeitos aleatórios é inconsistente • intuição do teste: se há efeitos fixos, os estimadores EA e EF serão muito diferentes; se há efeitos aleatórios, eles estarão próximos → teste Wald para verificar a diferença entre os 2 vetores de inclinações • W = (EF - EA {Var[ EF- EA] }-1 (EF- EA) • Var[ EF- EA] → covariância entre um estimador eficiente de um parâmetro e a diferença entre ele e um estimador ineficiente é zero Painel 84 EA ou EF? • sob H0: Cov[EA , (EA - EF)] = 0 = Var[EA] - Cov[EA,EF] • assim, Cov[EA,EF] = Var[EA] • e, Var[EF - EA] = VAR[EF] + VAR[EA] - 2Cov[EA,EF] = Var[EF] - Var[EA] • teste então usa os 2 estimadores e as 2 matrizes estimadas de covariância
Compartilhar