dados em painel

•

UFMG

Jennifer Bittencourt

16/06/2018

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 84 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 84 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 84 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Econometria

6.339 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1
Métodos para Dados em Painel
yit = b0 + b1xit1 + . . . bkxitk + uit
Painel 2
Cross-sections independentes acumuladas ao longo do tempo 
(pooling)
• Dado que uma amostra aleatória é extraída em cada período, a 
acumulação das amostras resultantes fornece uma cross-section 
independentemente acumulada → como tal, podemo usar métodos MQO
• Vantagem: aumentar o tamanho da amostra, permitindo obter estimativas 
mais precisas e estatísticas de teste com maior poder
• Acumulação só é útil se a relação entre a variável dependente e ao menos 
uma das variáveis independentes permanece constante ao longo do 
tempo
• Para refletir o fato de que a população pode ter diferentes distribuições 
em diferentes períodos, permite-se que o intercepto seja diferente entre 
os períodos (inclusão de dummies de períodos)
• Dummies de período podem ser interagidas com outras variáveis 
explicativas para verificar se o efeito da variável mudou ao longo do tempo
Painel 3
Cross-sections independentes acumuladas ao longo do tempo 
(pooling)
• Dois tipos de fatores não observados que afetam a 
variável dependente:
• Efeito não observado constante ao longo do tempo (efeito 
fixo)
• Erro idiossincrático que varia ao longo do tempo
• Desvantagem das cross-sections acumuladas: 
• Viés de heterogeneidade: assumindo que o erro 
idiossincrático uit não é correlacionado com xit, MQO 
empilhado (pooled) é viesado é inconsistente se ai e xit são 
correlacionados
Painel 4
Heterogeneidade não-observada
• Viés de variável omitida
• Muitas características individuais não são observadas e podem variar 
entre indivíduos → heterogeneidade não observada
• Se estas influenciam a variável de interesse, e são correlacionadas 
com as covariadas observadas, os efeitos estimados destas variáveis 
são viesados
Painel 5
Estrutura básica de dados
Indivíduo 1
Rodada 1
Rodada T
Rodada 1
Rodada T
Rodada 1
RodadaT
Indivíduo 2
Indivíduo N
Painel 6
Modelo Básico
• Nesta série de slides, métodos para casos com grandes cross-sections 
e pequenas séries temporais
• Para um i genérico na população
yit = ηt + xitβ + αi + uit, t = 1, . . . ,T
• onde ηt é um intercepto separado de período, xit é um vetor 1 x K de 
variáveis explicativas, αi é o efeito não observado constante no 
tempo, e uit são erros idiossincráticos
• αi : aleatório ao longo das variáveis observadas
Painel 7
Modelo Básico
• Pressuposto: exogeneidade contemporânea condicional 
em αi :
E(uit|xit, αi) = 0, t = 1, . . . ,T
• Equação define β no sentido que, dados os pressupostos:
E(yit|xit, αi) = ηt + xitβ + αi
• Tal que os βj são efeitos parciais, mantendo αi fixo
• Contudo, β não é identificado somente sob este 
pressuposto; necessário adicionar outro forte pressuposto 
→ Cov(xit, αi) = 0
Painel 8
Modelo Básico
• Permitindo alguma correlação entre xit e αi ao 
assumir exogeneidade estrita condicional em αi :
E(uit|xi1, xi2, . . . , xiT, αi) = 0, t = 1, . . . ,T
• Que pode ser expresso:
E(yit|xi, αi) = E(yit|xit, αi) = ηt +βxit + αi
• se βxit : t = 1, . . . ,T varia ao longo do tempo, β pode 
ser estimado de forma consistente por efeitos fixos 
(FE) ou por primeiras diferenças (FD) ou mínimos 
quadrados generalizados (GLS) ou método dos 
momentos generalizados (GMM)
Painel 9
Modelo Básico
• Pressuposto chave para efeitos aleatórios:
E(αi|xi) = E(αi)
• MQO empilhado (pooled OLS) ou qualquer 
procedimento GLS, incluindo o estimador de efeitos 
aleatórios, são consistentes 
• Inferência robusta está disponível para ambos
Painel 10
Modelo Básico
• Pressupostos do modelo de efeitos fixos:
a) αi são tratados como parâmetros (ou seja, diferentes 
interceptos individuais) → abordagem de dummies
b) αi são variáveis aleatórias correlacionadas com todos os 
regressores → EF
Painel 11
Modelo de componentes do erro
itkitkititit xxxy  +++++= ...22110
itiit u+=
Termo de erro compostoConstante entre indivíduos
Erro com distribuição 
normal
),0(~ 2uit Nu 
Variáveis 
explicativas
Painel 12
Um ou dois componentes do erro?
itiit u+=
Efeito
Individual
Erro 
aleatório
Efeito de
Período
ititit u++= 
Painel 13
Tratamento dos efeitos individuais
• Efeitos fixos: αi constantes
• Efeitos aleatórios: αi extraídos independentemente 
da alguma distribuição de probabilidade
Modelo com uma entrada → 2 opções para 
o tratamento dos efeitos individuais
Painel 14
Estimação do modelo linear de efeitos fixos
• para ilustrar a identificação e estimação a partir de dados de 
painéis, deve-se iniciar com a análise de um modelo linear 
simples com efeitos individuais fixos:
yit =x´itβ + i + uit
• i=1, …, N; t = 1, ..., T
• onde β é o parâmetro de interesse; o indexador i se refere 
aos indivíduos e assume-se que o banco de dados é uma 
série de cross sections independentes, tal que observações 
sobre N indivíduos estão disponíveis a cada período (dado 
que diferentes indivíduos são observados em cada período, 
isto implica que i não vai de 1 a N em cada t)
Painel 15
Estimação do modelo linear de efeitos fixos
• se os efeitos individuais i não são correlacionados com as 
variáveis explicativas em xit, este modelo pode ser estimado 
a partir de cross sections repetidas ao agregar (pooling) 
todas as observações e utilizar MQO tratando i + uit como 
um termo de erro composto
• o problema em se usar dados de cross sections repetidas é 
que a variância de i não pode ser identificada; além disto, o 
estimador resultante pode ser menos eficiente do que um 
banco de dados de painel genuíno
Painel 16
Estimação do modelo linear de efeitos fixos
• contudo, em várias aplicações, os efeitos individuais i 
tendem a ser correlacionados com as variáveis explicativas 
em xit, tal que procedimentos de estimação tratando i como 
extrações aleatórias de alguma distribuição (como no 
modelo de efeitos aleatórios) leva a estimadores 
inconsistentes, a menos que a correlação seja considerada 
explicitamente
• quando dados de painel são disponíveis, este problema é 
solucionado tratando os i como parâmetros fixos 
desconhecidos; esta estratégia não se aplica se não há 
observações repetidas sobre os mesmos indivíduos
Painel 17
Modelo de Efeitos Fixos 
( ) itkitkititiit uxxxy ++++++=  ...22110
Painel 18
0
10
20
30
40
50
60
-5 0 5 10 15 20
Diferente Constante para Cada Indivíduo
Individual 1
Individual 2
Individual 3
Individual 4
Graficamente
Painel 19
0
10
20
30
40
50
60
-5 0 5 10 15 20
Individual 1
Individual 2
Individual 3
Individual 4
Linear (Individual 1)
Linear (Individual 2)
Linear (Individual 3)
Linear (Individual 4)
A
A
B
B
A inclinação estimada é BB e não AA; inclinação de BB
é a mesma para cada indivíduo, somente a constante varia
Painel 20
Combinações Possíveis de Inclinações e Interceptos
Inclinações constantes
Interceptos variáveis Inclinações variáveis
Interceptos variáveis
Inclinações variáveis
Intercepto constante
Inclinações constantes
Interceptos constantes
Pressupostos 
exigidos para este 
modelo não são 
verificados
Modelo de 
Efeitos Fixos
Regressão separada 
para cada indivíduo
Improvável
Painel 21
Construção do modelo de efeitos fixos: eliminação da 
heterogeneidade não observada por primeiras diferenças
( ) ( )
( ) ( )
itkitkititit
ititkitkitk
itititititit
itkitkititi
itkitkititiitit
itkitkititiit
uxxxy
uuxx
xxxxyy
uxxx
uxxxyy
uxxxy
++++=
−+−+
+−+−=−
−−−−−−−
++++++=−
++++++=
−−
−−−−
−−−−
−






...
...
......
...
2211
11
1222111111
111221110
221101
22110
Equação original
Defasar um período e subtrair
Equação transformada
Constante e efeitos individuais eliminados
Painel 22
Alternativa às Primeiras Diferenças: Desvios das Médias 
Individuais →Modelo de Efeitos Fixos
Aplicação de mínimos quadrados fornece o estimador de 
primeiras diferenças: funciona quando há 2 períodos. 
Forma mais geral de eliminar os efeitos fixos quando há mais 
de 2 períodos → usar desvios das médias individuais. 
Seja x1i. a média da variável x1 para o indivíduo i, ao longo de 
todos os períodos. Calcular as médias para cada variável 
(incluindo y) e subtrair as médias: 
( ) ( ) itkikitkiitiiiit uxxxxyy +−++−+−+−=− ..111.00. ... 
itkitkititit uxxxy ++++=  ...2211
A constante e os efeitos individuais também são eliminados por esta transformação
Painel 23
Estimação do Modelo de Efeitos Fixos
Usar os desvios em relação às médias individuais e 
aplicar mínimos quadrados – efeitos fixos, LSDV ou 
estimador “within”
( ) ( ) itkikitkiitiit uxxxxyy +−++−=− ..111. ... 
Chamado de estimador “within” porque se baseia em variáveis 
intra-individuais, e não entre indivíduos. 
Há outro estimador que usa somente a informação sobre as 
médias individuais → estimador “between”.
O modelo de efeitos aleatórios é uma combinação do estimador 
de efeitos fixos (“within”) e do estimador “between”.
Painel 24
3 formas de estimação de β
( )
...
...
'
'
'
iii
iitiitiit
ititit
xy
xxyy
xy



+=
−+−=−
+=
global
within
between
Estimador global é uma média ponderada dos 
estimadores “within” e “between”; somente será 
eficiente se estes pesos estiverem corretos. 
Estimador de efeitos aleatórios usa os pesos corretos.
Painel 25
Análise de Dados de Painéis em 2 Períodos 
• tipo mais simples de dados de painel: para uma cross-section 
de indivíduos, escolas, firmas, municípios, etc., temos 2 anos 
de dados; t = 1 e t = 2; estes anos não precisam ser 
adjacentes, mas t = 1 corresponde ao ano inicial
• exemplo: dado sobre taxas de desemprego e taxas de 
criminalidade para municípios em 1982 (t=1) e 1987 (t=2); 
usando a cross section de 1987 e rodando uma regressão 
simples de crim sobre desempr:
crimest = 128,38 – 4,16desempr
• n = 46, R2 = 0,033
Painel 26
Análise de Dados de Painéis em 2 Períodos 
• interpretando a equação estimada de forma causal, implica que um 
aumento na taxa de desemprego diminui a taxa de criminalidade, o que 
não é o esperado
• coeficiente de desempr não é estatisticamente significativo: não há 
associação entre as taxas de criminalidade e de desemprego
• esta equação de regressão simples sofre dos problemas de variáveis 
omitidas
• solução possível: controlar por mais fatores, tais como distribuição etária, 
por gênero, níveis educacionais, etc., em uma análise de regressão 
multivariada; mas vários fatores são difíceis de serem controlados; incluir 
a taxa de criminalidade de um ano anterior (1982) poderia ajudar a 
controlar o fato de que diferentes municípios têm historicamente 
diferentes taxas de criminalidade
• esta é uma maneira de usar 2 anos de dados para estimar um efeito causal
Painel 27
Análise de Dados de Painéis em 2 Períodos 
• maneira alternativa de usar dados de painel: ver fatores não observados 
que afetam a variável dependente como de 2 tipos - constantes e que 
variam ao longo do tempo
• se i é a unidade cross-section e t o período, o modelo com uma variável 
explicativa observada é:
yit = 0 + 0d2t + 1xit + ai + uit ; t = 1,2
• em yit, i denota uma pessoa, firma, município, etc. e t denota o período
• a variável d2t é uma variável dummy igual a 0 se t =1 e 1 quando t=2, e que 
não muda entre os i
• assim, o intercepto para t=1 é 0, e o intercepto para t=2 é 0 + 0
• tal como no uso de cross sections independentes acumuladas, permitir que 
o intercepto varie ao longo do tempo é importante na maioria das 
aplicações
Painel 28
Análise de Dados de Painéis em 2 Períodos 
• variável ai capta todos os fatores constantes no 
tempo, não observados, que afetam yit; é chamada de 
efeito fixo (ou heterogeneidade não observada)
• o erro uit é o erro idiossincrático ou que varia no 
tempo, porque representa fatores não observados 
que mudam ao longo do tempo e afetam yit
• como o parâmetro de interesse, 1, seria estimado, 
dados 2 anos de dados de painel? Uma possibilidade 
é acumular os 2 anos e usar MQO; este método tem 
desvantagens 
Painel 29
Análise de Dados de Painéis em 2 Períodos 
• para MQO empilhado produzir um estimador 
consistente de 1, temos que assumir que o efeito 
não observado ai não é correlacionado com xit:
yit = 0 + 0d2t + 1xit + vit
• onde vit = ai + uit é oerro composto
• devemos assumir que vit não é correlacionado com 
xit, onde t=1 ou 2, para MQO estimar 
consistentemente 1; 
• isto é verdade quando usamos uma cross section ou 
acumulamos 2 cross sections
Painel 30
Análise de Dados de Painéis em 2 Períodos 
• assim, mesmo se assumimos que o erro 
idiossincrático uit não é correlacionado com xit, MQO 
acumulada é viesada e inconsistente se ai e xit são 
correlacionadas
• viés resultante na MQO acumulada é chamado de 
viés de heterogeneidade, mas é realmente o viés 
causado pela omissão de uma variável constante no 
tempo
• MQO empilhado não resolve o problema de variáveis 
omitidas
Painel 31
Análise de Dados de Painéis em 2 Períodos 
• na maioria das aplicações, a principal razão para usar 
dados de painel é permitir que o efeito não 
observado, ai, seja correlacionado com as variáveis 
explicativas
• no exemplo, seria permitir que fatores não 
mensurados do município em ai que afetam a taxa de 
criminalidade sejam também correlacionados com a 
taxa de desemprego
• assim, porque ai é constante ao longo do tempo, 
podemos diferenciar os dados entre os 2 anos
Painel 32
Análise de Dados de Painéis em 2 Períodos 
• para uma observação cross section i, os 2 anos seriam
yi2 = (0 + 0) + 1xi2 + ai + ui2
yi1 = 0 + 1xi1 + ai + ui1
• e subtraindo a segunda equação da primeira
(yi2 - yi1) = 0 + 1 (xi2 - xi1) + (ui2 - ui1)
yi = 0 + 1xi + ui
• onde  denota a mudança de t = 1 para t = 2; o efeito não 
observado, ai, não aparece nesta última equação (foi 
diferenciado para fora); intercepto também é a mudança do 
intercepto de t = 1 para t = 2 
Painel 33
Análise de Dados de Painéis em 2 Períodos 
• equação de primeiras diferenças é uma equação cross-section, 
mas cada variável é diferenciada ao longo do tempo
• análise usando métodos MQO, dado que os pressupostos 
sejam satisfeitos; o mais importante é que ui não seja 
correlacionado com xi; este pressuposto se aplica se o erro 
idiossincrático em cada período t, uit, não é correlacionado 
com a variável explicativa em ambos os períodos, sendo uma 
versão do pressuposto de exogeneidade estrita
• pressuposto elimina o caso em que xit é a variável dependente 
defasada yi,t-1; é permitido aqui que xit seja correlacionado com 
os não observáveis que são constantes no tempo; o estimador 
MQO de 1 é o estimador de 1ªs diferenças
Painel 34
Análise de Dados de Painéis em 2 Períodos 
• outra condição: xi tem alguma variação entre os i, ou seja, 
não é verificada se a variável explicativa não muda ao longo do 
tempo para nenhuma observação cross-section, ou se muda 
pelo mesmo montante para todas as observações
• Exemplo: se i denota um indivíduo e xit é uma variável dummy 
para gênero, xi = 0 para todos os i; claramente não é possível 
estimar a equação por MQO
• intuição: dado que permitimos que ai seja correlacionado com 
xit, não podemos separar o efeito de ai em yit do efeitode 
qualquer variável que não mude ao longo do tempo
Painel 35
Análise de Dados de Painéis em 2 Períodos 
• outra condição para usarmos MQO: a equação deve 
satisfazer o pressuposto de homocedasticidade; se 
não é verificada podemos testar e corrigir a 
heterocedasticidade
• assumindo que a equação satisfaça a todos os 
pressupostos do modelo linear clássico, os 
estimadores MQO são não viesados e toda a 
inferência estatística é exata neste caso 
Painel 36
Análise de Dados de Painéis em 2 Períodos 
• mesmo não partindo do modelo de efeitos fixos, usar 
diferenças ao longo do tempo é intuitivo
• ao invés de estimar uma relação cross section padrão, que 
poderia sofrer de variáveis omitidas, dificultando as 
conclusões ceteris paribus, a equação yi = 0 + 1xi + ui 
explicitamente considera como mudanças na variável 
explicativa ao longo do tempo afetam a mudança em y ao 
longo do mesmo período
• ainda assim, é importante ter a equação yit = 0 + 0d2t + 1xit + 
ai + uit em mente, já que mostra como estimamos o efeito de 
xit sobre yit, mantendo ai constante
Painel 37
Análise de Dados de Painéis em 2 Períodos 
•mesmo tendo coletado uma base de dados de painel, 
a diferenciação usada para eliminar ai pode reduzir 
muito a variação das variáveis explicativas; embora xit
tenha uma variação substancial na cross section para 
cada t, xi pode não apresentar tanta variação, o que 
levaria a grandes erros padrões MQO
• usar uma grande cross-section seria uma solução, 
assim como usar diferenças maiores ao longo do 
tempo
Painel 38
Análise de Dados de Painéis em 2 Períodos 
• adicionar outras variáveis explicativas não traz 
dificuldades; no modelo de efeitos fixos:
yit = 0 + 0d2t + 1xit1 + 2xit2 + … + kxitk + ai + uit
• dados de painel também podem ser usados para 
estimar modelos com defasagem finita distribuída; 
mesmo se especificamos a equação para somente 2 
anos, é necessário coletar mais anos de dados para 
obter as variáveis explicativas defasadas
Painel 39
Estimação de Efeitos Fixos 
Painel 40
Estimação de Efeitos Fixos 
Painel 41
Estimação de Efeitos Fixos 
Painel 42
Estimação de Efeitos Fixos 
• adicionar mais variáveis explicativas à equação causa poucas 
mudanças: a partir do modelo original, apenas usamos os 
desvios de cada variável explicativa (incluindo as dummies de 
período) em relação a sua média, e rodamos uma regressão 
MQO acumulada usando todas as variáveis
• sob o pressuposto de estrita exogeneidade das variáveis 
explicativas, o estimador de efeitos fixos não é viesado
• o erro idiossincrático uit não deve ser correlacionado com as 
variáveis explicativas ao longo de todo o tempo estudado
Painel 43
Estimação de Efeitos Fixos 
Painel 44
Estimação de Efeitos Fixos 
• há um ponto sutil na determinação dos graus de liberdade 
para o estimador de efeitos fixos
• quando estimamos a equação dos desvios através de MQO 
empilhado, temos NT observações e k variáveis 
independentes, sendo o intercepto eliminado na 
transformação de efeitos fixos
• assim, aparentemente teríamos NT-k graus de liberdade, mas 
não temos; para cada observação cross section i, perdemos 1 
grau de liberdade devido à transformação em desvios; ou seja, 
para cada i, os erros üit somam 0 quando somados ao longo de 
t, tal que perdemos 1 grau de liberdade; assim, os graus de 
liberdade são NT-N-k = N(T-1)k
Painel 45
Estimação de Efeitos Fixos 
• ao estimar um modelo de efeitos fixos, não é claro como é calculada uma 
medida de qualidade de ajuste do modelo; R2 se baseia na transformação 
interna, assim é interpretado como o montante de variação no tempo em 
yit que é explicado pela variação no tempo das variáveis explicativas
• embora variáveis constantes no tempo não possam ser incluídas em um 
modelo de efeitos fixos, podem ser interagidas com variáveis que mudam 
ao longo do tempo, em particular com as dummies de período
• Exemplo: na equação salarial em que educação é constante ao longo do 
tempo para cada indivíduo, podemos interagir educação com cada dummy 
de período e ver como o retorno à educação mudou ao longo do tempo; 
mas não podemos usar efeitos fixos para estimar o retorno à educação no 
período de referência, o que significa que não podemos estimar em 
qualquer período; podemos somente ver como o retorno à educação em 
cada ano difere daquele do período de referência
Painel 46
Estimação de Efeitos Fixos 
• quando é incluída uma série completa de dummies de período, 
não podemos estimar o efeito de qualquer variável cuja 
mudança ao longo do tempo é constante
• Por exemplo: anos de experiência em uma base de dados de 
painel, onde cada pessoa trabalha a cada ano, tal que a 
experiência sempre aumenta 1 a cada ano, para todos na 
amostra; a presença de ai considera as diferenças entre as 
pessoas em seus anos de experiência no período inicial; mas 
então o efeito de um ano de aumento na experiência não pode 
ser distinguido dos efeitos médios de período
• Isto também ocorreria se fosse usada uma tendência linear no 
tempo ao invés de dummies de período: para cada pessoa, a 
experiência não pode ser distinguida de uma tendência linear
Painel 47
Efeitos Fixos ou Primeira Diferenciação (EF ou PD)?
• até aqui, 2 métodos para estimar modelos com efeitos não 
observados: (1) diferenciar os dados; (b) desvios em relação à 
média
• como saber qual usar?
• quando T=2, as estimativas EF e PD e todas as estatísticas de 
teste são idênticas; PD tem a vantagem de ser mais direta, e é 
mais fácil calcular estatísticas robustas à heterocedasticidade
• quando T  3, os estimadores EF e PD não são iguais; dado que 
ambos são não viesados, não podemos usar o viés como 
critério; ambos são consistentes (com T fixo e N → ); para 
grandes N e pequenos T, a escolha deve se basear na eficiência 
relativa dos estimadores, que é determinada pela correlação 
serial dos erros uit (assumindo homocedasticidade)
Painel 48
Efeitos Fixos ou Primeira Diferenciação (EF ou PD)?
• quando os uit não são serialmente correlacionados, EF 
é mais eficiente; portanto, como o modelo de efeitos 
não observados é tipicamente reportado com erros 
não correlacionados, estimador EF é mais usado
• contudo, este pressuposto pode ser falso, já que os 
fatores não observados que mudam ao longo do 
tempo tendem a ser serialmente correlacionados; se 
uit segue um passeio aleatório – o que significa que há 
correlação serial substancial e positiva – então a 
diferença uit não é serialmente correlacionada e PD é 
melhor
Painel 49
Efeitos Fixos ou Primeira Diferenciação (EF ou PD)?
• é difícil testar se uit são serialmente correlacionados 
após a estimação EF, já que estimamos os desvios dos 
erros, mas não os próprios uit
• contudo, é possível testar se os erros diferenciados 
uit não apresentam correlação serial; se este é o 
caso, PD pode ser usado
• se há correlação serial negativa e grande nos uit, EF é 
melhor
Painel 50
Efeitos Fixos ou Primeira Diferenciação (EF ou PD)?
• quando T é grande, e principalmente quando N não é grande, 
devemos ter cautela com o estimador EF; embora resultados 
distribucionais exatos se apliquem para qualquer N e T sob os 
pressupostos de efeitos fixos clássicos, inferência pode ser 
sensível a violações dos pressupostos quando T é grande e N 
não
• inferência com o estimador EF é mais sensível à não 
normalidade, heterocedasticidade e correlação serial dos erros
• por outro lado, EF é menos sensível à violação do pressuposto 
de estrita exogeneidade, principalmente com T grande; 
recomenda-se estimar modelos EF com variáveis dependentes 
defasadas
Painel 51
Efeitos Fixos em Painéis Desbalanceados
• com anos ou unidades faltantes na amostra, mecanismode estimação de EF: se Ti é o número de períodos para a 
unidade cross section i, estas Ti observações são usadas 
para calcular os desvios em relação à média
• número total de observações é então T1 + T2 + ... + TN; 
novamente, um grau de liberdade é perdido para cada 
observação cross section
• painel desbalanceado não causa problemas se a razão 
para os dados faltantes para algum i (atrição) não é 
correlacionado com os erros uit (fatores não observados 
que mudam ao longo do tempo e afetam yit)
Painel 52
Efeitos Fixos em Painéis Desbalanceados
• se é correlacionado: o problema de viés de seleção 
pode levar a estimadores viesados
• entretanto, análise EF permite que a atrição seja 
correlacionada com ai, o efeito não observado, dado 
que, na amostragem inicial, algumas unidades tendem 
mais a sair da pesquisa, e isto é captado por ai
Painel 53
Estimação de Efeitos Aleatórios
Painel 54
Estimação de Efeitos Aleatórios
Painel 55
Estimação de Efeitos Aleatórios
Painel 56
Estimação de Efeitos Aleatórios
Painel 57
Estimação de Efeitos Aleatórios
Painel 58
Estimação de Efeitos Aleatórios
• esta transformação permite variáveis explicativas que são 
constantes ao longo do tempo, e é uma vantagem dos EA sobre 
os EF ou PD
• isto é possível porque EA assume que o efeito não observado 
não é correlacionado com todas as variáveis explicativas, fixas 
ao longo do tempo ou não
• Exemplo: na equação salarial, incluímos uma variável como 
educação, mesmo que não mude ao longo do tempo; mas 
estamos assumindo que educação não é correlacionada com ai, 
que contém background familiar e habilidade
• em várias aplicações, a razão para usar dados de painel é 
permitir que o efeito não observado seja correlacionado com 
as variáveis explicativas
Painel 59
Estimação de Efeitos Aleatórios
Painel 60
Modelo de Efeitos Aleatórios
itikitkititit
itkitkititit
uxxxy
xxxy
++++++=
+++++=


...
...
22110
22110
Equação original
αi como parte do termo de erro
itiit u+=
Lembrando
Painel 61
A estrutura da variância nos efeitos aleatórios
itktodosparaxE
stEstE
tiparatodosuEE
uEEuE
ikit
isituit
iiti
uitiit
,,0)(
;,)(;)(
,0)(;)(
;)(;0)()(
2222
22
22
=
==+=
==
===






No modelo de efeitos aleatórios, pressupomos que αi são parte do termo de 
erro composto eit. Para construir um estimador eficiente, é necessário avaliar 
a estrutura do erro e depois aplicar um estimador apropriado de mínimos 
quadrados generalizados para encontrar um estimador eficiente. Os seguintes 
pressupostos devem ser verificados se o estimador é eficiente:
Pressuposto crucial para o modelo RE: é necessário para a consistência do 
modelo RE, mas não para FE. Pode ser testado com o teste de Hausman.
Painel 62
A estrutura da variância nos efeitos aleatórios
( ) T tamanhode unitário vetorum1.....111'
'
..
....
)( então );,...,(
22
2222
2
2222
22222
'
21
'
éeeonde
eeI
E
u
u
u
u
iiiTiii
=
=+=














+
+
+
==










Derivar a matriz T x T que descreve a estrutura da variância de eit
para o indivíduo i. Dado que li aleatoriamente extraído está presente
em todos os períodos, há uma correlação entre cada par de 
períodos para este indivíduo.
Painel 63
Efeitos Aleatórios (Estimação GLS)
22
2/1 -1= '
1
u
u
T
u T
ondeee
T
I 
  +






−=−
-1
' 1 ' 1
1 1
ˆ = ( )
N N
RE i i i i
i i
X X X y − −
= =
 
  
 
 
O estimador de efeitos aleatórios tem a forma padrão de 
mínimos quadrados generalizados somada ao longo de todos 
os indivíduos:
Onde, dado :
Painel 64
Efeitos Fixos (Estimação GLS)
'
1
 onde )(=ˆ
1
'
-1T
1i
' ee
T
IMMyXMXX T
T
i
iiiiFE −=






==

O estimador de efeitos fixos também pode ser expresso
na forma GLS, que revela sua relação com o estimador RE: 
Pré-multiplicando uma matriz de dados X por M tem 
o efeito de construir uma nova matriz X*, composta 
por desvios em relação às médias individuais. O 
estimador FE usar M com a matriz de ponderação, ao 
invés de .
Painel 65
Relação entre os modelos de efeitos 
aleatórios e fixos
O estimador de efeitos aleatórios é uma combinação ponderada dos
estimadores “within” e “between”. O estimador “between” é:
.aleatório) erro ao relação em pequenos são
 sindividuai efeitos os (porque MQO a ecorrespond 0
.aleatórios erros aos
 nterelativame grande é sindividuai efeitos dos adevariabilid
 a quando ocorre Isto coincidem. FE e RE sestimadore
 os então1 se que forma de de depende 
ˆ)(ˆˆ
→
→
−+=


 WithinKBetweenRE I
Painel 66
Estimação de Efeitos Aleatórios
• relacionando o estimador EA com os efeitos MQO empilhado e 
EF: 
→MQO acumulado é obtido quando  = 0 e EF quando  = 1
→na prática  estimado nunca é 0 ou 1, mas próximo; 
→quando  estimado é próximo de 0, as estimativas EA se 
aproximam das de MQO acumulado; este é o caso quando o 
efeito não observado ai não é relativamente importante (dada 
sua pequena variância em relação a 2u)
→é mais comum que 2α seja grande em relação a 
2
u, quando 
estimado é próximo de 1
→na medida que T aumenta,  estimado tende a 1, tornando as 
estimativas EA e EF similares
Painel 67
Estimação de Efeitos Aleatórios
• mais intuições sobre os méritos relativos de EA vs. EF: 
vit - vi,med = (1-) αi + uit - ui,med
• expressão mostra que os erros na equação transformada usada 
na estimação EA ponderam o efeito não observado por (1-)
• embora a correlação entre ai e um ou mais xitj cause 
inconsistência na estimação EA, a correlação é atenuada por (1-
); na medida que  tende para 1, o termo de viés tende a zero, 
porque o estimador EA tende ao de EF; se  tende a 0, deixa-se 
uma grande fração do efeito não observado no termo de erro, 
e o viés assintótico do estimador EA será maior
Painel 68
Pressupostos para EF
Painel 69
Pressupostos para EF
• Sob estes 4 pressupostos (idênticos para o estimador de 1ªs 
diferenças), o estimador EF não é viesado, sendo a chave a 
exogeneidade estrita, e o estimador EF é consistente com um 
T fixo na medida que N tende a infinito
5. var (uit|Xi, αi) = var (uit) = 
2
u para todos os t=1,...,T
6. para todos os t  s, os erros idiossincráticos não são 
correlacionados (condicional a todas as variáveis explicativas e 
ai): cov (uit, uis|Xi, αi) = 0
• Sob pressupostos 1 a 6, estimador EF dos j é o melhor 
estimador linear não viesado (BLUE); dado que o estimador de 
PD é linear e não viesado, é necessariamente pior que EF. O 
pressuposto que torna EF melhor é o 6, que implica que os 
erros são serialmente não correlacionados.
Painel 70
Pressupostos para EF
7. condicional a Xi e αi, os uit são independente e identicamente 
distribuídos como N(0, 2u)
• Este pressuposto implica 3, 5 e 6, mas é mais forte porque 
assume uma distribuição normal dos erros. Neste caso, o 
estimador tem distribuição normal, e as estatísticas t e F têm 
distribuições t e F exatas
• Sem 7, podemos confiar em aproximações assintóticas, que 
requerem grandes N e pequenos T. 
Painel 71
Pressupostos para EA
• Pressupostos ideais EA incluem os de EF 1, 2, 3, 5, 6; mas agora 
permitem variáveis constantes no tempo
• Necessários pressupostos sobre como αi se relaciona com as 
variáveis explicativas.
3. valor esperado de αi, dadas as variáveis explicativas, constante: 
E(αi|Xi) = 0• Isto exclui a correlação entre o efeito não observado e as variáveis 
explicativas, e é a distinção chave entre EF e EA
• Assumindo que αi não é correlacionado com todos os elementos de 
xit, possível incluir variáveis explicativas constantes no tempo
• Permite-se uma esperança não zero para αi com este pressuposto, 
tal que o modelo sob os pressupostos EA contém um intercepto 0
Painel 72
Pressupostos para EA
Painel 73
Efeitos Fixos ou Aleatórios?
Vantagens dos efeitos aleatórios:
• são eficientes
• porque devemos assumir uma parte dos não observáveis 
como fixa e outra aleatória?
• lida com regressores fixos entre indivíduos
Desvantagens:
É provável que haja correlação entre os efeitos não 
observáveis e as variáveis explicativas, o que implica em 
inconsistência devido a variáveis omitidas no modelo RE. 
Nesta situação, FE é ineficiente, mas consistente.
Painel 74
EA ou EF?
• decisão pode se basear em se os αi são vistos como parâmetros 
a serem estimados ou resultados de uma variável aleatória
• quando não podemos considerar as observações como 
aleatórias a partir da população (e.g. municípios), faz sentido 
pensar em αi como parâmetros a estimar e usar o método EF 
(lembrando que usar EF é como permitir um intercepto 
diferente para cada observação, e é possível estimar estes 
interceptos incluindo variáveis dummies)
• decidindo tratar αi como variáveis aleatórias, temos que decidir 
se αi não são correlacionados com as variáveis explicativas; 
assumir que αi é aleatório não significa automaticamente que 
EA é a estratégia apropriada de estimação
Painel 75
EA ou EF?
• se podemos assumir que αi não são correlacionados com todos 
os xit, o método EA é apropriado; mas, se αi são correlacionados 
com algumas variáveis explicativas, o método EF (ou PD) é 
necessário
• comparar as estimativas EA e EF pode ser um teste para a 
correlação entre αi e xitj, assumindo que os erros e variáveis 
explicativas não são correlacionados ao longo dos períodos; 
teste de Hausman
Painel 76
EA ou EF?
• na medida em que os efeitos específicos são inseridos na 
equação estimada (explicitamente ou implicitamente através 
dos desvios em relação à média), a correlação entre esses 
efeitos e os regressores deixa de causar endogeneidade e passa 
a causar multicolinearidade
• portanto, somente a variação temporal inerente a cada 
unidade é utilizada na estimação, ou seja, toda variação cross-
section é eliminada; além disso, o estimador de efeitos 
aleatórios utiliza uma média ponderada da variação cross-
section e da variação temporal, atribuindo à temporal um peso 
maior que o estimador de MQO, que ignora a distinção entre as 
dimensões; isto tem implicações sobre as propriedades desses 
estimadores:
Painel 77
EA ou EF?
• somente os regressores com alguma variação temporal podem ser incluídos na 
regressão, o que inviabiliza incluir variáveis como educação (após conclusão dos 
estudos), sexo e cor, em um modelo com efeitos fixos
• a variação utilizada pelo modelo de efeitos fixos para estimar a relação de 
interesse é menor que a utilizada pelo estimador de efeitos aleatórios, o que 
diminui sua eficiência; isto é, o estimador de efeitos fixos estima N parâmetros 
(efeitos específicos), além dos K parâmetros associados às variáveis explicativas; 
por outro lado, o estimador de efeitos aleatórios utiliza o mesmo número de 
observações para estimar somente 2 parâmetros suplementares, os necessários 
para estimar a matriz de covariância das variáveis aleatórias
Painel 78
Testes de Hipóteses
• Acumulação dos dados (Teste de Chow)
• Efeitos individuais e fixos (Breusch-Pagan)
• Correlação entre Xit e li (Hausman)
Painel 79
Teste para Acumulação dos Dados
• Hipótese nula (irrestrita): regressões distintas para 
cada indivíduo
• Hipótese alternativa (restrita): indivíduos têm os 
mesmos coeficientes, sem componentes do erro 
(erro simples)
• Teste F: Chow
Painel 80
Teste para Efeitos Individuais
• Breusch-Pagan:
• Distribuição 2
2
• Testes de efeitos individuais e temporais podem 
ser derivados, distribuídos como c1
2
2 2: 0oH   = =
Painel 81
Teste de Hausman 
Testa qual modelo é apropriado: FE ou RE
H0: E(li|xit) = 0
Se não há correlação entre os regressores e os efeitos, ambos FE 
e RE são consistentes, mas FE é ineficiente.
Se há correlação, FE é consistente e RE é inconsistente.
Sob a hipótese nula de não haver correlação, não há diferenças 
entre os estimadores.
Painel 82
Teste para independência entre li e xkit.
A covariância de um estimador eficiente e sua diferença em 
relação ao estimador ineficiente deve ser zero. Assim, sob a 
hipótese nula, o teste é:
)(~)(ˆ)'(=W 2RE
1
RE kFEFE  −− −
Se W é significante, não devemos usar o estimador RE.
Teste de Hausman 
Painel 83
EA ou EF?
• Teste de Hausman: H0: há efeitos aleatórios vs. H1: há efeitos fixos
• sob H0, ambos os estimadores (EF, EA) são consistentes, mas EF é ineficiente
• sob H1, o estimador de efeitos aleatórios é inconsistente
• intuição do teste: se há efeitos fixos, os estimadores EA e EF serão muito 
diferentes; se há efeitos aleatórios, eles estarão próximos → teste Wald para 
verificar a diferença entre os 2 vetores de inclinações
• W = (EF - EA {Var[ EF- EA] }-1 (EF- EA)
• Var[ EF- EA] → covariância entre um estimador eficiente de um parâmetro e a 
diferença entre ele e um estimador ineficiente é zero
Painel 84
EA ou EF?
• sob H0: Cov[EA , (EA - EF)] = 0 = Var[EA] - Cov[EA,EF]
• assim, Cov[EA,EF] = Var[EA]
• e, Var[EF - EA] = VAR[EF] + VAR[EA] - 2Cov[EA,EF] = Var[EF] - Var[EA] 
• teste então usa os 2 estimadores e as 2 matrizes estimadas de covariância