Buscar

ECONOMETRIA_II_2_Modelos_de_Regressao_co (3)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 63 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 63 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 63 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
ECONOMETRIA II 
 
2 – Modelos de Regressão com Dados em Painel 
 
2.1 – Introdução 
Até este momento usamos dois tipos de dados: cortes transversais (cross-
section) e séries temporais. 
No primeiro, são coletados dados de algumas variáveis para várias unidades 
amostrais (famílias, empresas, pessoas, etc) no mesmo período de tempo. Já 
no segundo são coletados dados de várias variáveis ao longo do tempo. 
Atualmente, em econometria é cada vez mais comum encontrar análises de 
regressão que combinam tanto dados de cross-section como dados de séries 
temporais. 
Basicamente, temos dois tipos de conjuntos de dados que possuem essa 
combinação: Agrupamento de Cortes Transversais e Dados em Painel. 
Agrupamento de Cortes Transversais: 
Um agrupamento independente de cortes transversais corresponde a uma 
amostra aleatória de dados de uma população grande em diferentes períodos de 
tempo. Exemplo: 
Preço de imóveis em função de algumas características 
Nº obs Ano Preço do 
imóvel 
Nº de 
Quartos 
Distância do 
Centro 
1 2000 100000 2 5 
2 2000 152000 4 10 
3 2000 28000 1 30 
4 2000 200000 4 7 
... .... .... .... .... 
100 2000 70000 3 3 
101 2000 450000 5 7 
102 2000 135000 3 15 
103 2005 200000 3 3 
... .... .... .... .... 
200 2005 80000 2 3 
 
No agrupamento de cortes transversais o nº de observações em cada ano pode 
ser diferente, além é claro de não existir a necessidade de temos anos 
seqüências no conjunto dos dados. 
 
2 
Neste caso, a única exigência é que os dados sejam extraídos de maneira 
independente (aleatória), o que elimina a correlação nos erros entre as 
diferentes observações. 
O uso do agrupamento de cortes transversais permite aumentar o tamanho da 
amostra, já que com isso podemos obter estimadores mais precisos e 
estatísticas mais poderosas. 
Dados em Painel: 
Um conjunto de dados em painel (ou dados longitudinais) consiste em uma série 
de tempo para cada membro do corte transversal da base de dados. Neste caso, 
a principal diferença dos dados em painel em relação aos dados agrupados é 
que na primeira as mesmas unidades do corte transversal (indivíduos, famílias, 
empresas, etc) são acompanhadas ao longo de um determinado período. A 
tabela abaixo mostra um exemplo de dados em painel: 
Estatísticas de crime para algumas cidades 
Nº obs Cidade Ano Nº 
hom. 
População Taxa de 
desemprego 
Nº de 
policiais 
1 1 1986 5 350000 8,4 550 
2 1 2006 7 360000 7,4 850 
3 2 1986 7 358000 8,5 700 
4 2 2006 10 385000 8,1 900 
5 3 1986 9 120000 13,1 350 
6 3 2006 12 135000 9 450 
... .... .... .... .... .... .... 
397 199 1986 25 550000 7,2 1200 
398 199 2006 32 640000 8,5 1550 
399 200 1986 17 280000 9,2 600 
400 200 2006 19 300000 9,7 680 
 
A tabela acima mostra um exemplo de painel equilibrado, ou seja, é um conjunto 
de dados na qual as variáveis são observadas para cada unidade e cada período 
do tempo. 
Já o painel desequilibrado, ocorre quando se observa a falta de dados em pelo 
menos um período de tempo para uma das unidades da amostra. A tabela 
acima foi modificada para gerar um painel desequilibrado: 
Nº obs Cidade Ano Nº 
hom. 
População Taxa de 
desemprego 
Nº de 
políciais 
1 1 1986 5 350000 8,4 550 
 
2 2 1986 7 358000 8,5 700 
3 2 2006 10 385000 8,1 
4 3 1986 9 120000 13,1 350 
 
3 
 
... .... .... .... .... .... .... 
397 199 1986 25 600000 
 
7,2 1200 
398 199 2006 32 640000 8,5 1550 
399 200 1986 17 275000 9,2 600 
400 200 2006 19 300000 8,3 680 
 
De acordo com Baltagi apud Gujarati (2006, pág 513) os dados em painel 
apresentam inúmeras vantagens em relação aos dados em cross-section e 
séries temporais: 
• Permite levar em conta as diferenças de heterogeneidade entre as 
unidades amostrais (famílias, empresas, etc); 
• Os dados em painel proporcionam dados mais informativos, mais 
variabilidade e menos colinearidade entre as variáveis, além de gerar 
mais graus de liberdade e mais eficiência; 
• Os dados em painel são mais adequados para o estudo de dinâmicas de 
mudança: períodos de desemprego, rotatividade no emprego e impactos 
de políticas públicas. 
 
2.2 – Estimações de Modelos de regressão com Agrupamentos de Cortes 
Transversais e Dados em Painel 
Existem várias maneiras de rodar modelos de regressão com o uso de 
Agrupamentos de Cortes Transversais ou Dados em Painel. Nesta seção 
abordaremos algumas dessas maneiras: 
 
2.2.1 – MQO Agrupados (Pooled MQO) 
 
Uma maneira simples de usar agrupamentos de cortes transversais ou dados 
em painel é desconsiderar as dimensões de tempo e espaço dos dados 
combinados e estimar a regressão usando MQO. Neste caso empilhamos todas 
as observações como se fossem apenas uma cross-section. 
Exemplo 1: Modelo de Investimento (Gujarati – pág. 515) 
O arquivo de Excel “exemplo painel gujarati” mostra dados sobre investimento, 
valor da empresa e estoque de quatro grandes empresas: GE, US, GM e WEST. 
 
4 
Os dados mostram para cada variável os dados relativos de cada uma dessas 
empresas no período de 1935-1954. Dessa forma temos 04 unidades de corte 
transversal (as empresas) e 20 unidades de séries temporais (20 anos). 
O modelo teórico é dado abaixo: 𝑌𝑖𝑡 = 𝛽1 + 𝛽2𝑋2𝑖𝑡 + 𝛽3𝑋3𝑖𝑡 (1) 
 
Onde: 𝑌𝑖𝑡 – Investimento 
 𝑋2 - Valor real da empresa 
 𝑋3 - Estoque real de capital 
Observe que o subscrito “i” serve para indicar as empresas (GM, GE, etc) 
enquanto o subscrito “t” indica o tempo. 
Inicialmente poderíamos rodar 20 regressões de corte transversal, uma para 
cada ano, embora neste caso ocorreria problemas com os graus de liberdade (4 
obs e 3 variáveis) 
O objetivo do método de MQO Agrupados é desconsiderar tanto as diferenças 
entre as unidades de corte transversal (as empresas) como as mudanças 
temporais. Dessa forma a equação (1) passa a ser: 𝑌𝑖 = 𝛽1 + 𝛽2𝑋2𝑖 + 𝛽3𝑖𝑋3𝑖 (2) 
Com isso, no exemplo, ao empilhar os dados de cada empresa uma embaixo da 
outra passamos a ter 80 observações (20anos x 04 empresas). Sendo que agora 
o subscrito “i” da equação (2) indica que temos 80 observações independentes. 
Vamos inserir os dados no Gretl. Abra o programa clique em Arquivo, Abrir 
Dados, Arquivo dos Usuários e selecione o arquivo. Indique que a base de 
dados será no formato de Painel. O Gretl vai abrir a seguinte tela de transição: 
 
Selecione Usar variáveis índice e indique a opção de emp para variável 
unidade e ano para a variável tempo. Teremos a seguinte tela: 
 
5 
 
 
Vamos estimar por MQO a equação (2). Clique em Modelo, Mínimo Quadrado 
Ordinário, insira a equação (2) e dê ok. A saída abaixo mostra os resultados: 
 
 
Analisando a saída acima se observa que: 
- Os coeficientes são significativos; 
- O valor do R2 é 0,75 
- O valor da estatística de DW é baixo o que indica uma possível autocorrelação 
nos dados. 
Com a saída de regressão acima, podemos realizar diversos testes 
econométricos: 
 
6 
1) Teste de Ramsey: é um teste para verificar erros de especificações1 em 
modelos de regressão. 
Clique no menu da saída em Teste, Reset de Ramsey. Selecione o tipo 
de especificação a ser testado (quadrados e cubos) e aperte ok. Teremos 
a seguinte saída: 
 
A hipótese nula do teste é que a especificação do modelo é adequada. 
Como o p-valor é menor que o nível de significância (0,00932<0,01) 
rejeitamos a hipótese nula. 
2) Teste Jacque-Bera: usado para verificar se os resíduos apresentam uma 
distribuição Normal. 
Clique no menu da saída em Teste, Normalidade dos Resíduos. O Gretl 
vai produzir uma saída com gráfico e outra com dados. Olhando a saída 
com dados temos: 
 
 
1 Erros de especificações podem ocorrer omissão (ou inclusão) de variável relevante, adoção de forma 
funcional errada ou erros de medida. 
 
7 
Como o p-valor é maior que o nível de significância (0,6278>0,01) 
aceitamos a hipótese nula, ou seja, os resíduos apresentam uma 
distribuição normal. 
Atenção: 
O problema do modeloMQO Agrupado é que a regressão considera que os 
oeficientes angulares das duas variáveis X (𝛽2 𝑒 𝛽3) são idênticos para as 
quatro empresas. Além também de considerar que o valor do intercepto 
vertical é o mesmo para as quatro empresas. 
Os gráficos abaixo mostram essa ideia: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
𝛽1𝑈𝑆 
𝛽1𝑊𝐸𝑆𝑇 
𝛽1𝐺𝐸 
𝛽1𝐺𝑀 
𝛽2𝑊𝐸𝑆𝑇 
𝛽2𝑈𝑆 𝛽2𝐺𝑀 
𝛽2𝐺𝐸 
𝛽1𝐺𝐸 = 𝛽1𝐺𝑀 = 𝛽1𝑈𝑆 = 𝛽1𝑊𝐸𝑆𝑇 
𝛽1𝐺𝐸 = 𝛽1𝐺𝑀 = 𝛽1𝑈𝑆 = 𝛽1𝑊𝐸𝑆𝑇 𝛽2𝐺𝐸 = 𝛽2𝐺𝑀 = 𝛽2𝑈𝑆 = 𝛽2𝑊𝐸𝑆𝑇 
𝛽2𝑊𝐸𝑆𝑇 
𝛽2𝑈𝑆 
𝛽2𝐺𝑀 
𝛽2𝐺𝐸 
X2 
y 
𝛽1𝑊𝐸𝑆 𝛽1𝑈𝑆 
𝛽1𝐺𝑀 
𝛽1𝐺𝐸 
y 
X2 
0,11 
 (a) (b) 
y 
 (c) X2 (d) X2 
y 
file:///E:/Fecap/Econometria/2010/2º%20semestre/gráficos%20notas%20de%20aula%20II.docx
file:///E:/Fecap/Econometria/2010/2º%20semestre/gráficos%20notas%20de%20aula%20II.docx
 
8 
 
 
 
 
Observe que: 
• O gráfico (a) mostra os resultados da regressão por MQO Agrupados, na qual 
o intercepto vertical é o mesmo para cada empresa (- 63,30414) bem como 
o coeficiente angular para a variável X2 (0,11); 
• O gráfico (b) mostra como seria se tivéssemos o mesmo coeficiente angular 
para as quatro empresas, porém com interceptos verticais diferentes; 
• O gráfico (c) mostra as empresas com o mesmo intercepto vertical, mas com 
coeficientes angulares diferentes; 
• O gráfico (d) considera todas as diferenças possíveis entre as empresas, ou 
seja, interceptos verticais diferentes, bem como coeficientes angulares 
diferentes. Este gráfico incorpora toda heterogeneidade entre as empresas. 
O próximo exemplo considera a possibilidade de que a população de dados 
possa ter distribuições diferentes em períodos de tempo diferentes, ou seja, 
considera interceptos verticais diferentes em cada período de tempo. 
Exemplo 2: Retorno da Educação e a Diferença Salarial por Gênero (Wooldridge 
pág.406). 
O modelo teórico é dado abaixo: log(𝑠𝑎𝑙á𝑟𝑖𝑜) = 𝛽0 + 𝛽1𝑒𝑑𝑢𝑐 + 𝛽2𝑒𝑥𝑝 + 𝛽3𝑒𝑥𝑝2 + 𝛽4𝑠𝑖𝑛𝑑 + 𝛽5𝑓𝑒𝑚 (3) 
Os dados correspondem a 551 observações do ano de 1978 e 534 observações 
do ano de 1985. 
O objetivo da análise é verificar se houve mudanças entre: 
• o retorno da educação entre os anos de 1978 e 1985; 
• o retorno de gênero entre 1978 e 1985. 
Para tanto vamos abrir o arquivo “exemplo wooldridge mqo” para montar uma 
dummy do ano de 1985 (d85), bem como dummies de interação (d85educ e 
d85fem). A figura abaixo mostra o arquivo em Excel: 
 
9 
 
As fórmulas dessas dummies para o Excel são dadas abaixo: 
• Coluna “d85” – Preencha a coluna com o nº zero para o ano 78 e o nº 1 
para o ano de 85; 
• Coluna “d85fem” – Use a fórmula: M2=L2*D2; 
• Coluna “d85educ” – Use a fórmula: N2 = L2*A2; 
• Coluna “d85sind” – Use a fórmula: O2 =L2*H2. 
Vamos inserir as dummies diretamente no Gretl. Clique em Arquivo, Abrir 
Dados, Arquivo dos Usuários e selecione o arquivo. Lembre que a base é no 
formato de Dados Agrupados, que nada mais é do que uma grande base no 
formato de Cross-Section. 
 
Observe que com a inclusão das dummies a equação (3) passa a ser: log(𝑠𝑎𝑙á𝑟𝑖𝑜) = 𝛽0 + 𝛽1𝐷85 + 𝛽2𝑒𝑑𝑢𝑐 + 𝛽3𝐷85𝑒𝑑𝑢𝑐 + 𝛽4𝑒𝑥𝑝 + 𝛽5𝑒𝑥𝑝2 + 𝛽6𝑠𝑖𝑛𝑑+ 𝛽7𝑓𝑒𝑚 + 𝛽8𝐷85𝑓𝑒𝑚 
 
10 
A dummy de ano vai assumir 1 se os dados forem do ano de 1985 e 0 se forem 
do ano de 1978. Clique na série chamada anos e observe que até a observação 
de número 550 se refere ao ano de 1978. 
Para inserir a dummy d85 clique em Acrescentar, Dummies para o intervalo 
de observações. Selecione o início para 551 e coloque o nome da variável: 
 
As dummies de interação são criadas com o comando Acrescentar, Definir 
nova variável. Usamos as seguintes fórmulas: 
D85educ=d85*educ 
D85fem=d85*fem 
Com as dummies criadas podemos rodar a equação abaixo: log(𝑠𝑎𝑙á𝑟𝑖𝑜) = 𝛽0 + 𝛽1𝐷85 + 𝛽2𝑒𝑑𝑢𝑐 + 𝛽3𝐷85𝑒𝑑𝑢𝑐 + 𝛽4𝑒𝑥𝑝 + 𝛽5𝑒𝑥𝑝2 + 𝛽6𝑠𝑖𝑛𝑑+ 𝛽7𝑓𝑒𝑚 + 𝛽8𝐷85𝑓𝑒𝑚 
Lembre-se que a variável sal já está no formato logarítmico. 
Clique em Modelo, Mínimos Quadrados Ordinários e rode a equação acima. 
A saída abaixo mostra os resultados: 
 
11 
 
 
Vamos analisar os resultados: 
• O retorno da educação em 1978 é de 7,4%, ou seja, um ano a mais de estudo 
aumenta o log do salário em 7,4%; 
• O retorno da educação em 1985 é de 9,35% (7,47+1,85), ou seja, um ano a 
mais de estudo em 1985 aumenta o log do salário em 9,35%; 
• Uma mulher ganha em média 31,7% a menos que o homem em 1978; 
• Uma mulher ganha em média 23,2% a menos que o homem em 1985 (-
31,7+0,085); 
• Uma pessoa sindicalizada ganha em média 20,2% a mais em relação a uma 
pessoa não sindicalizada; 
• A variável d85 não é significativa; 
• A variável d85educ é significativa a 5% de significância; 
• A variável d85fem é significativa ao nível de 10% de significância; 
• 42,61% do modelo é explicado pela parte explicativa do modelo; 
• O teste DW indica o modelo não apresenta problemas de autocorrelação. 
 Rode agora o modelo sem a dummy de ano e sem as dummies de interação. 
Compare os resultados. 
Obs.: Rodar o modelo acima interagindo a dummy de ano (d85) com cada 
variável independente é o mesmo que rodar duas equações separadas, uma 
para 1978 e outra para 1985. 
Para comprovar essa ideia,y vamos rodar uma equação para o ano de 1978 e 
outra para 1985. 
 
12 
Para o ano de 1978 selecione Amostra, Definir intervalo. Selecione o 
intervalo de 01 a 550 (1978) e rode sal em função de c , educ, exp01, exp2 , 
sind e fem. A saída abaixo mostra essa ideia. 
 
 
Para o ano de 1985, rode a mesma equação alterando o período da amostra 
de 551 a 1084. Depois rode a mesma regressão. A saída abaixo mostra os 
resultados: 
 
 
Vamos agora interagir a variável d85 com cada variável independente e mostrar 
numa única saída tanto os valores de 1978 como os de 1985. 
 
13 
Rode a regressão de sal em função de c, d85, educ , d85 *educ, exp01, d85 
*exp01, exp2, d85*exp2, sind, d85*sind, fem e d85*fem. 
Antes altere amostra para o período original (1 a 1084). Vamos criar cada dummy 
de interação que falta na própria tela que usamos pra rodar o MQO: 
 
 
14 
 
Observe que: 
• As variáveis do ano de 1978 são: c, educ, exp, exp2, sind e fem. 
• Para achar as variáveis do ano de 1985 basta somar a variável do ano de 
1978 com a respectiva dummy. 
A educação de 1985 é de 0,0907418 (0,0768148 + 0,0139270). 
 
 
Compare os resultados. As estimativas dos coeficientes são iguais, enquanto 
que os valores dos erros-padrão são diferentes. 
 
Normalmente a metodologia de Dados em Painel separa os fatores não 
observados que afetam a variável dependente em dois tipos: os que são 
constantes e os que variam ao longo do tempo. 
Genericamente temos: 𝑌𝑖𝑡 = 𝛽0 + 𝛿0𝐷2𝑡 + 𝛽1𝑋𝑖𝑡 + 𝑎𝑖 + 𝑢𝑖𝑡 (1) 
Onde na variável 𝑌𝑖𝑡 , o “i” indica pessoa, empresa, etc. Enquanto o “t” indica o 
período de tempo. 
A variável D2 é uma dummy igual a zero quando t = 1 e um quando t = 2. 
 
15 
O intercepto de t = 1 é 𝛽0 e o intercepto de t = 2 é 𝛽0 + 𝛿0. 
A variável 𝑎𝑖 capta todos os fatores não observados que são constantes ao longo 
do tempo e que afetam 𝑌𝑖𝑡. Essa variável é chamada de Efeito não observado 
(Efeito Fixo, Heterogeneidade Não Observada). 
O termo do erro 𝑢𝑖𝑡 é chamado de erro idiossincrático. 
Conforme já vimos, uma maneira de estimar 𝛽1 é agrupar os dois anos e Usar 
MQO Agrupados. Dessa forma a equação (1) passa a ser: 𝑌𝑖𝑡 = 𝛽0 + 𝛿0𝐷2𝑡 + 𝛽1𝑋𝑖𝑡 + 𝑣𝑖𝑡 (2) 
Onde 𝑣𝑖𝑡 = 𝑎𝑖 + 𝑢𝑖𝑡 e é chamado de erro de composição. 
Para que o método de MQO Agrupados estime 𝛽1 consistentemente é preciso 
que tanto o erro idiossincrático como o termo de efeito fixo sejam não 
correlacionados com a variável 𝑋𝑖𝑡: 𝑐𝑜𝑟𝑟 (𝑋𝑖𝑡, 𝑣𝑖𝑡) = 0 𝑜𝑢 𝑐𝑜𝑟𝑟 (𝑋𝑖𝑡, 𝑎𝑖) = 0 𝑒 𝑐𝑜𝑟𝑟 (𝑋𝑖𝑡, 𝑢𝑖𝑡) = 0 
Quando essa hipótese não é válida dizemos que o MQO Agrupados produziuum 𝛽1 com viés de heterogeneidade, que na verdade é um viés causado pela 
omissão de uma variável constante no tempo. 
A abordagem de Dados em Painel possui alguns métodos que podem ser usados 
para estimar modelos que consideram a presença do efeito não observado que 
é fixo ao longo do tempo (𝑎𝑖). 
 
2.2.2 Estimador de Primeira Diferença (PD). 
 
O objetivo deste método é desaparecer com o efeito fixo (𝑎𝑖) por meio da primeira 
diferença das variáveis. Para exemplificar vamos usar novamente a equação (1): 𝑌𝑖𝑡 = 𝛽0 + 𝛿0𝐷2𝑡 + 𝛽1𝑋𝑖𝑡 + 𝑎𝑖 + 𝑢𝑖𝑡 (1) 
Para t = 2 , temos: 𝑌𝑖2 = 𝛽0 + 𝛿0 + 𝛽1𝑋𝑖2 + 𝑎𝑖 + 𝑢𝑖2 (𝑎) 
Para t = 1, temos: 𝑌𝑖1 = 𝛽0 + 𝛽1𝑋𝑖1 + 𝑎𝑖 + 𝑢𝑖1 (𝑏) 
Fazendo (a) – (b) : 
 
16 
𝑌𝑖2 − 𝑌𝑖1 = 𝛿0 + 𝛽1(𝑋𝑖2 − 𝑋𝑖1) + 𝑢𝑖2 − 𝑢𝑖1 
Que pode ser escrito como: ∆𝑌𝑖 = 𝛿0 + 𝛽1∆𝑋𝑖 + ∆𝑢𝑖 (𝑐) 
 
Observe que: 
✓ O intercepto em (c) representa a mudança no intercepto de t = 1 para t = 
2; 
✓ O efeito fixo (𝑎𝑖) desaparece no processo de diferenciação; 
✓ Na estimação em Primeira Diferença também precisamos assumir que ∆𝑢𝑖 seja não correlacionado com as variáveis explicativas em ambos os 
períodos de tempo; 
✓ O processo de diferenciação desaparece com todas as variáveis que são 
constantes ao longo do tempo. Dessa forma não podemos incluir, no 
modelo a ser estimado, variáveis que são constantes ao longo do tempo, 
ou que apresentam pouca variabilidade entre um ano e outro. 
Ex.: Caso o exemplo 2 (pág. 07) fosse um painel equilibrado, não 
poderíamos estimar uma equação de PD com a variável dummy “Ferm”. 
✓ A primeira diferença passa a considerar a heterogeneidade das 
observações, o que não acontecia no método de MQO Agrupados. 
Exemplo 03: Taxa de Criminalidade (Wooldridge pág. 414) 
 O arquivo em Excel “crime2” contém dados (entre outras coisas) sobre taxas 
de criminalidade e de desemprego de 46 cidades em 1982 e 1987. O modelo 
teórico é dado abaixo: 𝑡𝑥𝑐𝑟𝑖𝑚𝑖𝑡 = 𝛽0 + 𝛽1𝑑𝑒𝑠𝑒𝑚𝑝𝑖𝑡 
Inicialmente vamos inserir os dados no Gretl. Use o comando Arquivo, Abrir 
Dados, Arquivo de Usuários. Selecione a base no formato de painel, indicando 
cidade como variável de cross-section e ano como de tempo: 
 
17 
 
 
Antes de apresentar a regressão em primeira diferença vamos rodar uma 
equação apenas para o ano de 1987, conforme descrito na observação da pág. 
11. O modelo teórico seria uma regressão de Txcrim em função de c d87 
d87*desemp. 
Para isso precisamos criar a dummy de 1987 (1 = 1987 e 0 = 1982). Clique em 
Acrescentar, Dummies Temporais. Observe que o Gretl criou duas variáveis 
dummy. 
Precisamos saber qual delas será a do 1987. Abra a série de Ano e uma das 
dummies. Verifique a dummy dt_2 se refere a dummy de 1987. 
Rode o modelo desejado. Lembre-se de criar a dummy de interação. Teremos a 
seguinte saída: 
 
 Observe que: 
▪ 128,38 é o coeficiente linear para o ano de 1987 (97,70890+30,66922) 
 
18 
▪ A saída diz que um aumento da taxa de desemprego reduz a taxa de 
criminalidade, o que não é lógico. Porém como coeficiente não é 
significativo, não podemos dizer nada sobre a relação entre taxa de 
criminalidade e desemprego. 
Qual é o valor do coeficiente angular para o ano de 1985? A saída acima mostra 
esse coeficiente? 
 
Agora vamos rodar o modelo pelo método de MQO Agrupados, na qual o Gretl 
empilha as observações e não considera as diferenças entre as cidades. Clique 
em Modelo, Mínimos Quadrado Ordinários e rode Txcrim c d87 desemp. A 
saída abaixo mostra os resultados: 
 
Observe que: 
▪ O coeficiente desemp mudou o sinal em relação ao modelo com apenas 
uma equação, porém contínua sendo não significativo; 
▪ Tanto o modelo de MQO Agrupados como o modelo de apenas uma 
equação sofrem do problema de variáveis omitidas; 
▪ A dummy de ano “d87” permite interceptos lineares diferentes entre 1982 
e 1987 (veja gráfico b, pág.06), porém não considera as diferenças entre 
as cidades. 
Vamos agora rodar o nosso modelo em Primeira Diferença, ou seja, vamos 
considerar que existem fatores não observados e que são constantes no tempo 
(vide equação 01, pág. 18). 
Para o nosso exemplo a equação em Primeira Diferença é dada por: ∆𝑡𝑥𝑐𝑟𝑖𝑚𝑖 = 𝛽0 + 𝛽1∆𝑑𝑒𝑠𝑒𝑚𝑝𝑖 
 
19 
Ou seja, com a diferenciação vamos eliminar os fatores não observados que são 
constantes no tempo (𝑎𝑖). Selecione com o mouse as variáveis txcrim e desemp. 
Clique em Acrescentar, Primeiras Diferenças das Variáveis Selecionadas. 
 
Após criar as novas variáveis rode o modelo de interesse. Clique em Modelo, 
Mínimos Quadrado Ordinários e insira as variáveis. Teremo a seguinte saída: 
 
Observe que: 
• A relação entre taxa de criminalidade e desemprego é positiva e 
significante a 5%; 
• Mesmo que a variação na taxa de desemprego for zero entre 1982 e 1987 
(∆𝑑𝑒𝑠𝑒𝑚𝑝 = 0), a taxa de criminalidade aumentará 15,40 (crimes por mil 
hab.); 
• Um aumento de um ponto na taxa desemprego aumenta a taxa de 
criminalidade em 2,22. 
O arquivo em Excel “crime2” contém dados de localização das cidades (região 
nordeste, oeste e sul) bem como o tamanho de cada cidade (área). Esses dados 
poderiam ser usados na regressão acima? 
 
20 
Exemplo 04: Dormir x trabalhar (Wooldridge pág. 419). 
Wooldridge apresenta um exemplo de modelo de regressão que tenta estimar a 
substituição entre o tempo gasto dormindo e trabalhando. Os dados se referem 
aos anos de 1975 e 1981 com um total de 239 pessoas. O modelo teórico é dado 
abaixo: 𝑑𝑜𝑟𝑚𝑖𝑟𝑖𝑡 = 𝛽0 + 𝛽1𝑑81 + 𝛽2𝑡𝑟𝑎𝑏𝑎𝑙ℎ𝑜𝑖𝑡 + 𝛽3𝑒𝑑𝑢𝑐𝑖𝑡 + 𝛽4𝑐𝑎𝑠𝑎𝑑𝑜𝑖𝑡 + 𝛽5𝑐𝑟𝑖𝑎𝑛ç𝑎𝑖𝑡+ 𝛽6𝑏𝑜𝑎𝑠𝑎ú𝑑𝑒𝑖𝑡 + 𝑎𝑖𝑡 + 𝑢𝑖𝑡 
Onde: 
• Dormir: tempo em minutos gasto dormindo por semana; 
• D81: dummy do ano de 1981; 
• Trabalho: tempo em minutos trabalhados por semana; 
• Educ: anos de educação; 
• Casado: dummy indicando estado civil; 
• Criança: dummy indicando a presença de crianças menores de 3 anos; 
• Boasaúde: dummy indicando se a pessoa goza de boa saúde. 
 
A equação em Primeira Diferença é dada por: ∆𝑑𝑜𝑟𝑚𝑖𝑟𝑖 = 𝛽0 + 𝛽1∆𝑡𝑟𝑎𝑏𝑎𝑙ℎ𝑜𝑖 + 𝛽2∆𝑒𝑑𝑢𝑐𝑖 + 𝛽3∆𝑐𝑎𝑠𝑎𝑑𝑜𝑖 + 𝛽4𝑐𝑟𝑖𝑎𝑛ç𝑎𝑖+ 𝛽5∆𝑏𝑜𝑎𝑠𝑎ú𝑑𝑒𝑖 + ∆𝑢𝑖 
 
Para que o modelo em Primeira Diferença produza estimadores consistentes 
assumimos que o erro idiossincrático(∆𝑢𝑖) seja não correlacionado com as 
mudanças em todas as variáveis explicativas. 
Usando arquivo em Excel “dormir” coloque os dados no Gretl 
 Antes de rodar a equação em Primeira Diferença observe os dados no Excel. 
Nele cada linha representa uma unidade de corte transversal (pessoa), na qual 
cada variável possui duas colunas, uma para o ano de 1975 e outra para o ano 
de 1981. Neste caso, para rodar PD devemos montar as variáveis de variação 
entre 1975 e 1981. 
Selecione Modelo, Mínimos Quadrados Ordinários e rode deltadomir em 
função de c deltatrab deltaedu deltacasado deltacrincas deltasaude. A saída 
abaixo mostra os resultados: 
 
21 
 
 
Observe que: 
• O coeficiente deltatrab é significativo ao nível de 1%; 
• Uma hora a mais de trabalho está associada a 13,62 minutos (0,227*60) 
a menos dormindo; 
• As variáveis deltaeduc, deltacasado, deltacrianças e delta saúde não são 
significativas; 
• O erro padrão de deltaeduc é alto em relação à estimativa. Isso se deve 
ao fato de poucas pessoas apresentarem variação na educação entre 
1975 e 1981. Dessa forma 𝛽2 não é um número preciso. 
Vamos fazer um teste para verificar se podemos eliminar as variáveis não 
significativas. Clique em Testes, Omitir Variáveis. Selecione as variáveis a 
serem omitidas (todas menos deltatrab) A saída abaixo mostra os resultados: 
 
 
 
 
22 
Como o p-valor é igual a 0,4857, aceitamos a hipótese nula, ou seja, os 
coeficientes não são conjuntamente significativos. 
Dessa forma vamos rodar mais uma vez a regressão em PD apenas com a 
variável explicativadeltatrab. Abaixo temos a saída de regressão: 
 
 
Análise os resultados. 
Obs.: No estimador de Primeira Diferença precisamos tomar cuidado com a 
variabilidade de cada variável analisada (X´s), ou seja, se para uma dada 
variável, apenas uma pequena parte da amostra possui variação ao longo do 
tempo, será difícil obter um estimador preciso de 𝛽, a menos que tenhamos uma 
amostra de tamanho bastante grande. 
 
2.2.3 – Estimador de Efeitos Fixos 
 
O modelo de Efeitos Fixos também pretende controlar os efeitos das variáveis 
omitidas que variam entre os indivíduos e que são constantes ao longo do tempo. 
Para tanto, o modelo assume que os interceptos verticais são diferentes para 
cada indivíduo, porém constantes ao longo do tempo. Já os coeficientes 
angulares são constantes para todos os indivíduos em todos os períodos de 
tempo. 
A estimação de Efeitos Fixos representa outra maneira de eliminar o efeito fixo 𝑎𝑖. Dessa forma seja a equação abaixo: 𝑌𝑖𝑡 = +𝛽1𝑋𝑖𝑡 + 𝑎𝑖 + 𝑢𝑖𝑡 (1) 
 
23 
Vamos supor, como no caso do método de Primeira Diferença, que existe uma 
correlação arbitrária entre 𝑎𝑖 e a variável explicativa 𝑋𝑖𝑡 . Dessa forma, a 
estimação de (1) pelo método de MQO Agrupados produzirá estimadores 
viesados e inconsistentes. 
Calculando a média de cada variável, para cada observação i: 𝑌𝑖 = 𝛽1𝑋𝑖 + 𝑎𝑖 + 𝑢𝑖 (2) 
 
Onde 𝑌𝑖 = ∑ 𝑌𝑖𝑡𝑡𝑖=0𝑡 𝑒 𝑎𝑠𝑠𝑖𝑚 𝑝𝑜𝑟 𝑑𝑖𝑎𝑛𝑡𝑒 
Fazendo (1) – (2) temos: 𝑌𝑖𝑡 − 𝑌𝑖 = 𝛽1(𝑋𝑖𝑡 − 𝑋𝑖) + 𝑢𝑖𝑡 − 𝑢𝑖 
Que pode ser escrito como: �̈�𝑖𝑡 = 𝛽1�̈�𝑖𝑡 + �̈�𝑖𝑡 𝑝𝑎𝑟𝑎 𝑡 = 1, 2, … (a) 
O estimador de Efeitos Fixos calculados pelo método acima, é chamado de 
Estimador Intragrupo2 (ou estimador dentro do grupo), já que a equação mostra 
a variação do tempo para cada grupo de observações (subscrito i). 
Observe que: 
• Na equação (1) o coeficiente 𝛽1 é constante entre os indivíduos (subscrito 
i) e no tempo (subscrito t). Dessa forma, todas as diferenças de 
comportamento entre os indivíduos serão captadas pelo termo 𝑎𝑖; 
• O termo 𝑎𝑖 representa fatores não observados que são fixos para cada 
indivíduo; 
• A equação (a) elimina os efeitos fixos (𝑎𝑖) e todas as variáveis fixas ao 
longo do tempo. Dessa forma, não podemos usar no modelo de Efeitos 
Fixos variáveis que são constantes ou que possuem pouca variabilidade. 
Uma alternativa para o estimador Intragrupo, é usar o estimador Entregrupo3, na 
qual utilizamos as médias de tempo de todas as variáveis (x e y) e depois 
executamos uma regressão de corte transversal: 𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝑎𝑖 + 𝑢𝑖 
O problema desse método é que o estimador é viesado quando 𝑎𝑖 é 
correlacionado com 𝑋𝑖. 
 
2 Do termo em inglês “Whitin estimator” 
3 Do termo em inglês “Between estimator” 
 
24 
Regressão de variáveis Dummy: 
Outra maneira de estimar o Modelo de Efeitos Fixos é usar variáveis dummies 
para captar as diferenças entre os indivíduos. Exemplo: 𝑌𝑖𝑡 = 𝛽0 + 𝛽1𝑋1𝑖𝑡 + 𝛽2𝑋2𝑖𝑡 + 𝛽3𝑋3𝑖𝑡 + ⋯ + 𝛽𝑘𝑋𝑘𝑖𝑡 + 𝛾2𝐷2𝑖 + 𝛾3𝐷3𝑖 + ⋯ + 𝛾𝑛𝐷𝑛𝑖 + 𝑢𝑖𝑡 (𝑏) 
Onde: 𝐷2𝑖 = 1 𝑝𝑎𝑟𝑎 𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎çã𝑜 20 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜 𝑒 𝑎𝑠𝑠𝑖𝑚 𝑝𝑜𝑟 𝑑𝑖𝑎𝑛𝑡𝑒 
 
Na equação (b) as diferenças entre as observações são captadas pela inclusão 
de variáveis dummies, uma para cada indivíduo. Dessa forma temos: 
• Para a observação 1 o intercepto vertical será: 𝛽0; 
• Para a observação 2 o intercepto vertical será: 𝛽0 + 𝛾2; 
• Para a observação 3 o intercepto vertical será: 𝛽0 + 𝛾3; 
E assim sucessivamente. 
Na equação (b) não temos a dummy 𝐷1𝑖. Por quê? 
 
A estimação do Modelo de Variáveis Binárias produz os mesmos resultados da 
estimação do Modelo de Efeitos Fixos. Porém o uso das dummies não é prático, 
já que temos que inserir uma dummy para cada observação do modelo. 
Ex.: Para o exemplo da pág. 11 sobre criminalidade temos 46 cidades em dois 
anos (1982 e 1987). Assim a equação de regressão com o uso do modelo de 
variáveis binárias teria 45 dummies. 
 
Exemplo 05: Vamos usar o modelo de investimento de Gujarati apresentado na 
pág. 03. 
O arquivo de Excel “exemplo painel gujarati” mostra dados sobre investimento, 
valor da empresa e estoque de quatro grandes empresas: GE, US, GM e WEST. 
Agora o exemplo passa a ser: 𝑌𝑖𝑡 = 𝛽1 + 𝛽2𝑋2𝑖𝑡 + 𝛽3𝑋3𝑖𝑡 + 𝑎𝑖 + 𝑢𝑖𝑡 (1) 
Onde: 𝑌𝑖𝑡 – Investimento 
 𝑋2 - Valor real da empresa 
 
25 
 𝑋3 - Estoque real de capital 
 𝑎𝑖 – Fatores não observados que são constantes no tempo (Efeito Fixo) 
 Ex.: Tipo de investidor (moderado ou agressivo), Técnicas gerenciais, 
etc. 
 
Vamos inserir os dados no Gretl. Clique em Arquivo, Abrir dados, Arquivo de 
Usuário. Mude a base para o formato de painel. Temos: 
 
Vamos agora rodar o modelo de efeitos fixos. Selecione Modelo, Painel, Efeitos 
Fixos ou Aleatórios e rode a regressão de Y sobre C X1 X2 . 
 
26 
 
Selecione Efeitos Fixos e aperte ok. Temos: 
 
 
Observe que: 
• As variáveis são significativas a 1%; 
 
27 
• O aumento de uma unidade no valor da empresa aumenta 0,11 o seu 
investimento; 
• O aumento de uma unidade no estoque da empresa aumenta em 0,35 o 
seu investimento. 
• O Gretl apresenta dois valores para o R Quadrado: R quadrado LSDV e 
R quadrado por dentro. O R quadrado correto é o LSDV. Dessa forma, 
93,45% da variação de Y se deve a variação da parte explicativa; 
• A Hipótese nula do teste conjunto de regressores designados é de que o 
modelo adequado é aquele que excluímos uma das variáveis que foram 
usadas. Neste caso, rejeitamos a hipótese nula, já que o p-valor é menor 
do que o nível de significância (3,80998e-027< 0,01); 
• A saída também apresenta um teste para diferenciar interceptos de 
grupos. Neste teste, a hipótese nula é de que os interceptos verticais do 
modelo são iguais, o que equivale a dizer o modelo correto seria MQO 
Agrupados (Pooled MQO). Sendo assim, rejeitamos a hipótese nula 
(4,59178e-021 < 0,01). 
Observe que este teste serve para fazer uma comparação entre MQO 
Agrupados x Efeitos Fixos. 
O Gretl apresenta os interceptos verticais de cada empresa. Clique em Salvar, 
Contantes por unidade. Selecione um nome e clique em ok. Os resultados 
aparecem abaixo: 
 
 
Assim temos os seguintes interceptos: 
 
28 
• Empresa GE: -245,7924; 
• Empresa GM: -84,2202; 
• Empresa US: 93,8404; 
• Empresa WEST: -59,2258 
Dessa forma, temos quatro variações para a equação (1), sendo uma para cada 
empresa: 
• 𝐼𝑛𝑣𝑒𝑠𝑡𝑖𝑚𝑒𝑛𝑡𝑜 𝐺𝐸 = −245,7924 + 0,107948 ∗ 𝑉𝑎𝑙𝑜𝑟 𝑅𝑒𝑎𝑙 + 0,346162 ∗ 𝐸𝑠𝑡𝑜𝑞𝑢𝑒 
• 𝐼𝑛𝑣𝑒𝑠𝑡𝑖𝑚𝑒𝑛𝑡𝑜 𝐺𝑀 = −84,2202 + 0,107948 ∗ 𝑉𝑎𝑙𝑜𝑟 𝑅𝑒𝑎𝑙 + 0,346162 ∗ 𝐸𝑠𝑡𝑜𝑞𝑢𝑒 
• 𝐼𝑛𝑣𝑒𝑠𝑡𝑖𝑚𝑒𝑛𝑡𝑜 𝑈𝑆 = 93,8404 + 0,107948 ∗ 𝑉𝑎𝑙𝑜𝑟 𝑅𝑒𝑎𝑙 + 0,346162 ∗ 𝐸𝑠𝑡𝑜𝑞𝑢𝑒 
• 𝐼𝑛𝑣𝑒𝑠𝑡𝑖𝑚𝑒𝑛𝑡𝑜 𝑊𝐸𝑆𝑇 = −59,2258 + 0,107948 ∗ 𝑉𝑎𝑙𝑜𝑟 𝑅𝑒𝑎𝑙 + 0,346162 ∗ 𝐸𝑠𝑡𝑜𝑞𝑢𝑒 
O que está de acordo com o gráfico b (pág. 07) 
Vamos agora rodar o modelo com variáveis binárias. Este modelo é aquele que 
você cria uma dummy para cada observação da sua amostra. Sendo assim, para 
o nosso exemplo, seria uma dummy para cada empresa. 
Caso você fosse fazer isso no Excel, você teria a seguinte tela para inserir uma 
dummy para cada empresa: 
 
 
No Gretl a criação das dummies é feita de maneira mais rápida. Clique em 
Acrescentar, Dummies Unitárias. Temos a seguinte saída: 
 
29 
 
Rode o modelo com as variáveis dummy. Clique Modelo, Mínimos Quadrados 
Ordinários e selecione Y d2 d3 d4 x2 x3. A saída abaixo mostra os resultados: 
 
 
Compare os resultados com a estimação do modelo de efeitos fixos. Observe 
que os resultados são iguais. 
A saída acima tem a vantagem de trazer os interceptos verticais de cada 
empresa: 
• Empresa GE: -245,7924 
• Empresa GM: -84,220 (-245,7924+161,5722) 
• Empresa US: 93,8774(-245,7924+339,6328)• Empresa WEST: -59,2258 (-245,7924+186,5666) 
 
30 
Graficamente esses resultados podem ser vistos com ajuda do gráfico (b) da 
pág. 07. 
As diferenças nos valores dos interceptos podem ser devidas a características 
únicas de cada empresa, tais como: diferença no estilo gerencial ou no talento 
dos gestores. 
Vamos verificar se os dados apresentam problema de multicolinearidade. Clique 
em Análise, Colinearidade. Temos a seguinte saída: 
 
Essa saída apresenta um indicador chamado de Fatores de Inflação da Variância 
(FIV). Caso o número o indicador seja maior do que 10, teria um indício de que 
a referida variável apresenta problemas de Multicolinearidade. Observe que para 
todas as variáveis o resultado foi menor do que 10. 
Com esse Modelo de Regressão com Variáveis Dummy também podemos testar 
se os interceptos verticais do modelo são iguais, e portanto o melhor modelo 
seria MQO Agrupados. Clique em Testes, Omitir Variáveis. Selecione as 
variáveis a serem omitidas (todas as dummies). A tela apresenta três opções de 
como executar este teste. Selecione o teste de Wald4. A saída abaixo mostra os 
resultados: 
 
4 Usamos este teste porque ele aparece em outros softwares econométricos. 
 
31 
 
 
Como o p-valor é menor que o nível de significância (4,59178e-021< 0,01) 
rejeitamos a hipótese nula, ou seja, o melhor modelo é o de Efeitos Fixos. 
Exemplo 06: Criminalidade x Desemprego 
Vamos usar o exemplo sobre criminalidade apresentado na pág. 08. Abra o 
arquivo “crime2alunos” e insira os dados no Gretl. 
Selecione Modelo, Painel, Efeitos Fixos Aleatórios. e rode um modelo de 
regressão de tx crim sobre c desemp. Selecione Efeitos Fixo. Temos os 
seguintes resultados: 
 
 
Observe que: 
• os resultados não foram animadores, já que pelo modelo quanto maior a 
taxa de desemprego menor será a taxa de criminalidade, o que não é 
lógico; 
• A variável desemprego não é significativa ao nível de 1%; 
• Rejeitamos a hipótese nula de que os interceptos verticais são iguais 
(3,30296e-009 < 0,01), ou seja, o melhor modelo é o de Efeitos Fixos. 
 
32 
Vamos obter os coeficientes verticais de cada cidade. Clique em Salvar, 
Contantes por unidade. Selecione um nome e clique em ok. Os resultados 
aparecem abaixo: 
 
Vamos rodar o modelo de Efeitos Fixos entregrupos. Clique em Modelo, Painel, 
Modelo entre-grupos. Selecione a equação desejada e aperte ok. 
 
Até agora os exemplos apresentados têm trabalhado com modelos cuja equação 
teórica é dada abaixo: 𝑌𝑖𝑡 = +𝛽1𝑋𝑖𝑡 + 𝑎𝑖 + 𝑢𝑖𝑡 (1) 
Onde o erro de composição é dado por 𝑣𝑖𝑡 = 𝑎𝑖 + 𝑢𝑖𝑡, sendo 𝑎𝑖 os fatores não 
observados invariantes no tempo e 𝑢𝑖𝑡 erro idiossincrático. Neste caso, modelos 
 
33 
que apresentam essa estrutura são chamados de Modelos de Componentes de 
Erro Unidirecionais. 
Entretanto, alguns econometristas preferem trabalhar com Modelos de 
Componentes de Erro Bidirecionais. Com isso, a equação (1) é alterada para 
incorporar um efeito de tempo: 𝑌𝑖𝑡 = +𝛽1𝑋𝑖𝑡 + 𝑎𝑖 + 𝜆𝑡 + 𝑢𝑖𝑡 (2) 
 
Neste caso, o erro de composição passa a ser 𝑣𝑖𝑡 = 𝑎𝑖 + 𝜆𝑡 + 𝑢𝑖𝑡 , onde 𝑎𝑖 
continua sendo os fatores não observados invariantes no tempo e 𝑢𝑖𝑡 erro 
idiossincrático. O novo termo (𝜆𝑡) corresponde ao efeito específico do tempo, 
ou seja, algum acontecimento ocorrido em um determinado t e que influencia nas 
mudanças de 𝑌𝑖𝑡. 
Para estimar a equação (2) podemos inserir dummies de tempo que farão o 
papel de 𝜆𝑡. Dessa forma, a equação (2) passaria a ser: 𝑌𝑖𝑡 = +𝛽1𝑋𝑖𝑡+ 𝛽2𝐷1+ 𝛽3𝐷2+ 𝛽4𝐷3+ … + 𝛽𝑘𝐷𝑘 + 𝑎𝑖 + 𝑢𝑖𝑡 (3) 
 
Vamos usar essa ideia de modelos de componentes de erros bidirecionais para 
a estimação de Modelos de Efeitos Fixos no exemplo sobre criminalidade. 
Selecione Modelo, Painel, Efeitos Fixos e Aleatórios e rode um modelo de 
regressão de tx crim sobre c desemp. Selecione Efeitos Fixos e marque a 
caixa de Criar dummies temporais.. Abaixo segue a saída de regressão: 
 
 
34 
Observe que: 
• um aumento de um ponto na taxa desemprego aumenta a taxa de 
criminalidade em 2,22; 
• Rejeitamos a hipótese nula de que os interceptos verticais são iguais 
(1,21912e-010 < 0,01), ou seja, o melhor modelo é o de Efeitos Fixos; 
• O teste conjunto de dummies temporais, apresenta a hipótese nula de 
que o modelo mais adequado não possui efeitos temporais, o que 
equivale a dizer que o modelo correto é unidirecional. Neste caso, 
rejeitamos a hipótese nula (0,00105442 < 0,01), ou seja, o modelo de 
Efeitos Fixos precisa dos efeitos de tempo. 
Compare os resultados com as estimativas em Primeira Diferença (pág. 19). 
Quais são as semelhanças? 
Na saída acima é viável usar o modelo de variáveis dummy? Por quê? 
Também neste caso podemos calcular os interceptos verticais. Clique em 
Salvar, Constantes por unidade. Temos a seguinte saída: 
 
▪ Obs.: Efeitos Fixos ou Primeira Diferença? 
▪ Quando 𝑇 = 2 as estimativas de Efeitos Fixos e Primeira Diferença e 
todas as estatísticas de teste são idênticas. 
▪ Quando 𝑇 ≥ 3 os estimadores de Efeitos Fixos e Primeira Diferença não 
são os mesmos. Neste caso, quando os 𝑢𝑖𝑡 são serialmente não 
correlacionados, os estimadores de efeitos fixos serão mais eficientes que 
os estimadores de Primeira Diferença. 
 
35 
 
2.2.4 – Estimador de Efeitos Aleatórios5 
 
O modelo de Efeitos Fixos considera que existe uma correlação entre o fator não 
observado (𝑎𝑖) e as variáveis explicativas (X´s) em todos os períodos de tempo, 
ou seja, temos que: 𝑐𝑜𝑟𝑟(𝑎𝑖, 𝑋𝑖𝑡) ≠ 0 
A hipótese básica do modelo de Efeitos Aleatórios é considerar que o fator não 
observado (𝑎𝑖) não é correlacionado com as variáveis explicativas (X´s), ou seja: 𝑐𝑜𝑟𝑟(𝑎𝑖, 𝑋𝑖𝑡) = 0 
Dessa forma o modelo a ser estimado passa a ser: 𝑌𝑖𝑡 = 𝛽0 + 𝛽1𝑋𝑖𝑡1 + 𝛽2𝑋𝑖𝑡2 + 𝛽3𝑋𝑖𝑡3 + ⋯ + 𝛽𝑘𝑋𝑖𝑡𝑘 + 𝑣𝑖𝑡 (𝑎) 
 
Onde 𝑣𝑖𝑡 = 𝑎𝑖 + 𝑢𝑖𝑡 , é o erro de composição. 
Agora como 𝑎𝑖 aparece em cada período de tempo, os 𝑣𝑖𝑡 serão serialmente 
correlacionados ao longo do tempo, ou seja: 
𝐶𝑜𝑟𝑟(𝑣𝑖𝑡 , 𝑣𝑖𝑠) = 𝜎𝑎2𝜎𝑎2 + 𝜎𝑢2 , 𝑝𝑎𝑟𝑎 𝑡 ≠ 𝑠 
Onde: 𝜎𝑎2 = variância de 𝑎𝑖 e 𝜎𝑢2 = variância de 𝑢𝑖𝑡 
Dessa forma, usar MQO Agrupados produzirá estimadores viesados e não 
consistentes. 
Uma maneira de resolver esse problema é usar Mínimos Quadrados 
Generalizados (MQG) para eliminar essa correlação serial. Neste caso a 
equação (a) precisa ser corrigida pela seguinte equação de transformação: 
𝜆 = 1 − [ 𝜎𝑢2𝜎𝑢2+𝑇𝜎𝑎2]12 𝑠𝑒𝑛𝑑𝑜 0 < 𝜆 < 1 (𝑏) 
Transformando a equação (a) temos: 
 𝑌𝑖𝑡 − 𝜆𝑌𝑖 = 𝛽0(1 − 𝜆) + 𝛽1(𝑋𝑖𝑡1 − 𝜆𝑋𝑖1) + ⋯ + 𝛽𝑘(𝑋𝑖𝑡𝑘 − 𝑋𝑖𝑘) + (𝑣𝑖𝑡 − 𝜆𝑣𝑖) (𝑐) 
 
 
5 Também conhecido como Modelo de Componentes de Erros (MCE) 
 
36 
A vantagem da equação (c) é que agora podemos incluir variáveis explicativas 
que são constantes ao longo do tempo (dummies de sexo, localização, etc). 
Sendo essa inclusão, uma das principais vantagens dos efeitos aleatórios sobre 
os efeitos fixos, ou sobre a primeira diferença. 
Observe na equação (c) que: 
✓ Quando 𝜆 = 0 temos MQO Agrupados; 
✓ Quando 𝜆 = 1 temos o modelo de Efeitos Fixos. 
Exemplo 07: 
Vamos usar o modelo de investimento de Gujarati apresentado nas pág. 03 e 
24. Abra o arquivo de Excel “exemplo painel gujarati” e jogue os dados para o 
Gretl. 
Estime a equação de Efeitos Aleatórios. Selecione Modelo, Painel, Efeitos 
Fixos e Aleatórios e rode um modelo de regressão de y sobre C X1 X2. 
Selecione a opção de Efeitos Aleatórios. Abaixo segue a saída de regressão: 
 
 
37 
 
 
 Observe que: 
✓ A variância ‘entre’ representa a variância do termo de cross-section (ai); 
✓ A variância ‘por dentro’ representa a variância do termo de idiossincrático; 
✓ Do total da variância dos componentes do erro, 80,33%6 se deve ao termo 
de cross-section e 19,67% se deve ao termo idiossincrático. 
✓ O valor de 0,8033também corresponde ao valor da correlação entre os 
resíduos. 
✓ O valor de 𝜆 se refere ao “teta utilizado a quase-desmediação”. 
✓ O valor de 𝜆 também poderia ser calculado a partir dos dados da saída. 𝜆 =1 − [ 𝜎𝑢2𝜎𝑢2+𝑇𝜎𝑎2]12 = 1 − [ 5.668,425.668,42+20(23.152,10)]12 
 = 1 − [ 5668,425668,42+463042,00]12 = 1 − 0,10997 = 0,89002 
Ou seja, esse modelo se aproxima do modelo de efeito fixo. 
A saída apresenta três testes de Hipóteses: 
• Teste Conjunto dos Regressores Designados: 
Hipótese nula: o modelo adequado apresenta a exclusão de uma das 
variáveis utilizadas. 
 
6 Calculado da seguinte maneira: = 
𝑣𝑎𝑟. 𝑒𝑛𝑡𝑟𝑒𝑣𝑎𝑟. 𝑡𝑜𝑡𝑎𝑙 = 23152,1023,152,10+5.668,42 = 0,80332 = 80,33% 
 
38 
Análise: Rejeitamos a hipótese nula (9,81373e-070 < 0,01). 
• Teste de Breusch-Pagan (Pooled MQO x Efeitos Aleatórios) 
Hipótese nula: Variância do erro de unidade- específica = 0 [var(ai)=0]. Caso 
se aceite a Ho, o modelo mais adequado seria MQO Agrupados. 
Análise: Rejeitamos a hipótese nula (1,97363e-084 < 0,01), ou seja, o 
modelo mais adequado seria de Efeitos Aleatórios. 
• Teste de Hausman (Efeitos Fixos x Efeitos Aleatórios) 
Hipótese nula: O teste de Hausman (1978) consiste em verificar se existe 
correlação entre 𝑎𝑖 𝑒 𝑋𝑖𝑗. Caso se aceite a Ho, o modelo mais eficiente seria 
o de Efeitos Aleatórios7 [𝑐𝑜𝑟𝑟(𝑎𝑖, 𝑋𝑖𝑡) = 0]. 
Análise: Aceitamos a hipótese nula (0,455561 > 0,01), ou seja, o modelo 
mais adequado seria de Efeitos Aleatórios. 
 
Podemos obter os interceptos para cada empresa. Clique em Salvar, Efeitos 
Individuais. Os resultados aparecem abaixo: 
 
7O software Gretl indica como Ho que “as estimativas GLS são consistentes”. 
 
39 
 
Obs.: 
A tabela acima, não representa os interceptos verticais, mas a diferença entre 
o intercepto da empresa e o intercepto comum. Assim para GE temos -169,9282, 
ou seja, ele indica o quanto o intercepto da GE difere do intercepto comum. 
Para calcularmos os interceptos de cada empresa devemos somar os dados da 
tabela acima com o valor do c da saída de regressão. 
Ex.: para a empresa GE o intercepto vertical é de -242,9635 (-169,9282 -
73,03531) 
O valor de -73,03531 (valor da constante c) representa o valor médio do 
componente aleatório (𝑎𝑖). 
Vamos agora estimar o Modelo de Efeitos Aleatórios Bidirecional8, ou seja, 
aquele que consideramos os efeitos de tempo no modelo. Rode o modelo y 
 
8 Existem várias possibilidades diferentes de como rodar os modelos Bidirecionais. No Gretl rodar o 
modelo de Efeitos Aleatórios com dummies de tempo equivale a manter o efeito de grupo aleatório 
enquanto o efeito de tempo é fixo. 
 
40 
sobre x2 x3 e marque a caixa de incluir as dummies temporais. Teremos a 
seguinte saída: 
 
 
Observe que a saída trouxe um teste a mais sobre o conjunto de dummies 
temporais que foram incluídas. A hipótese nula desse teste de Wald é que não 
existe efeitos de tempos. Neste caso, aceitamos a hipótese nula (0,703912 > 
0,01), ou seja, o modelo adequado não apresenta os efeitos de tempo. 
 
2.2.5 – Modelo de Diferenças em Diferenças (Dif - Dif) 
 
41 
O Modelo de Diferenças em Diferenças é utilizado para avaliação do impacto de 
um certo evento exógeno sobre um grupo de observações, tais como: avaliação 
de políticas públicas, impacto de uma tecnologia, etc. 
A base de dados necessária para utilizar o modelo deve ser composta por dois 
grupos: 
• Grupo de Controle (C): formado pelas observações que não foram afetadas 
pelo evento; 
• Grupo de Tratamento (T): formado pelas observações que foram afetadas 
pelo evento exógeno. 
A análise é feita utilizando dados desses dois grupos, em dois momentos do 
tempo: um antes da incidência do evento e outro depois. Dessa forma, a nossa 
amostra vai conter quatro grupos: 
▪ CA – grupo de controle antes do evento; 
▪ CD – grupo de controle depois do evento; 
▪ TA – grupo de tratamento antes do evento; 
▪ TD – grupo de tratamento depois do evento. 
O método consiste em calcular duas diferenças seguidas9. 
 No primeiro passo, é calculado o valor médio da variável (y) que está sendo 
analisada, para os quatro grupos acima: 
𝐶𝐴 = ∑ 𝑌𝐶𝐴𝑛𝑖=0𝑛 𝐶𝐷 = ∑ 𝑌𝐶𝐷𝑛𝑖=0𝑛 𝑇𝐴 = ∑ 𝑌𝑇𝐴𝑛𝑖=0𝑛 𝑇𝐷 = ∑ 𝑌𝑇𝐷𝑛𝑖=0𝑛 
 No segundo passo, é calculada a diferença do valor médio para cada grupo (C 
ou T) considerando o antes e o depois do evento: ∆𝐶 = 𝐶𝐷 − 𝐶𝐴 ∆𝑇 = 𝑇𝐷 − 𝑇𝐴 
 No terceiro e último passo, é calculada a diferença entre os dois valores 
calculados no segundo passo, e com isso teremos o impacto do evento: 𝐼𝑚𝑝𝑎𝑐𝑡𝑜 = ∆𝑇 − ∆𝐶. 
A tabela abaixo, ilustra o método de Diferenças em Diferenças: 
Tabela 1 
Grupos Antes Depois Depois – Antes 
C CA CD CD – CA 
T TA TD TD – TA 
T - C TA - CA TD - CD TD – TA – (CD-
CA) 
 
9 Por isso o nome Diferenças em Diferenças. 
 
42 
Observe que: 
▪ CD – CA e TD - TA medem a diferença do antes e o depois da ocorrência do 
evento para os grupos de controle e tratamento; 
Os resultados da tabela acima, também podem ser obtidos com o uso de um 
modelo de regressão estimado por MQO: 𝑌 = 𝛽0 + 𝛽1𝐷𝐷 + 𝛽2𝐷𝑇 + 𝛽3(𝐷𝑇 ∗ 𝐷𝐷) + 𝑢𝑖 (1) 
Onde: 
DD – é uma variável dummy de tempo (=1 se os dados são do período após a 
ocorrência do evento); 
DT – representa uma dummy para o grupo de tratamento (= 1 se os dados são 
do grupo de tratamento) 
DD* DT – representa uma dummy de interação (= 1 se a observação foi afetada 
pelo evento e os dados são do período após a ocorrência do evento). 
Observe que: 
• 𝛽0 é o valor médio de Y antes da ocorrência do evento para o grupo de 
controle; 
• 𝛽1 mede a diferença na variável Y entre o período depois do evento e 
antes da ocorrência do evento; 
• 𝛽2 mede a diferença do Y entre os grupos, independentemente da 
ocorrência do evento; 
• 𝛽3 mede o impacto do evento, ou seja, representa o coeficiente de 
Diferenças em Diferenças. 
Por quê 𝛽3 é o estimador de Diferenças em Diferenças? 
Para responder essa pergunta precisamos calcular os dados da Tabela 1, 
usando a equação (1): 
▪ Grupo de Tratamento: 𝑇𝐴 = 𝛽0 + 𝛽1 ∗ 0 + 𝛽2 ∗ 1 + 𝛽3(1 ∗ 0) + 𝑢𝑖 = 𝛽0 + 𝛽2 𝑇𝐷 = 𝛽0 + 𝛽1 ∗ 1 + 𝛽2 ∗ 1 + 𝛽3(1 ∗ 1) + 𝑢𝑖 = 𝛽0 + 𝛽1 + 𝛽2 + 𝛽3 𝑇𝐷 − 𝑇𝐴 = 𝛽0 + 𝛽1 + 𝛽2 + 𝛽3 − (𝛽0 + 𝛽2) = 𝛽1 + 𝛽3 (𝑎) 
▪ Grupo de Controle: 𝐶𝐴 = 𝛽0 + 𝛽1 ∗ 0 + 𝛽2 ∗ 0 + 𝛽3(0 ∗ 0) + 𝑢𝑖 = 𝛽0 𝐶𝐷 = 𝛽0 + 𝛽1 ∗ 1 + 𝛽2 ∗ 0 + 𝛽3(1 ∗ 0) + 𝑢𝑖 = 𝛽0 + 𝛽1 
 
43 
𝐶𝐷 − 𝐶𝐴 = 𝛽0 + 𝛽1 − 𝛽0 = 𝛽1 (𝑏) 
Fazendo (a) – (b): 𝑇𝐷 − 𝑇𝐴 − (𝐶𝐷 − 𝐶𝐴) = 𝛽1 + 𝛽3 − 𝛽1 = 𝛽3 
Os resultados podem ser resumidos na tabela 2: 
Tabela 2 
Grupos Antes Depois Depois – Antes 
C 𝛽0 𝛽0 + 𝛽1 𝛽1 
T 𝛽0 + 𝛽2 𝛽0 + 𝛽1 + 𝛽2 + 𝛽3 𝛽1 + 𝛽3 
T - C 𝛽2 𝛽2 + 𝛽3 𝛽3 
 
Graficamente temos: 
 
Observações gerais sobre o Modelo Dif - Dif : 
 
• O valor do 𝛽3 também é chamado de Efeito Médio de Tratamento. 
• Para que o valor de 𝛽3 indique o impacto do evento exógeno é preciso que o 
modelo de regressão controle todas as variáveis que influenciam a variável 
analisada. Dessa forma, a equação (1) passaria a ser: 
 𝑌 = 𝛽0 + 𝛽1𝐷𝐷 + 𝛽2𝐷𝑇 + 𝛽3(𝐷𝑇 ∗ 𝐷𝐷) + 𝛽4𝑋1 + 𝛽5𝑋2 + ⋯ +𝛽𝑘𝑋𝑘 + 𝑢𝑖 (2) 
 
• Caso o modelo não controle todas as variáveis, o estimador Dif-Dif será 
viesado. 
Y 
Grupo de 
Tratamento 
Grupo de 
Controle 
Média Estimada do 
efeito no grupo de 
Tratamento 
Antes Depois 
Intervenção 
Tempo 
 
44 
• O tempo deve ser igual entre o grupo de tratamento e o grupo de controle. 
• O modelo Dif-Dif considera que o grupo de controle e tratamento possuem 
tendência comum (mesma inclinação das retas no gráfico). Caso essa 
hipótese seja violada, o estimador do modelo Dif-Dif será viesado. 
 
Exemplo 08: Efeito de um incinerador sobre o preço de imóveis 
(Wooldridge – pág. 499) 
 
O arquivo Kielmc apresenta o efeitoda inauguração de um incinerador de lixo 
sobre os preços de imóveis de uma certa cidade americana. A base de dados é 
formada por preços de imóveis que foram vendidos em 1978 e em 1981, 
totalizando 321 observações no formado de Agrupamentos de Cortes 
Transversais. O modelo teórico é dado abaixo: 𝑟𝑝𝑟𝑖𝑐𝑒 = 𝛽0 + 𝛽1𝑌81 + 𝛽2𝑛𝑒𝑎𝑟𝑖𝑛𝑐 + 𝛽3(𝑦81𝑛𝑟𝑖𝑛𝑐) + 𝑜𝑢𝑡𝑟𝑜𝑠 𝑓𝑎𝑡𝑜𝑟𝑒𝑠 + 𝑢𝑖 (1) 
Onde: 
• rprice = preço dos imóveis a preços constantes de 1981 
• y81 = dummy de ano (= 1 se os dados são do ano de 1981) 
• nearinc = dummy de localização (= 1 se o imóvel é localizado perto do 
incinerador) 
• y81nrinc = dummy de interação (=1 se o imóvel está localizado perto do 
incinerador e foi vendido em 1981) 
 
• Alguns dos outros fatores disponíveis na base de dados: 
o Age – idade do imóvel 
o Agesq – idade do imóvel ao quadrado 
o Área – metragem do imóvel 
o Baths – número de banheiros 
 
 
Inicialmente vamos rodar alguns modelos com os dados... 
Uma possibilidade é rodar uma equação usando os dados apenas do ano de 
1981: 𝑟𝑝𝑟𝑖𝑐𝑒 = 𝛽0 + 𝛽1𝑛𝑒𝑎𝑟𝑖𝑛𝑐 + 𝑢𝑖 
 
45 
Para rodar essa equação, você deve limitar a amostra com os dados de 1981. 
Clique em Amostra e selecione o intervalo para 180 a 321. Rode o modelo acima 
clicando em Modelo, Mínimos Quadrados Ordinários. A saída abaixo, mostra 
os resultados: 
 
Observe que: 
• O valor da constante representa o valor médio do preço dos aluguéis dos 
imóveis afastados do incinerador; 
• A variável Nearinc representa que o preço médio dos imóveis localizados 
perto do incinerador foi 30.688,30 a menos que os localizados longe do 
incinerador; 
Não podemos falar que o incinerador foi a única causa da queda do preço do 
imóvel. Para demonstrar isso, vamos rodar a mesma regressão para o ano de 
1978. No Gretl clique em Amostra e selecione o intervalo de 1 a 179. Temos os 
seguintes resultados: 
 
 
46 
Temos que: 
• O preço médio dos imóveis distantes do incinerador no ano de 1978 foi de 
82.517,2; 
• O preço médio dos imóveis localizados perto do incinerador foi 18824,4 a 
menos que os localizados longe do incinerador; 
• Mesmo antes da construção do incinerador, o preço médio dos imóveis 
localizados mais perto já eram inferiores aos preços dos imóveis distantes. 
Para analisar se o incinerador causou uma queda do preço dos imóveis é preciso 
calcular a diferença dos coeficientes que foram estimados acima: 𝛽3 = −30.688,30 − (−18824,40) = −11.863,90 
Dessa forma, 𝛽3 é o estimador Dif-Dif. 
Os mesmos resultados podem ser estimados usando a tabela 1 (pág. 40), na 
qual é calculado o valor médio da variável Y para cada grupo do experimento 
natural. Dessa forma, para o exemplo temos: 
▪ CA – representa o preço médio dos imóveis distantes do incinerador no ano 
de 1978. 
No Gretl, para calcular CA é preciso restringir a amostra da variável rprice. 
Clique em Amostra, Definir intervalo e selecione o intervalo de 01 a 179. 
Em seguida clique em Amostra, Restringir Baseado a Critérios e 
selecione nearinc=0. Dessa forma, primeiro selecionamos os dados do ano 
de 1978 e depois restringimos a amostra apenas com imóveis localizados 
longe do incinerador. Agora calcula-se o valor da média com o comando Ver, 
Estatísticas Descritivas. Temos os seguintes resultados: 
 
 
47 
▪ CD – representa o preço médio dos imóveis distantes do incinerador no ano 
de 1981. 
No Gretl, usamos o mesmo comando anterior, mas mudamos o intervalo da 
amostra para 180 a 321. Antes é preciso restaurar a amostra original. 
 
▪ TA - representa o preço médio dos imóveis localizados perto do incinerador 
no ano de 1978 
No Gretl, para calcular CA é preciso restringir a amostra da variável rprice. 
Clique em Amostra, Definir intervalo e selecione o intervalo de 1 a 179. 
Em seguida clique em Amostra, Restringir Baseado a Critérios e 
selecione nearinc=1. Dessa forma, primeiro selecionamos os dados do ano 
de 1978 e depois restringimos a amostra apenas com imóveis localizados 
perto do incinerador. Agora calcula-se o valor da média com o comando Ver, 
Estatísticas Descritivas. Temos os seguintes resultados: 
 
 
48 
▪ TD – representa o preço médio dos imóveis localizados perto do incinerador 
no de 1981. 
No Gretl, usamos o mesmo comando anterior, mas mudamos o intervalo da 
amostra para 180 a 321. Antes é preciso restaurar a amostra original. 
 
Agora com os valores médios podemos montar os dados da tabela 1: 
Grupos Antes Depois Depois – Antes 
C 82.517,23 101.307,51 18.790,28 
T 63.692,86 70.619,24 6.926,38 
T - C TA - CA TD - CD -11.863,90 
 
Uma outra maneira de estimar o Modelo Dif-Dif é rodar por MQO a equação 
abaixo: 𝑟𝑝𝑟𝑖𝑐𝑒 = 𝛽0 + 𝛽1𝑌81 + 𝛽2𝑛𝑒𝑎𝑟𝑖𝑛𝑐 + 𝛽3(𝑦81𝑛𝑟𝑖𝑛𝑐) + 𝑢𝑖 
No Gretl, clique em Modelo, Mínimos Quadrados Ordinários e coloque a 
equação acima. Os resultados estão abaixo: 
 
49 
 
Observe que: 
• O preço médio dos imóveis distantes do incinerador no ano de 1978 foi de 
82.517,2. Valor que foi calculado na saída da página 45; 
• No ano de 1978, o preço médio dos imóveis localizados perto do incinerador 
foi 18.824,4 a menos que os imóveis localizados longe do incinerador. 
Portanto, esse valor mede o efeito da localização que independe da presença 
do incinerador; 
• O estimador do modelo Dif-Dif é representado pela dummy de interação. Ele 
indica, que no ano de 1981, o preço médio dos imóveis localizados perto do 
incinerador foi 11.863,90 inferior ao preço médio dos imóveis localizados 
longe do incinerador. 
• Neste modelo, por hipótese, estamos considerando que o grupo de 
tratamento (imóveis de 81) e o grupo de controle (imóveis de 1978) possuem 
características semelhantes, ou seja, estamos considerando que os dois 
grupos possuem tendência comum (vide gráfico pág. 42). Caso essa hipótese 
seja abandonada, o estimador Dif-Dif será viesado. 
Para resolver esse problema, o modelo Dif-Dif precisa controlar outras variáveis 
que podem afetar o preço dos imóveis além da variável incinerador. Isso pode 
ser feito, incluindo novas variáveis X’s na equação (1): 𝑟𝑝𝑟𝑖𝑐𝑒 = 𝛽0 + 𝛽1𝑌81 + 𝛽2𝑛𝑒𝑎𝑟𝑖𝑛𝑐 + 𝛽3(𝑦81𝑛𝑟𝑖𝑛𝑐) + 𝛽4𝑖𝑛𝑡𝑠𝑡 + 𝛽5𝑙𝑎𝑛𝑑 + 𝛽6𝑎𝑟𝑒𝑎+ 𝛽7𝑟𝑜𝑜𝑚𝑠 + 𝛽8𝑏𝑎𝑡ℎ𝑠 + 𝛽9𝑎𝑔𝑒 + 𝛽10𝑎𝑔𝑒𝑠𝑞 + 𝑢𝑖 
 
Onde: 
• rprice = preço dos imóveis a preços constantes de 1981 
• y81 = dummy de ano (= 1 se os dados são do ano de 1981) 
 
50 
• nearinc = dummy de localização (= 1 se o imóvel é localizado perto do 
incinerador) 
• y81nrinc = dummy de interação (=1 se o imóvel está localizado perto do 
incinerador e foi vendido em 1981) 
• Age – idade do imóvel 
• Agesq – idade do imóvel ao quadrado 
• Área – área construída do imóvel 
• Baths – número de banheiros 
• Intst – distância do imóvel até a rodovia interestadual 
• Land – área do terreno 
• Rooms – número de quartos. 
Estimando o modelo acima, temos: 
 
Observe que: 
• O valor do R2 subiu em comparação ao modelo mais simples; 
• O erro padrão do estimador Dif-Dif (y81nrinc) caiu em comparação ao erro 
padrão do modelo mais simples. 
• O estimador Dif-Dif agora não é significativo, o que pode indicar que as 
variáveis inseridas, tem um peso maior na determinação do preço médio dos 
imóveis do que a inauguração do incinerador na região. f 
Exemplo 09: Efeito do aumento do salário mínimo sobre o emprego 
O arquivo njmin3.gdt possui dados de 410 restaurantes de grandes redes de fast 
food localizados nas cidades de New Jersey e Pensilvânia. O objetivo é verificar 
 
51 
o impacto do salário mínimo sobre o emprego, ocorrido apenas em New Jersey 
em 1992. Dessa forma, New Jersey é grupo de tratamento, enquanto a 
Pensilvânia é o grupo de controle. Os dados se referem a antes e depois da 
mudança da lei de salário mínimo. A equação teórica é dada por: 𝑓𝑡𝑒 = 𝛽0 + 𝛽1𝑑 + 𝛽2𝑛𝑗 + 𝛽3(𝑑_𝑛𝑗) + 𝑢𝑖 
Onde: 
• Fte = percentual de trabalhadores em regime de tempo integral 
• D = variável dummy de tempo (= 1 se a observaçãoé de depois da mudança 
da lei) 
• Nj = variável dummy de localização (= 1 se o restaurante é de New Jersey) 
• D_nj = variável dummy de interação (= 1 se o restaurante é de New Jersey e 
a observação é de depois da mudança da lei) 
Coloque os dados para dentro do Gretl e estime a equação acima. A saída 
abaixo mostra os resultados: 
 
Observe que: 
• A constante representa a taxa de emprego médio dos trabalhadores em 
tempo integral, da cidade da Pensilvânia antes da mudança da lei. 
• O percentual de trabalhadores em tempo integral de New Jersey é 2,89 
abaixo dos trabalhadores da Pensilvânia. 
• A taxa de emprego após a mudança da lei é 2,16 mais baixo do que antes da 
mudança. 
• O estimador Dif-Dif não é significativo. O que indica que o modelo precisa 
incorporar outros controles (regressores). 
 
52 
Para isso, a equação teórica passaria a ser: 𝑓𝑡𝑒 = 𝛽0 + 𝛽1𝑑 + 𝛽2𝑛𝑗 + 𝛽3(𝑑_𝑛𝑗) + 𝛽4𝑘𝑓𝑐 + 𝛽5𝑟𝑜𝑦𝑠 + 𝛽6𝑤𝑒𝑛𝑑𝑦𝑠 + 𝛽7𝑐𝑜_𝑜𝑤𝑛𝑒𝑑 + 𝑢𝑖 
Onde, além das variáveis já mencionadas, temos: 
• Kfc = variável dummy de empresa (= 1 se o restaurante é da kfc) 
• Bk = variável dummy de empresa (= 1 se o restaurante é do Burger King) 
• Roys = variável dummy de empresa (= 1 se o restaurante é da Roy Rodgers) 
• Wendys = variável dummy de empresa (= 1 se o restaurante é da Wendys) 
• Coowned = variável dummy de tipo de administração (= 1 se o restaurante é 
administrado pela matriz, ou seja, não é franqueado) 
Estimamos o modelo temos: 
 
Observe que: 
• Agora a variável do modelo Dif-Dif (d_nj) é significativa a 10%. O seu valor 
indica que, a política de aumento do salário mínimo teve um impacto positivo 
sobre o nível do emprego. Esse resultado, é diferente do que fala a literatura; 
• Um restaurante do KFC possui uma taxa de trabalhadores em tempo integral 
10,45 inferior ao restaurante BK; 
• Um restaurante, com administração própria da rede, possui uma taxa de 
trabalhadores em tempo integral 1,16 inferior aos restaurantes administrados 
pelos franqueados. 
 
 
53 
2.2.6 – Regressões Aparentemente não Relacionadas – SUR 
Um modelo de regressão aparentemente não relacionada (SUR) considera que 
os parâmetros da regressão (βs) diferem entre as diversas firmas, mas são 
constantes no tempo, ou seja, o modelo a ser rodado torna-se: 𝑌𝑖𝑡 = 𝛽1𝑖 + 𝛽2𝑖𝑋2𝑖𝑡 + 𝛽3𝑖𝑋3𝑖𝑡 + 𝑒𝑖𝑡 
Além disso, o modelo SUR considera que existe uma correlação contemporânea 
entre os resíduos de cada grupo (firmas, pessoas, etc) de observações: 𝑐𝑜𝑣(𝑒𝑚𝑡, 𝑒𝑛𝑡) = 𝜎𝑚𝑛 (1) 
Ou seja, a equação (1) indica que no ano t os mesmos fatores que influenciam 
os resíduos do grupo m também influenciam os resíduos do grupo n. 
O objetivo da estimação SUR é produzir estimativas melhores considerando a 
correlação contemporânea entre os resíduos. Em termos práticos, o software 
econométrico segue os seguintes passos: 
1) Estimar as equações separadamente para cada grupo utilizando MQO; 
2) Usar os resíduos de mínimos quadrados do 1º passo, para estimar 𝜎𝑚2 , 𝜎𝑛2 , 𝜎𝑚𝑛 (variância do grupo m, variância do grupo n e covariância 
entre m e n); 
3) Usar as estimativas do 2º passo para estimar as equações conjuntamente 
dentro do esquema de Mínimos Quadrados Generalizados (MQG). 
 
Exemplo 10: Modelo de investimento (Livro Hill, Judge e Griffiths, pág. 412). 
Considere abaixo, o modelo de investimento para as empresas General Eletric 
(G) e Westinghouse (W): 𝐼𝑛𝑣𝐺𝑇 = 𝛽1𝐺 + 𝛽2𝐺𝑉𝐺𝑇 + 𝛽3𝐺𝐾𝐺𝑇 + 𝑒𝐺𝑇 𝐼𝑛𝑣𝑊𝑇 = 𝛽1𝑊 + 𝛽2𝑊𝑉𝑊𝑇 + 𝛽3𝑊𝐾𝑊𝑇 + 𝑒𝑊𝑇 
 
Para esse exemplo a equação (1) torna-se: 𝑐𝑜𝑣(𝑒𝐺𝑡, 𝑒𝑊𝑡) = 𝜎𝐺𝑊 
Para entender por que 𝑒𝐺𝑡 e 𝑒𝑊𝑡 podem ser correlacionados, recorde que esses 
erros contêm a influência, sobre o investimento, de fatores que foram omitidos 
das equações. Tais fatores podem incluir utilização da capacidade, taxas de 
juros correntes e passadas, liquidez e a situação geral da economia. 
 
54 
Utilizando o arquivo tabela 9.3, insira os dados no Gretl. A figura abaixo mostra 
as variáveis: 
 
Para estimar o modelo SUR, clique em Modelo e selecione Equações 
Simultâneas. Na Caixa, coloque as seguintes equações: 
equation I_GE const K_GE V_GE 
equation I_WE const K_WE V_WE 
Selecione o modelo SUR e aperte ok. A saída abaixo, mostra os resultados: 
 
55 
 
Observe que o modelo SUR roda duas equações separadas, considerando a 
correlação contemporânea entre os resíduos [𝑐𝑜𝑣(𝑒𝐺𝑡, 𝑒𝑊𝑡) = 𝜎𝐺𝑊 ]. 
Usando o mesmo sistema, também podemos rodar as equações separadas 
através de MQO. Para isso, clique em Modelo, Equações Simultâneas e 
selecione MQO. A saída abaixo mostra os resultados: 
 
56 
 
 
Compare os resultados. 
Qual estimação é melhor? MQO ou SUR? 
A diferença entre as estimativas está no fato do modelo SUR considera a 
correlação contemporânea entre os resíduos de cada equação, ou seja, 𝑟𝑚𝑛 ≠ 0. 
Dessa forma, uma maneira simples é usar a seguinte hipótese nula: 𝐻0: 𝑟𝑚𝑛 = 0 ⟹ 𝑜 𝑚𝑒𝑙ℎ𝑜𝑟 𝑚𝑜𝑑𝑒𝑙𝑜 é 𝑀𝑄𝑂 
Neste caso, calculamos a seguinte equação: 𝜆 = 𝑇𝑟𝑚𝑛2 ~𝒳 𝑜𝑛𝑑𝑒 𝑇 é 𝑢𝑚 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎𝑛𝑜𝑠(𝑑𝑖𝑎𝑠, 𝑚𝑒𝑠𝑒𝑠, 𝑒𝑡𝑐) 
O valor de 𝑟𝑚𝑛 é dado pela seguinte fórmula: 𝑟𝑚𝑛 = �̂�𝑚,𝑛2�̂�𝑚2 ∗ �̂�𝑛2 = 𝑐𝑜𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑜𝑠 𝑔𝑟𝑢𝑝𝑜𝑠 𝑚 𝑒 𝑛√𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 𝑑𝑜 𝑔𝑟𝑢𝑝𝑜 𝑚 ∗ 𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 𝑑𝑜 𝑔𝑟𝑢𝑝𝑜 𝑛 
 
57 
𝑟𝑔𝑒,𝑤𝑒 = �̂�𝑔𝑒,𝑤𝑒2√�̂�𝑔𝑒2 ∗ �̂�𝑤𝑒2 
Para realizar este teste no Gretl, rode o modelo MQO10 e analise a parte final 
da saída de regressão. Temos: 
𝑟𝑔𝑒,𝑤𝑒 = �̂�𝑔𝑒,𝑤𝑒2√�̂�𝑔𝑒2 ∗ �̂�𝑤𝑒2 = 176,45√660,83 ∗ 88,662 = 0,72896 ≅ 0,729 
 
O valor da correlação dos resíduos entre as duas equações é dado pelo termo 
entre parênteses da matriz de covariâncias (0,729). Dessa forma, temos: 𝜆 = 𝑇𝑟𝑚𝑛2 = 20 ∗ (0,729)2 = 10,6288 
Como temos apenas uma correlação (𝑟𝐺𝐸𝑊𝐸2 ), na tabela Qui-quadrada 
procuramos o nível de significância com um grau de liberdade. Clique em 
Ferramentas, Tabelas Estatísticas. Coloque 1 em gl e 0,05 probabilidade da 
cauda direita. Temos os seguintes resultados: 
 
Neste caso o valor crítico de uma distribuição qui-quadrada com 5% de 
significância e um grau de liberdade é 3,84. 
Com isso, rejeitamos a hipótese nula (10,62 > 3,84), ou seja, o melhor modelo é 
o SUR. 
Os mesmos resultados podem ser obtidos, com a análise do p-valor (valor entre 
colchetes) do teste de Breusch-Pagan da saída MQO. Neste caso, como o p-
valor é menor que o nível de significância (0,0011 <0,05), rejeitamos a hipótese 
nula. 
Exemplo 11: Taxa de crescimento (Livro Hill, Judge e Griffiths, pág. 419, 
exercício 17.2). 
 
10 O Gretl apresenta o mesmo teste na saída do modelo SUR. Entretanto, o teste correto é aquele 
produzido pela saída de MQO e, portanto, o teste da saída do modelo SUR está errado. 
 
58 
Vamos rodar o modelo de crescimento proposto por Stengos apud Hill. O modelo 
teórico é dado abaixo: 𝐺60 = 𝛽1 + 𝛽260𝑃𝑂𝑃60 + 𝛽360𝐼𝑁𝑉60 + 𝛽460𝐼𝐺𝐷𝑃60 +𝛽560𝑆𝐸𝐶60 + 𝑒60 𝐺70 = 𝛽1 + 𝛽270𝑃𝑂𝑃70 + 𝛽370𝐼𝑁𝑉70 + 𝛽460𝐼𝐺𝐷𝑃70 + 𝛽570𝑆𝐸𝐶70 + 𝑒70 𝐺80 = 𝛽1 + 𝛽280𝑃𝑂𝑃80 + 𝛽360𝐼𝑁𝑉80 + 𝛽460𝐼𝐺𝐷𝑃80+𝛽580𝑆𝐸𝐶80 + 𝑒80 
Onde: 
G – taxa de crescimento de cada país 
POP – crescimento populacional 
INV – parcela da produção destinada ao investimento 
IGDP – índice inicial do PIB em 1960 em termos reais 
SEC – capital humano medido em termos da taxa de matrícula no secundário. 
Utilizando os dados da tabela 17.2, insira os dados no Gretl: 
 
Vamos agora estimar o modelo SUR. Clique em Modelo, Equações 
Simultâneas. Insira o sistema abaixo: 
 
59 
 
Teremos a seguinte saída de regressão: 
 
 
 
60 
 
 
 
 
Será que o impacto do investimento sobre a taxa de crescimento não seria o 
mesmo nos três anos, ou seja,𝛽𝐼𝑛𝑣60 = 𝛽𝐼𝑛𝑣70 = 𝛽𝐼𝑛𝑣80. Para realizar o teste, 
clique em Testes, Restrições Lineares e coloque a hipótese nula. Neste caso, 
o Gretl trabalha com formatob[i,j], onde i se refere ao número da equação e j ao 
número do 𝛽 (iniciando em 1). Assim, temos: 
 
Observe que a primeira linha equivale a 𝛽𝐼𝑛𝑣60 = 𝛽𝐼𝑛𝑣70, enquanto a segunda 
linha seria 𝛽𝐼𝑛𝑣70 = 𝛽𝐼𝑛𝑣80. Abaixo temos os resultados do teste: 
 
 
61 
 
Como o p-valor é maior que o nível de significância (0,2805>0,01), aceitamos a 
hipótese nula, ou seja, os coeficientes são iguais. 
Agora vamos rodar MQO: 
 
 
62 
 
 
Teste a hipótese de qual é o melhor modelo (SUR ou MQO). 
Neste caso, temos a seguinte hipótese nula: 𝐻0: 𝑟6070 = 𝑟6080 = 𝑟7080 = 0 
Como temos três equações a fórmula do teste também muda: 𝜆 = 𝑇(𝑟60702 + 𝑟60802 + 𝑟70802 ) = 86[(0,085)2 + (0,087)2 + (0,343)2] 𝜆 = 11,39. 
Observe que na saída de regressão de MQO, os valores das correlações estão 
entre parênteses. Além isso, o valor do 𝜆 é dado no teste de Breusch-Pagan 
(11,407211) 
Como temos três correlações (𝑟6070 , 𝑟6080 , 𝑟7080), na tabela Qui-quadrada 
procuramos o nível de significância com três graus de liberdade. Clique em 
Ferramentas, Tabelas Estatísticas. Coloque 3 em gl e 0,05 probabilidade da 
cauda direita. Temos os seguintes resultados: 
 
11 O valor de 11,4072 é ligeiramente diferente do valor calculado de 11,39. O motivo é uma simples 
questão de arredondamento, já que o valor de 11,39 foi calculado considerando apenas três casas 
decimais. 
 
63 
 
Como o valor 𝜆 é maior que o valor tabelado (11,39 > 7,814), rejeitamos a 
hipótese nula, ou seja, o melhor modelo é o SUR. 
O mesmo resultado é visto analisando o p-valor do teste Breusch Pagan (0,0097 
< 0,01). 
Exemplo 12: Modelo de investimento Revisitado 
O arquivo Greene 13_1 apresenta os mesmos dados do exemplo 10 (pág. 52) 
com 05 empresas. 
Tente executar os seguintes itens: 
• O modelo SUR 
• O modelo MQO 
• Teste a hipótese de que no modelo SUR 𝛽𝐹𝐺𝑀 = 𝛽𝐹𝑈𝑆 
• Qual o modelo é o melhor SUR ou MQO?

Continue navegando