Aula 3 - Regressao com Dados em Painel 2023

breadcrumb-separator

UFV

Raquel Patrícia Felipe

em 24/05/2024

Conteúdos escolhidos para você

dados em painel no R-parte básica

dados em painel no R-parte básica

Aula 2 - Examinando seus dados

Aula 2 - Examinando seus dados

ESTÁCIO

Livro-Texto 2 - Ciência de Dados

Livro-Texto 2 - Ciência de Dados

UNIP

Exercícios

UNIP

Avaliação Final (Objetiva) - Econometria I

Avaliação Final (Objetiva) - Econometria I

Uniasselvi

Perguntas dessa disciplina

1. Variável é toda característica que, observada em uma unidade da população ou amostra, pode variar de um indivíduo para outro (Callegari-Jacques...

UNILAVRAS

Um economista está planejando um estudo para analisar o impacto de diferentes fatores socioeconômicos no consumo de energia elétrica. Antes de inic...

Uma equipe de auditoria interna está analisando o desempenho de vendas diárias de uma filial específica, que é uma variável contínua. Durante a fas...

Um economista está planejando um estudo para analisar o impacto de diferentes fatores socioeconômicos no consumo de energia elétrica. Antes de inic...

Um time de cientistas de dados está desenvolvendo um modelo de regressão linear múltipla para prever o preço de imóveis (variável dependente Y) com...

Material

Conteúdos escolhidos para você

dados em painel no R-parte básica

dados em painel no R-parte básica

Aula 2 - Examinando seus dados

Aula 2 - Examinando seus dados

ESTÁCIO

Livro-Texto 2 - Ciência de Dados

Livro-Texto 2 - Ciência de Dados

UNIP

Exercícios

UNIP

Avaliação Final (Objetiva) - Econometria I

Avaliação Final (Objetiva) - Econometria I

Uniasselvi

Perguntas dessa disciplina

1. Variável é toda característica que, observada em uma unidade da população ou amostra, pode variar de um indivíduo para outro (Callegari-Jacques...

UNILAVRAS

Um economista está planejando um estudo para analisar o impacto de diferentes fatores socioeconômicos no consumo de energia elétrica. Antes de inic...

Uma equipe de auditoria interna está analisando o desempenho de vendas diárias de uma filial específica, que é uma variável contínua. Durante a fas...

Um economista está planejando um estudo para analisar o impacto de diferentes fatores socioeconômicos no consumo de energia elétrica. Antes de inic...

Um time de cientistas de dados está desenvolvendo um modelo de regressão linear múltipla para prever o preço de imóveis (variável dependente Y) com...

Prévia do material em texto

Regressão com dados em Painel
UNIVERSIDADE DE SÃO PAULO
FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E
CONTABILIDADE DE RIBEIRÃO PRETO
DEPARTAMENTO DE CONTABILIDADE
Prof. Fabiano Guasti Lima
fabianoguastilima@gmail.com
Pós-Graduação – 2023
mailto:fabianoguastilima@gmail.com
Linearidade dos coeficientes e das variáveis
Normalidade dos resíduos
Homoscedasticidade dos resíduos
Ausência de autocorrelação dos resíduos
Multicolinearidade das variáveis 
independentes
Regressão Múltipla
Pressupostos
 Kolmogorov – Smirnov (n>=30)
 Shapiro-Wilk (n<30)
 Shapiro-Francia (5<=n<=5000)
H0: A amostra provém de uma população com Distribuição Normal
H1: A amostra NÃO provém de uma população Distribuição Não Normal
Normalidade dos resíduos
Pressupostos
Tolerance – estimado com cada variaveis independente como se dependente
fosse e regredindo-a em relação as demais.
VIF – (Variance Inflation Factor). Tolerance
Até 1 – sem multicolineariedade Até 1
De 1 até 10 – multicolineariedade aceitável De 1 até 0,10
Acima de 10 – multicolineariedade problemática Abaixo de 0,10
Multicolinearidade das variáveis 
independentes
Pressupostos
Ausência de autocorrelação dos resíduos
TESTE DE DURBIN WATSON
Pressupostos
0
1
0 : Correlação entre os resíduos é nula (independência)
0 :Existe correlação entre os resíduos (dependência)
H
H


 
 
5
(I) (II) (III) (IV) (V)
0 dL du 2 4 – du L 4
d < 2 d > 2
Positiva Negativa
autocorrelação 
negativa
autocorrelação 
positiva
não 
conclusivo
ausência de 
autocorrelação não 
conclusivo
4 – d
Normalidade dos resíduos
Pressupostos
Homoscedasticidade dos resíduos
Pressupostos
0
1
não existe heterocedasticidade
existe heterocedasticidade
H
H


Teoria – Análise de dados em Painel 
(Dados Longitudinais)
Análise de dados em Cross – Section:
Dados de várias empresas em um mesmo período de
tempo.
Ex: 100 empresas no ano de 2022
Regressão Linear Simples/Múltipla
Análise de dados Séries de Tempo:
Dados de uma empresa ao longo de vários períodos de
tempo.
Ex: 1 Empresa no período de 2010 a 2022
Modelos de Séries de Tempo
Análise de dados Painel:
Dados de várias empresas ao longo de vários períodos
de tempo.
Ex: 100 empresas no período de 2010 a 2022
Teoria – Análise de dados em Painel 
(Dados Longitudinais)
Análise de dados em Cross – Section (Corte Transversal):
Teoria – Análise de dados em Painel 
(Dados Longitudinais)
Análise de dados em Série Temporal:
Teoria – Análise de dados em Painel 
(Dados Longitudinais)
Análise de dados em Painel:
Dados em Painel
 Painel Curto: painel com T < N
 Número de períodos no tempo é menor 
que o número de observações na 
amostra
 Painel Longo: painel com T > N
 Número de períodos no tempo é maior 
que o número de observações na 
amostra
Teoria – Análise de dados em Painel
Vantagens - Modelo Painel:
Maior Quantidade de dados analisados:
Maior Quantidade de Dados – Empresas e Período.
Redução da heterogeneidade individual, Menor
colineariedade entre as variáveis, mais graus de
liberdade e estimadores mais eficientes :
Observação de vários indivíduos na amostra ao longo do
tempo.
Maior Variabilidade dos dados:
Séries mais suavizadas ao longo do período analisado.
Teoria – Análise de dados em Painel
Painel Pooled (POLS) ou restrito:
Nestes modelos a estimação é feita assumindo que os 
parâmetros a e b´s são comuns para todos os indivíduos:
(homogeneidade na parte constante e na inclinação)
Nada mais é do que uma regressão agrupada (pooled)
POLS  Pooled Ordinary Least Square 
Desconsidera as dimensões de tempo e espaço. Todos os 
coeficientes são constantes ao longo do tempo e entre os 
indivíduos. CONSIDERA que a variância dos resíduos que reflete 
diferenças individuais é igual a zero.
Empilha-se as observações e obtém-se a regressão 
ititit ubXaY  ....
Teoria – Análise de dados em Painel
Painel Efeito Fixo
Nestes modelos, permite que o intercepto varie para 
cada observação, levando em conta a natureza específica dos 
casos, porém considera-se que os coeficientes angulares são 
constantes (fixos) entre os casos.
(heterogeneidade na parte constante e homogeneidade nas 
inclinações)
Cada unidade de corte transversal tem um intercepto
fixo no tempo.
Embora o intercepto possa diferir entre os indivíduos, o
intercepto de cada indivíduo não varia com o tempo
Y
it
=a
i
+bX
it
+....+u
it
Teoria – Análise de dados em Painel
Painel Efeito Aleatório:
Nestes modelos, a estimação é feita introduzindo a
heterogeneidade dos indivíduos no termo de erro Os modelos com
efeitos aleatórios consideram como um parâmetro aleatório não
observável:
O intercepto (a) é uma variável aleatória representada
por um valor médio comum para todos os indivíduos, ficando
diferenças individuais do intercepto de cada empresa (ou
suas características não observadas , em relação ao valor
médio no termo de erro
composto.
Y
it
=a+bX
it
+....+ a
i
+u
it( )
componente de erro individual (características
Não observadas de cada empresa)
a
i
componente de erro composto
Teoria – Análise de dados em Painel
Caso 1 : Regressão Pooled
É a maneira mais simples e mais fácil;
Desconsidera as dimensões de tempo e espaço;
É um modelo de REGRESSÃO MÚLTIPLA – Colocar 
Dummys – ANO – CASOS OU AS DUAS
Empilha-se as observações e roda-se a regressão:
Teoria – Análise de dados em Painel - Hipóteses
Caso 2: Painel Efeito Fixo
Faz o intercepto variar por empresa;
Permite uma análise mais profunda das diferenças 
entre os indivíduos
Embora o intercepto possa diferir entre os casos.
Cada intercepto individual não se altera ao longo do 
tempo.
Variáveis fixa no tempo são eliminadas – Controle 
variáveis omitidas.
Não é enviesado quando as variáveis não observadas 
são correlacionadas com as variáveis explicativas;
Apresenta melhores resultados quando a amostra não 
é uma boa representação da população estudada.
RESULTADOS SEMELHANTES NO CASO DE RODAR UMA 
OLS COM VARIÁVEIS DUMMY PARA CADA EMPRESA
Teoria – Análise de dados em Painel - Hipóteses
Caso 3: Painel Efeito aleatório
As empresas tem um valor médio comum para o 
intercepto (BETA 1)
As diferenças individuais no intercepto de cada 
empresa se refletem no termo de erro. Ganha em eficiência, 
uma vez que perde menos graus de liberdade por possuir 
menos parâmetros a serem estimados. 
Ao invés de tratar o coeficiente BETA 1 como fixo, 
supõe-se ser uma variável aleatória com valor médio BETA 
1 (sem subscrito i). O intercepto para uma empresa individual 
ficaria:
1i 1 i
u
i 1,2,...,N
  

2
i
N(0, ) 
Teoria – Análise de dados em Painel
Teoria – Análise de dados em Painel
Fonte: Fávero, 2017, p. 795
Teoria – Análise de dados em Painel
Modelo Efeitos
Fixos
Modelo de Efeitos Aleatórios
Cada unidade de corte 
transversal tem seu próprio valor 
fixo de intercepto, em todos os N 
valores para N unidades de corte 
transversal
O intercepto representa um valor 
médio de todos os interceptos de 
corte transversal e o elemento de 
erro EPSILON representa o desvio 
(aleatório) do intercepto 
individual de seu valor médio;
EPSILON é uma variável latente 
(não diretamente observável)
Teoria – Análise de dados em Painel
Teste de Hausman, Chow e Breusch – Pagan (verifica se 
existe correlação entre os erros e as variáveis 
explicativas:
Teste de Chow:
Teste para escolher entre efeito fixo e pooled
Ho: Utilizar pooled
Teste de Breusch - Pagan:
Teste para escolher entre efeito aleatório e pooled
Ho: Utilizar pooled
Teste de Hausman:
Teste para escolher entre efeito fixo e aleatório
Ho: Utilizar Efeito aleatório
TESTE DE CHOW
MODELO POOL
MODELO DE EFEITOS FIXOS
TESTE DE HAUSMAN
MODELO DE EFEITOS ALEATÓRIOS
Teoria – Análise de dados em Painel
TESTE DE BREUSH -
PAGAN
MODELO POOL
MODELO DE EFEITOS ALEATÓRIOS
MODELO DE EFEITOS FIXOS
Teoria – Análise de dados em Painel
Teste adicionais:
Autocorrelação (teste de Wooldridge) 
Instalação: finditxtserial, clicar em st0039 e depois click 
here to instal
hipótese nula: presença de autocorrelação.
Teoria – Análise de dados em Painel
Teste adicionais:
Autocorrelação (teste de Wooldridge) 
Instalação: findit xtserial, clicar em st0039 e depois click 
here to instal hipótese nula: presença de 
autocorrelação.
Teoria – Análise de dados em Painel
Teste adicionais:
Teste de Wald para heterocedasticidade em grupo (efeitos 
fixos) 
Instalação: findit xttest3, clicar em st0004 e depois click here to 
install 
hipótese nula: presença de heterocedasticidade.
Para solucionar problema – rodar modelos robustos
Teoria – Análise de dados em Painel
Teste adicionais:
Teste de Wald para heterocedasticidade em grupo (efeitos 
fixos) 
Instalação: findit xttest3, clicar em st0004 e depois click here to 
install 
hipótese nula: presença de heterocedasticidade.
Para solucionar problema – rodar modelos robustos
Teoria – Análise de dados em Painel
Classificações de acordo com a amostra - Modelo
Painel:
Painel Curto:
Quantidade de indivíduos (Empresas) maior que a
quantidade de períodos.
Painel Longo:
Quantidade de indivíduos (Empresas) menor que a
quantidade de períodos
Não existe diferença para rodar dos dois tipos de
Painel.
Teoria – Análise de dados em Painel – Resumo 
Modelos
Classificações de acordo com a amostra - Modelo Painel:
Painel Balanceado:
Dados disponíveis para todas os indivíduos ao longo de todo
período analisado.
Painel Desbalanceado:
Dados não disponíveis (Faltantes) para todas os indivíduos ao
longo de todo período analisado.
Comando: Drop if dependente==.
Diferenças na estimação dos dois casos:
Não existe diferença para rodar os dois tipos de painel;
Deve-se tomar cuidado com a origem dos dados faltantes, pois
pode trazer viés para a análise
Como a quantidade de dados no painel desbalanceado é menor a
eficiência do estimador diminui.
Teoria – Análise de dados em Painel - Balanceado
Teoria – Análise de dados em Painel -
Desbalanceado
Comando: Drop if dependente ==.
Teoria – Análise de dados em Painel -
Desbalanceado
Teoria – Análise de dados em Painel -
Desbalanceado