Prévia do material em texto
Regressão com dados em Painel UNIVERSIDADE DE SÃO PAULO FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E CONTABILIDADE DE RIBEIRÃO PRETO DEPARTAMENTO DE CONTABILIDADE Prof. Fabiano Guasti Lima fabianoguastilima@gmail.com Pós-Graduação – 2023 mailto:fabianoguastilima@gmail.com Linearidade dos coeficientes e das variáveis Normalidade dos resíduos Homoscedasticidade dos resíduos Ausência de autocorrelação dos resíduos Multicolinearidade das variáveis independentes Regressão Múltipla Pressupostos Kolmogorov – Smirnov (n>=30) Shapiro-Wilk (n<30) Shapiro-Francia (5<=n<=5000) H0: A amostra provém de uma população com Distribuição Normal H1: A amostra NÃO provém de uma população Distribuição Não Normal Normalidade dos resíduos Pressupostos Tolerance – estimado com cada variaveis independente como se dependente fosse e regredindo-a em relação as demais. VIF – (Variance Inflation Factor). Tolerance Até 1 – sem multicolineariedade Até 1 De 1 até 10 – multicolineariedade aceitável De 1 até 0,10 Acima de 10 – multicolineariedade problemática Abaixo de 0,10 Multicolinearidade das variáveis independentes Pressupostos Ausência de autocorrelação dos resíduos TESTE DE DURBIN WATSON Pressupostos 0 1 0 : Correlação entre os resíduos é nula (independência) 0 :Existe correlação entre os resíduos (dependência) H H 5 (I) (II) (III) (IV) (V) 0 dL du 2 4 – du L 4 d < 2 d > 2 Positiva Negativa autocorrelação negativa autocorrelação positiva não conclusivo ausência de autocorrelação não conclusivo 4 – d Normalidade dos resíduos Pressupostos Homoscedasticidade dos resíduos Pressupostos 0 1 não existe heterocedasticidade existe heterocedasticidade H H Teoria – Análise de dados em Painel (Dados Longitudinais) Análise de dados em Cross – Section: Dados de várias empresas em um mesmo período de tempo. Ex: 100 empresas no ano de 2022 Regressão Linear Simples/Múltipla Análise de dados Séries de Tempo: Dados de uma empresa ao longo de vários períodos de tempo. Ex: 1 Empresa no período de 2010 a 2022 Modelos de Séries de Tempo Análise de dados Painel: Dados de várias empresas ao longo de vários períodos de tempo. Ex: 100 empresas no período de 2010 a 2022 Teoria – Análise de dados em Painel (Dados Longitudinais) Análise de dados em Cross – Section (Corte Transversal): Teoria – Análise de dados em Painel (Dados Longitudinais) Análise de dados em Série Temporal: Teoria – Análise de dados em Painel (Dados Longitudinais) Análise de dados em Painel: Dados em Painel Painel Curto: painel com T < N Número de períodos no tempo é menor que o número de observações na amostra Painel Longo: painel com T > N Número de períodos no tempo é maior que o número de observações na amostra Teoria – Análise de dados em Painel Vantagens - Modelo Painel: Maior Quantidade de dados analisados: Maior Quantidade de Dados – Empresas e Período. Redução da heterogeneidade individual, Menor colineariedade entre as variáveis, mais graus de liberdade e estimadores mais eficientes : Observação de vários indivíduos na amostra ao longo do tempo. Maior Variabilidade dos dados: Séries mais suavizadas ao longo do período analisado. Teoria – Análise de dados em Painel Painel Pooled (POLS) ou restrito: Nestes modelos a estimação é feita assumindo que os parâmetros a e b´s são comuns para todos os indivíduos: (homogeneidade na parte constante e na inclinação) Nada mais é do que uma regressão agrupada (pooled) POLS Pooled Ordinary Least Square Desconsidera as dimensões de tempo e espaço. Todos os coeficientes são constantes ao longo do tempo e entre os indivíduos. CONSIDERA que a variância dos resíduos que reflete diferenças individuais é igual a zero. Empilha-se as observações e obtém-se a regressão ititit ubXaY .... Teoria – Análise de dados em Painel Painel Efeito Fixo Nestes modelos, permite que o intercepto varie para cada observação, levando em conta a natureza específica dos casos, porém considera-se que os coeficientes angulares são constantes (fixos) entre os casos. (heterogeneidade na parte constante e homogeneidade nas inclinações) Cada unidade de corte transversal tem um intercepto fixo no tempo. Embora o intercepto possa diferir entre os indivíduos, o intercepto de cada indivíduo não varia com o tempo Y it =a i +bX it +....+u it Teoria – Análise de dados em Painel Painel Efeito Aleatório: Nestes modelos, a estimação é feita introduzindo a heterogeneidade dos indivíduos no termo de erro Os modelos com efeitos aleatórios consideram como um parâmetro aleatório não observável: O intercepto (a) é uma variável aleatória representada por um valor médio comum para todos os indivíduos, ficando diferenças individuais do intercepto de cada empresa (ou suas características não observadas , em relação ao valor médio no termo de erro composto. Y it =a+bX it +....+ a i +u it( ) componente de erro individual (características Não observadas de cada empresa) a i componente de erro composto Teoria – Análise de dados em Painel Caso 1 : Regressão Pooled É a maneira mais simples e mais fácil; Desconsidera as dimensões de tempo e espaço; É um modelo de REGRESSÃO MÚLTIPLA – Colocar Dummys – ANO – CASOS OU AS DUAS Empilha-se as observações e roda-se a regressão: Teoria – Análise de dados em Painel - Hipóteses Caso 2: Painel Efeito Fixo Faz o intercepto variar por empresa; Permite uma análise mais profunda das diferenças entre os indivíduos Embora o intercepto possa diferir entre os casos. Cada intercepto individual não se altera ao longo do tempo. Variáveis fixa no tempo são eliminadas – Controle variáveis omitidas. Não é enviesado quando as variáveis não observadas são correlacionadas com as variáveis explicativas; Apresenta melhores resultados quando a amostra não é uma boa representação da população estudada. RESULTADOS SEMELHANTES NO CASO DE RODAR UMA OLS COM VARIÁVEIS DUMMY PARA CADA EMPRESA Teoria – Análise de dados em Painel - Hipóteses Caso 3: Painel Efeito aleatório As empresas tem um valor médio comum para o intercepto (BETA 1) As diferenças individuais no intercepto de cada empresa se refletem no termo de erro. Ganha em eficiência, uma vez que perde menos graus de liberdade por possuir menos parâmetros a serem estimados. Ao invés de tratar o coeficiente BETA 1 como fixo, supõe-se ser uma variável aleatória com valor médio BETA 1 (sem subscrito i). O intercepto para uma empresa individual ficaria: 1i 1 i u i 1,2,...,N 2 i N(0, ) Teoria – Análise de dados em Painel Teoria – Análise de dados em Painel Fonte: Fávero, 2017, p. 795 Teoria – Análise de dados em Painel Modelo Efeitos Fixos Modelo de Efeitos Aleatórios Cada unidade de corte transversal tem seu próprio valor fixo de intercepto, em todos os N valores para N unidades de corte transversal O intercepto representa um valor médio de todos os interceptos de corte transversal e o elemento de erro EPSILON representa o desvio (aleatório) do intercepto individual de seu valor médio; EPSILON é uma variável latente (não diretamente observável) Teoria – Análise de dados em Painel Teste de Hausman, Chow e Breusch – Pagan (verifica se existe correlação entre os erros e as variáveis explicativas: Teste de Chow: Teste para escolher entre efeito fixo e pooled Ho: Utilizar pooled Teste de Breusch - Pagan: Teste para escolher entre efeito aleatório e pooled Ho: Utilizar pooled Teste de Hausman: Teste para escolher entre efeito fixo e aleatório Ho: Utilizar Efeito aleatório TESTE DE CHOW MODELO POOL MODELO DE EFEITOS FIXOS TESTE DE HAUSMAN MODELO DE EFEITOS ALEATÓRIOS Teoria – Análise de dados em Painel TESTE DE BREUSH - PAGAN MODELO POOL MODELO DE EFEITOS ALEATÓRIOS MODELO DE EFEITOS FIXOS Teoria – Análise de dados em Painel Teste adicionais: Autocorrelação (teste de Wooldridge) Instalação: finditxtserial, clicar em st0039 e depois click here to instal hipótese nula: presença de autocorrelação. Teoria – Análise de dados em Painel Teste adicionais: Autocorrelação (teste de Wooldridge) Instalação: findit xtserial, clicar em st0039 e depois click here to instal hipótese nula: presença de autocorrelação. Teoria – Análise de dados em Painel Teste adicionais: Teste de Wald para heterocedasticidade em grupo (efeitos fixos) Instalação: findit xttest3, clicar em st0004 e depois click here to install hipótese nula: presença de heterocedasticidade. Para solucionar problema – rodar modelos robustos Teoria – Análise de dados em Painel Teste adicionais: Teste de Wald para heterocedasticidade em grupo (efeitos fixos) Instalação: findit xttest3, clicar em st0004 e depois click here to install hipótese nula: presença de heterocedasticidade. Para solucionar problema – rodar modelos robustos Teoria – Análise de dados em Painel Classificações de acordo com a amostra - Modelo Painel: Painel Curto: Quantidade de indivíduos (Empresas) maior que a quantidade de períodos. Painel Longo: Quantidade de indivíduos (Empresas) menor que a quantidade de períodos Não existe diferença para rodar dos dois tipos de Painel. Teoria – Análise de dados em Painel – Resumo Modelos Classificações de acordo com a amostra - Modelo Painel: Painel Balanceado: Dados disponíveis para todas os indivíduos ao longo de todo período analisado. Painel Desbalanceado: Dados não disponíveis (Faltantes) para todas os indivíduos ao longo de todo período analisado. Comando: Drop if dependente==. Diferenças na estimação dos dois casos: Não existe diferença para rodar os dois tipos de painel; Deve-se tomar cuidado com a origem dos dados faltantes, pois pode trazer viés para a análise Como a quantidade de dados no painel desbalanceado é menor a eficiência do estimador diminui. Teoria – Análise de dados em Painel - Balanceado Teoria – Análise de dados em Painel - Desbalanceado Comando: Drop if dependente ==. Teoria – Análise de dados em Painel - Desbalanceado Teoria – Análise de dados em Painel - Desbalanceado