Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Aula 2 ECONOMETRIA Profa. Dra. Margarida Garcia de Figueiredo margaridagf@ufmt.br mgfiguei@gmail.com 24/04/2014 2 ECONOMETRIA - INTRODUÇÃO Ferramenta de análise. Utilizada em todos os campos da economia aplicada para testar e validar empiricamente informações contidas na teoria econômica. Baseada no desenvolvimento de métodos estatísticos para analisar conjuntos de dados econômicos. 3 BASE DE DADOS ECONOMETRIA ESTATÍSTICA MATEMÁTICAx Dados não- experimentais (Dados Observacionais) Dados experimentais ESTRUTURA DOS DADOS ECONÔMICOS • Dados de corte transversal (cross-section): dados sobre diferentes entidades (trabalhadores, consumidores, empresas, etc.) coletados em um único período de tempo. • Dados de séries temporais: dados para uma única entidade coletados em diferentes períodos de tempo (diários, semanais, mensais, anuais, etc.). • Dados de painel: também chamados de dados longitudinais, são dados de diversas entidades em que cada uma delas é observada em dois ou mais períodos de tempo. Tabela 1: Dados de corte transversal sobre características individuais No Obs salário educ exper 1 500 4 10 2 380 2 12 3 420 4 3 4 670 5 20 5 890 7 15 . . . . . . . . . . . . 500 240 0 2 ESTRUTURA DOS DADOS ECONÔMICOS Tabela 2. Dados de séries temporais para o Brasil No obs Ano PIB (R$ bilhões) FBCF (R$ bilhões) POP (milhões hab) EXPORT. (R$ bilhões) 1 1995 705,64 127,21 158,87 51,21 2 1996 843,96 143,81 161,32 55,42 3 1997 939,14 163,66 163,77 64,06 4 1998 979,27 166,75 166,25 67,89 . . . . . . . . . . . . . . . . . . 19 2013 4.103,51 871,98 201,032 608,21 ESTRUTURA DOS DADOS ECONÔMICOS Tabela 3. Dados de painel para indústrias No Obs Fábrica Ano Faturam. Prod No func. 1 1 2000 258.000 354 120 2 1 2001 300.000 409 202 3 1 2002 427.150 543 318 4 2 2000 1.400.000 2.325 450 5 2 2001 1.562.000 2.514 523 6 2 2002 1.680.000 2.590 612 . . . . . . . . . . . . . . . . . . 58 20 2000 558.000 437 229 59 20 2001 648.500 529 352 60 20 2002 728.250 673 418 ESTRUTURA DOS DADOS ECONÔMICOS 8 MODELOS DE REGRESSÃO MODELOS DE REGRESSÃO IMPORTANTE INSTRUMENTO DE ANÁLISE DA ECONOMETRIA MODELOS DE REGRESSÃO • Regressão Linear Simples • Regressão Linear Múltipla • Regressão Não-Linear iXY 110 iXXXY 3322110 ieXXY 53 4110 2 2 10 MODELOS DE REGRESSÃO EXEMPLO HIPOTÉTICO: POPULAÇÃO COM 60 FAMÍLIAS • Estimar o nível médio de consumo semanal (Y) destas famílias. • Em função de suas rendas semanais disponíveis (X). • 10 grupos com o mesmo nível de renda. • Estudaremos o consumo médio dentro de cada grupo. 11 EXEMPLO HIPOTÉTICO: População com 60 famílias Renda familiar semanal em US$ (X) Y ↓ X → 80 100 120 140 160 180 200 220 240 260 Consumo Familiar Semanal em US$(Y) 55 65 79 80 102 110 120 135 137 150 60 70 84 93 107 115 136 137 145 152 65 74 90 95 110 120 140 140 155 175 70 80 94 103 116 130 144 152 165 178 75 85 98 108 118 135 145 157 175 180 - 88 - 113 125 140 - 160 189 185 - - - 115 - - - 162 191 Média do Consumo 65 77 89 101 113 125 137 149 161 173 12 Figura 1. Consumo semanal em função da renda semanal disponível Para cada uma das classes de renda (Xi) é possível calcular o consumo médio ou expectativa condicional do consumo, representado por E (Y/X = Xi) 13 FUNÇÃO DE REGRESSÃO POPULACIONAL (FRP) Para cada Xi, existe uma população de valores Y, que se supõe estarem distribuídos normalmente ao redor da média. A função de regressão populacional (FRP) nada mais é do que a reta que passa através dessas médias. Y X Y = Consumo semanal X = Renda familiar semanal FRP 14 FUNÇÃO DE REGRESSÃO POPULACIONAL (FRP) • O valor médio de Y, para cada valor observado de Xi, pode ser representado por uma função linear do tipo: • 𝛼 e 𝛽 são os parâmetros desconhecidos da FRP. • O objetivo da análise de regressão é justamente estimar os valores destes parâmetros com base nas observações de Y e X. XXYE ii 15 ESPECIFICAÇÃO ESTOCÁSTICA DA FRP • Para cada nível de renda fixado Xi, o consumo semanal das famílias oscila ao redor de um valor médio, ou seja, varia de família para família Y X 16 ESPECIFICAÇÃO ESTOCÁSTICA DA FRP • O consumo semanal de cada família individualmente não é explicado somente por sua renda • Considerar um desvio aleatório de cada Yi individual ao redor de seu valor esperado • A FRP pode ser reescrita da seguinte maneira: • Em que 𝜀𝑖 representa o erro aleatório da regressão 𝑌𝑖 = 𝛼 + 𝛽𝑋𝑖 + 𝜀𝑖 ECONOMETRIA: INFERÊNCIAS POPULAÇÃO “conjunto de indivíduos com caraterísticas comuns” AMOSTRA ALEATÓRIA “subconjunto da população selecionado ao acaso” ECONOMETRIA FAZ INFERÊNCIAS SOBRE O COMPORTAMENTO DA POPULAÇÃO COM BASE NA OBSERVAÇÃO DE DADOS AMOSTRAIS Na prática, dificilmente temos acesso às informações da população como um todo 18 FUNÇÃO DE REGRESSÃO AMOSTRAL • Amostras da população • Estimar a FRP com base em informações amostrais • Função de regressão amostral (FRA) 𝑌𝑖 = 𝛼 + 𝛽𝑋𝑖 + 𝜀𝑖 ESTIMADOR: fórmula desenvolvida para estimar o valor de um parâmetro da população a partir de valores observados em uma amostra. 19 FUNÇÃO DE REGRESSÃO POPULACIONAL - FRP FRP FRA Parâmetros Estimadores FUNÇÃO DE REGRESSÃO AMOSTRAL - FRA Estimativas: valores numéricos obtidos a partir dos estimadores 𝑌𝑖 = 𝛼 + 𝛽𝑋𝑖 + 𝜀𝑖 𝑌𝑖 = 𝛼 + 𝛽𝑋𝑖 + 𝜀𝑖 20 Após estimar os valores dos parâmetros da regressão, é necessário verificar se o modelo tem suporte estatístico. Isto é feito através da realização do teste t, do teste F e da qualidade do ajustamento da regressão (R2) UTILIZAÇÃO DE DADOS AMOSTRAIS 21 PROPRIEDADES DESEJÁVEIS DOS ESTIMADORES 1. Ausência de tendenciosidade 2. Eficiência 3. Consistência 22 PROPRIEDADES DESEJÁVEIS DOS ESTIMADORES 1. AUSÊNCIA DE TENDENCIOSIDADE (ou de viés): dizemos que 𝛽 é um estimador não- tendencioso quando o seu valor esperado, for igual ao verdadeiro parâmetro da população: ^ E 23 PROPRIEDADES DESEJÁVEIS DOS ESTIMADORES 2. EFICIÊNCIA: dizemos que 𝛽 é um estimador não-tendencioso eficiente quando, dentre todos os estimadores lineares não- tendenciosos, este apresente a menor variância. 24 PROPRIEDADES DESEJÁVEIS DOS ESTIMADORES 3. CONSISTÊNCIA: Gostaríamos que o estimador 𝛽 se aproximasse do verdadeiro 𝛽 conforme o tamanho da amostra aumentasse. Especificamente, esperamos que à medida que a amostra se torne muito grande, a probabilidade de que 𝛽 seja diferente de 𝛽 se torne muito pequena. 25 Escolha do Método dos MQO para a obtenção das estimativas dos parâmetros • Existe mais de um método disponível para estimar os parâmetros de uma regressão. • Estimador de MQO: amplamente utilizado. • VANTAGEM: sob determinadas hipóteses (pressupostos), dentre todos os estimadores lineares não-tendenciosos, as estimativas resultantes dos estimadores de MQO são as que apresentam a menor variância - PROPRIEDADES. • Melhores Estimadores Lineares Não-Tendenciosos (MELNT), também chamados de estimadores BLUE (Best Linear Unbiased Estimate) 26 GENERALIZANDO... iikkiii XXXY 22110 Variável Dependente Parâmetros Variáveis IndependentesErro Aleatório MODELO ECONOMÉTRICO REGRESSÃO LINEAR MÚLTIPLA ... 𝑖 = 1,2, ⋯ , 𝑛 27 i =1,2, ... n 𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖1 + 𝛽2𝑋𝑖2 + ⋯ + 𝛽𝑘𝑋𝑖𝑘 + 𝜀𝑖 𝑌1 𝑌2 ⋮ 𝑌𝑛 = 1 𝑋11 ⋯ 𝑋1𝑘 1 𝑋21 ⋯ 𝑋2𝑘 ⋮ 1 ⋮ 𝑋𝑛1 ⋱ ⋮ ⋯ 𝑋𝑛𝑘 𝛽0 𝛽1 ⋮ 𝛽𝑘 + 𝜀0 𝜀1 ⋮ 𝜀𝑛 NOTAÇÃO MATRICIAL 𝑌𝑛𝑥1 = 𝑋𝑛𝑥(𝑘+1)𝛽 𝑘+1 𝑥1 + 𝜀𝑛𝑥1 Modelo escrito em notação matricial: 𝑌 = 𝑋𝛽 + 𝜀 28 PRESSUPOSTOS BÁSICOS DO MODELO CLÁSSICO DE REGRESSÃO LINEAR • Pressuposição 1: Y é uma função linear (nos parâmetros) de X • Pressuposição 2: O erro aleatório tem média zero • Pressuposição 3: A variância do erro aleatório é constante (homocedasticia) • Pressuposição 4: Os erros aleatórios são independentes ou não correlacionados • Pressuposição 5: As variáveis explicativas são fixas (não estocásticas) • Pressuposição 6: O erro tem distribuição normal com média zero e variância constante • Pressuposição 7: Ausência de relação linear entre as variáveis explicativas 29 PRESSUPOSTOS BÁSICOS DO MODELO CLÁSSICO DE REGRESSÃO LINEAR • Pressuposição 1: Y é uma função linear (nos parâmetros) de X • Pressuposição 2: O erro aleatório tem média zero • Pressuposição 3: A variância do erro aleatório é constante (homocedasticia) • Pressuposição 4: Os erros aleatórios são independentes ou não correlacionados • Pressuposição 5: As variáveis explicativas são fixas (não estocásticas) • Pressuposição 6: O erro tem distribuição normal com média zero e variância constante • Pressuposição 7: Ausência de relação linear entre as variáveis explicativas 30 Pressuposição 1: Y é uma função linear (nos parâmetros) de X Existem dois tipos de linearidade: 1. Linearidade nas variáveis: a expectativa condicional de Y deve ser uma função linear de X nas variáveis 2. Linearidade nos parâmetros: a expectativa condicional de Y deve ser uma função linear de X nos parâmetros XXY 2211 31 Pressuposição 1: Y é uma função linear (nos parâmetros) de X • Modelos considerados “intrinsecamente lineares”, ou que podem se tornar lineares por transformação das variáveis • Exemplo clássico em economia: função do tipo Cobb- Douglas 𝑌 = 𝐴𝑋1 𝛽1𝑋2 𝛽2 𝑋3 𝛽3𝑒𝜀 32 PRESSUPOSTOS BÁSICOS DO MODELO CLÁSSICO DE REGRESSÃO LINEAR • Pressuposição 1: Y é uma função linear (nos parâmetros) de X • Pressuposição 2: O erro aleatório tem média zero • Pressuposição 3: A variância do erro aleatório é constante (homocedasticia) • Pressuposição 4: Os erros aleatórios são independentes ou não correlacionados • Pressuposição 5: As variáveis explicativas são fixas (não estocásticas) • Pressuposição 6: O erro tem distribuição normal com média zero e variância constante • Pressuposição 7: Ausência de relação linear entre as variáveis explicativas 33 Pressuposição 2: O erro aleatório tem média zero • Para um determinado valor de X, o valor médio ou esperado do erro aleatório é zero, ou seja, o erro tem uma distribuição de probabilidades ao redor de zero. Erro é o efeito de todas as variáveis não incluídas no modelo Variações das mesmas não afetam sistematicamente o valor esperado de Y 0 iE 0E Forma matricial Consequência da violação Estimadores de MQO serão tendenciosos 𝑖 = 1,2, ⋯ , 𝑛 34 PRESSUPOSTOS BÁSICOS DO MODELO CLÁSSICO DE REGRESSÃO LINEAR • Pressuposição 1: Y é uma função linear (nos parâmetros) de X • Pressuposição 2: O erro aleatório tem média zero • Pressuposição 3: A variância do erro aleatório é constante (homocedasticia) • Pressuposição 4: Os erros aleatórios são independentes ou não correlacionados • Pressuposição 5: As variáveis explicativas são fixas (não estocásticas) • Pressuposição 6: O erro tem distribuição normal com média zero e variância constante • Pressuposição 7: Ausência de relação linear entre as variáveis explicativas 35 Pressuposição 3: A variância do erro aleatório é constante (homocedasticia) Definição estatística da variância: • Em que é a variância populacional do erro comum a todas as observações (homocedasticia) eiEeiEeV i 2 2220 eee iii EEV 2 36 Pressuposição 3: A variância do erro aleatório é constante (homocedasticia) HOMOCEDASTICIA 2 2 2 37 Pressuposição 3: A variância do erro aleatório é constante (homocedasticia) • Na presença de heterocedasticia, tem-se: 22 iii ee EV Em que seria a variância dos resíduos, diferenciada para cada observação de X, ou seja, cada grupo de resíduos (ei) teria uma variância diferente na presença de heterocedasticia. 2 i 38 Pressuposição 3: A variância do erro aleatório é constante (homocedasticia) HETEROCEDASTICIA 2 1 2 2 2 3 39 Consequências da Violação: 1. Os estimadores de MQO ainda serão não- tendenciosos e consistentes 2. Porém, os estimadores não serão eficientes, ou seja, não apresentarão a menor variância, quando comparados com outros esimadores lineares não- tendenciosos Heterocedasticia: trata-se de um problema comum quando trabalhamos com dados em corte transversal. Pressuposição 3: A variância do erro aleatório é constante (homocedasticia) 40 PRESSUPOSTOS BÁSICOS DO MODELO CLÁSSICO DE REGRESSÃO LINEAR • Pressuposição 1: Y é uma função linear (nos parâmetros) de X • Pressuposição 2: O erro aleatório tem média zero • Pressuposição 3: A variância do erro aleatório é constante (homocedasticia) • Pressuposição 4: Os erros aleatórios são independentes ou não correlacionados • Pressuposição 5: As variáveis explicativas são fixas (não estocásticas) • Pressuposição 6: O erro tem distribuição normal com média zero e variância constante • Pressuposição 7: Ausência de relação linear entre as variáveis explicativas 41 Pressuposição 4: Os erros aleatórios são independentes ou não correlacionados • Esta pressuposição implica que os erros associados à uma observação Xi não afetam ou não estão correlacionados aos erros associados à uma outra observação Xj 0, eeCov ji ji eEeeEeEeeCov jjiiji , 42 Pressuposição 4: Os erros aleatórios são independentes ou não correlacionados Violação Autocorrelação Comum no ajustamento de séries temporais Séries temporais (preços, salários, produção) têm no seu comportamento o reflexo de movimentos cíclicos e/ou sazonais A principal consequência da violação ineficiência dos estimadores de MQO, porém, estes continuam não-tendenciosos e consistentes 47 PRESSUPOSTOS BÁSICOS DO MODELO CLÁSSICO DE REGRESSÃO LINEAR • Pressuposição 1: Y é uma função linear (nos parâmetros) de X • Pressuposição 2: O erro aleatório tem média zero • Pressuposição 3: A variância do erro aleatório é constante (homocedasticia) • Pressuposição 4: Os erros aleatórios são independentes ou não correlacionados • Pressuposição 5: As variáveis explicativas são fixas (não estocásticas) • Pressuposição 6: O erro tem distribuição normal com média zero e variância constante • Pressuposição 7: Ausência de relação linear entre as variáveis explicativas 48 Pressuposição 5: As variáveis explicativas são fixas (não estocásticas) • Esta pressuposição implica que os valores da variável explicativa X são considerados fixos e não estão correlacionados com o erro. • A variável X é considerada exógena no modelo. CONSEQUÊNCIA DA VIOLAÇÃO haverá inconsistência dos estimadores de MQO 49 PRESSUPOSTOS BÁSICOS DO MODELO CLÁSSICO DE REGRESSÃO LINEAR • Pressuposição1: Y é uma função linear (nos parâmetros) de X • Pressuposição 2: O erro aleatório tem média zero • Pressuposição 3: A variância do erro aleatório é constante (homocedasticia) • Pressuposição 4: Os erros aleatórios são independentes ou não correlacionados • Pressuposição 5: As variáveis explicativas são fixas (não estocásticas) • Pressuposição 6: O erro tem distribuição normal com média zero e variância constante • Pressuposição 7: Ausência de relação linear entre as variáveis explicativas 50 Pressuposição 6: O erro tem distribuição normal com média zero e variância constante Esta pressuposição pode ser especificada da seguinte forma: 𝜀𝑖~𝑁 0, 𝜎 2 𝑖 = 1,2, … , 𝑛 𝜇 = 0 𝜇 = 0 𝜇 = 0 51 Pressuposição 6: O erro tem distribuição normal com média zero e variância constante CONSEQUÊNCIA DA VIOLAÇÃO Os parâmetros estimados não seguem a distribuição normal de probabilidades. Não é possível realizar os testes de hipóteses com distribuições baseadas na normal, tais como os usuais testes (“t” e “F”) para avaliar a qualidade dos ajustamentos (dos parâmetros e da regressão) Os estimadores de MQO continuam sendo os Melhores Estimadores Lineares Não-Tendenciosos (MELNT) 52 PRESSUPOSTOS BÁSICOS DO MODELO CLÁSSICO DE REGRESSÃO LINEAR • Pressuposição 1: Y é uma função linear (nos parâmetros) de X • Pressuposição 2: O erro aleatório tem média zero • Pressuposição 3: A variância do erro aleatório é constante (homocedasticia) • Pressuposição 4: Os erros aleatórios são independentes ou não correlacionados • Pressuposição 5: As variáveis explicativas são fixas (não estocásticas) • Pressuposição 6: O erro tem distribuição normal com média zero e variância constante • Pressuposição 7: Ausência de relação linear entre as variáveis explicativas 53 Pressuposição 7: Ausência de relação linear entre as variáveis explicativas (ausência de multicolinearidade) • Considerando a notação matricial: • Esta pressuposição prevê a não existência de qualquer relação linear entre as colunas das variáveis X1, X2, ..., Xk. 𝑌1 𝑌2 ⋮ 𝑌𝑛 = 1 𝑋11 ⋯ 𝑋1𝑘 1 𝑋21 ⋯ 𝑋2𝑘 ⋮ 1 ⋮ 𝑋𝑛1 ⋱ ⋮ ⋯ 𝑋𝑛𝑘 𝛽0 𝛽1 ⋮ 𝛽𝑘 + 𝜀0 𝜀1 ⋮ 𝜀𝑛 54 Pressuposição 7: Ausência de relação linear entre as variáveis explicativas (ausência de multicolinearidade) EXEMPLO: • Suponha que queiramos estimar as médias de notas dos alunos de uma universidade (Y) em função de três variáveis explicativas: X1 (renda familiar), X2 (horas de estudo por dia) e X3 (horas de estudo por semana) • Variáveis X2 e X3 perfeitamente colineares (X3 = 7X2) Quando ambas entrarem no modelo Matriz (X’X) será singular Não é possível invertê-la Não é possível estimar os parâmetros desta regressão 55 Pressuposição 7: Ausência de relação linear entre as variáveis explicativas (ausência de multicolinearidade) O problema de correlação pode ocorrer de duas formas: 1. Correlação perfeita ou multicolinearidade perfeita: quando ocorre uma relação linear perfeita entre as variáveis X não consigo estimar os parâmetros pelo MQO 2. Alto grau de correlação entre as variáveis X ou multicolinearidade imperfeita: neste caso é possível estimar o vetor de parâmetros da regressão, porém, com algumas conseqüências indesejáveis. 56 Pressuposição 7: Ausência de relação linear entre as variáveis explicativas (ausência de multicolinearidade) Consequências da multicolinearidade: 1. Aumenta a variância dos parâmetros estimados. 2. Aumenta o desvio-padrão. 3. Reduz o valor da estatística t, induzindo a não significância do parâmetro estimado para a variável em questão. 4. Estimativas muito sensíveis: tirando uma ou duas observações, as estimativas dos parâmetros do modelo se alteram bastante. 57 ESTIMADORES DE MQO DEIXAM DE SER BLUE QUANDO 1. VIOLAÇÃO DE UMA OU MAIS DAS PREMISSAS BÁSICAS INERENTES AO MCRL 2. ERRO DE ESPECIFICAÇÃO
Compartilhar