Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Estimação de Variáveis Instrumentais e Mínimos Quadrados de Dois Estágios Wooldridge, Cápítulo 15 2 Variáveis Instrumentais (IV) 3 Variáveis Instrumentais yi = 0 + 1 x1i + 2 x2i + ... + k xki + ei Considere o seguinte modelo de regressão linear múltipla 4 Variáveis Instrumentais Suposições a) Modelo é linear nos parâmetros e a matriz X é de posto completo. b) c) X’X admite inversa d) e) ~~ 0X ~~ E E ee ~ plim QX'X ~~ n 1 ~ n ~~ IXe 2 Var 5 As suposições (a), (b), (c) e (d) são necessárias para demonstrar a consistência do vetor de estimadores ~ β̂ Variáveis Instrumentais 6 Variáveis Instrumentais Hipótese Crucial ~~ 0X ~~ E E ee Ou seja, todos os fatores contidos em e devem ser não correlacionados com as variáveis explicativas e deve ter sido usada a forma funcional correta. 7 Variáveis Instrumentais Suposição: E(ei | x1, x2, ..., xk) = E(ei) = 0 Como pode falhar? yi = 0 + 1 x1i + 2 x2i + ... + k xki + ei • Omissão de Variáveis (Ignorar o problema? Usar proxy? Dados em Painel?) • Erro nas Variáveis • Endogeneidade 8 Uma variável explicativa, num modelo de regressão linear, que é correlacionada com o termo de erro é dita variável explicativa endógena. Endogeneidade Problema: ~~~ 0e'X n 1 plim Variáveis Instrumentais yi = 0 + 1 x1i + 2 x2i + ... + k xki + ei 9 Dessa forma, se estimarmos o modelo de regressão linear por mínimos quadrados teremos estimadores viesados e inconsistentes para os parâmetros do modelo. Variáveis Instrumentais yi = 0 + 1 x1i + 2 x2i + ... + k xki + ei 10 Variáveis Instrumentais Considere o seguinte modelo de regressão Exemplo 1 Ih = 0 + 1 educh + 2 filhosh + 3 rendah + ei Ih – indicador de saúde do h-ésimo domicílio educh – educação do chefe da família do h-ésimo domicílio filhosh – número de filhos no h-ésimo domicílio rendah – renda do h-ésimo domicílio número de filhos é uma decisão endógena, pode depender de diversos fatores 11 Variáveis Instrumentais Considere o seguinte modelo de regressão Exemplo 2 salárioi = 0 + 1 educi + 2 x2i + ... + k xki + ei 0 1 ~~ eeduc'plim n Quais seriam os motivos desta violação? Possíveis soluções? 12 Uso de variáveis instrumentais Solução Variáveis Instrumentais yi = 0 + 1 x1i + 2 x2i + ... + k xki + ei 13 Considere o modelo Variáveis Instrumentais yi = 0 + 1 x1i + ei (1) com Cov(x1, e) 0 14 Mas, suponha que tenha sido observada uma variável z que satisfaça a duas suposições: Variáveis Instrumentais (a) z é não-correlacionada com e, isto é, Cov(z, e) = 0 (b) z é correlacionada com x1, isto é, Cov(z, x1) 0 z é exógena em (1) Como testar tais suposições? 15 Do exposto, chamaremos z de variável instrumental para x1. Variáveis Instrumentais 16 Variáveis Instrumentais Em termos matriciais: ~ ZX ~~ QX'Z n 1 plim (b.1) ~~~ 0eZ 'plim (a.1) n 1 ~ Z ~ X - Matriz de Instrumentos - Matriz de Explicação 17 Variáveis Instrumentais Considere o seguinte modelo de regressão Voltando ao Exemplo 2 salárioi = 0 + 1 educi + 2 x2i + ... + k xki + ei Devemos procurar uma variável correlacionada com educ e não-correlacionada com habilidade (que está no termo de erro e é correlacionada com educ) Possíveis instrumentos? 18 • O método de estimação com o uso de variáveis instrumentais (IV) é mais geral do que OLS; Variáveis Instrumentais • OLS é um caso particular de IV, uso as variáveis explicativas como instrumentos delas mesmas. 19 Variáveis Instrumentais Considere o modelo de regressão linear geral ~~~~ eβXy Pré multiplicando a equação anterior pela transposta da matriz de instrumentos, temos que: ~~~~~~~ e'ZβX'Zy'Z 20 Variáveis Instrumentais Multiplicando a equação anterior por n-1, vem que: ~~~~~~~ e'ZβX'Zy'Z nnn 111 e tomando o limite de probabilidade em ambos os lados da igualdade, temos que: ~~~~~~~ ~~~~~~~ e'ZβX'Zy'Z e'ZβX'Zy'Z nnn nnn 111 111 plimplimplim plimplim 21 Variáveis Instrumentais (cont.) ~ IV ~ ~~~~~~~~~ ~~~~~ ~~~~~~~ ββ y'ZX'Zy'ZX'Zβ y'ZX'Zβ e'ZβX'Zy'Z ˆplim plimplim plimplim plimplim plim 1 1 1 11 11 111 nn nn nnn 22 Variáveis Instrumentais Assim, ~~~~~ IV y'ZX'Zβ 1 ˆ Que é um estimador consistente! 23 Variáveis Instrumentais Observações (i) Admitindo a validade das suposições (a.1) e (b.1), o vetor de estimadores gerado com o uso de variáveis instrumentais é consistente. (ii) Para estimar o vetor de parâmetros, precisamos garantir que a matriz Z’X admite inversa. Logo, se Z for uma matriz de dimensão n x L e X for uma matriz de dimensão n x (k + 1), precisaremos que L = k + 1. (neste caso, obtenho os estimadores diretamente) 24 Variáveis Instrumentais Observações (cont.) iii. Faremos, ainda, uma suposição adicional de que a variável instrumental z seja fortemente correlacionada com a variável endógena x. (suposição ligada ao fato do uso de instrumentos fracos) iv. De (iii) conseguimos garantir que o método de estimação proposto apresenta bom desempenho com amostras finitas. Leitura: Wooldridge (2003, p. 493-94) 25 Variáveis Instrumentais 'ˆˆEˆVar ~~ IV ~~ IV ~ IV βββββ ~~~~~~ IV ~~~~~~ IV ~~~~~~~~~~ IV ~~~~~~~~~~~ IV e'ZX'Zββ e'ZX'Zββ e'ZX'ZβX'ZX'Zβ eβX'ZX'Zy'ZX'Zβ 1 1 11 11 ˆ ˆ ˆ ˆMas, 26 Variáveis Instrumentais 'ˆˆEˆVar ~~ IV ~~ IV ~ IV βββββ 11 11 ~~~~~~~~~ IV ~~~~~~~~~ IV ~~ IV ~~ IV ~ IV ZXZee'ZX'Zβ ZXZee'ZX'Zβ βββββ ''EˆVar ''EˆVar 'ˆˆEˆVar Logo, 27 Variáveis Instrumentais 'ˆˆEˆVar ~~ IV ~~ IV ~ IV βββββ 112 ~~~~~~~ IV ZXZ'ZX'Zβ ' ˆVar Se a suposição de homocedasticidade for válida, então, e 112 ~~~~~~~ IV ZXZ'ZX'Zβ 'ˆ ˆVar ~ IV ~~~ IV ~~~~ βXyβXye'e ˆ'ˆˆˆˆ nn 112 com 28 Variáveis Instrumentais 'ˆˆEˆVar ~~ IV ~~ IV ~ IV βββββ Caso contrário, 112 ~~~~~~~~ IV ZXZΩ'ZX'Zβ ' ˆVar 29 Variáveis Instrumentais É possível provar que ~ 1 XZ ~ ZZ ~ 1 ZX ~~~ IV QQQ0ββ 2 , ~ˆ a Nn 30 Variáveis Instrumentais Exemplo ~~~~ eβXy em que ~ k ~ 3 ~ 2 ~ 1 ~ ... xxxxi ~ X Considere o modelo de regressão linear geral Desconfia-se que as variáveis x1 e x2 sejam endógenas. 31 Perguntas: (a) Poderíamos propor o mesmo instrumento para ambas as variáveis? Discuta as implicações no método de estimação. (b) Haveria algum problema no caso em que fossem propostos exatamente um instrumento diferente para cada variável? (c) Poderíamos propor mais de um instrumento para cada variável endógena? (d) De acordo com o enunciado de (c), como ficariam as dimensões das matrizes Z e X? (e) Admitindo a validade de (c), seria possível gerar diretamenteo vetor de estimadores? Variáveis Instrumentais Exemplo (cont.) 32 Solução para o que foi discutido em (c), (d) e (e): 2SLS (mínimos quadrados em dois estágios) Variáveis Instrumentais Exemplo (cont.) 33 Inicialmente devemos construir a matriz de instrumentos Z. As variáveis que são exógenas serão consideradas instrumentos delas mesmas. Isso feito, 1o. Estágio: Regredir cada variável explicativa do modelo original em função dos instrumentos (estimação das formas reduzidas) e gerar uma matriz de valores ajustados em cada um das regressões; 2o. Estágio: Estimar o modelo para a variável resposta em função dos valores estimados para as variáveis explicativas. Mínimos Quadrados em Dois Estágios 34 2o. Estágio: 1o. Estágio: Mínimos Quadrados em Dois Estágios ~~~ πZX ˆˆ ~~~~ eβXy ˆ ~~~~ υ πZX Obter ~~~~~ XZZZπ ''ˆ 1 Onde 35 Mínimos Quadrados em Dois Estágios ~~ Z ~~~~~~~~ XHXZZZZπZX ''ˆˆ 1 Temos que no primeiro estágio que: ~~~~~ XZZZπ ''ˆ 1 Assim, 36 Logo, Mínimos Quadrados em Dois Estágios ~~ Z ~~~~~~~~ XHXZZZZπZX ''ˆˆ 1 Sabemos, do 2o. estágio, que: ~~ 1 ~~ y'XX'Xβ 2SLS ˆˆˆˆ ~ Mas, ~~ Z ~ 1 ~~ Z ~~~ Z ~ 1 ~~ Z ~ Z ~~~ 1 ~~ y'H'XXH'Xy'H'XXH'H'Xy'XX'Xβ 2SLS ˆˆˆˆ ~ 37 Logo, Mínimos Quadrados em Dois Estágios ~~ Z ~ 1 ~~ Z ~~~~~~ Z ~ 1 ~~ Z ~ e'H'XXH'XβeβX'H'XXH'Xβ 2SLS ˆ ~ Do exposto, ~~ Z ~ 1 ~~ Z ~ e'H'XXH'Xββ 2SLS ~~ ˆ Mas, ~~ Z ~ 1 ~~ Z ~ y'H'XXH'Xβ 2SLS ~ ˆ 38 Mínimos Quadrados em Dois Estágios 1 ~~ Z ~~~ Z ~~~ Z ~ 1 ~~ Z ~ XH'XXHeeH'XXH'Xβ 2SLS 'ˆ ~ EVar Assim, Pode ser expressa como, 'ˆˆˆ ~~~~~ βββββ 2SLS2SLS2SLS EVar 39 Mínimos Quadrados em Dois Estágios 1 22 ~~ Z ~ XH'Xβ SLS ~ ˆVar Se a suposição de homocedasticidade for válida, então, e 1 22 ~~ Z ~ XH'Xβ ̂ˆVar ~ SLS 2SLS ~~~ 2SLS ~~~~~ βX yβX ye'e ˆ'ˆˆˆˆ nn 112 com 40 Mínimos Quadrados em Dois Estágios 11 2 ~~ Z ~~~ Z ~~ Z ~~~ Z ~ XH'XXHΩH'XXH'Xβ SLS ~ ˆVar Caso contrário, 41 Mínimos Quadrados em Dois Estágios É possível provar que SLSSLS VarN 22 ~ a ~ ˆ , ~ˆ βββ ~ 42 1) IV pode ser bem mais ineficiente que OLS; 2) A distribuição de probabilidades do estimador usando IV, no caso de amostras finitas, pode ser bem diferente da distribuição de probabilidades assintótica. Mínimos Quadrados em Dois Estágios Problemas Mesmo quando Corr(z,e) = 0, onde IV é consistente, ainda podemos ter problemas: 43 Teste de Endogeneidade Mínimos Quadrados em Dois Estágios O estimador de 2SLS é menos eficiente que o de OLS quando as variáveis explicativas são exógenas. Assim sendo, se torna útil fazer um teste de endogeneidade de uma variável explicativa que mostre se a utilização de 2SLS é necessária. 44 Considere o modelo Mínimos Quadrados em Dois Estágios y1 = 0 + 1y2 + 2z1 + 3z2 + e1 (1) em que y2 – variável endógena z1 e z2 – variáveis exógenas Teste de Endogeneidade 45 Fatos 1. Se y2 for não correlacionada com e1, então, devemos estimar os parâmetros do modelo por OLS (mais eficiente). 2. OLS e 2SLS fornecem estimadores consistentes se a condição de exogeneidade estiver satisfeita. Mínimos Quadrados em Dois Estágios Teste de Endogeneidade 46 Teste de Endogeneidade Mínimos Quadrados em Dois Estágios HAUSMAN (1978), sugeriu fazer uma comparação direta das estimativas de OLS e 2SLS e determinar se as diferenças são estatisticamente significantes. Se as estimativas geradas por OLS e 2SLS diferirem de forma significante, concluímos que y2 deve ser endógena (supondo z1 e z2 exógenas). 47 Teste de Endogeneidade Mínimos Quadrados em Dois Estágios 1) Estime a forma reduzida de y2, regredindo y2 sobre todas as variáveis exógenas (inclusive aquelas da equação estrutural e as IVs adicionais). 2) Obtenha os resíduos. 3) Estime a equação estrutural, por OLS, utilizando os resíduos, obtidos em (2), como variável explicativa. Se o parâmetro associado ao resíduo for estatisticamente significante, concluiremos que y2 é endógena. 48 Teste de Restrições Sobreidentificadoras Mínimos Quadrados em Dois Estágios Suponha que em nosso modelo apareça somente uma variável explicativa endógena: Se tivermos somente uma única IV, não teremos restrições sobreidentificadoras. Neste caso, não haverá nada que possa ser testado Se tivermos somente duas IVs, teremos uma restrição sobreidentificadora. Se tivermos três IVs, teremos duas restrições sobreidentificadoras, e assim por diante. 49 Teste de Restrições Sobreidentificadoras Mínimos Quadrados em Dois Estágios 1) Estime a equação estrutural por 2SLS 2) Obtenha os resíduos. 3) Regrida os resíduos em função de todas as variáveis exógenas. 4) Obtenha o R2 (coeficiente de explicação). 5) Sob a hipótese nula de que todas as IVs são não correlacionadas com o erro, nR2 ~2q q – número de variáveis endógenas. 50 Teste de Restrições Sobreidentificadoras Mínimos Quadrados em Dois Estágios Rejeitar a hipótese nula significa que pelo menos uma das IVs não é exógena.
Compartilhar