Baixe o app para aproveitar ainda mais
Prévia do material em texto
Econometria Aula 24 Marta AreosaMarta Areosa marta@econ.puc-rio.br Problema: Má Especificação • Ocorre quando o modelo especificado não explica de modo apropriado a relação da variável dependente com as variáveis explicativas • Isso pode ocorrer quando: 2 • Isso pode ocorrer quando: o Omitimos variáveis; o Não consideramos a forma funcional correta; � As variáveis estão em nível, quando deveriam estar em log; � As relações entre variáveis não são consideradas Problema: Má Especificação • Variáveis omitidas: O modelo verdadeiro é y= β0 + β1x1 + β2x2 + β3x3 + u 3 y= β0 + β1x1 + β2x2 + β3x3 + u e estimamos y= β0 + β1x1 + β2x2 +v Ou seja: v= β3x3 + u Problema: Má Especificação Se β3≠0 e cov(v, β1x1 + β2x2) ≠0, teremos E[v |X] ≠0 Consequência: os estimadores serão viesados 4 Se x3 = (x2)2 a situação é pior, pois, ainda que.β2 fosse não- viesado, não seria possível estimar o efeito de x2 em y, dado por β2 + 2β3 Se x3 = x1x2 (ou outra forma de relação entre as variáveis), os coeficientes, além de viesados, não terão a interpretação correta Problema: Má Especificação • Forma funcional incorreta: Com a ajuda do teste F, é podemos especificar um modelo que englobe várias possíveis especificações para obter qual é a correta 5 é a correta y= β0 + β1x1 + β2x2 + β3x3 + β4ln(x1)+ β5ln(x2) + β6ln(x3) + β7(x1)2+ β8(x2)2 + β9(x3)2 + u Dificuldade: Os graus de liberdade aumentam muito e, portanto, esta abordagem requer um grande número de observações Problema: Má Especificação • Como detectar a má especifição? • Utilizando o teste de RESET 1) Estima-se a regressão y= β0 + β1x1 + β2x2 + β3x3 + u 2) Calcula-se o valor predito de y 6 2) Calcula-se o valor predito de y 3) Estima-se a regressão y= β0 + β1x1 + β2x2 + β3x3 + β4z2 + β5 z3 + v Idéia: os termos z2 e z3 captam não linearidades do modelo Para testar H: β4=0, β5=0 utiliza-se a distribuição F2,n-k-3. 3322110 ˆˆˆˆ xxxz ββββ +++= Problema: Má Especificação • Como escolher entre dois modelos não-aninhados? • Podemos utilizar o R2-ajustado ou... 1) Estimar as regressões y= β0 + β1x1 + β2x2 + β3x3 + u y= β0 + β1ln(x1)+ β2 ln(x2) + β3 ln(x3) + u 7 y= β0 + β1ln(x1)+ β2 ln(x2) + β3 ln(x3) + u 2) Calcula-se o valor predito de y 3) Estima-se a regressão y= β0 + β1x1 + β2x2 + β3x3 + β4z + v Idéia: β4 não deve ser significativo se o primeiro modelo é verdadeiro ( ) ( ) ( )3322110 lnˆlnˆlnˆˆ xxxz ββββ +++= Problema: Má Especificação • A rejeição de um modelo não implica que o outro seja verdadeiro; • Se vários modelos forem “aceitos”, pode-se utilizar o R2- ajustado para selecionar entre os modelos; 8 ajustado para selecionar entre os modelos; • Se vários modelos forem rejeitados, uma análise crítica mais profunda será necessária. (O que pode estar interferindo na estimação? Problemas nos dados? Causalidade simultânea? Outro fator?) Problema: Variáveis não-observáveis • Algumas variáveis não são passíveis de serem medidas. Dizemos que elas são não-observáveis. Ex: Aptidão de uma pessoa, comprometimento com o trabalho, etc. • Nesse caso utilizamos uma variável “proxy”. Isto é 9 • Nesse caso utilizamos uma variável “proxy”. Isto é olhamos para uma variável observável que se relacione com a variável desejada. • Ou seja gostaríamos de estimar mas, observamos ivxx ++= 310 * 3 δδ iiiii uxxxy ++++= 3322110 ββββ Problema: Variáveis não-observáveis • Ou seja, estamos estimando • Se ( ) ( )133132211030 * 3322110 vwxxx wxxxy iii iiii γδγγγδγγ γγγγ ++++++= ++++= 10 • Se o vi não for correlacionado com x1i ou x2i, o ui não for correlacionado com x3i teremos que Os estimadores e serão viesados e inconsistentes. ( ) 1 3 313303000300 2211 ; ;; δ βγδγβδγβγδγγβ βγβγ =⇔=−=⇔+= == 30 ˆˆ γγ Problema: Variáveis não-observáveis • Se vi for correlacionado com x1i ou x2i teremos que Nesse caso, todos os estimadores serão viesados e ivxxxx ++++= 3322110 * 3 δδδδ 11 Nesse caso, todos os estimadores serão viesados e inconsistentes. ( ) ( ) ( ) ( )13313 22321131030 * 3322110 vwx xx wxxxy ii ii iiii γδγ δγγδγγδγγ γγγγ +++ +++++= ++++= Problema: Erro de Medida • Vamos supor que algumas variáveis são obtidas com erro. Devemos coniderar dois casos: o O erro ocorre na variável dependente e o O erro ocorre em um regressor. 12 • No primeiro caso, o parâmetro de interesse (y*) tem erro. Ou seja, gostaríamos de regredir O que corresponde a ter iii eyy += * ( )iiii euxy +++= 110 γγ iii uxy ++= 110 * γγ Problema: Erro de Medida • Se ei não é correlacionado com xi, temos que os estimadores de MQO são não-viesados e consistentes. • O único problema é que 13 • Portanto, os estimadores de MQO terão variâncias maiores. • Se ei é correlacionado com xi, temos que os estimadores de MQO serão viesados e inconsistentes. )var()var()var()var( iiiii ueueu >+=+ Problema: Erro de Medida • No segundo caso, o regressor de interesse (x*) tem erro • Ou seja iii exx += * iii uxy * 10 γγ ++= 14 • Se ei for não-correlacionado com ui, os estimadores serão consistente e não- viesados. • Teremos ( )iii iii eux uxy 110 10 γγγ γγ −++= ++= )var()var()var()var( 211 iiiii ueueu >+=− γγ Problema: Erro de Medida • Se ei for correlacionado com ui, os estimadores serão inconsistentes e viesados. • No caso em questão: )var()var(),cov(),cov( * eeexex −=−= 15 • Ou seja: )var(),cov(),cov(),cov( )var()var(),cov(),cov( 111 * iiiiiiii iiiiii eexuxeux eeexex γγγ −=−=− −=−= ( ) ( ) ( ) −=−= − += x e x e x euxp iiiii var )var(1 var )var( var ),cov( ˆlim 111111 γ γγγγγ Problema: Erro de Medida • Como • Temos que )var()var()var( * iii exx += ( ) + = −= )var()var( )var( var )var(1lim ** * 11 ii ex x x ep γγ 16 • Temos um viés (assintótico) de atenuação. • Se var(e*) for pequena, este viés é pequeno. Num modelo geral, com k regressores, não é tão fácil obter uma expessão para o viés. ( ) += −= )var()var(var1lim **11 ii exxp γγ Problema: Identificação • Quando temos um sistema de equações em que as variáveis estão relacionadas, dizemos que temos um modelo de equações simultâneas (MES). • Nesse caso, nem sempre conseguimos estimar corretamente 17 • Nesse caso, nem sempre conseguimos estimar corretamente todos os coeficientes das equações. • Dizemos que ocorre um problema de identificação. Problema: Identificação • Seja o seguinte sistema • Econometricamente, temos apenas uma equação... iii iii vyy uyy ++= ++= 1102 2101 γγ ββ 18 • Econometricamente, temos apenas uma equação... • Não há motivo para obtermos { { 321 iw iii iii vyy uyy 1 2 11 0 1 2101 11 10 γγγ γ ββ αα −+−= ++= ii wue ˆˆˆ ˆ;ˆˆ 1100 ≠≠≠ αβαβ Problema: Identificação • Precisamos de variáveis que sejam determinadas fora do sistema para nos ajudar a identificar cada curva separadamente. • Considere o sistema iii uyy ++= 2101 ββ 19 • Nesse caso iiii iii vxyy uyy +++= ++= 21102 2101 γγγ ββ ( ) ( ) ( )iiii iiiii vuxy vxuyy +++++= +++++= 12211010 2210102 γγβγβγγ γββγγ Problema: Identificação • Ou seja 434214342143421 iw ii ii vu xy − + + − + − + = 11 1 11 2 11 010 2 111 10 βγ γ βγ γ βγ βγγ αα 20 • Chamamos esta equação de forma reduzida. • Se tivermos , ou seja , poderemos utilizar x como instrumento. • Obtendo , podemos estimar ( ) 0,cov =ii wx ( ) 0,cov =ii ux iy2ˆ iii uyy ++= 2101 ˆββ Problema: Identificação • Vimos que podemosobter os parâmetros de uma das equações utilizando variáveis instrumentais. E quanto a outra equação? • Parece que podemos fazer a mesma coisa obtendo 21 • Parece que podemos fazer a mesma coisa obtendo • Mas, intuitivamente, o procedimento parece estranho. Estamos identificando deslocamentos em y1 através de x, que é uma variável que desloca a curva de y2! 01 1 01 21 01 010 1 111 γβ β γβ γβ γβ γββ − + + − + − + = ii ii uv xy Problema: Identificação • De fato, este procedimento não pode ser feito... Se tentássemos estimar não iríamos conseguir. Existe colinearidade perfeita entre iiii vxyy +++= 21102 ˆ γγγ 22 não iríamos conseguir. Existe colinearidade perfeita entre os regressores! • Dizemos que esta equação não é identificada. Problema: Identificação • Seja o seguinte sistema • Podemos estimar a forma reduzida deste sistema como iiii iiii vxyy uxyy +++= +++= 221102 122101 γγγ βββ 23 • Podemos estimar a forma reduzida deste sistema como • Para ter sentido, a matriz acima deve ser inversível. + + − = − i i i i i i v u x x y y 2 1 2 2 0 0 1 1 1 2 1 0 0 1 1 γ β γ β γ β Problema: Identificação • Devemos ter os erros não-correlacionados com os regressores para estimar as formas reduzidas sem viés +++= +++= 221102 221101 ααα pipipi iiii iiii exxy wxxy 24 onde − = − = − = +++= − −− 2 2 1 1 1 11 21 1 1 1 0 0 1 1 1 0 0 221102 0 0 1 1 1 1 ; 1 1 γ β γ β αα pipi γ β γ β γ β α pi ααα i i i i iiii v u e w exxy Problema: Identificação • Não podermos ter multicolinearidade perfeita entre para estimarmos ii ii xey xey 22 11 ˆ ˆ iiii vxyy uxyy +++= +++= 122101 ˆ ˆ γγγ βββ 25 • Como, o caso em questão, esta condição nos diz que iii iii xxy xxy 221102 221101 ˆˆˆˆ ˆˆˆˆ ααα pipipi ++= ++= iiii vxyy +++= 221102 ˆ γγγ ( ) { }1,1,0ˆ;0ˆ 2112 −∉≠≠ xxcorreleαpi Problema: Identificação • Caso geral: [ ] [ ] [ ] T niii T niii ii uuUyyY UDYCXBY ;; 11 LL == +++= 26 • A forma reduzida se torna [ ] nxnnxknxnxnTkii DCBAxxX ;;;; 11 L= )(;111 DIAUACXABAY ii −=++= −−− Problema: Identificação • Para haver identificação nas equações: o A matriz A deve ser inversível. o Para estimarmos as formas reduzidas sem viés, U não pode ser correlacionado com X; o Não pode haver multicolinearidade perfeita entre 27 o Não pode haver multicolinearidade perfeita entre para estimarmos ii UYDCXBAY +++= ˆ CXeCXDABDAYD i 11 ˆ −− +=
Compartilhar