Baixe o app para aproveitar ainda mais
Prévia do material em texto
Soluções para o Manual de Econometria Rodrigo De Losso da Silveira Bueno São Paulo – Março/2001 2 Soluções para o Manual de Econometria Rodrigo De Losso da Silveira Bueno1 1 Mestre em Economia, Universidade de São Paulo. Master of Arts, The University of Chicago (Ph.D Pass). Doutorando em Economia pela Universidade de São Paulo. 3 Nota – O parênteses abaixo representam a fonte de adaptação em alguns dos exercícios, da seguinte forma: 1. (B&D) BROCKWELL, Peter J. & DAVIS, Richard A. Time Series: Theory and methods. New York: Springer, 1991. 2. (J) JOHNSTON, J. Econometric Methods, 3rd. ed. New York: McGraw-Hill, 1984; 3. (K) KENNEDY, Peter. A Guide to Econometrics, 4th. ed. Cambridge, MA: MIT, 1998; 4. (E) ENDERS, Walter. Applied Econometric Time Series. New York: Wiley, 1995. 5. (C) exercícios ministrados na The University of Chicago; 6. Exercícios formulados pelo autor. Índice 1. Metodologia da Econometria ___________________________________________ 4 2. Modelo de Regressão Linear Geral_______________________________________ 5 3. Extensões ao Modelo Básico de Regressão Linear _________________________ 12 4. Análise da Base de Dados e Utilização de Variáveis Binárias_________________ 23 5. Problemas Econométricos no Modelo Linear Geral ________________________ 33 6. Multicolinearidade___________________________________________________ 39 7. Econometria das Variáveis de Resposta Qualitativas e Limitadas _____________ 45 8. Sistemas de Equações Simultâneas______________________________________ 50 9. Análise de Séries de Tempo ____________________________________________ 59 10. Metodologia de Box-Jenkins para Modelos Univariados ____________________ 65 11. Modelos de Função de Transferência e de Análise de Intervenção ____________ 70 12. Testes de Raízes Unitárias e Co-Integração _______________________________ 77 13. Modelos GARCH ____________________________________________________ 87 4 1. Metodologia da Econometria Não há exercícios. 5 2. Modelo de Regressão Linear Geral 2.1 Estime as regressões: Y X! " #! " " e X Y$ % &! " " e conclua que 1ˆ ˆ" % # 2, como intuitivamente poderíamos afirmar. Solução: Este exercício procura mostrar que regredir Y contra X, encontrando o parâmetro "ˆ , NÃO é o mesmo que regredir X contra Y, encontrar o parâmetro %ˆ e inferir que 1ˆ ˆ" % ! . Sabemos que 1 2 2 1 ˆ n i i i n i i Y X nXY X nX " ! ! $ ! $ % % . Agora, resta observar que 1ˆ ˆ" % # . Note que 2 2 1 1 2 2 1 1 1ˆ ˆ n n i i i i i n n i i i i i Y X nXY Y nY X nX Y X nXY " % ! ! ! ! $ $ ! # ! $ $ % % % % . 2.2 Suponha o seguinte modelo linear: y X" #! " , onde y e # são vetores 1n& , X <∞ é uma matriz n k& eβ é um vetor 1k& . a. Qual(is) a(s) hipótese(s) necessária(s) para estimar esse modelo por MQO? b. Qual(is) a(s) hipótese(s) necessária(s) para que oβ estimado, !β , exista e seja único? c. Qual(is) a(s) hipótese(s) necessária(s) para que !β seja não viesado? d. Qual(is) a(s) hipótese(s) necessária(s) para que !β seja eficiente?3 2 O acento circunflexo denota parâmetro estimado. 3 Este item apenas tem sentido em ser perguntado se, em aula, o professor apresenta os resultados da regressão para X estocástico. 6 e. Qual(is) a(s) hipótese(s) necessária(s) para que se possa fazer inferência estatística? Solução: Este exercício possui dois propósitos. Primeiro, induzir o estudante a entender onde exatamente se aplica cada hipótese do modelo de regressão linear múltipla, fazendo-o retornar a esses conceitos. Segundo, revisar os conceitos estatísticos de viés e eficiência, aplicados à Econometria dos Mínimos Quadrados – uma boa referência, para o professor, seria WHITE, Halbert. Asymptotic Theory for Econometricians, 2nd. ed. Orlando: Academic Press, 2000. Note que nada é dito sobre o comportamento do termo aleatório, justamente porque algumas perguntas referem- se a seu comportamento. a. Estimar o modelo por MQO é apenas um método matemático, nada mais. Portanto, apenas necessitamos de uma condição matemática que é ' (X k' ! , isto é, o posto da matriz X seja pleno. Precisamos disso porque, do contrário, X’X não seria inversível e, então, não poderíamos estimar o modelo por MQO. b. Outra vez, apenas necessitamos que ' (X k' ! , do contrário, !β não existiria. A unicidade é dada justamente porque o posto é pleno. Se X fosse estocástico, precisaríamos que lim 0X Xp Q n ) ! # . c. Aqui precisamos de várias hipóteses. c.1 "ˆ* ; c.2 !β é único; c.3 Se X é não estocástico, como assumido neste capítulo, ' ( ' (0E X E# #! ! , onde a segunda desigualdade resulta da Lei das Expectativas Iterativas. Se X é estocástico, precisamos que lim 0Xp n #) ! . d. Aqui usamos a hipótese de homocedasticidade. Por isso, podemos concluir que, para ser não viesado, nada precisamos impor sobre a variância dos resíduos. d.1 "ˆ* ; d.2 !β é único; 7 d.3 lim 0Xp n #) ! ; d.4 Se ' (0,# +! , onde 2I(+! , basta estimar o modelo por MQO. Para complementar, mesmo que o professor ainda não tenha dado heterocedasticidade, ele poderia dizer que precisamos estimar por um outro método a ser aprendido, denominado mínimos quadrados generalizados. Isto é dizer, formalmente, se 2I(+# , estime 1 1 1 ,C y C X C CC" #$ $ $ )! " +! . e. Para inferência estatística, admitimos que o erro tenha uma distribuição Normal e sejam independentes entre si, de onde se seguem todos os resultados do capítulo. Se forem normais, mas não independentes, ter-se-ia que estimar os parâmetros por mínimos quadrados generalizados, pois, do contrário, as inferências estatísticas não seriam válidas. Esta é a única hipótese necessária. Se não admitirmos que os erros têm distribuição Normal, podemos assumir a hipótese mais fraca de que são identicamente e independentemente distribuídos, mas nesse caso os testes somente serão válidos assintoticamente. Em ambos os casos, pode-se argumentar que tais hipóteses são muito fortes, a primeira mais forte do que a segunda. 2.3 Adão Ismiti queria verificar se a produtividade do trabalho aumentava com a divisão do trabalho. Para isso, fez a seguinte experiência: regrediu a produtividade (p) de n trabalhadores de fábricas de alfinetes contra o número de funções exercidas pelo trabalhador (F), anos de escolaridade (E), salário (w) e número de filhos (N). Formalmente a regressão foi: iiiii uNwEFp +++++= 543121 βββββ . Usando o teste t-student, Ismiti aceitou a hipótese nula de parâmetro igual a zero para 3βˆ . Retirou a variável E da regressão e estimou o modelo restrito, observando que 5βˆ tornou-se, também, estatisticamente não significativo. Finalmente, retirou N da regressão e estimou o modelo de novo. a. Por que não foi preciso fazer o teste de F em 3"ˆ , para retirar E do modelo? Ou seja, por que apenas o teste de t–student pôde ser feito?; b. Justifique se o procedimento adotado por Smith está correto ou equivocado, para ter eliminado a variável N do modelo. 8 Solução: Este exercício é muito ilustrativo e traz um pouco de problemas empíricos à tona. Quer-se testar se o estudante entendeu como usar os testes t e F corretamente, e evitar que ele cometa o erro de retirar variáveis explicativas, estatisticamente iguais a zero, seqüencialmente. O certo é apenas fazer um teste de hipótese conjunta e, se for o caso, concluir que tais variáveis não explicam o modelo. a. A razão para não usar o teste F é que, quando estamos testando apenas um parâmetro, o teste t e F se equivalem. Ou seja, pode-se usar um ou outro. Em geral, nos pacotes econométricos o teste t sai automaticamente,por isso podemos olhar para ele sem problemas. Vale lembrar que, para um parâmetro apenas, t2 é equivalente a F(1,n), como provado no corpo do texto. b. O procedimento de Ismiti está absolutamente equivocado. O correto seria testar, conjuntamente, por F, se 3"ˆ e 5"ˆ são, simultaneamente, iguais a zero. A razão específica é que no segundo teste, mudou-se o número de graus de liberdade, por isso o equívoco. Ou, em outras palavras, no segundo teste, o modelo mudou em relação ao primeiro. 2.4 (J) Para entender melhor como funciona o R2, prove que uma regressão estimada sem a constante não implica que os resíduos somarão, necessariamente, zero e que o R2, se calculado como 1 2− ′ ′ − ! !e e y y ny , pode ser negativo, onde ! !e y X= − β , em que !β é o vetor de parâmetro estimados estimado4. Solução: Este exercício mostra que o R2 pode ser negativo, quando a regressão por mínimos quadrados ordinários é feita sem constante (note que, mesmo com constante, quando estimamos um modelo não linear por máxima verossimilhança, podemos ter um R2 negativo, mas isso é um caso raro). Seu objetivo é alertar o estudante que, quando o R2 é negativo, na regressão por MQO, é porque ele deve acrescentar a constante ao modelo. O motivo é muito sutil e será explicitamente apresentado na resolução. A primeira parte do exercício procura esclarecer por que os resíduos somam zero, quando há constante, embora isto já esteja no corpo do capítulo. O 4 A segunda parte deste exercício é difícil. 9 exercício também é útil para treinar e entender várias passagens feitas no corpo do texto. Dada a regressão y X" #! " , temos que: ' ( 1 1 2 2 2 1 1 1 2 2 1 , 1,2, , . 0, 1,2, , . i i i ik k i n i n i i i i ik k ji ij y X X X i n y X X X X j k " " " # # " " " " ! ! ! " " " " ! , ! $ $ $ $ ! ! , % % " # " # Isso não garante que o resíduos somarão zero, pois Xji pode ser diferente de 1, para todo i, mesmo quando j = 1. Claramente, se X1i = 1, para todo i, os resíduos somarão zero. Isto finaliza a primeira parte da questão. Sigamos para a segunda parte. Lembremos que: ' ( ' ( ' (2 2 1 2 2 ' ; ˆ ˆ ˆ ; ˆ ˆ ˆ . n i i SQT y y y y y y y y ny SQE y y ny SQR e e ne ! ) )! $ ! $ $ ! $ )! $ )! $ % Note como nada garante que eˆ seja zero, e, no cálculo do R2, não incluímos esse termo (retorne à fórmula dada no exercício); é por isso que o R2 pode ser negativo. Note, também, que: ˆ ˆ ˆ ˆ ˆi i ï i i ïy y e y y e y y! " - ! " - !% % % , apenas quando ˆ 0ïe !% , o que somente ocorre se o modelo é estimado com constante, como demonstrado na primeira parte do exercício. Sabemos, ainda, que ˆ ˆ ˆ ˆy y y y e e) ) )! " . Com essas informações, temos: 2 2 2 2 2 2 ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ 1 1e e y y y y y y ny y y y y ny y y y y ny y y ny y y ny y y ny ) ) ) ) ) ) )$ $ $ " $ "$ ! $ ! ! ) ) ) )$ $ $ $ . Conseqüentemente, se 2 2ˆ ˆ 0ny y y R). - / . Para ver por que o R2 é positivo quando existe constante, note que se ˆy y! (caso com constante), temos que ' (22 1 ˆ ˆ ˆ 0 n i i ny y y y y ! )$ " ! $ 0% 5. 5 Veja a semelhança com a fórmula do SQT. 10 2.5 (J) Dadas as seguintes estimativas de MQO: 1 1 2 1 2 1 3 3 4 1 4 0,9 0,8 0,7 0,5 t t t t t t t t t t t t C K Y C K C C K Y Y K C # # # # $ $ $ 1 ! " "2222 ! " "2232 ! " "222 ! " "224 , calcule as estimativas de MQO de 2" e 3" na regressão C Y C ut t t t= + + +−β β β1 2 3 1 . Solução: O exercício é de nível médio a difícil. Tem o objetivo de treinar os conceitos básicos de regressão, para verificar se o aluno sabe formulá-los. A solução pode ser avaliada em duas etapas. Na primeira etapa, o aluno deve ser capaz de oferecer as seguintes respostas. O modelo pode (e deve) ser formulado em relação aos desvios. O aluno deve perceber isso pelo fato de não ser pedido o valor de 1" , ou seja 2 3 1t t ttc y c u" " $! " " . Sendo assim, pode-se concluir que: ' ( 2 12 222 2 1 13 1 1 ˆ 1 ˆ t t t t t t t t t tt t t t c y c y c y c y c cy c y c " " $ $ $$ $ 5 6 5 6 5 6$7 8 7 8 7 8!7 8 7 8 7 8$$ 7 8 7 87 8 9 : 9 :9 : % % % % % %% % % . Ainda, podemos concluir o seguinte: 1 1 1 2 2 2 2 1 1 0,9 ;0,8 ;0,7 ;0,5t t t t t t t t t t t t y c c c y c y c y c y c $ $ $ $ $ ! ! ! !% % % % % % % % . A segunda etapa começa aqui, pois, com essas informações, torna-se tranqüilo encontrar os parâmetros desejados. ' ( ' ( ' ( 2 1 1 1 2 22 2 1 1 2 2 2 2 1 1 22 2 2 2 1 2 1 2 2 2 1 ˆ 0,9 0,7 0,8 0,7 0,9 0,7 0,8 . 0,7 t t t t t t t t t t t t t t t t t t t t t c c y c y c c y c c y c y y c y c y c c y " $ $ $ $ $ $ $ $ $ $ $ ! ! $ $ ! ! $ $ ; ! $ % % % % % % % % % % % % % % % % % Mas, das duas últimas equações acima, 2 20,7 0,5t ty c!% % . Logo, 11 2 2 2 2 0,70,34 0,5ˆ 0,5231 0,7 0,7 0,5 t t y y " ! !< =>? $ >? >>?@ A % % . Aplicando o mesmo procedimento, obtemos 3ˆ 0,5385" ! . Uma outra maneira de resolver o problema é a seguinte: seja 1 o índice da variável ct, 2 o índice da variável y e 3 o índice de ct-1. Além disso, seja bij o coeficiente angular da regressão que tem i como regressando e j como regressor, segue-se, então, que6: 12 13 32 2 23 32 13 12 23 3 23 32 0,9 0,8 0,7ˆ 0,5231; 1 1 0,7 0,5 0,8 0,9 0,5ˆ 0,5385. 1 1 0,7 0,5 b b b b b b b b b b " " $ $ ;! ! ! $ $ ; $ $ ;! ! ! $ $ ; . 6 Ver Johnston (1984), cap. 3. 12 3. Extensões ao Modelo Básico de Regressão Linear 3.1 Qual é a intuição do método de estimação por máxima verossimilhança? Este método produz resultados necessariamente iguais ao método de mínimos quadrados ordinários? Por que é possível obter um R2 negativo quando estimamos um modelo (com constante) pelo método de máxima verossimilhança? Solução: (Sugestão de leitura adicional – CUTHBERTSON, Keith; HALL, Stephen & TAYLOR, Mark. Applied Econometrics Techniques. Ann Arbor: Michigan, 1992) Este é um exercício que reforça a idéia de máxima verossimilhança introduzida no texto, procurando estimular o raciocínio intuitivo do alunos. Dada uma seqüência de observações e supondo-se uma determinada distribuição para os erros dessa seqüência e seu processo gerador de dados, o método de máxima verossimilhança permite obter os parâmetros que mais aproximam a distribuição amostral da suposta distribuição populacional dos erros. Nesse sentido, não importa se o método produz erros pequenos ou grandes, desde que esses erros tenham a configuração de uma normal, por exemplo. Por isso, a média desses erros pode ser bem diferente de zero, de modo que o R2 pode ser negativo (ver exercício 2.5). Observe que, nos pacotes econométricos, o R2 é calculado supondo-se que a estimação seja feita por MQO com constante. Daí um dos motivos para que não seja uma boa medida de regressão, necessariamente. 3.2 (C) Uma variável aleatória X tem uma distribuição exponencial, com parâmetro ' (0" ". se X tem uma distribuição contínua pela qual a função densidade de probabilidade, f.d.p., ' ( , para 0, 0, para 0 xe x f x x """ $12 .2!32 B24 . Para mais tarde, note que essa formulação implica que a função densidade acumulada, f.d.c., é: ' ( 1 , para 0, 0, para 0 xe x F x x """ $12 $ .2!32 B24 . 13 A média e a variância de uma distribuição exponencial com parâmetro " é ' ( 1E X " ! e ' ( 2 1Var X " ! . a. Suponhaque x1, x2, ..., xn formem uma amostra aleatória de uma distribuição exponencial, cujo valor " é desconhecido. Encontre a estimativa de máxima verossimilhança, EMV, de " . b. Usando a propriedade de invariância da EMV, encontre a EMV de 2 1 1 e " " . (A propriedade da invariância da EMA significa que ' ( ' (ˆg g) )! ). Solução: Este exercício serve de treino para derivar as condições de primeira ordem da máxima verossimilhança, saindo um pouco da tão conhecida distribuição normal. O exercício serve também para mostrar como se obtêm resultados para uma estimativa, a partir de outra estimativa. Além disso, o exercício, apesar da enorme formulação, é fácil. a. Primeiro formulamos o problema na linguagem aprendida no livro. ' ( 1 1 ; n i i i n x x n i L X e e " "" " " ! $ $ ! % ! !C . Tomando-se o log: ' ( ' ( ' ( 1 log ; ; log n i i L X l X n x" " " " ! 5 6 ! ! $9 : % . As condições de primeira ordem dão; 1 1 1ˆ ˆ0 n i n i i i l n nx Xx " " " " ! ! , ! $ ! - ! D ! , % % . b. A segunda parte do problema é ainda mais fácil. ' ( ' (1 1ˆ ˆg g X" "" "! - ! ! . Da mesma forma: ' ( ' ( 22 21 1ˆ ˆg g X" "" "! - ! ! . 14 É possível mostrar isso formalmente, utilizando a mesma metodologia anterior. 3.3 (C) Suponha que X1, X2, ..., Xn são variáveis aleatórias de Bernoulli i.i.d., com: 1, com probabilidade 0, com probabilidade 1i x ) ) 122!32 $24 . a. Encontre a EMV de ) e sua distribuição assintótica7. b. Teste a hipótese 0 : 0,4H )! por Wald, LR e LM? Teste a hipótese 2 0 : 0,5H ) ! 8? Solução: Este exercício é bastante completo e verifica se o aluno entendeu como funcionam os testes apresentados no corpo do texto. a. Primeiro, vamos definir a função de Bernoulli, depois a função de verossimilhança para achar o valor dos parâmetros e, em seguida, encontrar a distribuição assintótica. A função de Bernoulli é dada por: ' ( ' (11 , 0,1xxiP X x x) ) ) $! ! $ ! . Como Xi é i.i.d.: ' ( ' (11 2 1 , , , 1 ii n xx n i P X x X x X x ) ) ) $ ! ! ! ! ! $C" . Assim, ' ( ' ( ' ( ' ( ' (1 1 1 1 ; ln 1 ln ln 1 1ii n n n xx i i i i i l x x x) ) ) ) )$ ! ! ! 5 6! $ ! " $ $7 89 :% % % . As condições de primeira ordem resultam em: ' ( ' ( ' (1 0 1 1 ˆ . i i i i i x x x n x x n ) ) ) ) ) $ $ ! - $ ! $ - $ ! % % % % % As condições de segunda ordem garantem o máximo. Agora, tratemos da distribuição assintótica. Pelo Teorema Central do Limite de Levy- Lindberg, sabemos que, como E F 1 n i i x ! são i.i.d., ' ( ' ( 2 ,E x Var x n (*! ! , logo: 7 Não é preciso resolver a parte de distribuição assintótica, embora seja simples a resposta. 8 Como se trata de uma restrição não linear, esta parte do exercício pode ser evitada. 15 ' (2 0,1d Xn N* ( $ GGH . ' ( ' ( ' ( ' ( ' ( ' (2 2 ˆ ; 1 1ˆ . i i E x nE n n Var x n Var n n n )) ) ) ) ) ) ) ! ! ! $ $ ! ! ! % % A segunda igualdade da variância é resultado da variância para o caso da distribuição de Bernoulli. Desse modo: ' ( ' ( ' ( ˆ ˆ 0,1 1 1 dn N n ) ) ) ) ) ) ) ) $ $! GGH $ $ . A solução apresentada para distribuição assintótica, no entanto, pode ser feita usando as propriedades do EMV. Uma delas afirma que, sob determinadas condições encontradas neste problema, o estimador de máxima verossimilhança é assintoticamente normal. Formalmente, isso significa; ' ( ' ( ' ( 1 2 2 ˆ 0, , onde ;1 . dn N L x E n ) ) ) ( $$ GGH + 5 6,7 8+!$ 7 8,7 89 : Logo, ' ( ' ( ' ( ' ( ' ( ' ( ' ( ' ( ' ( ' (' ( ' ( ' ( 2 2 2 2 22 2 2 2 2 2 22 2 ˆ ˆ1 1ˆ ˆ11 1 1 1 1 1 1 1 1 1 . 11 1 i ix xE E E n ) ) ) )) ) ) )) ) ) ) ) ) ) ) ) ) ) ) ) )) ) ) ) < =5 6< = < = $ " $ >?$ $> >? ? >7 8 ?> >? ? >+! " ! " ! !?> > >7 8? ? ?> > >? ?> >> > ?? ?$ $ $7 8 >@ A @ A >?@ A9 : < = < =$ " $ $ $ "> >? ?> >? ?+! ! !> >? ?> >? ? $> >> >? ?$ $@ A @ A % % Portanto, ' ( ' (' (ˆ 0, 1dn N) ) ) )$ GGH $ . b. O primeiro teste que devemos fazer é assim especificado: 0 1: 0,4 : 0, 4.H H) )! & # 16 Apenas para formalizar melhor a idéia de máxima verossimilhança, temos que definir os seguintes resultados: ' ( 0, 4 0H ) )! $ ! , que a “função hipótese nula”; ' ( ' ( ' ( ' ( ' ( 22 2 2 2 1; ˆ ˆ ˆ; 1 1 . ˆ ˆ1 i i H l x x x ) ) ) ) ) ) ) ) ) , ! , , $ $ $ $ ! ), , $ % % Teste de Wald Com isso, o teste de Wald é dado por: ' ( ' ( ' ( ' ( ' ( 2 2 2 12 2 ˆ ˆ1 ˆ ˆ0, 4 1 1 0,4 ˆ ˆ1 1 d i i W x x + ) ) ) ) , ) ) ! 1 I2 2$2 22 22 2! $ ; ; $ GGH3 J2 22 2$ " $2 22 24 K% % . Portanto, se ' ( 2 1 95%W +, !. , rejeitamos H0. Note que aqui, temos apenas que estimar o modelo não restrito, ou seja, sem impor qualquer restrição. Teste Razão de Verossimilhança – LR ' ( ' ( ' ( ' ( ' (E F 2 1ˆ ˆ2 ln ln 0, 4 1 ln 1 ln 0,6 di iLR x x +) ) , !5 6 5 6!$ $ " $ $ $ GGH7 8 7 89 : 9 :% % . Portanto, se ' ( 2 1 95%LR +, !. , rejeitamos H0. Note que aqui temos que calcular o modelo restrito e o não restrito. Teste Multiplicador de Lagrange – LM No teste LM, temos apenas que calcular a verossimilhança com o modelo restrito. ' ( ' ( ' ( 2 2 2 12 2 1 1 11 1 i i i i d i i x n x x n x LM x x + ) ) , ) ) ) )) ) ! 1 I) 2 2< = < =$2 2$ $> >? ?2 2> >? ?! $ $ GGH3 J> >? ?> >2 2> >$ $? ?? ?@ A @ A$ " $2 22 24 K % % % % % % $ $ $ $ $ $$ $ , onde )$ é o vetor de parâmetros estimados do modelo restrito. Assim, temos: ' ( 2 2 1 0,0576 0, 4 0,6 0,36 0,16 1 i i d i i x n x LM x x + , ! 1 I< = 2 2$ >? 2 2>?! $ GGH3 J>? > 2 2> " $??@ A 2 24 K % % % % . Portanto, se ' ( 2 1 95%LM +, !. , rejeitamos H0. 17 O segundo teste que devemos fazer é assim especificado: 2 2 0 1: 0,5 : 0,5H H) )! & # . Apenas para formalizar melhor a idéia de máxima verossimilhança, temos que definir os seguintes resultados: ' ( 2 0,5 0H ) )! $ ! ; ' ( 2 H ) ) ) , ! , . Teste de Wald ' ( ' ( ' ( ' ( 22 22 2 12 2 ˆ ˆ1 ˆ 0,5 ˆ ˆ1 1 d i i W x x + ) ) ) , ) ) ! 1 I2 2$2 22 22 2! $ GGH3 J2 22 2$ " $2 22 24 K% % . Teste Razão de Verossimilhança – LR ' ( ' ( ' ( ' ( ' ( 2 11 1ˆ ˆ2 ln ln 0,5 1 ln 1 ln 0,52 2 d i iLR x x +) ) , ! 1 I5 6 5 62 22 27 8 7 8!$ $ " $ $ $ GGH3 J2 27 8 7 89 : 9 :2 24 K % % . Teste Multiplicador de Lagrange – LM ' ( ' ( ' ( ' ( ' ( ' ( ' ( 22 2 2 2 2 2 12 1 2 1 1 4 0,5 0,5 1 0,5 . 1 0,5 0,5 1 i i d i i LM x x x x + ) ) ) ) ) , ! 1 I2 2$2 22 2! !3 J2 2$ " $2 22 24 K ; ; $ GGH $ " $ % % % % $ $ $ $ 3.4 (C) Seja ' (21 , . . . 0, , 1t t t ty y i i d N+ # # ( +$! " /! 9. 9 Exercício difícil, mas importante para entender e trabalhar os conceitos de viés, consistência, EMV e MQO. Consultar, também, capítulo 5 do livro. 18 a. Escreva a função log-verossimilhança para uma amostra com T observações (y1, y2, ..., yT), a partir do processo acima, condicional à primeira observação. Escreva a função de verossimilhança como: ' ( ' ( ' ( ' ( ' ( ' ( ' ( ' ( ' ( ' ( 1 1 1 2 1 1 2 1 1 2 1 1 2 3 1 2 3 1 1 2 1 1 2 3 1 2 1 1 , , , , , , , , , , , , , , , , , , , , , , , , . t t t t t t t t t t t t t t t t t t t t t f y y y f y y y y f y y y f y y y y f y y y y f y y y f y y y y f y y y y f y y f y $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ ! ! ! ! ! ! ! # # # # # # " # # "Para o processo acima, os valores de (y1, y2, ..., yT-1) interessam para yT apenas através do valor de yT-1. Assim, ' ( ' (1 2 1 1, , ,t t t t tf y y y y f y y$ $ $!# . b. Mostre que ˆ ˆ ˆEMV MQO+ + +! ! , onde ˆMQO+ vem da regressão de yt contra yt-1 e ˆEMV+ é a EMV (condicional em y1). c. Mostre que +ˆ é um estimador viesado de + . d. Mostre que +ˆ é consistente. e. Obtenha a distribuição assintótica de +ˆ . f. Agora, suponha que o processo seja alterado para ' ( 1 1 2 , , . . . 0, , , 1. t t t t t t t y y u u u i i d N + # # ) ( + ) $ $! " ! " /! O estimador de mínimos quadrados é consistente? Derive o limite de probabilidade. Solução: No corpo do texto, usaram-se termos como consistência, viés, eficiência. Este exercício serve para trabalhar esses termos, de modo a esclarecer seu significado. Daí sua importância. No entanto, este exercício pode ser considerado difícil, a partir da letra d. Note que aqui, implicitamente, estamos retirando a hipótese de que a matriz X é não estocástica. Isto muda radicalmente os resultados. Sugerimos a seguinte bibliografia adicional: HAMILTON, James D. Time Series Analysis. Princeton: Princeton, p. 215, 1994. a. Vamos primeiro definir a função de verossimilhança condicional a y1, como, aliás, já foi ensinado no corpo do exercício. ' ( ' ( ' (21 2 1 1 22 2 1 1 1, , , 2 t ty y t t tf y y y y e #( #-( $ 5 6$7 8$7 8$ 7 87 89 : $ $ !# . Agora, seguindo a sugestão do exercício: 19 ' ( ' ( ' (21 2 2 1 2 1 2 2 1 1 1, , , 2 T t t t y y T t t tf y y y y e #( #-( $ ! 5 6 7 8$7 8 7 8$7 8 7 8 7 8$ 7 8$ 7 87 89 : $ $ % !# . Dessa forma: ' ( ' ( ' ( ' (22 2 121 2 1 1 1, ; ln 2 ln 2 2 2 T T t t tt t T Tl y y y# # # + ( - ( + ( $! ! $ $5 6 !$ $ $ $7 89 : % . b. Agora, é fácil ver que ' ( ' (2* 2 11 2 ˆ arg max , ; arg min T T t t tt t l y y y#+ + ( + $! ! 5 6! ! $7 89 : % . Assim, temos que ˆ ˆEMV MQO+ +! . De fato, tomando as condições de primeira ordem, ' ( ' ( 2 1 1 12 2 2 1 1 2 2 1 2 2 1 2 , ; 1 0 0 ˆ ˆ . T Tt t t t t t T T t t t t t T t t t EMV MQOT t t l y y y y y y y y y y # # + ( + + ( + + + ! $ $ ! $ $ ! ! $ ! $ ! 5 6, 7 89 : ! $ ! - , $ ! - ! ! % % % % % Apenas para constar, as condições de segunda ordem dão para + : 2 1 2 2 0 T t t y #( $ !$ / % . c. Para mostrar que é viesado, temos apenas que tomar a esperança da estimativa. Ou seja, ' (1 1 1 2 2 2 2 1 1 2 2 ˆ T T t t t t t t t T T t t t t y y y E E E y y + # # + + $ $ $ ! ! $ $ ! ! 5 6 5 6 7 8 7 8"7 8 7 85 6 7 8 7 8! ! "7 89 : 7 8 7 8 7 8 7 8 7 8 7 89 : 9 : % % % % . Temos que desenvolver o numerador da segunda parcela. 20 ' ( ' ( ' ( 2 1 2 1 1 2 3 2 2 2 1 1 1 2 1 . T T T t t t t t t t t t t t t t t j tT j j t t j t t j y y y y # # + # # # +# # + # # # + + # $ $ $ $ $ $ ! ! ! ! $ $ $ ! ! ! " ! " " ! ! ! ! " % % % %% " Podemos ver, a partir disso, que: ' ( 1 1 1 1 2 1 0 j tT j j t t j t t j E y y# # + + # ! $ $ $ ! ! 5 6 7 8" !7 87 89 : % % , porém, ' ( ' ( ' ( ' ( ' ( 1 1 2 1 1 2 1 2 g xg x 0, pois E j tT j t t j t j T t t E E y h y E h yy # # + ! $ $ $ ! ! $ ! 5 6 7 8 5 65 67 8 9 :7 87 8 # #7 87 8 5 67 89 :7 8 9 : 7 87 89 : % % % . A conclusão, portanto, é que +ˆ é viesado. A intuição básica é que o denominador, que também depende dos erros, altera a razão, ou seja, impõe uma estrutura de ponderação, cuja esperança não é mais zero. d. A consistência é um conceito, quando tomamos a probabilidade do limite. Como, nesse caso, pelo Teorema de Slutsky, ' ( ' ( ' ( ' ( lim g xg x lim lim p p h y p h y 5 65 6 9 :7 8 !7 8 5 67 89 : 9 : , temos que: ' ( ' ( 1 1 1 1 2 1 2 1 2 2 1 1 2 2 01 1 2 1 2 1 2 lim ˆlim lim lim lim . lim j t j tT T j j t t j t t j t j t j T T t t t t j tT j t t j t j T t t p p p y p y p p y # # + # # + + + + + # # + + ! $ ! $ $ $ $ $ ! ! ! ! $ $ ! ! !! $ $ $ ! ! $ ! ! " ! " ! 5 69 : ! " ! %% %% % % %% % %&&&&&'&&&&&( Logo, +ˆ é consistente. e. Este exercício não é difícil, mas exige atenção. 21 ' ( 1 2 1 2 2 2 1 1 2 2 1ˆ ˆ1 1 T T t t t t t t T T t t t t y y TT y y T # # + + + + $ ! $ ! $ $ ! ! $! " - $ $ ! $ % % % % . Pelo Teorema Central do Limite, ' (' ( 1 4 2 22 1 20, 0,11 T t t dt t y N E y N T # # # (( + $ ! $ < =>? >GGH ! ? >? >? $@ A$ % . Pela Lei dos Grandes Números, 2 1 2 2 21 1 T t pt y T #( + $ ! GGH $ $ % . Para ver este último resultado, observe que ' ( ' ( ' ( ' ( ' () ' ( 22 2 2 2 2 1 1 1 2 2 2 2 1 1 0 2 2 2 2 2 . 1 p pp t t t t t t t t t t t t t t E y t y y y y y E y E y E y E E y #( # + # + # # + # # ( + $ $ $ $ $ GGH GGHGGH ! " - ! " " - ! " " - ! $ *&&&+&&&,*&&+&&, Ou, de outra maneira, lembrando que a esperança é sobre uma amostra infinita: ' ( 2 2 2 2 2 2 2 1 T j j t t j t t t y E y ## (+ # + ( + L $ ! ! ! - ! ! $% % . Portanto ' ( ' ( 2 2 2 2 2 1ˆ1 0, 0,1 1 1 dT N N# # (+ + + ( + + < =>? >$ $ GGH ! $? >? >? $@ A $ . f. Agora, como 1 1, lim 0t t t t tu u p y# ) #$ $! " # . Assim, 22 ' (' ( 2 1 1 2 1 2 2 2 1 2 1 2 2 2 2 2 0 0 0 2 1 2 1 22 2 0 p p p p p u T T t t t t t t t t t T T T T t t t t t t t t t t t t T T t t t t t t y u u y u u y u y u u u u T T T T u y u u T T ( # ) ) # ) ) ) ) $ $ $ $ $ ! ! $ $ $ $ ! ! ! ! GGH GGH GGH $ $ $ ! ! GGH GGH ! " " " - ! " " " " " " % % % % % % % % *&&&+&&&, *&&&+&&&, *&&&+&&&, *&&&&+&&&&, *&&+&&, 1 2 2 0 1 22 0. p T t t T t t pt u u T y T # )( $ $ ! GGH $ ! - GGH # % % *&&&&+&&&&, Agora, no denominador temos: ' ( 2 2 2 1 2 2 22 2 2 2 1 2 1 2 2 1 2 2 22 2 2 2 2 1 2 2 2 2 2 0 2 2 2 T p p u u t p t p p u T T T T T t t t t t t t t t t t t y T T T t t t t t t t y y u u y u u T T T T T u y u y u T T ( ( ( + ) + ) + +) ) $ ! $ $ $ $ $ $ $ ! ! ! ! ! GGH GGH GGH $ $ $ $ ! ! GGH GGH " " ! ! " " " % " " " % % % % % % % *&&+&&, *&&+&&, *&&+&&, *&&&&+&&&&, *&&&&+&&&&, ' ( 1 2 2 0 2 21 22 2 1 2 . 1 p T t t T t pt u u T y T ) )+ ( + $ $ ! GGH $ ! - " " GGH $ % % *&&&&+&&&&, Portanto, ' ( ' (21 22 22 2 2 1 22 lim 1ˆlim 1 21 2lim 1 T t t t u T u t t p y p p y # + ))(+ + + + + ) )+) )+ ( + $ ! $ ! $ ! " ! " ! " # " "" " $ % % . Logo, podemos concluir que ˆMQO+ é inconsistente. 23 4. Análise da Base de Dados e Utilização de Variáveis Binárias 4.1 Explique sucintamente como se faz o teste de Chow e para que ele serve. Apresente, pelo menos, duas limitações ao teste de Chow. Solução: O exercício pretende estimular o raciocínio do estudante quanto à aplicabilidade do teste de Chow. O professor deve esperar que o estudante encontreduas limitações, pois a terceira é bastante sutil, tratando-se de modelos não lineares. Para teste de apenas uma mudança estrutural, divida a amostra em antes e depois da mudança. Estime o modelo não restrito, ou seja, estime o modelo antes e depois da mudança separadamente, calcule a soma dos quadrados dos resíduos para cada caso e some-as. Estime o modelo sem mudança estrutural, usando todos os dados, e obtenha a soma dos quadrados dos resíduos restritos. Use o teste F, tomando cuidado para especificar corretamente o número de restrições. O teste de Chow serve para verificar se houve alguma mudança estrutural na série. A primeira limitação trata do fato de que o teste de Chow, usado para mudanças estruturais, não é aplicável se o número de variáveis explicativas, k, é maior do que o número de observações de uma das subamostras, isto é, se k > ni, para algum i. Na prática isso dificilmente ocorre, mas trata-se um problema potencial. Imagine intervenções na economia de poucos meses, por exemplo, o que poderia acarretar esse problema. A segunda limitação é que o teste supõe um modelo homocedástico, ou seja, mesma variância nas diversas subamostras, o que é fortemente implausível se há mudança estrutural. A terceira limitação é que o teste se aplica apenas a modelos lineares, e não se aplica a modelos não lineares. Porém, o escopo desse livro é estudar estimação apenas em modelos lineares. Para maiores detalhes sobre isso, ver DAVIDSON, Russel & MACKINNON, James G. Estimation and Inference in Econometrics. New York: Oxford, pág. 376, 1993. 4.2 (K) Suponha que se estime y x D! " % #! " " " , onde D é uma dummy para estado civil (casado ou solteiro). Suponha que saibamos que a fração de casados na amostra é duas vezes maior do que a fração de solteiros na população Que modificação, se houver, você sugeriria. 24 Solução: Este é um exercício destinado a treinar a atenção do aluno, para evitar que, num trabalho real, ele cometa erros primários. Nada, pois esta informação não tem qualquer implicação sobre os valores s parâmetros. 4.3 (C) Suponha que o único determinante do consumo das famílias no Br ai, do chefe da família. Temos dados de cross-section de famílias. Con modelo simples: ( 1 ) 1 2i i ic a" " #! " " , e o modelo mais geral ( 2 ) 1 1 2 2i i i i i ic D a D a" $ " $ #! " " " " , onde Di é uma variável dummy indicando se o chefe é aposentado ou seguinte forma: 1, se 60; 0, se 60. i i i a D a 1 022!32 /24 Assuma que todas as hipóteses padrões para pequenas amostras são modelo ( 2 ) e que ' ( 2iVar # (! é desconhecido. a. De acordo com ( 2 ), qual é a esperança condicional do consumo da f tem 40 anos de idade? E para aquela cujo chefe tem 20 anos de idade?; Para b. e c. considere as três figuras abaixo: ai ci sem pulo sem quina 60 ci sem pulo quina 60 ai ci pulo quina 60 do asil, ci, é a idade, sidere o seguinte não, definida da satisfeitas para o amília cujo chefe ai 25 b. Que restrições devem ser impostas sobre os parâmetros do modelo ( 2 ) para evitar mudanças descontínuas na esperança condicional do consumo na época da aposentadoria? Como você testaria essa restrição? c. Suponha que a restrição de b. seja verdadeira. Imponha isso sobre ( 2 ) e derive um teste de hipótese que não haja pulo (como imposto) e não haja quina na consumo na época da aposentadoria. Solução: O exercício aplica os conhecimentos de variáveis dummy. Ele tem o mérito de induzir o estudante a pensar em como se usam as variáveis dummy. a. O exercício é bastante simples, não demandando maiores dificuldades. 1 2 1 2 40 40; 20 20. i i i i E c a E c a " " " " 5 6! ! " ;9 : 5 6! ! " ;9 : Ao passo que, por exemplo, ' (1 1 2 273 73i iE c a " $ " $5 6! ! " " " ;9 : . b. A restrição necessária para evitar o pulo é: 1 2 60 0$ $" ; ! . Podemos testar, 0 1 2 1 1 2: 60 0 : 60 0H H$ $ $ $" ; ! & " ; # , fazendo um teste t-student da combinação linear dos coeficientes. Assim, rejeite H0 se ' ( ' ( M N M N 12 2 1 1 2 2 ˆ 0 4 , onde 0,1,0,60 ; , , , . Rt t n s R X X R R ! " " " $ " $ $ $! 0 $ 5 6) )7 89 : )! ! c. Impondo a restrição de que não haja pulo sobre ( 2 ), obtemos: ' (1 2 2 60i i i i ic a D a" " $ #! " " $ " . A restrição adicional para evitar quina é 2 0$ ! . Podemos, então, testar: 0 2 1 2: 0 : 0H H$ $! & # , fazendo um teste t-student da seguinte forma: 26 ' ( ' (2 12 2 33 ˆ 0 3t t n s X X ! $ $ $! 0 $ 5 6)7 89 : . Se a desigualdade for verdadeira, rejeitamos H0. Apenas note o número de graus de liberdade, entre parênteses. 4.4 (J) Um conjunto de dados “cross-section” de famílias com relação a renda, y, e consumo, c, é dividida em subconjuntos de observações, da seguinte maneira: a. Operários; b. Assalariados; e c. Autônomos. Uma regressão do log(c) contra o log(y) é computada para cada sub-amostra e para a amostra completa (com “dummy” para cada intercepto), produzindo: !β s2 T a. Operários 1 02 0 06 , ( , ) 0,24 102 b. Assalariados 0 91 0 1 , ( , ) 0,46 104 c. Autônomos 0 76 0 08 , ( , ) 0,30 26 d. Todas famílias 0 86 0 05 , ( , ) 0,39 232 Aqui !β é o coeficiente de declividade (com os erros-padrão entre parênteses), s2 é a variância residual, e T é o tamanho da amostra. Teste as hipóteses de que: a. A elasticidade de c com respeito a y é a mesma para todas as classes ocupacionais; b. Seu valor é unitário. Interprete os seus resultados e dê algumas possíveis explanações para as diferenças observadas. Solução: Este exercício é ilustrativo do uso das variáveis dummy, onde o aluno é obrigado a raciocinar sobre sua utilização. Ao mesmo tempo, introduz-se um exemplo 27 prático, para aguçar a intuição do estudante. O exercício é muito bom, porque esclarece muitos detalhes que em geral passam despercebidos, mesmo após uma cuidadosa leitura do texto principal. Ao final da resolução, apresentamos uma variante do exercício, muito ilustrativa, embora de um elevado grau de dificuldade, se proposto aos alunos. Porém, tal variante poderia servir como um desafio, mais voltado aos alunos aplicados. a. Temos que fazer um teste de F para esse caso. Assim, precisamos encontrar os erros quadrados da equação restrita e da não restrita. Não temos isso diretamente, mas podemos calcular. Se somarmos os erros das três regressões separadas, teremos o erro da equação não restrita, da mesma forma que é feito no corpo do texto. Vamos ver isso, algebricamente. 2 ˆ ˆ , 1, 2,3í íi e es i n k ) ! ! $ , 1 representa os operários, 2 representa os assalariados, 3 representa os autônomos. Com isso, podemos calcular o erro quadrado de cada regressão. Sabemos que o tamanho da amostra, T, será nosso n da equação e k é o número de parâmetros estimados. Como temos uma dummy para cada intercepto, cada equação foi estimada com duas variáveis explicativas, e a última equação foi estimada com três dummy mais o coeficiente de declividade. Este é o primeiro detalhe importante. Logicamente, a última equação trata do modelo restrito, que será denotado por um asterisco, *. Assim, temos: ' ( ' ( ' ( ' ( 1 1 1 1 2 2 2 2 3 3 3 3 * * * * ˆ ˆ ˆ ˆ0, 24 102 2 24; ˆ ˆ ˆ ˆ0, 46 104 2 46,92; ˆ ˆ ˆ ˆ0,30 26 2 7,2; 0,39 232 4 88,92. e e e e e e e e e e e e e e e e ) )$ ! - ! ) )$ ! - ! ) )$ ! - ! ) )$ ! - ! A soma dos erros quadrados das três primeiras equações nos dá a soma dos quadrados dos erros da equação não restrita. Calculando temos que 24 46,92 7,2 78,12" " ! . Agora, vamos especificar o teste F que desejamos fazer. Este segundo detalhe é muito importante, pois defineo número de restrições, q, para o teste de F, número esse que freqüentemente causa confusões. 28 1 2 1 2 0 1 2 3 2 3 : : ouH H " " " " " " " " 1 #221 !2 22 2&3 32 2!24 2 #224 . O número de restrições é melhor entendido, pensando na hipótese alternativa. Dessa forma, calculando F, obtemos: ' ( ' ( ' (95% 88,92 78,12 2 15,62 2, 22678,12 232 6 F F $ ! ! . $ . Com esse resultados, rejeitamos H0 de que as declividades são idênticas para as três classes laborais. Note que não sabemos se as três declividades são diferentes entres si, ou se apenas uma delas difere das outras duas, nem qual delas seria. Apenas sabemos que são diferentes. b. Agora temos que testar, para cada regressão, se a declividade é diferente. Basta usar um teste t-student, bastante conhecido. ' (0 1 1 1 2,5% 1,02 1: 1 : 1: 0,333 100 0,06 H H t t" " $! & # ! ! / , de modo que aceitamos H0 ao nível de 5% de significância. ' (0 2 1 2 2,5% 0,91 1: 1 : 1: 0,9 102 0,1 H H t t" " $! & # ! ! / , de modo que aceitamos H0 ao nível de 5% de significância. ' (0 3 1 3 2,5% 0,76 1: 1 : 1: 3 24 0,08 H H t t" " $! & # ! ! . , de modo que rejeitamos H0 ao nível de 5% de significância. À luz do teste que fizemos no item anterior, observamos que a diferença de declividade encontra-se no 3" . Ou seja, temos duas declividades iguais a 1 e uma diferente de 1. Não fizemos o teste para verificar se 3" é maior ou menor do que 1 (nosso teste foi para verificar se era diferente de 1), mas é de se esperar que seja menor do que 1, de acordo com as explicações a seguir. Uma possível explicação é a percepção do que a renda representa para cada classe laboral. Os assalariados e operários percebem aquela renda de uma perspectiva de mais longo prazo, ou seja, entendem aquela renda como fazendo parte de seu fluxo de renda permanente. Os autônomos não sabem se a renda percebida será igual nos períodos 29 seguintes, ou seja, se se trata de renda permanente ou transitória. Por isso, os autônomos têm uma propensão marginal a poupar maior do que as outras classes ocupacionais. À propósito, isto é o que Milton Friedman propôs em suas Teoria da Renda Permanente. Esta é a razão por que a elasticidade renda dos autônomos é menor. Isto encerra o problema proposto. O problema comporta algumas variantes de interesse. Inicialmente, suponha que não tivesse sido citada uma dummy para cada intercepto. Então, isso traria ambigüidades, pois não seria possível definir se em “todas famílias” foram regredidas com apenas um intercepto ou com uma dummy para cada intercepto. Assim, a solução dada anteriormente testa a seguinte hipóteses: Modelo Restrito: diferentes interceptos e uma declividade comum; Modelo não Restrito: diferentes interceptos e diferentes declividades. Porém, se assumimos que “todas famílias” tem apenas um intercepto, então estaríamos testando H0: interceptos são os mesmos e declividades são as mesmas. Formalmente: 1 2 1 2 2 3 2 3 0 1 1 2 1 2 2 3 2 3 , ou , ou : : , ou . H H ! ! ! ! ! ! ! ! " " " " " " " " 1 1! #2 22 22 22 2! #2 22 2&3 32 2! #2 22 22 2! #2 22 24 4 Nesse caso, apenas o valor dos erros quadrados restritos é que mudariam para: ' ( * * * *0,39 232 2 89,70e e e e) )$ ! - ! . O teste de F seria dado por: ' ( ' ( ' (95% 89,70 78,12 4 8,38 4, 22678,12 232 6 F F $ ! ! . $ . De modo que rejeitaríamos a hipótese nula, sem saber se a rejeição seria causada por interceptos diferentes, ou declividades diferentes, ou ambos. Agora uma problema mais difícil. Supondo que a regressão “todas famílias” tenha, de fato, um único intercepto, seria possível extrair a soma dos quadrados dos resíduos para um 30 modelo restrito com diferentes interceptos e uma declividade comum, a partir dos mesmos dados fornecidos? Se estimássemos os modelos a partir de seus desvios em relação à média, recuperaríamos os betas. Isto é, a partir da média, para modelos com intercepto e declividade apenas: ˆ y x x x " ) ! ) , onde y e x são desvios em relação à sua média. Disso, podemos deduzir que:: ' (2 * * y x e e y y x x ) ) )! $ ) . Dos dados do problema, temos que: 21 1 1 1 1 1 22 2 2 2 2 2 23 3 3 3 3 3 0, 241,02 e 0,06 ; 0, 460,91 e 0,10 ; 0,300,76 e 0,08 . y x x x x x y x x x x x y x x x x x ) ! ! ) ) ) ! ! ) ) ) ! ! ) ) Assim, obtemos: 1 1 1 1 2 2 2 2 3 3 3 3 66,67 e y 68,00; 46,00 e 41,86; 46,88 e 35,63; 159,55 e 145, 49. x x x x x y x x x y x x x y x ) ! ! ) )! ! ) )! ! ) )! ! Assim: 145,49ˆ 0,91 159,55 " ! ! . Isso difere da declividade de “todas famílias” de 0,86, confirmando nossa conjectura que a regressão “todas famílias” não continha variáveis dummy que permitisse interceptos diferentes. Quer dizer, se queremos testar para diferentes declividades apenas, devemos estimar o " da equação restrita com dummy para os interceptos e declividade comum, como assumimos para resolver o problema anterior. Para estimar * *e e) , precisamos computar 1 1 2 2 3 3y y y y y y y y) ) ) )! " " . Para qualquer regressão: 31 ' ( ' ( ' ( ' ( 2 2 2 2 ˆ ˆ , 1,2,3 . í i í í i i i í i í i i i i í i y x e e s n k y y i x x y x y y s n k x x ) ) )! $ ! $ ! - ) ) ) ! " $ ) Logo, temos; ' ( ' ( ' ( 2 1 1 2 2 2 2 68,00 0, 24 100 93,36; 66,67 41,86 0, 46 102 85,01; 46,00 35,63 0,30 24 34, 28; 46,88 212,65. i i y y y y y y y y ) ! " ! ) ! " ! ) ! " ! ) ! Dessa forma, obtemos: 2 * * 145,49212,65 80,50 159,55 e e) ! $ ! . Ou seja, se não avisássemos no enunciado do problema que “todas famílias” é calculado com uma dummy para cada intercepto, teríamos que realizar todos os cálculos acima, para obter a soma dos quadrados dos resíduos corretamente, a fim de testar para diferentes declividades. Finalmente, estamos prontos para testar que a elasticidade do consumo com relação à renda é a mesma para todas as classes. Agora, há apenas duas restrições: 1 2 1 2 0 1 2 3 2 3 ; ou : :H H " " " " " " " " 1 1! #2 22 2&3 32 2! #2 24 4 . Fazendo o teste F: ' ( ' ( ' ( ' (95% 99% 80,50 78,12 22, 226 3,05 3,44 2,226 3,7078,12 232 6 F F F $ / ! ! / $ - - . Portanto, podemos rejeitar a hipótese de declividades comuns ao nível de 5%, mas não ao nível de 1%. Estas conclusões estão sujeitas a qualificações, no entanto. Se os dados disponibilizados tiverem sido arredondados, consideráveis erros podem ter sido introduzidos. Por exemplo, 32 se 2 ˆ 0,0501"( ! (embora reportado 0,1), então 2 2 180,37x x) ! , não 46,00, como assumimos. Assim, este exercício deve ser visto como pedagogicamente interessante, em vez de empiricamente útil. Para concluir o problema, suponha que aceitemos a hipótese de que as declividades sejam iguais. Devemos, agora, testar se elas diferem da unidade. As informações que temos são as seguintes: 2 2 * * ˆ 0,353ˆ 0,91; 0,353; 0,047 232 4 159,55 e e ss s x x" " ) ! ! ! ! ! ! )$ . O teste t é dado por: ' (2,5% 0,91 1 1,915 226 1,97 0,047 t t$! ! / ! . Portanto, aceitamos a hipótese nula de que os coeficientes são conjuntamente iguais a 1. Note que isso contrasta com os resultados obtidos pelo teste individual dos coeficientes, feitos na resposta principal. O problema de se usar este tipo de teste é que estamos fazendo um teste sobre outro. Isto é, aceitamos a hipótese de que os coeficientes são iguais; dado isso, testamos se são iguais a 1. Nesse processo, perdem-se precisão e informação, motivo pelo qual não recomendamos esse procedimento freqüentemente. Além disso, não é intuitivoque os coeficiente sejam todos iguais a 1, conforme explicamos na resolução principal, embora possam ser todos iguais. 33 5. Problemas Econométricos no Modelo Linear Geral 6.1 Suponha o modelo y X" #! " , onde y e # são vetores 1n& , X <∞ é uma matriz n k& eβ é um vetor 1k& , estimado por MQO com constante. Responda F(also) ou V(erdadeiro) para cada alternativa e justifique sucintamente: a. Heterocedasticidade nas perturbações produz estimativas consistentes deβ ; b. Heterocedasticidade nas perturbações geram estimativas ineficientes; c. Heterocedasticidade nas perturbações resulta numa matriz de covariância das estimativas inconsistente; d. Testes de hipóteses sobre os coeficientes deixam de ser válidos se há heterocedasticidade. Solução: Este é um exercício que tenta dirimir dúvidas, dando ao estudante a oportunidade de voltar aos conceitos básicos e entendê-los melhor. A resposta do exercício exige que se façam algumas hipóteses não explicitadas no enunciados. Elas são as seguintes: i. ' (. . . 0,i i d# O! ; ii. X é não estocástico. Com essas hipóteses, podemos responder a questão. a. Verdadeiro, pois prova-se, como está no corpo do texto, que ' (ˆE " "! ; b. Verdadeiro, pois ' ( ' ( ' ( ' ( ' (1 11ˆ ˆMQG MQOVar X X Var X X X X X X" " $ $$) ) ) )! O / ! O ; c. Verdadeiro, decorrente de b.; d. Verdadeiro, decorrente de b. Aqui, uma consideração. O teste de hipótese usando o lado direito da igualdade em b. é válido. O problema é que muitos pacotes econométricos simplesmente calculam como matriz de covariância como (X’X)-1 e não a matriz de covariância correta. Maiores detalhes a respeito deste exercício são encontrados em WHITE, H. A Heteroskedasticity-Consistent Covariance Matrix and a Direct Test for Heteroskedasticity. Econometrica, vol. 48, n.º 4, 1980. 34 6.2 Suponha um modelo de regressão linear múltiplo em que !β exista, seja não viesado e eficiente, pois u é homocedástico. Suponha que você imponha falsas restrições sobre os parâmetros do modelo. a. Mostre que as estimativas nesse caso são viesadas; b. Mostre que a variância das estimativas do modelo com restrições é menor do que a variância das estimativas do modelo sem restrição; c. Qual a implicação desse resultado em termos de previsão? Qual a intuição desse resultado? Sugestão: Lembre o que é EQM, ou seja, o erro quadrático médio. Solução: O exercício procura ilustrar um caso que não é muito intuitivo, à primeira vista, ou seja quando se impõem falsas restrições no modelo a variância reduz-se. Isto é importante para se ter uma primeira intuição do erro quadrático médio, sua importância e suas conseqüências para a previsão. Às vezes, impondo falsas restrições, pode-se melhorar a previsão, pois reduz-se o erro de previsão, não obstante o viés possa aumentar. a. Primeiramente, note que ' ( ' ( ' ( ' ( 1 * 11 1 ˆ ˆ ˆ ˆ ˆ; , . sr crX X X Y K r R K X X R R X X R " " " " " "$ $$ $ ) )! ! ! ! " $ 5 6) ) ) )! 7 89 : 10 Daqui podem-se tirar as seguintes conclusões: ' ( ' ( ' ( ' ( 12 * ˆ ; . Var X X E K r R " ( " " " $)! ! " $ Como ' (*r R E" " "# - # . Portanto, as estimativas são viesadas. b. Há bastante álgebra neste exercício, mas, com calma, obtém-se a resposta. 10 Ver exercício 3.1.c. 35 ' ( ' ( M N ' (' (' ( ' ( ' ( * ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ A A Var E Kr KR Kr KR Kr KR Kr KR E AA E KR A E I KR I KR I KR B I " " " " " " " " " " " " " " " " " ! ! )5 6 5 6 7 8 7 8! " $ $ $ $ " $ $ $ $ !7 8 7 87 8 7 89 : 9 : 5 6)! !9 : 5 6)5 6 ) )7 8! $ $ $ ! $ $ $ $ !7 8 7 89 : 9 : ! $ *&&&&&&&&&&&&&&+&&&&&&&&&&&&&&, *&&&&&&&&&&&&&&+&&&&&&&&&&&&&&, ' ( ' ( 2 2 1 , . D KR B BR K KRB KRBR K B X X ( ( ! $ < =) >? ) ) ) )$ ! $ $ " >? >>?@ A )! *&&&+&&&, Desenvolvendo D, temos: ' ( ' ( ' ( 11 1 1 BK D X X R R X X R R X X R K BR K $$ $ $ !! 5 6) ) ) ) ) ) ) ) )! !7 89 : *&&&+&&&,*&&&&&&&&&&&&+&&&&&&&&&&&&, . Dessa forma, conseguimos: ' ( ' ( ' ( ' (' ( 1* 2 2 2Var B KRB I KR B I KR X X" ( ( ($)! $ ! $ ! $ . Logo, se ' ( ' (* ˆ0KR Var Var" ". - / . Para ver este último fato, observe que ' ( ' ( 11 1 0 T T R L LR KR X X R R X X R R ) $$ $ . ) ) 5 6) ) ) )! 7 89 : *&&&+&&&, *&&&+&&&, *&&&&&&&&&+&&&&&&&&&, . Agora, seja c = Tv, onde c é um vetor 1n& . Sendo assim, c’c = v’T’Tv > 0, como queríamos demonstrar, pois c’c é um escalar. c. Mesmo com falsas restrições, as previsões serão melhores se a diminuição da variância for maior do que o aumento do viés. Formalmente, se EQM* < EQM. A intuição do resultado é que impor falsos parâmetros significa que haverá menos parâmetros variando, o que poderia reduzir o erro de previsão. 6.3 Responda: a. Cite pelo menos dois testes para a hipótese de homocedasticidade; b. Cite pelo menos um teste para a hipótese de autocorrelação dos resíduos; c. Em caso de rejeição da hipótese nula em a., por que método você estimaria o modelo? d. Em caso de rejeição da hipótese nula em b., por que método você estimaria o modelo? 36 Solução: O exercício pretende que o aluno volte ao livro-texto e verifique claramente que testes ele pode aplicar e de que maneiras ele deve estimar o modelo, em caso de rejeição da hipótese nula. Com isso, sistematiza-se todo o capítulo. Sugerimos consultar, adicionalmente, Johnston e Dinardo (1998). a. Há vários testes que podem ser usados: Breusch-Pagan, White, Goldfeld-Quandt, Glesjer; b. Durbin-Watson, ACF, Ljung-Box; c. Mínimos quadrados generalizados, mínimos quadrados generalizados factíveis; d. Pode-se usar o método de Cochrane-Orcutt, Durbin ou Variáveis instrumentais. 6.4 (C) Suponha o seguinte e verdadeiro modelo: , 1, 2, ,t t ty x t T" #)! " ! # , porém um econometrista, equivocadamente, estima , 1, 2, ,t t t ty x z t T" $ #) )! " " ! # , onde xt é 1k& e zt é 1m& . Assuma que ' ( ' ( 2, 0, ,E x z E x z I# ## ()! ! . Seja "ˆ o estimador por MQO do modelo correto. Seja "$ e $$ os estimadores do modelo equivocado. a. "$ é não viesado para " ?; b. Compute a matriz de covariância para ' (," $$ $ . Compare o bloco da matriz de covariância correspondente a "$ com a matriz de covariância de "ˆ . Quando elas são as mesmas? Solução: O exercício tem o objetivo de mostrar se variáveis omitidas causam viés. Sabemos que não, conforme provado no corpo do texto. Por isso, o exercício apenas busca formalizar melhor os resultados já conhecidos, aplicando-se o Teorema de Frisch-Waugh-Lovell ou Frisch-Waugh11, entre tantas outras maneiras de resolvê-lo. Tal teorema pode ser encontrado em livros como DAVIDSON, Russel & MACKINNON, James G. Estimation and Inference in Econometrics. New York: Oxford, cap. 1, 1993 ou GREENE, William H. Economic Analysis, 4th. ed. Upper 11 Veja exercício 6.1.c, onde se demonstra esse teorema. 37 Saddle River: Prentice Hall, 2000. À propósito, por se tratar de um teorema muito útil, sugerimos que o mesmo seja apresentado em detalhes para os alunos. a. Sim, "$ é não viesado. Para ver isso, reescreva o modelo como ( 3 ) 1 1, , ,T k T TY X X Y" # #& & &! " . Reescreva o modelo equivocado como ( 4 ) 1, ,T m TY X Z Z" $ . .& &! " " . Agora, pré-multiplique ( 4 ) por ' ( 1zM I Z Z Z Z $) )! $ , observando que Mz é idempotente e simétrica. Assim, obtemos, ( 5 ) z z zM Y M X M" .! " . Pelo Teorema de Frisch-Waugh-Lovell, o " estimado usando-se ( 5 ) é idêntico àquele usando-se ( 4 ). Agora, note que pré-multiplicando ( 3 ) por Mz, voltaríamos a ( 5 ). Isto é, se " estimado por ( 3 ) é não viesado, então aquele estimado por ( 5 ) também não o é. Formalmente, usandoMQO em ( 5 ), conseguimos: ' ( ' ( ' ( ' ( ' ( 1 1 1 . z z z z z z X M X X M Y X M X X M E X M X X M E " " # " " # " $ $ $ ) ) ) )! ! " - ) )! " ! $ $ Portanto, "$ é não viesado. b. Podemos estimar o modelo da seguinte forma: M N 1ˆ . ˆ Y X Z X X X Z X Y Z X Z Z Z Y " . $ " $ $ 5 6 7 8! " -7 89 : 5 6 5 6 5 6) ) )7 8 7 8 7 8!7 8 7 8 7 8) ) )7 8 9 : 9 :9 : Agora, temos que relembrar uma propriedade de inversão de matrizes. Dada a seguinte matriz: A B M C D 5 6 7 8! 7 89 : , então 38 ' (1 1 1 1 11 1 1 1 A I BE CA A BE M E CA E $ $ $ $ $ $ $ $ $ 5 6" $7 8! 7 8$7 89 : , onde E = D – CA-1B. Então, defina ' ( ' ( ' ( ' ( ' ( ' ( ' ( ' ( ' ( 1 11 1 11 1 1 1 1 1 1 1 ; xM E Z Z Z X X X X Z A I BE CA X X I X Z Z Z Z X X X X Z Z X X X X X I X Z Z I X X X X Z Z X X X X X $ $$ $ $$ $ $ $ $ $ $ ! $ ) ) ) )! $ 1 I2 25 62 2) ) ) ) ) ) ) )" ! " $ !3 J7 82 29 :2 24 K 1 I2 25 6< =2 2>?7 82 2>2 2? >) ) ) ) ) ) )! " $ !7 8?3 J>? >2 27 8? >>?2 2@ A7 82 29 :2 24 K )! *&&&&&&&+&&&&&&&, ' ( ' (E F1 1 .xI X Z Z M Z Z X X X$ $) ) ) )" Na primeira regressão, em ( 3 ), ' ( ' ( 12ˆVar X X" ( $)! . Agora, ' ( ' ( ' ( ' ( ' (1 1 1 12 2 xVar X X X X X Z Z M Z Z X X X" ( ($ $ $ $) ) ) ) ) )! "$ . Portanto, uma condição suficiente para que ' ( ' (ˆVar Var" "! $ é que X’Z = 0, isto é, que X e Z sejam ortogonais. 39 6. Multicolinearidade 6.1 (C) Considere o modelo 1 1 2 2 , 1, 2, ,t t t ty x x t T" " #) )! " " ! # , onde x1t é 1k& e x2t é 1m& . Assuma que ' ( ' ( 21 2 1 2, 0, ,E X X E X X I# ## ()! ! , e 1 2 0X X) ! . Seja "ˆ o estimador por MQO do modelo correto. As variáveis estão em termos de seus desvios em relação a sua média. a. Mostre que a único estimador de ' (1 2," " de variância mínima, não viesado e linear pode ser escrito na forma: ' ( ' (1 11 1 1 1 2 2 2 2,X X X y X X X y" " $ $) ) ) )! !$ $ . Note que estes são estimadores de MQO para os modelos 1 1 1 1t t ty x! " #)! " " e 2 2 2 2t t ty x! " #)! " " , respectivamente. b. 1"$ e 2"$ são estimadores não viesados se 1 2 0X X) # ? Se são, compute o viés de cada um. c. Suponha, agora, que 1 2 0X X) # . Seja ' ( 1 , 1,2i i i i iM I X X X X i $) )! $ ! . Qual é a interpretação de M2X1 e M2y? Mostre que a estimativa de 1" pode ser escrita como ' ( 11 1 2 1 1 2ˆ X M X X M y" $) )! , e similarmente para 2"ˆ . Compute as matrizes de covariância de 1ˆ" e 2"ˆ . d. Considere o caso onde k = 1, m = 1 e 1 2 0X X) # . Expresse a variância de 1ˆ" como uma função do coeficiente de correlação amostral entre X1 e X2, 212r . O que acontece quando 212 1r H ? Solução: Este problema tem vários objetivos. O primeiro é mostrar as várias maneiras de se obter as estimativas do modelo. O segundo é mostrar as conseqüências de não se ter X1 e X2 ortogonais entre si, ou seja, mostrar o viés causado por variáveis omitidas. Além disso, prova-se parte do importante Teorema de Frisch-Waugh. Finalmente, mostram-se as conseqüências da multicolinearidade, inclusive graficamente. a. Vamos reescrever o modelo na forma matricial 40 ( 6 ) 1 1 2 2 1 2 1 1, , , ,T TT k T my X X X X y" " # #& && &! " " . Defina ' ( 1 , 1,2i i i i iM I X X X X i $) )! $ ! . Pré-multiplicando ( 6 ) por M2, obtemos: ( 7 ) 2 2 1 1 2M y M X M" #! " . Por causa do Teorema de Frisch-Waugh-Lovell 1ˆ" estimado por ( 6 ) é idêntico ao 1ˆ" por estimado por ( 7 )12. Logo, ' ( 11 1 2 1 1 2ˆ X M X X M y" $) )! . Como . ' ( 0 1 1 2 1 1 2 2 2 2 1 2 1X M X X X X X X X M X ! $) ) ) ) ) )! $ - ! , então, ' ( 11 1 1 1ˆ X X X y" $) )! , como queríamos demonstrar. Adotando o mesmo procedimento para 2"ˆ , obtemos ' ( 12 2 2 2ˆ X X X y" $) )! . b. Suponha que 1 2X X# , e que 1"$ é estimado usando o modelo 1 1y X " #! " , quando o verdadeiro modelo é 1 1 2 2y X X" " #! " " . Então, ' ( ' ( M N ' ( ' ( 1 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 2 2 1 1 1 . X X X y X X X X X X X X X X X X " " " # " " # $ $ $ $ ) ) ) )! ! " " ! ) ) ) )! " " $ Logo ' ( ' ( 11 1 1 1 1 2 2 vies E X X X X" " "$) )! "$ *&&&&&&&+&&&&&&&, . Procedendo da mesma maneira, 12 Ver demonstração no item c. deste exercício. 41 ' ( ' ( 12 2 2 2 2 1 1 vies E X X X X" " "$) )! "$ *&&&&&&&+&&&&&&&, . c. Primeiro observe que ' ( 2 1 2 2 2 2 2 ˆ yX M y y X X X X y " $ ! ) )! $ *&&&&&&+&&&&&&, é o resíduo da regressão de y contra X2. Seguindo o mesmo raciocínio, observe que ' ( 1 2 1 2 1 1 2 2 2 2 1 ˆ X X M X X X X X X X " $ )! $ *&&&&&&+&&&&&&, . Ou seja, isto é como se regredíssemos cada uma das colunas de X1 contra X2, e depois calculássemos os resíduos de cada uma da k regressões. Agora temos que provar que 1 1ˆ ˆ A B" "! , onde (A) 1 1 2 2y X X" " #! " " ; (B) 2 2 1 1 2M y M X M" #! " . Este é o Teorema de Frisch-Waugh-Lovel que temos usado. Tomando as condições de primeira ordem de (A), por mínimos quadrados ordinários, obtemos: 11 1 1 2 1 2 1 2 2 22 ˆ ˆ X X X X X y X X X X X y " " 5 65 6 5 6) ) )7 87 8 7 8!7 87 8 7 8) ) )7 89 : 9 :9 : . Desenvolvendo essa expressão, chegamos a ' ( ' (1 11 1 1 1 2 2 1 1 1 1 2 1 1 1 2 2 2 1 1 2 2 2 2 ˆ ˆ ˆ ˆ ˆ ˆ . X X X X X y X X X y X X X X X X X X X y " " " " " " $ $12 ) ) ) ) ) ) )" ! - ! $2232 ) ) )" !224 Substituindo a primeira equação na segunda, temos: ' ( ' ( ' ( ' ( ' ( 1 1 1 1 2 1 1 1 1 2 1 1 1 1 2 2 2 2 2 2 1 1 2 1 1 1 1 2 2 2 1 1 1 1 2 1 2 2 2 1 1 2 2 1 2 2 1 ˆ ˆ ˆ ˆ ˆ . M M X X X X X y X X X X X X X X X y X I X X X X X X I X X X X y X M X X M y X M X X M y " " " " " $ $ $ $ ! ! $ ) ) ) ) ) ) )$ " ! - 5 6 5 6 7 8 7 8) ) ) ) ) )$ ! $ -7 8 7 8 7 8 7 87 8 7 89 : 9 : ) )! - ) )! *&&&&&&&&+&&&&&&&&, *&&&&&&&&+&&&&&&&&, Procedimento análogo dá: 42 ' ( 11 1 2 1 1 2ˆ X M X X M y" $) )! . Para calcular a variância, note que: ' ( ' ( ' ( ' ( ' ( ' ( ' ( ' ( ' ( 1 1 1 1 2 1 1 2 2 1 1 2 1 1 2 1 1 2 1 1 1 1 2 1 1 2 1 1 1 1 12 1 1 2 1 1 2 2 1 1 2 1 1 2 1 ˆ ˆ ˆ , e ˆ . X M X X M M X M X M X X M X M X X M E Var E X M X X M M X X M X X M X " " # " # " " # " " " ## ( $ $ $ $ $ $ ) ) ) )! " ! " - ) )$ ! - ! 5 6) ) ) ) )! !7 89 : Analogamente, ' ( ' ( 122 2 1 2ˆVar X M X" ( $)! . d. Primeiro, do apêndice sabemos que o coeficiente de correlação amostral é dado por: ' ( ' (' ( 2 1 22 12 1 1 2 2 X X r X X X X ) ! ) ) . Dessa forma, ' ( ' ( ' ( ' ( ' (' ( ' (' ( 12 11 1 22 2 1 1 1 1 2 2 2 2 1 1 1 2 2 12 11 22 2 2 1 1 1 1 1 1 1 1 12 1 1 2 2 2 2 1 1 12 ˆ . 1 X X Var X X X X X X X X X X X X X X X X X X X X X X r X X X X X X r " ( ( ( ( ( $ $$ $ $ 5 6)7 85 6) ) ) ) )! $ ! $ !7 87 89 : )7 89 : 5 6)7 8 5 6) ) ) )! $ ! $ !7 8 7 89 :) )7 89 : ! ) $ Ou seja, ' ( ' (' ( ' (212 2 1 12 1 1 1 12 ˆ ˆlim 1 r Var Var X X r (" " H ! - !L ) $ . Graficamente, isso significa: 43 Interpretando 1 2 1X M X) como a soma dos quadrados dos resíduos de regressão de cada coluna de X1 contra X2, podemos ver que, quanto menor os resíduos, maior a ' (1ˆVar " . Os resíduos serão menores, quanto maior for a colinearidade entre X1 e X2. Assim, se 212 1r H , ' (1ˆVar " vai para o infinito, e concluímos que o modelo tem variáveis redundantes. Isso significa que podemos excluir uma das variáveis explicativas do modelo sem perder muita informação. 6.2 (K) Retirar um variável pode ser uma “solução” paramulticolinearidade? (explique detalhadamente) Solução: O exercício procura aguçar a intuição do estudante. Note, inicialmente, que não existe uma solução para multicolinearidade. Em segundo lugar, deve estar claro que retirar uma variável pode significar a omissão de variável relevante, o que resulta no viés de estimação. Porém, se a variável retirada for altamente correlacionada com outra do modelo, pouca informação se perderia, pois essa outra variável do modelo já está incorporando a informação da outra que foi retirada. Portanto, quanto mais correlacionadas forem duas variáveis, menos necessário é que apareçam simultaneamente no modelo, pois uma contém a informação da outra. É nesse sentido que retirar uma variável pode ser uma “solução” para multicolinearidade. ' (1ˆVar " 2 1 1X X ( ) 2 12r1 44 6.3 (K) Se x2 é uma função exata de x, defrontar-nos-íamos com exata multicolinearidade se usássemos x e x2 simultaneamente como regressores. Explique. Solução: Mais uma vez, o objetivo do exercício é aguçar a intuição do estudante. A afirmação é falsa, pois não existe uma relação linear entre x e x2. A multicolinearidade é causada quando há uma relação linear. O próprio nome já leva a pensar isso, pois pontos colineares são pontos que pertencem à mesma linha (ou reta). 6.4 (K) No modelo de regressão linear clássico, a multicolinearidade poderia resultar em viés na estimativa de suas variâncias? Explique. Solução: Este é um exercício bastante sutil, por isso importante. Afirmação falsa. As variâncias tornam-se grandes, mas suas estimativas também. Isso é fácil de ser visto, pois variância e estimativas têm (X’X)-1 como fator comum, que fica cada vez menor à medida que mais perfeita seja a multicolinearidade. 6.5 (K) Suponha um modelo de regressão linear clássico: y x w! " % #! " " " . Muitas amostras são tais que x e w são correlacionados, porém, por sorte, você observa uma amostra em que eles são não correlacionados. Então, você regride y contra x e um intercepto, obtendo *" . a. *" é não viesado? b. A estimativa da variância de *" é não viesada? Solução: Mais um exercício cuja sutileza lapida o conhecimento do estudante, fazendo-o raciocinar sobre o problema. a. *" é não viesado, haja vista que x e w são não correlacionados. Basta ver o primeiro exercício deste capítulo. b. A variância de *" é viesada, no entanto. Isto ocorre porque a estimativa de 2"( é viesada para cima. Para ver isso, lembre-se de que s2 é dividido por n – k, onde k deveria ser igual a 3, mas neste caso, por falta de uma variável, será dividido por (n – k – 1). 45 7. Econometria das Variáveis de Resposta Qualitativas e Limitadas 7.1 Escreva o modelo de probabilidade de escolha Probit. Interprete o impacto de uma modificação em uma variável explicativa. Sugestão: Consulte GRIFFTHS, William E., HILL, R Carter, JUDGE, George G. Learning and Practicing Econometrics. New York: Wiley, 1992. Solução: Apesar do livro texto escrever a função Probit explicitamente, esta é uma boa oportunidade para entendermos melhor as conseqüências do uso desse modelo. De acordo com o modelo Probit temos: ' (i iP F X ")! , onde ' (iF X ") é a função densidade de probabilidade acumulada, tal que ' ( 21 exp 22 iX i zF X dz " " - ) $L 5 6 7 8) ! $7 89 : P . A questão agora e derivar essa função com respeito a Xj. Para isso, usamos o teorema de Leibnitz que diz o seguinte: ' ( ' ( ' ( ' (' ( ' ( ' (' ( ' ( ' ( ' ( ' (, , , , A x A x B x B x F x z dz F x z F A x z A x F B x z B x dz x x , ,) )! $ " , , P P . Como ' (B x !$L , então ' ( 0B x) ! . Além diso, como ' ( ' (,F x z F z! , então ' (, 0 F x z x , ! , . Logo o resultado da derivada é: ' ( ' ( 2 1 exp 22 i j i j X f X " " " " - 5 6)7 8 )$ !7 8 7 89 : , onde ' (if X ") é a função densidade de probabilidade. Podemos, assim, ver que o impacto de uma modificação da variável explicativa dependerá de ' (if X ") e j" , e não apenas de j" isoladamente, como em modelos lineares. 46 Vamos entender, intuitivamente, o que está ocorrendo. Quanto mais próximo de 1 ou 0 estiver a função densidade de probabilidade acumulada, ' (iF X ") , menores serão os valores da f.d.p., ' (if X ") . Com isso, a mínima modificação em Xj tem poucas chances de mudar a decisão. Se ' (iF X ") estiver ao redor de 0,5, então torna-se mais fácil modificar uma decisão, pois a ' (if X ") estará em seu valor máximo. Dessa discussão podemos concluir que, dado que ' (if X ") é sempre positiva, o sentido da modificação dependerá do sinal de j" . Além disso, a magnitude da mudança na probabilidade, dada uma variação em Xj, é determinada pela magnitude de j" e de ' (if X ") , simultaneamente. 7.2 (C) Em um modelo de escolha discreta Probit, suponha que a utilidade líquida é ' (2, 0,I X N #" # # (! " ! , onde 1, se 0 0, c.c., D I D 1 ! 02232 !24 e ' (2, 0, VX V V N# / (! " ! . Assuma que, na amostra à sua disposição, as observações são independentes entre as pessoas. O que pode ser identificado de uma grande amostra de observações de pessoas, quando (dê as condições precisas): a. 0/! ?; b. 0/# ?. Solução: Este é um exercício simples, apenas exigindo a montagem da função de verossimilhança para fins estimação. a. Vamos definir a função de verossimilhança primeiro, para, depois, responder as questões. 47 I X X X V" # " /! " ! " " . Logo, ' ( ' ( 1, se 0 0 0, se 0. D I X V D X V " / " / 1 ! 0 - " " 02232 ! " " /24 Dessa forma, ' ( ' (' ( ' ( ' ( ' ( Pr 1 Pr 0 Pr Pr . V V V V V XVD X V X XV " / " / ( ( " / " / ( ( ( < =" >? >! ! " " 0 ! 0$ !? >? >>?@ A < = < =" "> >? ?> >B !Q? ?> >? ?> >> >? ?@ A @ A Aqui, ' (Q ; representa a função densidade de probabilidade acumulada. É preciso dividir as expressões pela variância de V, pois os resultados estimados sempre referem-se a uma normal-padrão. Então, o modelo Probit fica: ' ( ' ( 1 1 1 ii DDn i i i V V X X L " / " / ( ( $ ! 5 6< = < =" "> >? ?7 8> >! Q $Q? ?> >7 8? ?> >> >? ?@ A @ A7 89 : C , donde obtemos a estimativa ' ( V " / ( " . Assim, se 0/! , podemos identificar V " ( . b. Se 0/# , identificamos ' ( V " / ( " sem, no entanto, podermos separar V " ( de V / ( . 7.3 (C) Seja ' ( ' ( ' (1 1 2 2, , , , , ,n nY x Y x Y x5 69 :# uma amostra aleatória de n observações, onde xi é uma variável aleatória escalar, e Yi é variável aleatória de Bernoulli, que assume apenas dois valores, 0 e 1, com as seguintes probabilidades: ' ( ' (' ( ' ( ' ( 1 2 1 2 1 2 exp Pr 1 ; 1 exp 1Pr 0 . 1 exp i i i i i x Y X x Y X x ) ) ) ) ) ) " ! ! " " ! ! " " 48 Esse modelo é conhecido como um modelo de resposta binária Logit. É uma alternativa ao modelo Probit, como já sabemos. a. Encontre a função esperança condicional de Yi dado X = (x1, x2, ..., xn); b. Escreva a função log-verossimilhança para esse modelo. Solução: Este é um exercício que requer apenas os conhecimentos de probabilidade. É muito importante saber escrever a função log-verossimilhança, por isso a insistência nesse conceito ao longo dos exercícios propostos. a. Primeiro, vamos converter o problema em notação matricial, apenas para resolvê-lo de uma maneira mais geral, mas isso não seria preciso, de fato. ' ( ' ( Pr 1 ; 1 1Pr 0 . 1 i i i X i X i X eY X e Y X e ) ) ) ! ! " ! ! " Agora, é aplicar o operador esperança, simplesmente. ' ( ' ( ' (1 2 1 2 1 2, , , 1 Pr 1 , , , 0 Pr 0 , , , . 1 i i i n i n i nX X E Y x x x Y x x x Y x x x e e ) ) ! ; ! " ; ! ! ! $ # # # b. Como assumimos cada observação independente da outra, temos: ' ( ' ( ' ( ' ( ' ( ' ( ' ( ' ( 1 1 1 1 1 1 1 1 ; 1 ; ln ; ln 1 ii iii i i i ii i i YY XYX i X X Xi YXn n i Xi i i n X i i i eef Y X e e e e L X f Y X e l X L X Y X e )) ) ) ) ) ) ) ) ) ) ) $ ! ! ! < = < =>? >?>! ! -? >?> >>? ?>? @ A" " "@ A ! ! - " 5 6! ! $ "7 89 : C C % Para completar, fornecemos as condições de primeira ordem. M N ' (' ( M N ' (' ( 1 2 1 1 1 1 2 1 2 2 1 1 1 2 exp : ; 1 exp exp : . 1 exp n n i i i i i n n i i i i i i i x Y x x x Y x x ) ) ) ) ) ) ) ) ) ) ! ! ! ! " ! " " " ! " " % % % % 7.4 (K) Suponha que você deseja estimar a curva de demanda por bilhetes de futebol. Você acredita que a demanda é determinada linearmente por uma séries de fatores, entre os 49 quais o preço do bilhete, o padrão relativo da equipe local e da equipe visitante, a renda familiar da cidade, a renda total da cidade, etc. Você possui 10 anos de dados, durante os quais, em várias ocasiões, os bilhetes estiveram esgotados. Qual a sua recomendação para os dados quando os bilhetes estiveram esgotados? Solução: Este é problema de dados censurados, em que se procura verificar se o estudante entendeu a idéia geral para esses casos. Um jogo cujos bilhetes estavam esgotados reflete uma demanda acima da capacidade dos lugares. Essas observações devem ser tratadas como observações limites em um modelo Tobit. 50 8. Sistemas de Equações Simultâneas 8.1 (C) Discuta a identificação e estimação do seguinte modelo de equações simultâneas: 1 12 2 13 3 11 1 13 3 1 2 23 3 22 2 23 3 2 31 1 3 32 2 3 . t t t t t t t t t t t t t t t y y y x x y y x x y y x $ $ " " # $ " " # $ " # 1 " " " " !2222 " " " !3222 " " !24 Aqui não há restrições de covariância. Assegure-se de considerar as condições de ordem e rank (ou posto, em português) e explicitar as hipóteses de que você precisa para estimar os parâmetros do modelo. Solução: Este é um exercício básico para verificar a compreensão do aluno a respeito do texto principal. Ele treina fartamente as condições de ordem e posto, necessárias à estimação e identificação do modelo. Vamos apresentar um método de resolução do problema, não necessariamente único, mas que entendemos que seja compreensível. Na verdade, depois de entendida técnica é que se verifica quão fácil é o método de identificação de equações simultâneas. Primeiramente, vamos montar uma matriz, onde na linha superior estão as variáveis do modelo, endógenas e exógenas. Na primeira coluna, representam-se as equações. Os zeros da matriz representam as variáveis excluídas, endógenas ou exógenas. Com isso, podemos obter a condição de ordem. 1 2 3 1 2 3 1 12 13 11 13 2 23 22 23 3 31 32 1 0 0 1 0 0 1 0 0 y y y x x x i y ii y iii y $ $ " " $ " " $ " Montada essa matriz, temos que preencher a seguinte tabela: 51 Cond. Ordem Exóg. Excl. End. Incl. – 1 Diagnóstico i 1 < 2 não identificado ii 1 = 1 Identificado? iii 2 > 1 super identificado? Note que, na matriz, separamos o bloco de endógenas do bloco de exógenas. Contamos as exógenas excluídas olhando na linha da matriz. Para cada zero em cada linha, no bloco das variáveis exógenas, temos uma exclusão. Com isso, preenchemos a segunda coluna da tabela acima. Depois contamos as endógenas incluídas. Outra vez, olhando em linha, para cada zero temos uma endógena excluída, portanto o número de endógenas incluídas é o número total de endógenas menos o número de zeros da linha. No nosso caso, temos três endógenas e, na segunda linha, não há exclusões. Feito isso, preenchemos a quarta coluna da tabela, sem esquecer de subtrair 1 do número de endógenas incluídas. Note que as exógenas excluídas é o K00 do corpo do texto. Depois disso, preenchemos a coluna três com o sinal apropriado, comparando as colunas 2 e 4. Se o número de endógenas incluídas menos um superar o de exógenas excluídas, não se identificam os parâmetros daquela equação com certeza, ou seja, a equação é subidentificada. Se são iguais ou maiores, aquela equação é candidata a identificação exata ou superidentificação, respectivamente, dependendo da condição de posto a ser discutida a partir de agora. Temos que nos preocupar com as equações ii e iii. Para definir a condição de posto, temos que olhar simultaneamente na linha, procurando os zeros para aquela equação, e a coluna, para montar a matriz relevante para calcular o posto. Olhando na linha da equação ii o zero aparece na terceira coluna, abaixo de 1 e acima de 31$ ; depois aparece no bloco das exógenas, abaixo de 11" e acima de outro zero. Montam-se com esses elementos a matriz para se calcular o posto: (ii) 11 31 1 0 " $ < =>? >? >? >?@ A . 52 Esta matriz tem posto 2, assumindo que 11 31 0" $ # , ou seja, que nenhum desses parâmetros seja zero, inclusive porque não seria lógico do contrário. Utilizando mesmo procedimento para a equação (iii), obtemos a seguinte matriz: (iii) 12 11 13 231 0 $ " " " < =>? >? >? >?@ A . No máximo, o posto dessa matriz é 2. Assumimos esse resultado, a menos que 11 0" ! ou 23 0" ! , o que não teria sentido como já dissemos, ou 13 12 23" $ "! . Nesse caso, a equação iii é super identificada. 8.2 (C) Considere o seguinte modelo de oferta e demanda: 0 1 2 0 1 2 s s d d s d q p w q p y q q ! ! ! # " " " # 1 ! " " "2222 ! " " "3222 !24 , onde w denota um vetor de observações 1T& a respeito do clima, y é um vetor de observações da renda de mesma dimensão, ambos exógenos. a. Discuta a questão de identificação sobre as equações de oferta e demanda; b. Assumir 2 0! ! impõe alguma restrição sobre os parâmetros da forma reduzida? Cuidadosamente esquematize um teste 0 2 1 2: 0 : 0H H! !! & # , usando a forma reduzida dos parâmetros. (Dica: escreva H0 como 0 0:H R qR! ); c. Suponha que a primeira equação é estimada por um estimador de informação limitada, por exemplo, variáveis instrumentais. Você pode determinar se a primeira equação é uma curva de demanda ou oferta apenas examinando o sinal de 1! ?; d. Suponha que uma agência do governo fixe o preço a cada ano em 0tp , o qual pode ser diferente de ano para ano. Que efeito esta política terá sobre a identificação e estimação do modelo? Solução: Este é um exercício que continua o anterior, relembrando e solidificando os principais conceitos aprendidos no texto principal. Não se trata de um exercício difícil, embora tenha um grande enunciado. a. Vamos proceder como no exercício anterior, sem tantas explicações detalhadas. Primeiro montamos a matriz de coeficientes para as três equações. 53 1 0 2 1 0 2 1 1 0 0 0 1 0 1 1 0 0 0 0 s dq q p w y i ii iii ! ! ! " " " $ $ $ $ $ $ $ O detalhe aqui é que, embora não explicitamente, o vetor de 1s é uma variável explicativa também. Vamos agora preencher a tabela da condição de ordem. Cond. Ordem Exóg. Excl. End. Incl. – 1 Diagnóstico i 1 = 1 Identificado? ii 1 = 1 Identificado? iii 3 > 1 super identificado? Agora vamos montar as matrizes para cada equação. (i) 2 1 2 1 0 " ' < =$ >? >!? >? >?$@ A , onde ' (' ; representa o posto da matriz entre parênteses. Note que o posto é válido assumindo que 2 0" # . Portanto i é exatamente identificado. (ii) 2 1 2 1 0 ! ' < =$ >? >!? >? >?$@ A , a menos que 2 0! ! . Portanto ii é exatamente identificado. 1 0 2 1 0 2 0 2 0 ! ! ! ' " " " < =$ $ $ >? >!?
Compartilhar