Baixe o app para aproveitar ainda mais
Prévia do material em texto
Introdução à Econometria ECO-132497 Departamento de Economia Universidade de Brasília 2º Semestre – 2013 Lista 2 - Respostas (Data de entrega – 25/09/2011) Problema 1 Considere a seguinte função poupança Onde e é uma variável aleatória com E(e) = 0 e Var(e) = . Assuma que e é independente de rend. Mostre que de modo que a hipótese de média condicional zero é satisfeita. (Sugestão, se e é independente de rend , então ). Quando nós condicionamos à renda, se torna uma constante. Assim, , porque =0. Mostre que a �� EMBED Equation.3 rend, de modo que a hipótese de homocedasticidade é violada. Sustente a hipótese de que a variância da poupança pode aumentar com a renda da família. Famílias de renda baixa não têm muita opção a não ser gastar toda a renda; tipicamente, uma família de baixa renda tem que gastar com comida, roupa, moradia e outras necessidades. Já famílias de alta renda têm mais opções. Enquanto umas escolhem mais consumo, outras, mais poupança. Isto sugere uma variabilidade maior em termos de poupança entre famílias de alta renda. Problema 2 Considere o modelo de regressão simples Assuma que os estimadores dos parâmetros populacionais e , e , são não-viesados e satisfaçam as hipóteses RLS1 a RLS4. Seja o estimador de obtido ao assumir que o intercepto é zero. Encontre E( ) em termos de xi, e . Verifique que é não-viesado para quando o intercepto populacional é zero. Há outros casos em que é não viesado? Da equação 2.66 temos que Ou E já que =0, . O vies é dado pelo primeiro termo da equação. Encontre a variância de . De i) sabemos que . Portanto, E já que Var(ui) = , temos que . Mostre que var( ) var( ). (Dica: , para ). De 2.57 temos . Portanto podemos ver claramente que para , var( ) var( ). Podemos ver isso mais diretamente se notarmos que . Comente a relação entre viés e variância, ao escolher entre e . Para um dado tamanho de amostra n, o viés em aumenta (para fixo). Mas quando aumenta, a variância de também aumenta relativamente à variância de . O viés em é pequeno quando é pequeno. Consequentemente, se preferimos ou , isso vai depender das magnitudes de , , n e . Problema 3 Sejam e o intercepto e a inclinação da regressão de yi sobre xi, usando n observações. Sejam c1 e c2 constantes, com . Sejam e o intercepto e a inclinação da regressão de c1yi em c2xi. Mostre que e . Sejam e o intercepto e a inclinação da regressão de yi sobre xi, usando n observações. Sejam c1 e c2 constantes, com . Sejam e o intercepto e a inclinação da regressão de c1yi em c2xi. Mostre que e . Bem, sabemos que, Desse modo, temos Também sabemos que Desse modo, temos , e já que , temos . Problema 4 Você tem os resultados de uma regressão linear simples com 51 observações (Isto é, n=51). Estes dados foram coletados em cada um dos 50 estados mais o distrito de Columbia nos Estados Unidos. (a) Quais são a: (i) Equação econômica ou matemática a ser estimada? yi = β0 + β1xi (ii) Equação estatística/econométrica a ser estimada? yi = β0 + β1xi + ui (iii) Liste as 4 hipóteses do modelo de regressão linear simples Capítulo 2 do livro. (b) A variância estimada do erro foi de 2.004672. Qual informação que este número nos dá? A variância estimada do erro nos dá informação sobre como os dados amostrais estão dispersos ao redor da linha de regressão estimada. (ii) Qual é a soma dos quadrados dos resíduos? , ou (b) A variância estimada do erro foi de 2.004672. Qual informação que este número nos dá? A variância estimada do erro nos dá informação sobre como os dados amostrais estão dispersos ao redor da linha de regressão estimada. (ii) Qual é a soma dos quadrados dos resíduos? , ou (c) Var( ) = 0.00098. Qual informação que este número nos dá? Veja nas notas de aula e no livro. Qual o valor de ? Var( ) Ou, = 2045,6. (d) Suponha que: yi =renda média do estado i ($ mil) daqueles indivíduos com 18 anos ou mais. xi = a porcentagem de homens no estado i com 18 anos ou mais com o segundo grau completo. Suponha que = 0,18. Como você interpretaria este resultado? O valor de = 0,18 sugere que 1% de aumento na porcentagem de homens com 18 anos ou mais com segundo grau completo conduzirá a um aumento de $180 na renda média de homens com 18 anos ou mais. (e) Suponha que = 69,139 e = 15,187. Qual o valor de , ou o intercepto? (f) Dados os resultados para as partes (c) (d) e (e), qual é o valor de ? Portanto, 2045,6 + 51*(69,139)2 = 245836. (g) Suponha que para o estado de Montana o valor de yi seja de 12,274 e que o valor para xi seja de 58,3. Qual é o valor dos resíduos para Montana? Problema 5: Em um esforço de determinar se comparecer às classes melhora o desempenho do estudante de graduação, Professor Romer desenvolveu a seguinte equação Gi = β0 + β1ATTi + β2PSi + ui . Onde: Gi = a nota do estudante i na classe do professor Romer. ATTi = porcentagem das aulas nas quais o aluno i compareceu. PSi = porcentagem das listas de exercícios completadas pelo estudante i. (a) Antes de rodar sua regressão, quais sinais você espera para os coeficientes β1 e β2 ? Explique. Esperamos que β1 e β2 sejam ambos positivos; quanto mais o aluno comparece às classes e faz as listas de exercícios melhor serão suas notas previstas. (b) Claramente interprete os coeficientes β1 e β2. β1= Nota importante: β1 não mede a mudança na nota, dada uma mudança no número de horas gastas com classes. O mesmo vale para β2. Prof. Romer estimou a equação acima. Sua base de dados inclui 195 estudantes, e obteve as seguintes estimativas: = 1,07; = 1,74; = 0,60; R2 = 0,33 (c) Estes sinais satisfazem suas expectativas? Sim, os resultados estão de acordo com nossas expectativas a priori. (d) Suponha que um aluno médio gaste no trimestre 25 horas com aulas e 50 horas para completar todas as listas de exercícios no trimestre. Se este estudante tivesse somente uma hora a mais para se dedicar ao curso e melhorar sua nota, deveria o estudante ir para a aula ou trabalhar na lista de exercícios por uma hora a mais? (Nota: Você não pode somente olhar para os coeficientes para responder a esta questão; os coeficientes precisam ser convertidos para refletir as horas gastas durante o trimestre com aulas e com listas de exercícios). Dadas as interpretações de β1 e β2 acima, temos que converter os coeficientes em horas. Considere ATT: Uma hora a mais de classe aumentará ATT em 0,04 = 4% = (26-25)/25. Desse modo, a contribuição para a nota final de uma hora adicional de ATT é: 0,04* β1 = 0,04*1,74 = 0,0696 pontos na nota. (ou 1,74/25 = 0,0696). Mesma coisa para PS: 0,02* β2 = 0,02*0,60 = 0,012 pontos na nota. (ou 0,60/50 = 0,012). Portanto ir para classe permite um maior benefício em termos de nota. e) Agora suponha que ao invés de 25 horas com aulas e 50 com exercícios, o estudante gastasse 50 horas com aulas e somente 10 com as listas, com o que o estudante deveria gastar sua hora: aula ou lista? A contribuição para a nota final de uma hora adicional de ATT é: 0,02* β1 = 0,02*1,74 = 0,0348 pontos na nota. (ou 1,74/50 = 0,0348). Mesma coisa para PS: 0,10* β2 = 0,10*0,60 = 0,06 pontos na nota. (ou 0,60/10 = 0,06). Portanto, trabalhar na lista de exercício permite um maior benefício em termos de nota. (f) Considerando suas respostas para as partes (d) e (e), você pode concluir que, sozinha, a magnitude dos coeficientes tem importância relativa? Não, nestecaso. Frequentemente, contudo, as magnitudes dos coeficientes estimados dão sim uma idéia da magnitude relativa, mas isto requer que as variáveis tenham a mesma unidade de medida. (g) O que um R2 de 0.33 implica? O modelo como especificado explica 33% da variação em Gi sobre sua média. (h) Você acha que os coeficientes e são não-viesados? Explique. É bastante improvável que e sejam não-viesados dado que o modelo está mal especificado, ao menos em termos de variáveis potenciais a ser incluídas. Por exemplo, nós esperaríamos que a habilidade dos estudantes certamente contribua para nota etc. Problema 6 A equação seguinte descreve o preço mediano das residências de uma comunidade em termos da quantidade de poluição (oxn, óxido nitroso) e do número médio de cômodos nas residências da comunidade (comods): log(preço) = β0 + β1log(oxn) + β2comods + u . Quais são os prováveis sinais de β1 e β2 ? Qual é a interpretação de β1? Explique. β1<0 e provavelmente β2 > 0, já que comods pode ser pensado como um proxi para tamanho de uma casa. (Contudo, ele não permite a distinção entre casas onde os cômodos são grandes de casas onde os cômodos são pequenos). b) Por que oxn [ou mais precisamente, log(oxn)] e comods deveriam ser negativamente correlacionados? Se esse for o caso, a regressão simples de log(preço) e log(onx) produz um estimador viesado para cima ou para baixo de β1? Se assumirmos que comods cresce com a qualidade da casa, então log(oxn) e comods são negativamente correlacionados quando vizinhanças mais pobres tem mais poluição. Se β2 > 0 e Corr(x1,x2) <0, o estimador de regressão simples tem um viés para baixo. Mas como β1 < 0, isso significa que a regressão simples, na média, superestima a importância de poluição (E( ) é mais negativo que ) c) Utilizando os dados do arquivo HPRICE2.RAW foram estimadas as seguintes equações: , n = 506, R2 = 0,264. comods, n = 506, R2 = 0,514. A relação entre as estimativas da elasticidade do preço das regressões simples e múltipla é a que você previu, tomando como base suas respostas na parte (b)? Isto é o que esperávamos dado (b). -1,043 é mais negativo (maior em magnitude) do que a estimativa de regressão múltipla, -0,718. Pode-se dizer que -0,718 está claramente mais próximo da elasticidade verdadeira do que -1,043? Como as estimativas são somente para uma amostra, nós nunca saberemos qual está mais próxima de . Mas se a amostra puder ser considerada como amostra “típica”, ou que representa bem a população, então está mais perto de -0,718. Problema 7 Em um estudo que relaciona a nota média em um curso superior (nmgrad) ao tempo gasto em várias atividades, você distribui um questionário para vários estudantes. Os estudantes devem responder quantas horas eles gastam em quatro atividades: estudo, sono, trabalho e lazer. Toda atividade é colocada em uma das quatro categorias, de modo que, para cada estudante, a soma das horas nas quatro atividades deve ser igual a 168. No modelo nmgrad = β0 + β1estudar + β2dormir + β3trabalhar+ β2lazer + u , faz sentido manter dormir, trabalhar e lazer fixos, enquanto estudar varia? Não. Estudar + dormir + trabalhar + lazer = 168. Portanto, se nós mudamos estudar, temos que mudar pelo menos uma das outras atividades para que a soma dê 168. Explique a razão de esse modelo violar a hipótese RLM.4 de não-colinearidade perfeita. Podemos escrever, por exemplo, estudar como uma combinação linear de dormir, trabalhar e lazer. Impossível distinguir os parâmetros! Como você poderia reformular o modelo, de modo que seus parâmetros tivessem uma interpretação útil e ele satisfizesse a RLM.4? Tire uma das variáveis, por exemplo, lazer. Agora por exemplo, β1 é interpretado como a mudança em nmgrad quando estudar aumenta em uma hora, dado dormir, trabalhar e u. Se nós mantivermos dormir e trabalhar fixos, mas aumentar estudar em uma hora, então nós devemos estar reduzindo lazer em uma hora. Os outros parâmetros têm a mesma interpretação. Problema 8 Use os dados em HPRICE1 para estimar o modelo preço = β0 + β1mquad + β2quartos + u , em que preço (ou price na base de dados) é o preço da residência medido em milhares de dólares, mquad (ou sqrft na base de dados) é o tamanho em metros quadrados, e quartos (ou bdrms na base de dados) é o número de quartos. Escreva os resultados na forma de uma equação. prêço = -19,32 + 0,128 mquad + 15,2quartos, Qual é o aumento estimado no preço para uma casa com um quarto a mais, mantendo constante o metro quadrado? Δ prêço = 15,20Δquartos. Portanto prêço aumenta em 15,20 ou $15200. Qual é o aumento estimado no preço para uma casa com um quarto adicional, a qual tem 140 metros quadrados de tamanho? Compare sua resposta à parte (ii). Δ prêço = 0,128Δnmquad + 15,2Δquartos = 0,128(140) + 15,2 = 33,12 ou $33120. (iv) Qual é a porcentagem da variação no preço que é explicada pelo metro quadrado e pelo número de quartos? 63,2% (v) A primeira casa na amostra tem mquad = 2.438 e quartos = 4. Ache o preço de venda predito para essa casa a partir da reta de regressão de MQO. -19,32 + 0,128 (2.438) + 15,2(4) = 353,544 ou $353544. (vi) O preço de venda real da primeira casa na amostra foi de $ 300.000 (assim, preço = 300). Ache o resíduo para essa casa. Isso sugere que o comprador pagou mais ou menos por ela? De (v), temos que o valor estimado da casa baseado somente no número de metros quadrados e quartos é 353544. Mas o valor real de venda foi de 300000, o que sugere que a comprador sub-pagou. Mas claro há muitos outros fatores de uma casa (alguns não podemos medir) que afeta preço, e nós não controlamos estes. Problema 9 Use o banco de dados em WAGE2 para este problema. Como de costume, esteja seguro de que todas as seguintes regressões contenham um intercepto. Inclua o output do STATA com a sua resposta. Rode uma regressão de QI (ou IQ na base de dados) sobre educ ( ou years of education) para obter o coeficiente de inclinação , digamos . O coeficiente de inclinação de QI em EDUC, , é 3,53383 Rode a regressão de log(salário) (ou lwage na base de dados) sobre educ e obtenha o coeficiente de inclinação, . =0,05984 (iii) Rode a regressão múltipla de log(salário) sobre educ e QI e obtenha os coeficientes de inclinação, e . = 0,03912 = 0,00586 Verifique que = + �� EMBED Equation.3 . .05983,βδβ+=+ = + �� EMBED Equation.3 = 0,03912 + 3,53383 * 0,00586 ≈ 0,05983 Problema 10 No exemplo 3.2 do livro, e usando dados de WAGE1, a equação estimada foi . Agora confirme a interpretação de imparcialização das estimativas de MQO fazendo explicitamente a imparcialização para esse exemplo. Isso requer, em primeiro lugar, que você faça a regressão de educ sobre exper e perm e salve os resíduos, . Então, regrida log(salário) sobre . Compare o coeficiente de com o coeficiente de educ da regressão de log(salário) sobre educ, exper e perm. A regressão de educ sobre perm é Educ = 13,57 – 0,074 exper + 0,048 perm + R2 = 0,101 Agora fazendo a regressão de log(salário) sobre , obtemos Log(salârio) = 1,62 +0,092 R2 = 0,207 Como esperado, o coeficiente sobre na segunda regressão é idêntico ao coeficiente em EDUC no exemplo 3.2. Note que o R2 da regressão acima é menor do que o R2 no exemplo 3.2. De fato, a regressão sobre somente usa a parte de EDUC que é não correlacionada com exper e perm para explicar log(salário) Nota: para salvar os resíduos siga os seguintes passos: Logo após a regressão auxiliar, isto é após ter regredido educ sobre exper e perm, crie a variável que representaos valores preditos de educ, isto é digite predict educhat Note que se você tiver mantido educ como var2 (como reconhecido pelo stata) então digite: predict var2hat. Crie uma variável para os resíduos, isto é, digite generate r1hat = educ – educhat Faça uma regressão de log(salário) sobre r1hat. � PAGE \* MERGEFORMAT �1� _1376122295.unknown _1377333327.unknown _1377691712.unknown _1377932904.unknown _1378664004.unknown _1378664562.unknown _1378665349.unknown _1378665885.unknown _1378705716.unknown _1378730425.unknown _1378705493.unknown _1378665456.unknown _1378665195.unknown _1378664377.unknown _1378664389.unknown _1378664093.unknown _1378661094.unknown _1377933507.unknown _1377933539.unknown _1377933289.unknown _1377930305.unknown _1377932780.unknown _1377932852.unknown _1377932770.unknown _1377693692.unknown _1377930096.unknown _1377691725.unknown _1377350815.unknown _1377690622.unknown _1377690757.unknown _1377691704.unknown _1377690663.unknown _1377690548.unknown _1377690562.unknown _1377350869.unknown _1377690540.unknown _1377334617.unknown _1377335104.unknown _1377341614.unknown _1377341630.unknown _1377335070.unknown _1377333464.unknown _1377334314.unknown _1377333409.unknown _1376135457.unknown _1377331950.unknown _1377332629.unknown _1377332760.unknown _1377332871.unknown _1377332734.unknown _1377332047.unknown _1377332399.unknown _1377332036.unknown _1377331796.unknown _1377331920.unknown _1377330569.unknown _1376123635.unknown _1376132728.unknown _1376132903.unknown _1376132936.unknown _1376132653.unknown _1376123408.unknown _1376123256.unknown _1376123276.unknown _1376122655.unknown _1376122856.unknown _1376122338.unknown _1376122042.unknown _1376122160.unknown _1376117782.unknown _1376117759.unknown
Compartilhar