Lista de IE 2+Respostas

•

UNB

12

2

12

2

0

Nathanael Pereira Costa

22/04/2014

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Econometria

6.467 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Introdução à Econometria 
ECO-132497
Departamento de Economia
 Universidade de Brasília
2º Semestre – 2013
Lista 2 - Respostas
(Data de entrega – 25/09/2011)
Problema 1
Considere a seguinte função poupança
Onde e é uma variável aleatória com E(e) = 0 e Var(e) = 
. Assuma que e é independente de rend.
Mostre que 
 de modo que a hipótese de média condicional zero é satisfeita. (Sugestão, se e é independente de rend , então 
).
Quando nós condicionamos à renda, 
se torna uma constante. Assim,
, porque 
=0.
Mostre que a 
�� EMBED Equation.3 rend, de modo que a hipótese de
homocedasticidade é violada.
 Sustente a hipótese de que a variância da poupança pode aumentar com a renda da família.
Famílias de renda baixa não têm muita opção a não ser gastar toda a renda; tipicamente, uma família de baixa renda tem que gastar com comida, roupa, moradia e outras necessidades. Já famílias de alta renda têm mais opções. Enquanto umas escolhem mais consumo, outras, mais poupança. Isto sugere uma variabilidade maior em termos de poupança entre famílias de alta renda. 
Problema 2 
Considere o modelo de regressão simples 
Assuma que os estimadores dos parâmetros populacionais
 e 
, 
 e 
, são não-viesados e satisfaçam as hipóteses RLS1 a RLS4. Seja 
 o estimador de 
 obtido ao assumir que o intercepto é zero.
Encontre E(
) em termos de xi, 
 e 
. Verifique que 
 é não-viesado para
 quando o intercepto populacional 
 é zero. Há outros casos em que 
 é não viesado?
Da equação 2.66 temos que
Ou
E já que
=0, 
. O vies é dado pelo primeiro termo da equação.
Encontre a variância de 
.
De i) sabemos que 
. Portanto,
E já que Var(ui) = 
, temos que 
.
Mostre que var(
)
var(
). (Dica: 
, para 
).
De 2.57 temos
. 
Portanto podemos ver claramente que para 
, var(
)
var(
). Podemos ver isso mais diretamente se notarmos que 
.
Comente a relação entre viés e variância, ao escolher entre 
 e 
.
Para um dado tamanho de amostra n, o viés em 
 aumenta (para 
fixo). Mas quando 
aumenta, a variância de 
também aumenta relativamente à variância de 
. O viés em 
 é pequeno quando 
 é pequeno. Consequentemente, se preferimos 
 ou 
, isso vai depender das magnitudes de 
, 
, n e 
.
Problema 3
Sejam 
 e 
 o intercepto e a inclinação da regressão de yi sobre xi, usando n observações. Sejam c1 e c2 constantes, com 
. Sejam 
 e 
o intercepto e a inclinação da regressão de c1yi em c2xi. Mostre que 
e 
.
Sejam 
 e 
 o intercepto e a inclinação da regressão de yi sobre xi, usando n observações. Sejam c1 e c2 constantes, com 
. Sejam 
 e 
o intercepto e a inclinação da regressão de c1yi em c2xi. Mostre que 
e 
.
Bem, sabemos que,
Desse modo, temos
Também sabemos que 
 
Desse modo, temos
,
e já que 
, temos 
.
Problema 4
Você tem os resultados de uma regressão linear simples com 51 observações (Isto é, n=51). Estes dados foram coletados em cada um dos 50 estados mais o distrito de Columbia nos Estados Unidos. 
(a) Quais são a:
(i) Equação econômica ou matemática a ser estimada?
 	yi = β0 + β1xi
(ii) Equação estatística/econométrica a ser estimada?
yi = β0 + β1xi + ui
(iii) Liste as 4 hipóteses do modelo de regressão linear simples 
Capítulo 2 do livro.
(b) A variância estimada do erro foi de 2.004672.
Qual informação que este número nos dá?
A variância estimada do erro nos dá informação sobre como os dados amostrais estão dispersos ao redor da linha de regressão estimada. 
(ii) Qual é a soma dos quadrados dos resíduos?
, ou 
(b) A variância estimada do erro foi de 2.004672.
Qual informação que este número nos dá?
A variância estimada do erro nos dá informação sobre como os dados amostrais estão dispersos ao redor da linha de regressão estimada. 
(ii) Qual é a soma dos quadrados dos resíduos?
, ou 
(c) Var(
) = 0.00098.
Qual informação que este número nos dá?
Veja nas notas de aula e no livro.
Qual o valor de 
?
Var(
) 
Ou, 
 = 2045,6.
(d) Suponha que:
yi =renda média do estado i ($ mil) daqueles indivíduos com 18 anos ou mais.
xi = a porcentagem de homens no estado i com 18 anos ou mais com o segundo grau completo. 
Suponha que 
= 0,18. Como você interpretaria este resultado?
O valor de 
= 0,18 sugere que 1% de aumento na porcentagem de homens com 18 anos ou mais com segundo grau completo conduzirá a um aumento de $180 na renda média de homens com 18 anos ou mais.
(e) Suponha que 
 = 69,139 e 
= 15,187. Qual o valor de 
, ou o intercepto?
(f) Dados os resultados para as partes (c) (d) e (e), qual é o valor de 
?
Portanto,
2045,6 + 51*(69,139)2 = 245836.
(g) Suponha que para o estado de Montana o valor de yi seja de 12,274 e que o valor para xi seja de 58,3. Qual é o valor dos resíduos para Montana?
Problema 5:
Em um esforço de determinar se comparecer às classes melhora o desempenho do estudante de graduação, Professor Romer desenvolveu a seguinte equação
Gi = β0 + β1ATTi + β2PSi + ui .
Onde:
Gi = a nota do estudante i na classe do professor Romer.
ATTi = porcentagem das aulas nas quais o aluno i compareceu.
 PSi = porcentagem das listas de exercícios completadas pelo estudante i.
 
(a) Antes de rodar sua regressão, quais sinais você espera para os coeficientes β1 e β2 ? Explique.
Esperamos que β1 e β2 sejam ambos positivos; quanto mais o aluno comparece às classes e faz as listas de exercícios melhor serão suas notas previstas.
(b) Claramente interprete os coeficientes β1 e β2.
β1= 
Nota importante: β1 não mede a mudança na nota, dada uma mudança no número de horas gastas com classes. O mesmo vale para β2.
Prof. Romer estimou a equação acima. Sua base de dados inclui 195 estudantes, e obteve as seguintes estimativas:
 = 1,07; 
 = 1,74; 
 = 0,60; R2 = 0,33
(c) Estes sinais satisfazem suas expectativas?
Sim, os resultados estão de acordo com nossas expectativas a priori.
(d) Suponha que um aluno médio gaste no trimestre 25 horas com aulas e 50 horas para completar todas as listas de exercícios no trimestre. Se este estudante tivesse somente uma hora a mais para se dedicar ao curso e melhorar sua nota, deveria o estudante ir para a aula ou trabalhar na lista de exercícios por uma hora a mais? (Nota: Você não pode somente olhar para os coeficientes para responder a esta questão; os coeficientes precisam ser convertidos para refletir as horas gastas durante o trimestre com aulas e com listas de exercícios). 
Dadas as interpretações de β1 e β2 acima, temos que converter os coeficientes em horas.
Considere ATT: 
Uma hora a mais de classe aumentará ATT em 0,04 = 4% = (26-25)/25.
Desse modo, a contribuição para a nota final de uma hora adicional de ATT é:
0,04* β1 = 0,04*1,74 = 0,0696 pontos na nota. (ou 1,74/25 = 0,0696).
Mesma coisa para PS:
0,02* β2 = 0,02*0,60 = 0,012 pontos na nota. (ou 0,60/50 = 0,012).
Portanto ir para classe permite um maior benefício em termos de nota.
e) Agora suponha que ao invés de 25 horas com aulas e 50 com exercícios, o estudante gastasse 50 horas com aulas e somente 10 com as listas, com o que o estudante deveria gastar sua hora: aula ou lista? 
A contribuição para a nota final de uma hora adicional de ATT é:
0,02* β1 = 0,02*1,74 = 0,0348 pontos na nota. (ou 1,74/50 = 0,0348).
Mesma coisa para PS:
0,10* β2 = 0,10*0,60 = 0,06 pontos na nota. (ou 0,60/10 = 0,06).
Portanto, trabalhar na lista de exercício permite um maior benefício em termos de nota. 
(f) Considerando suas respostas para as partes (d) e (e), você pode concluir que, sozinha, a magnitude dos coeficientes tem importância relativa?
Não, nestecaso. Frequentemente, contudo, as magnitudes dos coeficientes estimados dão sim uma idéia da magnitude relativa, mas isto requer que as variáveis tenham a mesma unidade de medida. 
(g) O que um R2 de 0.33 implica?
O modelo como especificado explica 33% da variação em Gi sobre sua média.
(h) Você acha que os coeficientes 
 e 
 são não-viesados? Explique.
É bastante improvável que 
 e 
 sejam não-viesados dado que o modelo está mal especificado, ao menos em termos de variáveis potenciais a ser incluídas. Por exemplo, nós esperaríamos que a habilidade dos estudantes certamente contribua para nota etc.
Problema 6
A equação seguinte descreve o preço mediano das residências de uma comunidade em termos da quantidade de poluição (oxn, óxido nitroso) e do número médio de cômodos nas residências da comunidade (comods):
log(preço) = β0 + β1log(oxn) + β2comods + u .
Quais são os prováveis sinais de β1 e β2 ? Qual é a interpretação de β1? Explique.
β1<0 e provavelmente β2 > 0, já que comods pode ser pensado como um proxi 
para tamanho de uma casa. (Contudo, ele não permite a distinção entre casas 
onde os cômodos são grandes de casas onde os cômodos são pequenos). 
 b) Por que oxn [ou mais precisamente, log(oxn)] e comods deveriam ser 
 negativamente correlacionados? Se esse for o caso, a regressão simples de 
 log(preço) e log(onx) produz um estimador viesado para cima ou para baixo de β1?
Se assumirmos que comods cresce com a qualidade da casa, então log(oxn) e comods são negativamente correlacionados quando vizinhanças mais pobres tem mais poluição. Se β2 > 0 e Corr(x1,x2) <0, o estimador de regressão simples 
tem um viés para baixo. Mas como β1 < 0, isso significa que a regressão simples, na média, superestima a importância de poluição (E(
) é mais negativo que 
) 
c) Utilizando os dados do arquivo HPRICE2.RAW foram estimadas as seguintes equações: 
, n = 506, R2 = 0,264.
comods, n = 506, R2 = 0,514.
A relação entre as estimativas da elasticidade do preço das regressões simples e múltipla é a que você previu, tomando como base suas respostas na parte (b)? 
Isto é o que esperávamos dado (b).
 -1,043 é mais negativo (maior em magnitude) do que a estimativa de regressão múltipla, -0,718. 
Pode-se dizer que -0,718 está claramente mais próximo da elasticidade verdadeira do que -1,043?
Como as estimativas são somente para uma amostra, nós nunca saberemos qual está mais próxima de 
. Mas se a amostra puder ser considerada como amostra “típica”, ou que representa bem a população, então 
 está mais perto de -0,718.
Problema 7 
Em um estudo que relaciona a nota média em um curso superior (nmgrad) ao tempo gasto em várias atividades, você distribui um questionário para vários estudantes. Os estudantes devem responder quantas horas eles gastam em quatro atividades: estudo, sono, trabalho e lazer. Toda atividade é colocada em uma das quatro categorias, de modo que, para cada estudante, a soma das horas nas quatro atividades deve ser igual a 168.
No modelo
nmgrad = β0 + β1estudar + β2dormir + β3trabalhar+ β2lazer + u ,
faz sentido manter dormir, trabalhar e lazer fixos, enquanto estudar varia?
Não. Estudar + dormir + trabalhar + lazer = 168. Portanto, se nós mudamos estudar, temos que mudar pelo menos uma das outras atividades para que a soma dê 168.
 Explique a razão de esse modelo violar a hipótese RLM.4 de não-colinearidade perfeita.
Podemos escrever, por exemplo, estudar como uma combinação linear de dormir, trabalhar e lazer. Impossível distinguir os parâmetros!
Como você poderia reformular o modelo, de modo que seus parâmetros tivessem uma interpretação útil e ele satisfizesse a RLM.4? 
 Tire uma das variáveis, por exemplo, lazer.
Agora por exemplo, β1 é interpretado como a mudança em nmgrad quando estudar aumenta em uma hora, dado dormir, trabalhar e u. Se nós mantivermos dormir e trabalhar fixos, mas aumentar estudar em uma hora, então nós devemos estar reduzindo lazer em uma hora. Os outros parâmetros têm a mesma interpretação. 
Problema 8
Use os dados em HPRICE1 para estimar o modelo
preço = β0 + β1mquad + β2quartos + u ,
em que preço (ou price na base de dados) é o preço da residência medido em milhares de dólares, mquad (ou sqrft na base de dados) é o tamanho em metros quadrados, e quartos (ou bdrms na base de dados) é o número de quartos. 
Escreva os resultados na forma de uma equação.
prêço = -19,32 + 0,128 mquad + 15,2quartos,
Qual é o aumento estimado no preço para uma casa com um quarto a mais, mantendo constante o metro quadrado?
Δ prêço = 15,20Δquartos. Portanto prêço aumenta em 15,20 ou $15200.
Qual é o aumento estimado no preço para uma casa com um quarto adicional, a qual tem 140 metros quadrados de tamanho? Compare sua resposta à parte (ii).
Δ prêço = 0,128Δnmquad + 15,2Δquartos = 0,128(140) + 15,2 = 33,12 ou 
$33120. 
(iv) Qual é a porcentagem da variação no preço que é explicada pelo metro quadrado e pelo número de quartos?
 	63,2%
(v) A primeira casa na amostra tem mquad = 2.438 e quartos = 4. Ache o preço de venda predito para essa casa a partir da reta de regressão de MQO.
-19,32 + 0,128 (2.438) + 15,2(4) = 353,544 ou $353544. 
(vi) O preço de venda real da primeira casa na amostra foi de $ 300.000 (assim, preço = 300). Ache o resíduo para essa casa. Isso sugere que o comprador pagou mais ou menos por ela?
De (v), temos que o valor estimado da casa baseado somente no número de metros quadrados e quartos é 353544. Mas o valor real de venda foi de 300000, o que sugere que a comprador sub-pagou. Mas claro há muitos outros fatores de uma casa (alguns não podemos medir) que afeta preço, e nós não controlamos estes. 
Problema 9
Use o banco de dados em WAGE2 para este problema. Como de costume, esteja seguro de que todas as seguintes regressões contenham um intercepto. Inclua o output do STATA com a sua resposta.
Rode uma regressão de QI (ou IQ na base de dados) sobre educ ( ou years of education) para obter o coeficiente de inclinação , digamos 
.
O coeficiente de inclinação de QI em EDUC, 
, é 3,53383
Rode a regressão de log(salário) (ou lwage na base de dados) sobre educ e obtenha o coeficiente de inclinação, 
.
=0,05984
(iii) Rode a regressão múltipla de log(salário) sobre educ e QI e obtenha os coeficientes de inclinação, 
e 
.
= 0,03912
= 0,00586
Verifique que 
=
+
�� EMBED Equation.3 .
.05983,βδβ+=+
 
=
+
�� EMBED Equation.3 = 0,03912 + 3,53383 * 0,00586 ≈ 0,05983
Problema 10
No exemplo 3.2 do livro, e usando dados de WAGE1, a equação estimada foi 
. 
Agora confirme a interpretação de imparcialização das estimativas de MQO fazendo explicitamente a imparcialização para esse exemplo. Isso requer, em primeiro lugar, que você faça a regressão de educ sobre exper e perm e salve os resíduos, 
. Então, regrida log(salário) sobre 
. Compare o coeficiente de 
com o coeficiente de educ da regressão de log(salário) sobre educ, exper e perm.
A regressão de educ sobre perm é
		Educ = 13,57 – 0,074 exper + 0,048 perm + 
 R2 = 0,101
 Agora fazendo a regressão de log(salário) sobre 
, obtemos
 Log(salârio) = 1,62 +0,092
 R2 = 0,207
Como esperado, o coeficiente sobre 
 na segunda regressão é idêntico ao coeficiente em EDUC no exemplo 3.2. Note que o R2 da regressão acima é menor do que o R2 no exemplo 3.2. De fato, a regressão sobre 
 somente usa a parte de EDUC que é não correlacionada com exper e perm para explicar log(salário) 
Nota: para salvar os resíduos siga os seguintes passos:
Logo após a regressão auxiliar, isto é após ter regredido educ sobre exper e perm, crie a variável que representaos valores preditos de educ, isto é digite
predict educhat
Note que se você tiver mantido educ como var2 (como reconhecido pelo stata) então digite: predict var2hat.
Crie uma variável para os resíduos, isto é, digite
generate r1hat = educ – educhat
Faça uma regressão de log(salário) sobre r1hat.
� PAGE \* MERGEFORMAT �1�
_1376122295.unknown
_1377333327.unknown
_1377691712.unknown
_1377932904.unknown
_1378664004.unknown
_1378664562.unknown
_1378665349.unknown
_1378665885.unknown
_1378705716.unknown
_1378730425.unknown
_1378705493.unknown
_1378665456.unknown
_1378665195.unknown
_1378664377.unknown
_1378664389.unknown
_1378664093.unknown
_1378661094.unknown
_1377933507.unknown
_1377933539.unknown
_1377933289.unknown
_1377930305.unknown
_1377932780.unknown
_1377932852.unknown
_1377932770.unknown
_1377693692.unknown
_1377930096.unknown
_1377691725.unknown
_1377350815.unknown
_1377690622.unknown
_1377690757.unknown
_1377691704.unknown
_1377690663.unknown
_1377690548.unknown
_1377690562.unknown
_1377350869.unknown
_1377690540.unknown
_1377334617.unknown
_1377335104.unknown
_1377341614.unknown
_1377341630.unknown
_1377335070.unknown
_1377333464.unknown
_1377334314.unknown
_1377333409.unknown
_1376135457.unknown
_1377331950.unknown
_1377332629.unknown
_1377332760.unknown
_1377332871.unknown
_1377332734.unknown
_1377332047.unknown
_1377332399.unknown
_1377332036.unknown
_1377331796.unknown
_1377331920.unknown
_1377330569.unknown
_1376123635.unknown
_1376132728.unknown
_1376132903.unknown
_1376132936.unknown
_1376132653.unknown
_1376123408.unknown
_1376123256.unknown
_1376123276.unknown
_1376122655.unknown
_1376122856.unknown
_1376122338.unknown
_1376122042.unknown
_1376122160.unknown
_1376117782.unknown
_1376117759.unknown