Buscar

prova_1_matutino_gabarito

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
 
Prova #1 Econometria I Professor Thiago Fonseca Morello 1 
Nome______________________________________________ RA________________ Turno__________ 2 
Instruções para resolução da prova 3 
1. O tempo para resolução é de 2 horas: não será concedido tempo adicional; 4 
2. Não ultrapassar o espaço reservado, no caderno de respostas (este documento) para a resolução de cada 5 
questão: todo o texto escrito fora do espaço reservado será desconsiderado; 6 
3. Será fornecido papel para rascunho em quantidade suficiente. Por favor, utilizar o rascunho para chegar 7 
a respostas consistentes e concisas e reservar tempo para transcrevê-las neste caderno de respostas. Uma 8 
hora e meia para elaborar as respostas (22,5 min. por questão) e meia hora para transcrever é 9 
uma alocação adequada do tempo disponível. 10 
(1) Como parte uma avaliação da performance da política macroeconômica nos últimos 12 anos, um órgão 11 
do governo federal procura medir o efeito da elevação da taxa de juros básica da economia, a SELIC, sobre 12 
o custo de vida efetivamente enfrentado pelas famílias brasileiras. Para isso, toma-se uma amostra de 144 13 
(122) famílias e calcula-se, para dois momentos entre os quais houve um aumento expressivo da SELIC, o 14 
valor da cesta de consumo básico adquirida pelas famílias. Seja Yit o valor da cesta no período inicial, pré-15 
alta da SELIC, adquirida pela i-ésima família e YiT, a cesta no período final. Uma medida para o efeito da 16 
SELIC é dado por δi = (YiT – Yit)/Yit. O objetivo da análise é testar a hipótese de que o valor populacional da 17 
média de δi é nulo. Considerando-se teorias macroeconômicas ortodoxas e heterodoxas, tal valor pode ser 18 
(além de nulo) negativo ou positivo, a priori não é possível saber. O nível de significância do teste é de 5%. 19 
A média amostral para o indicador de impacto é de ߜ̅ = ଵ
ே
∑ ߜ௜
ே
௜ୀଵ = - 0,06 com desvio padrão de ܦܲ =20 
ට
ଵ
ேିଵ
∑ (ߜ௜ − ߜ̅)ଶே௜ୀଵ = 0,24. Probabilidades acumuladas para alguns valores da distribuição t de Student com 21 
143 graus de liberdade podem ser visualizadas no gráfico ao final desta questão. Apoiando-se nos dados 22 
fornecidos, preencha as lacunas abaixo. 23 
(1.a) [0.9 ponto] Valor da estatística do teste: ____________. 24 
(1.b) [0.8 ponto] Valores críticos do teste: __________ e __________. 25 
(1.c) [0.8 ponto (vide obs)] Decisão (marque apenas a opção correta com um “x”) 26 
□ Rejeitar a hipótese nula 27 
□ Não rejeitar a hipótese nula 28 
Observação: será conferida nota zero para os três itens caso apenas o item 1.c for resolvido. 29 
 30 
Lendo o gráfico a seguir 31 
As letras A, B e C indicam polígonos compreendidos entre a curva da distribuição t de Student e segmentos 32 
específicos do eixo horizontal, quais sejam: [-4;-1.98], para a curva A, [-1.98;-1.66] para B e [-1.66;-1.29] 33 
para C. As áreas dos polígonos são equivalentes a probabilidades acumuladas cujos valores são: 2,5% para 34 
A, 2,5% para B e 5% para C. E analogamente para o segmento positivo do eixo horizontal. 35 
2 
 
Figura 1 Distribuição t de Student com 143 graus de liberdade 36 
 37 
R: o valor da estatística do teste é de -3, os valores críticos são de -1.98 e 1.98 e a decisão correta é a de 38 
rejeição da hipótese nula. 39 
 (2) [2,5 pontos] Um pesquisador interessado na relação entre severidade de desnutrição infantil e renda 40 
familiar, agregou os dados da POF 2008/2009, originalmente disponíveis na escala de pessoas, convertendo-41 
os para a escala de setores censitários (regiões submunicipais definidas pelo IBGE). A agregação foi 42 
realizada a partir do cálculo das médias das duas variáveis ao longo de todas as crianças de zero a cinco anos 43 
amostradas pela POF em cada setor censitário. A tabela ao final desta questão apresenta estatísticas que 44 
resumem o comportamento da medida de severidade de desnutrição infantil dentro de faixas de renda 45 
familiar mensal per capita, considerando-se, separadamente, cada um dos dois conjuntos de dados, original e 46 
agregado. É possível, com base nas estatísticas, verificar que a distribuição probabilística empírica 47 
(amostral) da severidade de desnutrição é modificada pela agregação. O pesquisador deseja estimar a função 48 
de regressão populacional (FRP) em que desnutrição infantil é explicada (variável Y) apenas em função da 49 
renda familiar (variável X). 50 
Quanto a isso, responda: porque é de se esperar que a soma dos quadrados dos resíduos (SQR) da regressão 51 
estimada com base nos dados agregados seja inferior ao que seria obtido com base nos dados originais? 52 
Justifique sua resposta comparando o comportamento intra-faixa da medida de severidade de desnutrição em 53 
cada um dos dois conjuntos de dados, original e agregado. 54 
Lembrete 1: o 10° e 90° percentis indicam, respectivamente, o limiar abaixo do qual um valor pode ser 55 
considerado muito pequeno (inferior ao valor assumido por 90% da amostra) e o limiar acima do qual um 56 
valor pode ser considerado muito grande (superior ao valor assumido por 90% da amostra). Valores 57 
consideravelmente distantes da tendência central (média) têm maior probabilidade de ocorrer quanto 58 
maiores forem os valores absolutos do 10° e 90° percentis. 59 
Lembrete 2: A SQR é dada por ∑ ݑො௜
ଶே
௜ୀଵ , em que ݑො௜ = ݕ௜ − ߚመ଴ − ߚመଵݔ௜ em que ߚመ଴ e ߚመଵ são as estimativas 60 
pontuais para os parâmetros da FRP. 61 
 62 
 63 
3 
 
 64 
 65 
Tabela 1 Estatísticas para a distribuição empírica da desnutrição infantil por faixas de renda, 66 
10°p = décimo percentil, 90°p = nonagésimo percentil, SM = salário mínimo. 67 
Faixa de renda familiar 
mensal per capita 
Dados originais: escala de pessoas Dados agregados: setores censitários 
10°p 90°p Desvio-padrão 10°p 90°p 
Desvio-
padrão 
renda <= 1/2 SM -2,03 0,64 1,13 -1,64 0,26 0,82 
1/2 SM < renda <= 1 SM -1,91 0,83 1,18 -1,52 0,54 0,86 
1 SM < renda <= 2 SM -1,79 0,91 1,16 -1,30 0,60 0,92 
2 SM < renda <= 5 SM -1,60 0,86 1,06 -1,25 0,77 0,80 
renda > 5 SM -1,42 0,85 0,95 -1,34 0,59 0,87 
 68 
R: De acordo com a tabela, a ocorrência de valores para a severidade de desnutrição muito discrepantes da 69 
tendência central (média) correspondente a uma dada faixa é mais provável para os dados originais. O que 70 
é verificado para todas as faixas de renda, uma vez que, em todas elas, os valores absolutos do 10° e do 90° 71 
percentis são maiores nos dados não agregados. A agregação, portanto, reduz a recorrência de outliers, 72 
sejam eles valores muito pequenos (muito negativos) ou muito grandes. O que é equivalente a afirmar que a 73 
recorrência de valores próximos das médias intra-faixa é aumentada pela agregação. Adicionalmente, a 74 
dispersão em torno da média (ou volatilidade) da severidade de desnutrição também foi reduzida, uma vez 75 
que o desvio padrão intra-faixa é inferior para todas as faixas nos dados agregados. O impacto conjunto 76 
destes dois efeitos da agregação está em tornar os valores de Y mais próximos de suas médias intra-faixa, 77 
ou média condicional. Olhando, portanto, para cada uma das faixas, é de se esperar um menor número de 78 
observações que discrepem consideravelmente da média intra-faixa de Y para os dados agregados. 79 
Para continuar a explicação, é preciso considerar que a reta de regressão é a melhor aproximação linear 80 
da média condicional, ou seja, trata-se da reta mais próxima das médias de Y para cada faixa de X (i.e., 81 
“médias intra-faixa”). Isso significa que os valores previstos pela reta de regressão para Y são valores tão 82 
próximos quanto possível das médias intra-faixa de Y. Consequentemente, valores de Y consideravelmente 83 
distantes das médias intra-faixa também serão consideravelmente distantes dos valores previstos pela 84 
regressão. Daí porque, quanto maior for a dispersão e o número de outliers (pequenose grandes) dentro de 85 
uma dada faixa, maior será o valor total das diferenças entre os valores efetivos de Y e os valores previstos 86 
pela regressão, denotados por ෠ܻ௜. 87 
A SQR é exatamente a soma dos quadrados de tais diferenças, de modo que, quanto maior a dispersão de Y 88 
dentro de cada faixa de X e quanto mais outliers de Y intra-faixa existirem, maior a SQR. Daí porque a SQR 89 
tende a ser maior na regressão estimada com base nos dados não agregados, pois é neles que Y é mais 90 
disperso e registra mais outliers intra-faixa. 91 
 92 
(3) [2,5 pontos] Ao apresentar o relatório final de uma consultoria prestada para o Ministério do Trabalho e 93 
Emprego (MTE), um economista teve seus resultados criticados. A consultoria tinha como objetivo estimar 94 
o retorno da educação para pessoas que concluíram pelo menos o primeiro grau (ensino fundamental). Para 95 
isso, com base nos dados da PNAD 2013, foi estimada uma regressão de Mincer em que a remuneração do 96 
trabalho é explicada apenas em função do nível educacional. A amostra, portanto, continha apenas pessoas 97 
com pelo menos este nível. Observando um intercepto negativo, o representante do MTE afirmou que os 98 
4 
 
resultados poderiam estar equivocados ao indicar que pessoas que não concluíram um ano de estudo, i.e., 99 
pessoas com valor zero para a explicativa "nível educacional", receberiam, no mercado de trabalho, uma 100 
remuneração negativa, o que não faz sentido, pois ninguém “paga para trabalhar”. Como você responderia a 101 
esta crítica? 102 
R: É preciso deixar claro para o representante do Ministério que o estudo contratado não teve por objetivo 103 
estimar a remuneração média de pessoas com nível educacional inferior ao ensino fundamental completo. 104 
Desta maneira, os resultados não podem ser usados como base para responder a uma pergunta sobre uma 105 
parte da população brasileira que não pertencia à população-alvo do estudo. A validade dos resultados de 106 
uma regressão linear se restringe à população-alvo cujo comportamento tal ferramenta analítica procura 107 
descrever. Atribuir valor nulo à variável explicativa, sendo que na população-alvo e, portanto, na amostra 108 
considerada, não há nenhuma unidade observacional com valor nulo para tal variável consiste em 109 
extrapolar os resultados da análise para além da população-alvo. O que tende a resultar em erros, tal como 110 
o resultado do raciocínio do representante demonstra. As estimativas pontuais, e, especificamente, o 111 
intercepto, não foram gerados com base em informação referente à remuneração de pessoas com nível 112 
educacional inferior a um ano. Exatamente por isso o intercepto não pode ser interpretado como se 113 
contivesse essa informação, o que significa que o valor do intercepto não capta a remuneração média, 114 
prevista pela regressão, para pessoas com nível educacional zero, não devendo ser interpretado desta 115 
maneira. 116 
 117 
(4) [2,5 pontos] Tendo em mente a demonstração de ausência de viés para o estimador de MQO para o 118 
coeficiente da FRP, assinale, com um “x”, o interior do quadrado ao lado esquerdo da alternativa que 119 
corresponde ao equivalente lógico da expressão ܧ ൤	
∑ ௨೔(௫೔ି௫̅)ಿ೔సభ
∑ (௫೔ି௫̅)మಿ೔సభ ฬܺ൨. Apenas uma alternativa deve ser 120 
assinalada. 121 
ܣ)⎕			∑ ݑ௜ܧ[(ݔ௜ − ̅ݔ)|ܺ]ே௜ୀଵ
∑ (ݔ௜ − ̅ݔ)ଶே௜ୀଵ 
ܤ)⎕			 ܧ[∑ ݑ௜(ݔ௜ − ̅ݔ)|ܺ]ே௜ୀଵ
ܧ[∑ (ݔ௜ − ̅ݔ)ଶே௜ୀଵ |ܺ] 
ܥ)⎕			∑ ܧ[ݑ௜|ܺ](ݔ௜ − ̅ݔ)ே௜ୀଵ
∑ (ݔ௜ − ̅ݔ)ଶே௜ୀଵ 
R: A expressão “A” não é um equivalente lógico de ܧ ൤	∑ ௨೔(௫೔ି௫̅)ಿ೔సభ
∑ (௫೔ି௫̅)మಿ೔సభ ฬܺ൨, pois ela incorpora um equívoco que 122 
é o de tomar ui como uma constante para a expectativa condicional, pois afirma que ܧ[ݑ௜(ݔ௜ − ̅ݔ)|ܺ] =123 
ݑ௜ܧ[(ݔ௜ − ̅ݔ)|ܺ]. A expressão B está incorreta pois ܧ ቂ஺஻ቚ ܺቃ ≠ ா[஺|௑]ா[஻|௑] e, portanto, ܧ ൤	∑ ௨೔(௫೔ି௫̅)ಿ೔సభ∑ (௫೔ି௫̅)మಿ೔సభ ฬܺ൨ ≠124 
	
ா[∑ ௨೔(௫೔ି௫̅)|௑]ಿ೔సభ
ா[∑ (௫೔ି௫̅)మಿ೔సభ |௑] .Já a expressão “C” está correta, pois é obtida completamente a partir do emprego de 125 
propriedades do operador E[|X], quais sejam (i) a expectativa de uma soma é a soma das expectativas e (ii) 126 
expressões que sejam funções exclusivamente de X podem ser tratadas como constantes para a expectativa 127 
condicional em relação a X (ver nota de aula 5 para os detalhes).Conclusivamente, pois, a opção correta é 128 
a expressão C. 129

Continue navegando