Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Prova #1 Econometria I Professor Thiago Fonseca Morello 1 Nome______________________________________________ RA________________ Turno__________ 2 Instruções para resolução da prova 3 1. O tempo para resolução é de 2 horas: não será concedido tempo adicional; 4 2. Não ultrapassar o espaço reservado, no caderno de respostas (este documento) para a resolução de cada 5 questão: todo o texto escrito fora do espaço reservado será desconsiderado; 6 3. Será fornecido papel para rascunho em quantidade suficiente. Por favor, utilizar o rascunho para chegar 7 a respostas consistentes e concisas e reservar tempo para transcrevê-las neste caderno de respostas. Uma 8 hora e meia para elaborar as respostas (22,5 min. por questão) e meia hora para transcrever é 9 uma alocação adequada do tempo disponível. 10 (1) Como parte uma avaliação da performance da política macroeconômica nos últimos 12 anos, um órgão 11 do governo federal procura medir o efeito da elevação da taxa de juros básica da economia, a SELIC, sobre 12 o custo de vida efetivamente enfrentado pelas famílias brasileiras. Para isso, toma-se uma amostra de 144 13 (122) famílias e calcula-se, para dois momentos entre os quais houve um aumento expressivo da SELIC, o 14 valor da cesta de consumo básico adquirida pelas famílias. Seja Yit o valor da cesta no período inicial, pré-15 alta da SELIC, adquirida pela i-ésima família e YiT, a cesta no período final. Uma medida para o efeito da 16 SELIC é dado por δi = (YiT – Yit)/Yit. O objetivo da análise é testar a hipótese de que o valor populacional da 17 média de δi é nulo. Considerando-se teorias macroeconômicas ortodoxas e heterodoxas, tal valor pode ser 18 (além de nulo) negativo ou positivo, a priori não é possível saber. O nível de significância do teste é de 5%. 19 A média amostral para o indicador de impacto é de ߜ̅ = ଵ ே ∑ ߜ ே ୀଵ = - 0,06 com desvio padrão de ܦܲ =20 ට ଵ ேିଵ ∑ (ߜ − ߜ̅)ଶேୀଵ = 0,24. Probabilidades acumuladas para alguns valores da distribuição t de Student com 21 143 graus de liberdade podem ser visualizadas no gráfico ao final desta questão. Apoiando-se nos dados 22 fornecidos, preencha as lacunas abaixo. 23 (1.a) [0.9 ponto] Valor da estatística do teste: ____________. 24 (1.b) [0.8 ponto] Valores críticos do teste: __________ e __________. 25 (1.c) [0.8 ponto (vide obs)] Decisão (marque apenas a opção correta com um “x”) 26 □ Rejeitar a hipótese nula 27 □ Não rejeitar a hipótese nula 28 Observação: será conferida nota zero para os três itens caso apenas o item 1.c for resolvido. 29 30 Lendo o gráfico a seguir 31 As letras A, B e C indicam polígonos compreendidos entre a curva da distribuição t de Student e segmentos 32 específicos do eixo horizontal, quais sejam: [-4;-1.98], para a curva A, [-1.98;-1.66] para B e [-1.66;-1.29] 33 para C. As áreas dos polígonos são equivalentes a probabilidades acumuladas cujos valores são: 2,5% para 34 A, 2,5% para B e 5% para C. E analogamente para o segmento positivo do eixo horizontal. 35 2 Figura 1 Distribuição t de Student com 143 graus de liberdade 36 37 R: o valor da estatística do teste é de -3, os valores críticos são de -1.98 e 1.98 e a decisão correta é a de 38 rejeição da hipótese nula. 39 (2) [2,5 pontos] Um pesquisador interessado na relação entre severidade de desnutrição infantil e renda 40 familiar, agregou os dados da POF 2008/2009, originalmente disponíveis na escala de pessoas, convertendo-41 os para a escala de setores censitários (regiões submunicipais definidas pelo IBGE). A agregação foi 42 realizada a partir do cálculo das médias das duas variáveis ao longo de todas as crianças de zero a cinco anos 43 amostradas pela POF em cada setor censitário. A tabela ao final desta questão apresenta estatísticas que 44 resumem o comportamento da medida de severidade de desnutrição infantil dentro de faixas de renda 45 familiar mensal per capita, considerando-se, separadamente, cada um dos dois conjuntos de dados, original e 46 agregado. É possível, com base nas estatísticas, verificar que a distribuição probabilística empírica 47 (amostral) da severidade de desnutrição é modificada pela agregação. O pesquisador deseja estimar a função 48 de regressão populacional (FRP) em que desnutrição infantil é explicada (variável Y) apenas em função da 49 renda familiar (variável X). 50 Quanto a isso, responda: porque é de se esperar que a soma dos quadrados dos resíduos (SQR) da regressão 51 estimada com base nos dados agregados seja inferior ao que seria obtido com base nos dados originais? 52 Justifique sua resposta comparando o comportamento intra-faixa da medida de severidade de desnutrição em 53 cada um dos dois conjuntos de dados, original e agregado. 54 Lembrete 1: o 10° e 90° percentis indicam, respectivamente, o limiar abaixo do qual um valor pode ser 55 considerado muito pequeno (inferior ao valor assumido por 90% da amostra) e o limiar acima do qual um 56 valor pode ser considerado muito grande (superior ao valor assumido por 90% da amostra). Valores 57 consideravelmente distantes da tendência central (média) têm maior probabilidade de ocorrer quanto 58 maiores forem os valores absolutos do 10° e 90° percentis. 59 Lembrete 2: A SQR é dada por ∑ ݑො ଶே ୀଵ , em que ݑො = ݕ − ߚመ − ߚመଵݔ em que ߚመ e ߚመଵ são as estimativas 60 pontuais para os parâmetros da FRP. 61 62 63 3 64 65 Tabela 1 Estatísticas para a distribuição empírica da desnutrição infantil por faixas de renda, 66 10°p = décimo percentil, 90°p = nonagésimo percentil, SM = salário mínimo. 67 Faixa de renda familiar mensal per capita Dados originais: escala de pessoas Dados agregados: setores censitários 10°p 90°p Desvio-padrão 10°p 90°p Desvio- padrão renda <= 1/2 SM -2,03 0,64 1,13 -1,64 0,26 0,82 1/2 SM < renda <= 1 SM -1,91 0,83 1,18 -1,52 0,54 0,86 1 SM < renda <= 2 SM -1,79 0,91 1,16 -1,30 0,60 0,92 2 SM < renda <= 5 SM -1,60 0,86 1,06 -1,25 0,77 0,80 renda > 5 SM -1,42 0,85 0,95 -1,34 0,59 0,87 68 R: De acordo com a tabela, a ocorrência de valores para a severidade de desnutrição muito discrepantes da 69 tendência central (média) correspondente a uma dada faixa é mais provável para os dados originais. O que 70 é verificado para todas as faixas de renda, uma vez que, em todas elas, os valores absolutos do 10° e do 90° 71 percentis são maiores nos dados não agregados. A agregação, portanto, reduz a recorrência de outliers, 72 sejam eles valores muito pequenos (muito negativos) ou muito grandes. O que é equivalente a afirmar que a 73 recorrência de valores próximos das médias intra-faixa é aumentada pela agregação. Adicionalmente, a 74 dispersão em torno da média (ou volatilidade) da severidade de desnutrição também foi reduzida, uma vez 75 que o desvio padrão intra-faixa é inferior para todas as faixas nos dados agregados. O impacto conjunto 76 destes dois efeitos da agregação está em tornar os valores de Y mais próximos de suas médias intra-faixa, 77 ou média condicional. Olhando, portanto, para cada uma das faixas, é de se esperar um menor número de 78 observações que discrepem consideravelmente da média intra-faixa de Y para os dados agregados. 79 Para continuar a explicação, é preciso considerar que a reta de regressão é a melhor aproximação linear 80 da média condicional, ou seja, trata-se da reta mais próxima das médias de Y para cada faixa de X (i.e., 81 “médias intra-faixa”). Isso significa que os valores previstos pela reta de regressão para Y são valores tão 82 próximos quanto possível das médias intra-faixa de Y. Consequentemente, valores de Y consideravelmente 83 distantes das médias intra-faixa também serão consideravelmente distantes dos valores previstos pela 84 regressão. Daí porque, quanto maior for a dispersão e o número de outliers (pequenose grandes) dentro de 85 uma dada faixa, maior será o valor total das diferenças entre os valores efetivos de Y e os valores previstos 86 pela regressão, denotados por ܻ. 87 A SQR é exatamente a soma dos quadrados de tais diferenças, de modo que, quanto maior a dispersão de Y 88 dentro de cada faixa de X e quanto mais outliers de Y intra-faixa existirem, maior a SQR. Daí porque a SQR 89 tende a ser maior na regressão estimada com base nos dados não agregados, pois é neles que Y é mais 90 disperso e registra mais outliers intra-faixa. 91 92 (3) [2,5 pontos] Ao apresentar o relatório final de uma consultoria prestada para o Ministério do Trabalho e 93 Emprego (MTE), um economista teve seus resultados criticados. A consultoria tinha como objetivo estimar 94 o retorno da educação para pessoas que concluíram pelo menos o primeiro grau (ensino fundamental). Para 95 isso, com base nos dados da PNAD 2013, foi estimada uma regressão de Mincer em que a remuneração do 96 trabalho é explicada apenas em função do nível educacional. A amostra, portanto, continha apenas pessoas 97 com pelo menos este nível. Observando um intercepto negativo, o representante do MTE afirmou que os 98 4 resultados poderiam estar equivocados ao indicar que pessoas que não concluíram um ano de estudo, i.e., 99 pessoas com valor zero para a explicativa "nível educacional", receberiam, no mercado de trabalho, uma 100 remuneração negativa, o que não faz sentido, pois ninguém “paga para trabalhar”. Como você responderia a 101 esta crítica? 102 R: É preciso deixar claro para o representante do Ministério que o estudo contratado não teve por objetivo 103 estimar a remuneração média de pessoas com nível educacional inferior ao ensino fundamental completo. 104 Desta maneira, os resultados não podem ser usados como base para responder a uma pergunta sobre uma 105 parte da população brasileira que não pertencia à população-alvo do estudo. A validade dos resultados de 106 uma regressão linear se restringe à população-alvo cujo comportamento tal ferramenta analítica procura 107 descrever. Atribuir valor nulo à variável explicativa, sendo que na população-alvo e, portanto, na amostra 108 considerada, não há nenhuma unidade observacional com valor nulo para tal variável consiste em 109 extrapolar os resultados da análise para além da população-alvo. O que tende a resultar em erros, tal como 110 o resultado do raciocínio do representante demonstra. As estimativas pontuais, e, especificamente, o 111 intercepto, não foram gerados com base em informação referente à remuneração de pessoas com nível 112 educacional inferior a um ano. Exatamente por isso o intercepto não pode ser interpretado como se 113 contivesse essa informação, o que significa que o valor do intercepto não capta a remuneração média, 114 prevista pela regressão, para pessoas com nível educacional zero, não devendo ser interpretado desta 115 maneira. 116 117 (4) [2,5 pontos] Tendo em mente a demonstração de ausência de viés para o estimador de MQO para o 118 coeficiente da FRP, assinale, com um “x”, o interior do quadrado ao lado esquerdo da alternativa que 119 corresponde ao equivalente lógico da expressão ܧ ∑ ௨(௫ି௫̅)ಿసభ ∑ (௫ି௫̅)మಿసభ ฬܺ൨. Apenas uma alternativa deve ser 120 assinalada. 121 ܣ)⎕ ∑ ݑܧ[(ݔ − ̅ݔ)|ܺ]ேୀଵ ∑ (ݔ − ̅ݔ)ଶேୀଵ ܤ)⎕ ܧ[∑ ݑ(ݔ − ̅ݔ)|ܺ]ேୀଵ ܧ[∑ (ݔ − ̅ݔ)ଶேୀଵ |ܺ] ܥ)⎕ ∑ ܧ[ݑ|ܺ](ݔ − ̅ݔ)ேୀଵ ∑ (ݔ − ̅ݔ)ଶேୀଵ R: A expressão “A” não é um equivalente lógico de ܧ ∑ ௨(௫ି௫̅)ಿసభ ∑ (௫ି௫̅)మಿసభ ฬܺ൨, pois ela incorpora um equívoco que 122 é o de tomar ui como uma constante para a expectativa condicional, pois afirma que ܧ[ݑ(ݔ − ̅ݔ)|ܺ] =123 ݑܧ[(ݔ − ̅ݔ)|ܺ]. A expressão B está incorreta pois ܧ ቂቚ ܺቃ ≠ ா[|]ா[|] e, portanto, ܧ ∑ ௨(௫ି௫̅)ಿసభ∑ (௫ି௫̅)మಿసభ ฬܺ൨ ≠124 ா[∑ ௨(௫ି௫̅)|]ಿసభ ா[∑ (௫ି௫̅)మಿసభ |] .Já a expressão “C” está correta, pois é obtida completamente a partir do emprego de 125 propriedades do operador E[|X], quais sejam (i) a expectativa de uma soma é a soma das expectativas e (ii) 126 expressões que sejam funções exclusivamente de X podem ser tratadas como constantes para a expectativa 127 condicional em relação a X (ver nota de aula 5 para os detalhes).Conclusivamente, pois, a opção correta é 128 a expressão C. 129
Compartilhar