Buscar

prova_1_noturno_gabarito

Prévia do material em texto

1 
 
Prova #1 Econometria I Professor Thiago Fonseca Morello 1 
Nome___________________________________________ RA________________ Turno_____________ 2 
Instruções para resolução da prova 3 
1. O tempo para resolução é de 2 horas: não será concedido tempo adicional; 4 
2. Não ultrapassar o espaço reservado, no caderno de respostas (este documento) para a resolução de cada 5 
questão: todo o texto escrito fora do espaço reservado será desconsiderado; 6 
3. Será fornecido papel para rascunho em quantidade suficiente. Por favor, utilizar o rascunho para chegar 7 
a respostas consistentes e concisas e reservar tempo para transcrevê-las neste caderno de respostas. Uma 8 
hora e meia para elaborar as respostas (22,5 min. por questão) e meia hora para transcrever é 9 
uma alocação adequada do tempo disponível. 10 
(1) Ao final da década de 90, houve uma expressiva valorização do Real, e há um debate acerca das 11 
consequências para a indústria brasileira. O efeito da valorização sobre o investimento industrial é ambíguo. 12 
Por um lado, a valorização exerce influência positiva sobre o investimento, barateando importações de bens 13 
de capital. Por outro lado, a valorização exerce influência negativa, reduzindo a rentabilidade das 14 
exportações de manufaturados. A teoria, pois, não permite concluir quanto ao efeito líquido destas duas 15 
influências, ele pode ser positivo ou negativo. Seja Iit o valor real do investimento realizado pela i-ésima 16 
empresa industrial antes da valorização e IiT o valor deste investimento após a valorização. Com base em 17 
uma amostra de 81 (92) empresas industriais, coletada no período a que este enunciado se refere, é possível 18 
testar, a um nível de significância de 10%, a hipótese de que a média populacional para a variação do 19 
investimento foi nula no período. O valor observado, na amostra, da média para o indicador de impacto,	̅ߠ =20 
ଵ
ே
∑ ቀ୍೔೅ି୍೔೟
୍೔೟
ቁே௜ୀଵ , é de 0,22, com desvio padrão ܦܲ = ට ଵேିଵ∑ (ߜ௜ − ߜ̅)ଶே௜ୀଵ = 1,32. Preencha as lacunas 21 
abaixo, consultando, para isso o gráfico da distribuição t ao final desta questão. 22 
(1.a) [0.9 ponto] Valor da estatística do teste: ____________. 23 
(1.b) [0.8 ponto] Valores críticos do teste: __________ e __________. 24 
(1.c) [0.8 ponto (vide obs)] Decisão (marque apenas a opção correta com um “x”) 25 
□ Rejeitar a hipótese nula 26 
□ Não rejeitar a hipótese nula 27 
Observação: será conferida nota zero para os três itens caso apenas o item 1.c for resolvido. 28 
 29 
Lendo o gráfico a seguir 30 
As letras A, B e C indicam polígonos compreendidos entre a curva da distribuição t de Student e segmentos 31 
específicos do eixo horizontal, quais sejam: [-4;-1.99], para a curva A, [-1.99;-1.66] para B e [-1.66;-1.29] 32 
para C. As áreas dos polígonos são equivalentes a probabilidades acumuladas cujos valores são: 2,5% para 33 
A, 2,5% para B e 5% para C. E analogamente para o segmento positivo do eixo horizontal. 34 
 35 
2 
 
Figura 1 Distribuição t de Student com 80 graus de liberdade 36 
 37 
R: o valor da estatística do teste é de 1,5, os valores críticos são de -1.66 e 1.66 e a decisão correta é a de 38 
não rejeição da hipótese nula. 39 
 (2) [2,5 pontos] Utilizando dados de pesquisas do IBGE é possível elaborar os dois gráficos box-plot abaixo 40 
que descrevem o comportamento de uma medida de severidade de desnutrição infantil dentro de faixas de 41 
renda familiar mensal per capita (intra-faixa). Após os examinar detalhadamente, responda: porque a soma 42 
dos quadrados dos resíduos (SQR) da regressão linear estimada com base nos dados do gráfico 1 tende a ser 43 
maior? Fundamente sua resposta detalhando as diferenças dos dois conjuntos de dados no que tange ao 44 
comportamento da severidade de desnutrição infantil por faixas de renda familiar, reveladas pelos box-plots 45 
intra-faixa de renda. 46 
Considere que, para ambos os gráficos, as médias intra-faixa da severidade são aproximadamente iguais às 47 
medianas indicadas pelos box-plots. 48 
Lembrete 1: estrutura do box-plot 49 
 50 
A distância entre o primeiro e o terceiro quartil dá uma medida de dispersão análoga ao desvio padrão. 51 
Valores mais extremos do que os limites inferior e superior do box plot discrepam consideravelmente da 52 
mediana (e, portanto, da média). 53 
3 
 
Lembrete 2: A SQR é dada por ∑ ݑො௜
ଶே
௜ୀଵ , em que ݑො௜ = ݕ௜ − ߚመ଴ − ߚመଵݔ௜ e ߚመ଴ e ߚመଵ são as estimativas pontuais 54 
para os parâmetros da FRP. 55 
Figura 1 Gráficos para a relação entre severidade de desnutrição e renda familiar mensal per 56 
capita (renda), f1 ≡ renda ≤ 1/2SM, f2 ≡ 1/2SM ≤ renda ≤1SM, f3 ≡ 1SM ≤ renda ≤2SM, f4 ≡ 2SM ≤ 57 
renda ≤5SM, f5 ≡ renda > 5SM, SM ≡ salário mínimo. 58 
Gráfico 1 Gráfico 2 59 
 60 
R: de acordo com os box-plots, a volatilidade, ou dispersão em torno da média, de Y (medida pela distância 61 
entre q1 e q3), bem como a presença de valores aberrantes (i.e., valores mais extremos do que os limites 62 
superiores ou inferiores), são maiores, para todas as faixas de X, na situação retratada pelo gráfico 1. Uma 63 
vez que a soma dos quadrados dos resíduos (SQR) é uma medida para os erros cometidos pela regressão, o 64 
valor desta medida tende a ser tão maior quanto maior for o número de valores de Y consideravelmente 65 
distantes da reta de regressão. Uma vez que tal reta é a melhor aproximação linear da curva que conecta as 66 
médias condicionais de Y em relação a X, quanto maior for o número de valores de Y consideravelmente 67 
distantes da média de Y, maior será o número de valores consideravelmente distantes da reta de regressão. 68 
Do que se conclui, portanto, que, como no gráfico 1 há mais dispersão de Y em torno de sua média e maior 69 
recorrência de valores aberrantes, então, conclusivamente, os erros de previsão tendem a ser maiores e 70 
mais recorrentes. Daí porque o SQR será maior na situação retratada pelo gráfico 1, comparativamente ao 71 
que se observa no gráfico 2. 72 
(3) [2,5 pontos] Os dois gráficos de dispersão a seguir apresentam duas amostras distintas para as mesmas 73 
variáveis aleatórias, X e Y. Em cada um deles há a função de regressão amostral (FRA) em que Y é 74 
explicada apenas em função de X e também a média de Y. Quanto a isso, responda: em qual dos dois 75 
gráficos, 1 ou 2, o coeficiente de determinação (R2) atinge maior valor e por quê? Fundamente sua resposta 76 
no conceito de coeficiente de determinação e também na fórmula desta estatística. 77 
 78 
 79 
 80 
 81 
4 
 
Gráfico 1 Gráfico 2 82 
 83 
R: o coeficiente de determinação é maior no gráfico 2 e a razão para isso está em que a diferença entre o 84 
poder preditivo da regressão linear e da média de Y é claramente maior em tal gráfico – o que decorre do 85 
fato de que há uma tendência linear bastante mais clara para a relação entre X e Y no gráfico 2. Para 86 
perceber isso, basta tomar a distância vertical entre observações (pontos) cujos valores de Y que estão 87 
afastados da média de Y para verificar que, para a maioria destas observações, a razão entre o valor 88 
absoluto do erro de previsão cometido pela regressão, dado por |ݕ௜ − ݕො௜| é inferior ao erro cometido pela 89 
média, dado por |ݕ௜ − ݕത|. Isso quer dizer, portanto, que a razão entre a soma dos quadrados dos erros de 90 
previsão cometidos pela regressão, o que é equivalente à soma dos quadrados dos resíduos, SQR, e a soma 91 
dos quadrados dos desvios da média, esta denominada soma dos quadrados total, SQT, é inferior no gráfico 92 
2 - isso é equivalente a dizer que a razão entre a distância dos valores observados de Y e a FRA 93 
(SQE=SQT-SQR) e a distância dos valores observados de Y e sua média (SQT) é inferior no contextodo 94 
gráfico 2. Uma vez que o coeficiente de determinação é tal que ܴଶ = 1 − ௌொோ
ௌொ்
, fica claro porque o valor 95 
desta estatística é superior nas condições retratadas pelo gráfico 2. 96 
(4) [2,5 pontos] Tendo em mente a demonstração a partir da qual se obtém a variância do estimador de 97 
MQO para o coeficiente da FRP, assinale, com um “x”, o interior do quadrado ao lado esquerdo da 98 
alternativa que é equivalente, sob a validade da hipótese de que E[ui|X] = 0, i=1,...,N, à expressão 99 
ܧ ቂ൫∑ ݑ௜(ݔ௜ − ̅ݔ)ே௜ୀଵ ൯ଶቚ ܺቃ. Apenas uma alternativa deve ser assinalada. OBS: V(.|X) é a variância. 100 
ܣ)⎕			 ൭ܧ ൥෍ݑ௜(ݔ௜ − ̅ݔ)ே
௜ୀଵ
൩อ ܺ൱
ଶ
 
ܤ)⎕			෍ܸ[ݑ௜|ܺ](ݔ௜ − ̅ݔ)ଶே
௜ୀଵ
+ ෍෍ܿ݋ݒ[ݑ௜ ,ݑ௝|ܺ](ݔ௜ − ̅ݔ)൫ݔ௝ − ̅ݔ൯ே
௜ୀଵ
ே
௝ஷଵ
 
ܥ)⎕			ܧ ൥෍ݑ௜ଶ(ݔ௜ − ̅ݔ)ଶே
௜ୀଵ
อ ܺ൩ 
5 
 
R: A expressão “A” está equivocada pois afirma que a expectativa de um quadrado é o quadrado da 101 
expectativa, i.e., E[Z2|X] = E[Z|X]2, o que é errado. A expressão “B” está correta, sendo equivalente a 102 
ܧൣ∑ ݑ௜
ଶ(ݔ௜ − ̅ݔ)ଶே௜ୀଵ + 2∑ ∑ ݑ௜(ݔ௜ − ̅ݔ)ݑ௝൫ݔ௝ − ̅ݔ൯ே௜ୀଵே௝ஷଵ หܺ൧. Basta considerar que, sob a hipótese de que 103 
E[ui|X] = 0, tem-se ܸ[ݑ௜|ݔ] = ܧ[ݑ௜ଶ|ݔ] e cov(ui,uj) = E[uiuj|X]. A expressão C está equivocada pois omite 104 
ൣ∑ ݑ௜
ଶ(ݔ௜ − ̅ݔ)ଶே௜ୀଵ + 2∑ ∑ ݑ௜(ݔ௜ − ̅ݔ)ݑ௝൫ݔ௝ − ̅ݔ൯ே௜ୀଵே௝ஷଵ หܺ൧. A opção correta, portanto é a B (consultar a 105 
nota de aula 6 para os detalhes). 106 
 107

Continue navegando

Outros materiais