Buscar

Lista_1_gabarito_corr_22_10

Prévia do material em texto

1 
 
Econometria I 
Lista de exercícios # 1 
Gabarito corrigido em 22/10 (valores críticos dos exercícios 5 e 6) 
Thiago Fonseca Morello 
fonseca.morello@ufabc.edu.br 
sala 301, Bloco Delta, SBC 
A resolução desta lista deve ser escrita à mão e entregue ao professor, na sala de 
aula, até no máximo dia 15 de Outubro. Ela deve conter, no máximo, cinco páginas 
(ou 2 folhas frente e verso e uma apenas frente). Caso haja páginas além deste 
limite, elas serão desconsideradas. 
Todos os exercícios têm o mesmo valor, 1,667 pontos (o valor dos itens é 
equivalente à divisão equitativa do valor do respectivo exercício). 
(Q.1) Seja X1, X2,...,XN uma sequência de variáveis aleatórias (VAs) identicamente 
distribuídas mas dependentes com média μ e variância σ2, i.e., E[Xi] = μ e V[Xi]= σ2, 
i=1,...,N. Considerando isso, faça as demonstrações a seguir requisitadas. 
(Q.1.a) V(X1 + X2) = 2σ2 + 2cov(X1,X2), em que cov() é o operador covariância; 
R: V(X1 + X2) = E[(X1 + X2 – E[X1 + X2])2]. Defina A ≡ X1 + X2 e B ≡ E[X1 + X2] de 
modo que E[(X1 + X2 – E[X1 + X2])2] = E[(A – B)2]. Prosseguindo, tem-se E[(A – B)2] 
= E[A2 + B2 – 2AB] = E[(X1 + X2)2 + (E[X1 + X2])2 – 2(X1 + X2)E[X1 + X2]] = 
= E[(X1 + X2)2]+ (E[X1 + X2])2 – 2E[(X1 + X2)E[X1 + X2]]] = 
= E[(X1 + X2)2]+ (E[X1 + X2])2 – 2[E(X1 + X2)E[X1 + X2]]] = 
 V(X1 + X2) = E[(X1 + X2)2] - (E[X1 + X2])2 (i). 
Defina C ≡ E[(X1 + X2)2] e D ≡ (E[X1 + X2])2. 
(ii) C ≡ E[(X1 + X2)2] = E[(X12 + X22 + 2X1X2)] = E[(X12 + X22)] + 2E[X1X2] 
(iii) D ≡ (E[X1 + X2])2 = (E[X1]+ E[X2])2= E[X1]2+ E[X2]2 +2E[X1] E[X2] 
Levando os resultados (ii) e (iii) em (i): 
V(X1 + X2) = E[(X12 + X22)] + 2E[X1X2] – E[X1]2- E[X2]2 -2E[X1] E[X2] = 
E[X12] – E[X1]2+ E[X22] - E[X2]2+ 2(E[X1X2] -E[X1] E[X2]) 
 V(X1 + X2) = E[X12] – E[X1]2+ E[X22] - E[X2]2+ 2(E[X1X2] -E[X1] E[X2]) 
Aplicando as definições de variância e covariância, chega-se, finalmente, a 
2 
 
V(X1 + X2) = V[X1] + V[X2] + 2cov[X1X2]. 
 (Q.1.b) Generalize o resultado do item anterior para N VAs, i.e., demonstre que 
ܸ[∑ ௜ܺଵ௜ୀଵ ] = ܰߪଶ + ∑ ∑ ܿ݋ݒ൫ܺ௜ , ௝ܺ൯ே௜ୀଵ௜ஷ௝ ; 
Serão seguidos os passos da demonstração anterior. 
R: Defina X1 + X2+...+ XN = Σ. Assim, V(X1 + X2+...+ XN) = V(Σ) = E[(Σ – E[Σ])2] = 
= E[(Σ2 + E[Σ]2 – 2Σ E[Σ])] = E[Σ2]+ E[Σ]2 – 2E[Σ]2 = E[Σ2] – E[Σ]2  V(X1 + 
X2+...+ XN) = E[Σ2] – E[Σ]2 (i). 
Defina A ≡ E[Σ2] e B ≡ E[Σ]2. 
(ii) A ≡ E[Σ2] = E[(X1 + X2+...+ XN)2] = ܧൣ∑ ௜ܺଶே௜ୀଵ + ∑ ∑ ௜ܺ ௝ܺே௜ୀଵ௝ஷ௜ ൧ = ∑ ܧ[ ௜ܺଶ]ே௜ୀଵ +
∑ ∑ ܧ[ܺ௜ ௝ܺ]ே௜ୀଵ௝ஷ௜ 
(iii) B ≡ E[Σ]2 = (E [X1 + X2+...+ XN])2 = (E[X1]+ E[X2]+...+ E[XN])2 = ∑ ܧ[ܺ௜]ଶே௜ୀଵ + ∑ ∑ ܧ[ܺ௜]ܧ[ ௝ܺ]ே௜ୀଵ௝ஷ௜ 
Uma dúvida que pode ter surgido neste item é quanto ao somatório duplo abaixo. 
෍෍ ௜ܺ ௝ܺ
ே
௜ୀଵ௝ஷ௜
= ෍෍ܺ௜ ௝ܺே
௜ୀଵ
ே
௝ୀଵ
௝ஷ௜= ଵܺ(ܺଶ + ܺଷ + ⋯+ ܺே) + ܺଶ( ଵܺ + ܺଷ + ⋯+ ܺே) + ⋯+ ܺே( ଵܺ + ܺଷ + ⋯+ ܺேିଵ) 
 
(Q.1.c) Assumindo, agora, que as N VAs são independentes, demonstre que ܸ[ തܺ] = ఙమ
ே
, 
com തܺ = ଵ
ே
∑ ௜ܺ
ே
௜ୀଵ . Utilize, para isso, o resultado obtido na demonstração do item 
anterior. 
R: 
ܸ[ തܺ] = ܸ ൥ 1ܰ ෍ ௜ܺଵ
௜ୀଵ
൩ = ൬ 1ܰ൰ଶ ܸ ൥෍ ௜ܺଵ
௜ୀଵ
൩ = ൬ 1ܰ൰ଶ ቌܰߪଶ + ෍෍ܿ݋ݒ൫ ௜ܺ , ௝ܺ൯ଵ
௜ୀଵ௜ஷ௝
ቍ 
Como X1, X2,...,XN são independentes, ܿ݋ݒ൫ ௜ܺ , ௝ܺ൯ = 0, i,j=1,...,N, i≠j, do que decorre 
que ܸ[ തܺ] = ቀଵ
ே
ቁ
ଶ (ܰߪଶ) = ఙమ
ே
. 
(Q.2) Os dados da Pesquisa de Orçamentos Familiares (POF) 2008/2009 do IBGE 
podem ser agregados por setor censitário. Fazendo isso e descartando-se os setores 
censitários com coeficiente de variação (razão desvio padrão/média) para a renda 
3 
 
familiar mensal per capita superior à unidade, pode-se obter o gráfico de dispersão 
abaixo para as variáveis “renda familiar mensal per capita” (simplesmente “renda”, no 
que segue) e “prevalência de desnutrição”. 
 
O coeficiente de correlação linear de Pearson relacionando renda mensal per capita e 
prevalência de desnutrição, para os dados acima, é equivalente a -0,088. 
Os dados podem ser novamente agregados, agora por faixas de renda, tomando-se as 
médias para as duas variáveis, renda e prevalência de desnutrição, em cada faixa de 
renda. Assim procedendo, obtém-se o gráfico abaixo. O eixo x indica as faixas de renda 
(e não a renda média das faixas). 
 
O coeficiente de correlação linear de Pearson relacionando as médias intra faixas de 
renda tem valor absoluto superior ao observado anteriormente, assumindo o valor 
de -0.982. 
Deve-se notar que a média para a prevalência de desnutrição infantil dentro das faixas 
de renda é a média condicional desta variável em relação à variável renda (é esta média 
condicional que está representada no gráfico acima). 
Levando em conta o enunciado, explique, em detalhe: porque a correlação entre renda 
familiar per capita e prevalência de desnutrição infantil é maior (em valor absoluto) com 
os dados agregados por faixas de renda? 
4 
 
R: Essa questão não tem uma resposta exata. Uma resposta adequada, contudo, 
trataria de dois aspectos. Em primeiro lugar, do conceito de média condicional o qual 
corresponde, na amostra, ao conceito populacional de expectativa condicional. E, em 
segundo lugar, do resumo de informação resultante do cálculo da média para a 
prevalência de desnutrição infantil (Y) para cada faixa de renda (X). Um exame da 
figura abaixo (nota de aula 4) é esclarecedor a este respeito (a média condicional é 
indicada pelos pontos vermelhos e os valores de Y para cada faixa de X são indicados 
pelos pontos pretos). 
 
(Q.3) Seja X1, X2,..., XN uma sequência de variáveis aleatórias (VAs) independentes e 
identicamente distribuídas (i.i.d) com média e variância populacionais dadas, 
respectivamente, por μ e σ2, i.e., E[Xi] = μ e V[Xi]= σ2, i=1,...,N. Um possível estimador 
para a média populacional é ܹ = ∑ ߙ௜ ௜ܺଵ௜ୀଵ , em que αi, i=1,...,N são constantes. Qual 
condição os valores das constantes α1,...,αN devem atender para que o estimador W seja 
não-viesado? 
R: B(W) = E[W] – μ = E[∑ ߙ௜ ௜ܺଵ௜ୀଵ ] – μ = E[ߙଵ ଵܺ + ߙଶܺଶ + ⋯+ ߙேܺே] – μ = 
E[ߙଵ ଵܺ] + ܧ[ߙଶܺଶ] + ⋯+ ܧ[ߙேܺே] – μ = ߙଵE[ ଵܺ] + ߙଶܧ[ܺଶ] + ⋯+ ߙேܧ[ܺே] – μ = 
ߙଵE[ ଵܺ] + ߙଶܧ[ܺଶ] + ⋯+ ߙேܧ[ܺே] – μ = ߙଵߤ + ߙଶߤ + ⋯+ ߙேߤ – μ = 
ߤ(ߙଵ + ߙଶ + ⋯+ ߙே) – μ = ߤ(ߙଵ + ߙଶ + ⋯+ ߙே − 1) 
B(W) = ߤ(ߙଵ + ߙଶ + ⋯+ ߙே − 1) (*) 
Para ter ausência de viés, temos de ter B(W) = 0, o que, de acordo com (*) é: 
ߤ(ߙଵ + ߙଶߤ + ⋯+ ߙே − 1) = 0 → ߙଵ + ߙଶߤ + ⋯+ ߙே − 1 = 0 
Finalmente, pois, conclui-se que, para que o estimador W seja não-viesado, é preciso 
ter ߙଵ + ߙଶߤ + ⋯+ ߙே = 1 
(Q.4) Você foi contratado pelo governo federal para realizar um estudo acerca do 
impacto da redução da alíquota do Imposto sobre Produtos Industrializados (IPI) sobre 
5 
 
o número de funcionários empregados por montadoras de veículos localizadas no País. 
O orçamento destinado ao estudo é suficiente apenas para entrevistar algumas das 
montadoras, as quais são selecionadas aleatoriamente para compor uma amostra. Com 
base nos dados obtidos a partir das entrevistas às empresas da amostra, calcula-se o 
indicador de impacto da política pública. Este é dado pela diferença entre o número de 
funcionários antes da redução da alíquota e o número de funcionários depois da redução 
da alíquota, medida que será denotada por Yi, com o índice “i” denotando a i-ésima 
empresa da amostra. 
(Q.4.a) A oposição afirma que a política pública de redução do IPI fracassou, não tendo 
impacto sobre o nível de emprego. O governo federal contratou você para produzir uma 
avaliação estatística que cometa, com a menor probabilidade possível, o erro de afirmar 
que a oposição está equivocada quando, efetivamente, ela está correta. Há apenas duas 
hipóteses nulas possíveis para o teste de hipóteses que procura prover evidências acerca 
do impacto da política. A primeira é a hipótese de que o impacto é nulo, a segunda é a 
hipótese de que o impacto é não nulo. Qual das duas hipóteses dá origem a umteste de 
hipóteses consistente com a preocupação do governo? Explique detalhadamente. 
R: a primeira opção de hipótese nula é adequada pois, a selecionando, tem-se certeza 
de que a probabilidade de cometer o erro de apresentar um resultado que favorece o 
governo (desfavorece a oposição) mas que é incorreto é baixa. Com isso, o governo 
acaba gerando um resultado robusto a qualquer suspeita levantada pela oposição. 
(Q.4.b) Os valores do indicador de impacto para cada montadora são VAs 
independentes e identicamente distribuídas com ௜ܻ ~ N(μ, σ
2), i=1,...,N. Por 
simplicidade, será assumido que σ2 = 625. O parâmetro a ser estimado é o valor 
populacional da média do impacto, μ. Assuma que este valor não pode ser negativo, ou 
seja, a redução do IPI não pode reduzir o nível de emprego (dica: o teste é unicaudal). A 
estimativa pontual obtida é തܻ = ܰିଵ ∑ ௜ܻே௜ୀଵ = 6 e N = 64. Obtenha o valor crítico do 
teste (região de rejeição), consultando, para isso, a tabela da distribuição normal padrão, 
ela pode ser encontrada nas páginas finais dos livros de Wooldridge e Gujarati. 
Alternativamente, a função qnorm() do R reporta o valor γ tal que P(Z ≤ γ) = α, α sendo 
uma probabilidade qualquer e Z~ N(μ, σ2). 
Os comandos do R para funções de distribuição de probabilidades (FDs) estão 
explicados na seção “Funções de distribuição de probabilidades (FD) no R” do 
script_lab_1, um arquivo de texto (pode ser aberto com o bloco de notas). Este 
arquivo pode ser encontrado no repositório da página do curso no TIDIA-AE, 
pasta “Laboratórios”, arquivo zip “metria_1_lab_1.zip”. 
R: trata-se de um teste unicaudal, ou seja, a região de rejeição/ crítica é dada por 
[γ;∞] tal que P(Z> γ) = 5%, sendo Z uma VA com FD N(0,1), o que implica que γ = 
1,65. A estatística do teste é ZO = ( തܻ-μ0)/(σ/√ܰ), em que μ0 é o valor do parâmetro 
populacional definido pela hipótese nula, de modo que μ0 = 0. Desta maneira, ZO = 
6/(25/8)=1,92. Uma vez que 1,92 > 1,65, a hipótese nula deve ser rejeitada. 
6 
 
(Q.4.c) Qual é o resultado do teste? Quem está correto, governo ou oposição? 
R: o governo está correto. 
(Q.5) O governo do Estado de São Paulo implementou um programa de qualificação 
para trabalhadores vítimas de desemprego tecnológico no setor rural. Um exemplo é o 
da introdução de máquinas colheitadeiras em substituição à colheita manual em plantios 
de cana-de-açúcar. Você foi contratado para determinar se os trabalhadores que 
passaram por este programa de qualificação tiveram sua remuneração aumentada 
significativamente. O indicador de impacto do programa, calculado para cada 
trabalhador, é a diferença de remuneração antes e depois do treinamento, sendo 
representado por Wi, i=1,...,N. Este se distribui normalmente com Wi~ N(μ, σ2), 
i=1,...,N. É tomada uma amostra de N = 100 trabalhadores e obtida a estimativa pontual 
para o valor populacional do impacto médio, μ. O valor da estimativa pontual é de 
ഥܹ = ܰିଵ ∑ ௜ܹே௜ୀଵ = 100, o desvio padrão estimado, ݏ = ටܰିଵ∑ ( ௜ܹ − ഥܹ )ଶே௜ୀଵ = 640. 
Neste caso, o valor populacional do desvio padrão é desconhecido e, portanto, a 
estatística do teste é T	 = ௐഥିఓబ
௦/√ே ~ݐேିଵ, uma VA com distribuição t de Student com N-1 
graus de liberdade. O símbolo μ0 representa o valor da média populacional de Wi 
definido pela hipótese nula, zero, no caso, i.e., μ0 = 0. 
(Q.5.a) Obtenha os valores críticos para o teste de hipóteses bicaudal. Para isso você 
pode utilizar a tabela da distribuição t ao final dos livros-texto ou empregar a função 
qt() do R (ver nota em negrito acima); 
R: os valores críticos são γ1 e γ2 tais que P(γ1≤t≤ γ2) = 0,95, de acordo com a 
distribuição t com 99 graus de liberdade trata-se γ1 = -1,98 e γ2 = 1,98. O valor da 
estatística do teste é ܶ	 = ଵ଴଴
଺ସ଴/√ଵ଴଴ = 1,5625, -1,98<1,5625<1,98, de modo que a 
hipótese nula não deve ser rejeitada. 
(Q.5.b) Obtenha o p-valor do teste (o que pode ser feito com base nas tabelas ao final 
dos livros-texto ou utilizando a função pt() do R); 
R: o p-valor é de 6,068% 
(Q.5.c) Qual é o resultado do teste? Explique com detalhe como, com base nos 
resultados dos itens anteriores e na estimativa pontual, é possível concluir acerca da 
existência de um impacto relevante ou não do programa de qualificação. 
R: a resposta deve afirmar que a evidência não refuta a hipótese nula, uma vez que a 
estatística do teste pertence à região de aceitação e o p-valor > 5%. 
(Q.6) Uma das políticas públicas de contenção do desmatamento que recebeu maior 
investimento nos últimos dez anos no Brasil é a de criação de áreas protegidas, as quais 
não podem, por lei, ser desmatadas. Alguns pesquisadores têm se dedicado à tarefa de 
calcular o desmatamento que tal política permitiu evitar. O indicador mais adequado é a 
7 
 
diferença entre a área efetivamente desmatada, mediante a implementação da política, 
D1, e a área que seria desmatada no cenário hipotético em que a política não fosse 
implementada, D0. Um grupo de pesquisadores pôde obter esta medida para uma 
amostra de 324 municípios da Amazônia, denotando-a por δi = D1 – D0, i=1,...,N. Sabe-
se que δi ~ N(δμ, σμ2). Da amostra, tem-se que δത = ܰିଵ ∑ δ௜ே௜ୀଵ = -200 km2 e ݏఋ =
ටܰିଵ ∑ (δ௜ − δത)ଶே௜ୀଵ = 1417 km2. A partir da construção de um teste de hipóteses, 
responda: há evidência de que a criação de áreas protegidas tem efeito relevante sobre o 
desmatamento dos municípios amazônicos? Considere, para isso, que tal política não 
pode atuar para aumentar o nível de desmatamento, mas apenas para reduzi-lo. 
R: se a política não pode aumentar o desmatamento, não faz sentido considerar a 
possibilidade de que a estatística do teste seja positiva. Trata-se, pois, de um teste 
unicaudal. A região de rejeição/ crítica é dada por [-∞;-γ] tal que P(t< -γ) = 5%, sendo 
t uma VA com FD tN-1, em que N-1 = graus de liberdade = 324-1 = 323. Decorre que -γ 
= -1,65. A estatística do teste é tO = ( തܻ-μ0)/(s/√ܰ), em que μ0 é o valor do parâmetro 
populacional definido pela hipótese nula, de modo que μ0 = 0. Desta maneira, tO = -
200/(1417/324)= -2,54. Uma vez que -2,54 < -1,66, a hipótese nula deve ser rejeitada. 
O p-valor é de 0,577% < 5%.

Continue navegando

Outros materiais