Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Econometria I Lista de exercícios # 1 Gabarito corrigido em 22/10 (valores críticos dos exercícios 5 e 6) Thiago Fonseca Morello fonseca.morello@ufabc.edu.br sala 301, Bloco Delta, SBC A resolução desta lista deve ser escrita à mão e entregue ao professor, na sala de aula, até no máximo dia 15 de Outubro. Ela deve conter, no máximo, cinco páginas (ou 2 folhas frente e verso e uma apenas frente). Caso haja páginas além deste limite, elas serão desconsideradas. Todos os exercícios têm o mesmo valor, 1,667 pontos (o valor dos itens é equivalente à divisão equitativa do valor do respectivo exercício). (Q.1) Seja X1, X2,...,XN uma sequência de variáveis aleatórias (VAs) identicamente distribuídas mas dependentes com média μ e variância σ2, i.e., E[Xi] = μ e V[Xi]= σ2, i=1,...,N. Considerando isso, faça as demonstrações a seguir requisitadas. (Q.1.a) V(X1 + X2) = 2σ2 + 2cov(X1,X2), em que cov() é o operador covariância; R: V(X1 + X2) = E[(X1 + X2 – E[X1 + X2])2]. Defina A ≡ X1 + X2 e B ≡ E[X1 + X2] de modo que E[(X1 + X2 – E[X1 + X2])2] = E[(A – B)2]. Prosseguindo, tem-se E[(A – B)2] = E[A2 + B2 – 2AB] = E[(X1 + X2)2 + (E[X1 + X2])2 – 2(X1 + X2)E[X1 + X2]] = = E[(X1 + X2)2]+ (E[X1 + X2])2 – 2E[(X1 + X2)E[X1 + X2]]] = = E[(X1 + X2)2]+ (E[X1 + X2])2 – 2[E(X1 + X2)E[X1 + X2]]] = V(X1 + X2) = E[(X1 + X2)2] - (E[X1 + X2])2 (i). Defina C ≡ E[(X1 + X2)2] e D ≡ (E[X1 + X2])2. (ii) C ≡ E[(X1 + X2)2] = E[(X12 + X22 + 2X1X2)] = E[(X12 + X22)] + 2E[X1X2] (iii) D ≡ (E[X1 + X2])2 = (E[X1]+ E[X2])2= E[X1]2+ E[X2]2 +2E[X1] E[X2] Levando os resultados (ii) e (iii) em (i): V(X1 + X2) = E[(X12 + X22)] + 2E[X1X2] – E[X1]2- E[X2]2 -2E[X1] E[X2] = E[X12] – E[X1]2+ E[X22] - E[X2]2+ 2(E[X1X2] -E[X1] E[X2]) V(X1 + X2) = E[X12] – E[X1]2+ E[X22] - E[X2]2+ 2(E[X1X2] -E[X1] E[X2]) Aplicando as definições de variância e covariância, chega-se, finalmente, a 2 V(X1 + X2) = V[X1] + V[X2] + 2cov[X1X2]. (Q.1.b) Generalize o resultado do item anterior para N VAs, i.e., demonstre que ܸ[∑ ܺଵୀଵ ] = ܰߪଶ + ∑ ∑ ܿݒ൫ܺ , ܺ൯ேୀଵஷ ; Serão seguidos os passos da demonstração anterior. R: Defina X1 + X2+...+ XN = Σ. Assim, V(X1 + X2+...+ XN) = V(Σ) = E[(Σ – E[Σ])2] = = E[(Σ2 + E[Σ]2 – 2Σ E[Σ])] = E[Σ2]+ E[Σ]2 – 2E[Σ]2 = E[Σ2] – E[Σ]2 V(X1 + X2+...+ XN) = E[Σ2] – E[Σ]2 (i). Defina A ≡ E[Σ2] e B ≡ E[Σ]2. (ii) A ≡ E[Σ2] = E[(X1 + X2+...+ XN)2] = ܧൣ∑ ܺଶேୀଵ + ∑ ∑ ܺ ܺேୀଵஷ ൧ = ∑ ܧ[ ܺଶ]ேୀଵ + ∑ ∑ ܧ[ܺ ܺ]ேୀଵஷ (iii) B ≡ E[Σ]2 = (E [X1 + X2+...+ XN])2 = (E[X1]+ E[X2]+...+ E[XN])2 = ∑ ܧ[ܺ]ଶேୀଵ + ∑ ∑ ܧ[ܺ]ܧ[ ܺ]ேୀଵஷ Uma dúvida que pode ter surgido neste item é quanto ao somatório duplo abaixo. ܺ ܺ ே ୀଵஷ = ܺ ܺே ୀଵ ே ୀଵ ஷ= ଵܺ(ܺଶ + ܺଷ + ⋯+ ܺே) + ܺଶ( ଵܺ + ܺଷ + ⋯+ ܺே) + ⋯+ ܺே( ଵܺ + ܺଷ + ⋯+ ܺேିଵ) (Q.1.c) Assumindo, agora, que as N VAs são independentes, demonstre que ܸ[ തܺ] = ఙమ ே , com തܺ = ଵ ே ∑ ܺ ே ୀଵ . Utilize, para isso, o resultado obtido na demonstração do item anterior. R: ܸ[ തܺ] = ܸ 1ܰ ܺଵ ୀଵ ൩ = ൬ 1ܰ൰ଶ ܸ ܺଵ ୀଵ ൩ = ൬ 1ܰ൰ଶ ቌܰߪଶ + ܿݒ൫ ܺ , ܺ൯ଵ ୀଵஷ ቍ Como X1, X2,...,XN são independentes, ܿݒ൫ ܺ , ܺ൯ = 0, i,j=1,...,N, i≠j, do que decorre que ܸ[ തܺ] = ቀଵ ே ቁ ଶ (ܰߪଶ) = ఙమ ே . (Q.2) Os dados da Pesquisa de Orçamentos Familiares (POF) 2008/2009 do IBGE podem ser agregados por setor censitário. Fazendo isso e descartando-se os setores censitários com coeficiente de variação (razão desvio padrão/média) para a renda 3 familiar mensal per capita superior à unidade, pode-se obter o gráfico de dispersão abaixo para as variáveis “renda familiar mensal per capita” (simplesmente “renda”, no que segue) e “prevalência de desnutrição”. O coeficiente de correlação linear de Pearson relacionando renda mensal per capita e prevalência de desnutrição, para os dados acima, é equivalente a -0,088. Os dados podem ser novamente agregados, agora por faixas de renda, tomando-se as médias para as duas variáveis, renda e prevalência de desnutrição, em cada faixa de renda. Assim procedendo, obtém-se o gráfico abaixo. O eixo x indica as faixas de renda (e não a renda média das faixas). O coeficiente de correlação linear de Pearson relacionando as médias intra faixas de renda tem valor absoluto superior ao observado anteriormente, assumindo o valor de -0.982. Deve-se notar que a média para a prevalência de desnutrição infantil dentro das faixas de renda é a média condicional desta variável em relação à variável renda (é esta média condicional que está representada no gráfico acima). Levando em conta o enunciado, explique, em detalhe: porque a correlação entre renda familiar per capita e prevalência de desnutrição infantil é maior (em valor absoluto) com os dados agregados por faixas de renda? 4 R: Essa questão não tem uma resposta exata. Uma resposta adequada, contudo, trataria de dois aspectos. Em primeiro lugar, do conceito de média condicional o qual corresponde, na amostra, ao conceito populacional de expectativa condicional. E, em segundo lugar, do resumo de informação resultante do cálculo da média para a prevalência de desnutrição infantil (Y) para cada faixa de renda (X). Um exame da figura abaixo (nota de aula 4) é esclarecedor a este respeito (a média condicional é indicada pelos pontos vermelhos e os valores de Y para cada faixa de X são indicados pelos pontos pretos). (Q.3) Seja X1, X2,..., XN uma sequência de variáveis aleatórias (VAs) independentes e identicamente distribuídas (i.i.d) com média e variância populacionais dadas, respectivamente, por μ e σ2, i.e., E[Xi] = μ e V[Xi]= σ2, i=1,...,N. Um possível estimador para a média populacional é ܹ = ∑ ߙ ܺଵୀଵ , em que αi, i=1,...,N são constantes. Qual condição os valores das constantes α1,...,αN devem atender para que o estimador W seja não-viesado? R: B(W) = E[W] – μ = E[∑ ߙ ܺଵୀଵ ] – μ = E[ߙଵ ଵܺ + ߙଶܺଶ + ⋯+ ߙேܺே] – μ = E[ߙଵ ଵܺ] + ܧ[ߙଶܺଶ] + ⋯+ ܧ[ߙேܺே] – μ = ߙଵE[ ଵܺ] + ߙଶܧ[ܺଶ] + ⋯+ ߙேܧ[ܺே] – μ = ߙଵE[ ଵܺ] + ߙଶܧ[ܺଶ] + ⋯+ ߙேܧ[ܺே] – μ = ߙଵߤ + ߙଶߤ + ⋯+ ߙேߤ – μ = ߤ(ߙଵ + ߙଶ + ⋯+ ߙே) – μ = ߤ(ߙଵ + ߙଶ + ⋯+ ߙே − 1) B(W) = ߤ(ߙଵ + ߙଶ + ⋯+ ߙே − 1) (*) Para ter ausência de viés, temos de ter B(W) = 0, o que, de acordo com (*) é: ߤ(ߙଵ + ߙଶߤ + ⋯+ ߙே − 1) = 0 → ߙଵ + ߙଶߤ + ⋯+ ߙே − 1 = 0 Finalmente, pois, conclui-se que, para que o estimador W seja não-viesado, é preciso ter ߙଵ + ߙଶߤ + ⋯+ ߙே = 1 (Q.4) Você foi contratado pelo governo federal para realizar um estudo acerca do impacto da redução da alíquota do Imposto sobre Produtos Industrializados (IPI) sobre 5 o número de funcionários empregados por montadoras de veículos localizadas no País. O orçamento destinado ao estudo é suficiente apenas para entrevistar algumas das montadoras, as quais são selecionadas aleatoriamente para compor uma amostra. Com base nos dados obtidos a partir das entrevistas às empresas da amostra, calcula-se o indicador de impacto da política pública. Este é dado pela diferença entre o número de funcionários antes da redução da alíquota e o número de funcionários depois da redução da alíquota, medida que será denotada por Yi, com o índice “i” denotando a i-ésima empresa da amostra. (Q.4.a) A oposição afirma que a política pública de redução do IPI fracassou, não tendo impacto sobre o nível de emprego. O governo federal contratou você para produzir uma avaliação estatística que cometa, com a menor probabilidade possível, o erro de afirmar que a oposição está equivocada quando, efetivamente, ela está correta. Há apenas duas hipóteses nulas possíveis para o teste de hipóteses que procura prover evidências acerca do impacto da política. A primeira é a hipótese de que o impacto é nulo, a segunda é a hipótese de que o impacto é não nulo. Qual das duas hipóteses dá origem a umteste de hipóteses consistente com a preocupação do governo? Explique detalhadamente. R: a primeira opção de hipótese nula é adequada pois, a selecionando, tem-se certeza de que a probabilidade de cometer o erro de apresentar um resultado que favorece o governo (desfavorece a oposição) mas que é incorreto é baixa. Com isso, o governo acaba gerando um resultado robusto a qualquer suspeita levantada pela oposição. (Q.4.b) Os valores do indicador de impacto para cada montadora são VAs independentes e identicamente distribuídas com ܻ ~ N(μ, σ 2), i=1,...,N. Por simplicidade, será assumido que σ2 = 625. O parâmetro a ser estimado é o valor populacional da média do impacto, μ. Assuma que este valor não pode ser negativo, ou seja, a redução do IPI não pode reduzir o nível de emprego (dica: o teste é unicaudal). A estimativa pontual obtida é തܻ = ܰିଵ ∑ ܻேୀଵ = 6 e N = 64. Obtenha o valor crítico do teste (região de rejeição), consultando, para isso, a tabela da distribuição normal padrão, ela pode ser encontrada nas páginas finais dos livros de Wooldridge e Gujarati. Alternativamente, a função qnorm() do R reporta o valor γ tal que P(Z ≤ γ) = α, α sendo uma probabilidade qualquer e Z~ N(μ, σ2). Os comandos do R para funções de distribuição de probabilidades (FDs) estão explicados na seção “Funções de distribuição de probabilidades (FD) no R” do script_lab_1, um arquivo de texto (pode ser aberto com o bloco de notas). Este arquivo pode ser encontrado no repositório da página do curso no TIDIA-AE, pasta “Laboratórios”, arquivo zip “metria_1_lab_1.zip”. R: trata-se de um teste unicaudal, ou seja, a região de rejeição/ crítica é dada por [γ;∞] tal que P(Z> γ) = 5%, sendo Z uma VA com FD N(0,1), o que implica que γ = 1,65. A estatística do teste é ZO = ( തܻ-μ0)/(σ/√ܰ), em que μ0 é o valor do parâmetro populacional definido pela hipótese nula, de modo que μ0 = 0. Desta maneira, ZO = 6/(25/8)=1,92. Uma vez que 1,92 > 1,65, a hipótese nula deve ser rejeitada. 6 (Q.4.c) Qual é o resultado do teste? Quem está correto, governo ou oposição? R: o governo está correto. (Q.5) O governo do Estado de São Paulo implementou um programa de qualificação para trabalhadores vítimas de desemprego tecnológico no setor rural. Um exemplo é o da introdução de máquinas colheitadeiras em substituição à colheita manual em plantios de cana-de-açúcar. Você foi contratado para determinar se os trabalhadores que passaram por este programa de qualificação tiveram sua remuneração aumentada significativamente. O indicador de impacto do programa, calculado para cada trabalhador, é a diferença de remuneração antes e depois do treinamento, sendo representado por Wi, i=1,...,N. Este se distribui normalmente com Wi~ N(μ, σ2), i=1,...,N. É tomada uma amostra de N = 100 trabalhadores e obtida a estimativa pontual para o valor populacional do impacto médio, μ. O valor da estimativa pontual é de ഥܹ = ܰିଵ ∑ ܹேୀଵ = 100, o desvio padrão estimado, ݏ = ටܰିଵ∑ ( ܹ − ഥܹ )ଶேୀଵ = 640. Neste caso, o valor populacional do desvio padrão é desconhecido e, portanto, a estatística do teste é T = ௐഥିఓబ ௦/√ே ~ݐேିଵ, uma VA com distribuição t de Student com N-1 graus de liberdade. O símbolo μ0 representa o valor da média populacional de Wi definido pela hipótese nula, zero, no caso, i.e., μ0 = 0. (Q.5.a) Obtenha os valores críticos para o teste de hipóteses bicaudal. Para isso você pode utilizar a tabela da distribuição t ao final dos livros-texto ou empregar a função qt() do R (ver nota em negrito acima); R: os valores críticos são γ1 e γ2 tais que P(γ1≤t≤ γ2) = 0,95, de acordo com a distribuição t com 99 graus de liberdade trata-se γ1 = -1,98 e γ2 = 1,98. O valor da estatística do teste é ܶ = ଵ ସ/√ଵ = 1,5625, -1,98<1,5625<1,98, de modo que a hipótese nula não deve ser rejeitada. (Q.5.b) Obtenha o p-valor do teste (o que pode ser feito com base nas tabelas ao final dos livros-texto ou utilizando a função pt() do R); R: o p-valor é de 6,068% (Q.5.c) Qual é o resultado do teste? Explique com detalhe como, com base nos resultados dos itens anteriores e na estimativa pontual, é possível concluir acerca da existência de um impacto relevante ou não do programa de qualificação. R: a resposta deve afirmar que a evidência não refuta a hipótese nula, uma vez que a estatística do teste pertence à região de aceitação e o p-valor > 5%. (Q.6) Uma das políticas públicas de contenção do desmatamento que recebeu maior investimento nos últimos dez anos no Brasil é a de criação de áreas protegidas, as quais não podem, por lei, ser desmatadas. Alguns pesquisadores têm se dedicado à tarefa de calcular o desmatamento que tal política permitiu evitar. O indicador mais adequado é a 7 diferença entre a área efetivamente desmatada, mediante a implementação da política, D1, e a área que seria desmatada no cenário hipotético em que a política não fosse implementada, D0. Um grupo de pesquisadores pôde obter esta medida para uma amostra de 324 municípios da Amazônia, denotando-a por δi = D1 – D0, i=1,...,N. Sabe- se que δi ~ N(δμ, σμ2). Da amostra, tem-se que δത = ܰିଵ ∑ δேୀଵ = -200 km2 e ݏఋ = ටܰିଵ ∑ (δ − δത)ଶேୀଵ = 1417 km2. A partir da construção de um teste de hipóteses, responda: há evidência de que a criação de áreas protegidas tem efeito relevante sobre o desmatamento dos municípios amazônicos? Considere, para isso, que tal política não pode atuar para aumentar o nível de desmatamento, mas apenas para reduzi-lo. R: se a política não pode aumentar o desmatamento, não faz sentido considerar a possibilidade de que a estatística do teste seja positiva. Trata-se, pois, de um teste unicaudal. A região de rejeição/ crítica é dada por [-∞;-γ] tal que P(t< -γ) = 5%, sendo t uma VA com FD tN-1, em que N-1 = graus de liberdade = 324-1 = 323. Decorre que -γ = -1,65. A estatística do teste é tO = ( തܻ-μ0)/(s/√ܰ), em que μ0 é o valor do parâmetro populacional definido pela hipótese nula, de modo que μ0 = 0. Desta maneira, tO = - 200/(1417/324)= -2,54. Uma vez que -2,54 < -1,66, a hipótese nula deve ser rejeitada. O p-valor é de 0,577% < 5%.
Compartilhar