Baixe o app para aproveitar ainda mais
Prévia do material em texto
ECONOMETRIA II 2019 Prof. Vanderlei Kleinschmidt GABARITO DAS AUTOATIVIDADES 2 ECONOMETRIA II UNIDADE 1 TÓPICO 1 1 Sobre os conceitos preliminares relativos às séries temporais, avalie as afirmações a seguir respondendo V para verdadeiro e F para falso. a) (V) As séries temporais apresentam alguns padrões de comportamento, tais como tendência, sazonalidade e ciclo. b) (F) É importante ressaltar que estas componentes ocorrem de forma isolada, ou seja, se uma série apresenta um componente de tendência, não terá um componente de ciclo ou sazonal embutido na mesma série. c) (V) A distinção entre o processo estocástico e sua realização é parecida com a distinção entre a população e a amostra de dados em cortes transversais. Do mesmo modo que utilizamos as amostras de dados para extrair inferências sobre a população, utilizamos, em séries temporais, a realização para extrair inferências sobre o processo estocástico subjacente. d) (F) Um processo de série temporal é estacionário se apresentar tendências aparentes, e média variante ao longo do tempo. e) (V) Uma sequência {εt} é um ruído branco se cada valor nela tiver média zero, variância constante e não for correlacionado com qualquer realização da própria série (autocorrelação igual a zero). 2 Dê o significado dos seguintes termos: a) Estacionariedade. b) Regressão espúria. c) Série temporal. R.: a) Um processo estocástico Yt, é fracamente estacionário ou covariância estacionária se satisfizer as seguintes condições: i) E[Yt] é independente de t; ii) Var[Yt] é uma constante finita, positiva e independente de t; iii) Cov[Yt,Ya] é uma função de | t −s|, mas não de t ou s. 3 ECONOMETRIA II TÓPICO 2 1 A abordagem padrão para análise de séries temporais estacionárias é a metodologia Box-Jenkins (1970). Essa abordagem permite que valores futuros de uma série sejam previstos tomando por base apenas seus valores presentes e passados. O primeiro passo dessa abordagem consiste em identificar as ordens p e q do modelo. Com base nessa metodologia, relacione a coluna da direita com a coluna da esquerda: b) Podem-se encontrar relações econométricas entre duas ou mais variáveis econômicas sem qualquer relação de causalidade entre uma e outra por puro acaso. c) Uma série temporal é uma sequência de dados numéricos na qual cada item é associado a um instante particular no tempo. 1) (5) Função de autocorrelação: truncada na defasagem q. Função de autocorrelação parcial: declina exponencialmente. 2) (3) ARMA (1, 1) 3) (2) MA (1) 4) Modelo AR(p) (1) AR (1) 5) Modelo MA(q) (4) Função de autocorrelação: declina exponencialmente. Função de autocorrelação parcial: truncada na defasagem p. 1t t tY c Yφ ε−= + + 1t t tY µ ε θε −= + + 1 1 1 1t t t tY c Yφ θ ε ε− −= + + + 2 Com base na metodologia Box-Jenkins, responda às questões a seguir: a) Raiz unitária: com base em uma simulação contendo 300 observações, gerou-se uma série temporal Yt. O teste ADF foi rodado sobre a série Yt a fim de apurar se há problemas de raiz unitária nessa série. O resultado apurado foi o seguinte: 4 ECONOMETRIA II Teste Aumentado de Dickey-Fuller para Y hipótese nula de raiz unitária: a = 1 teste sem constante estatística de teste: tau_nc(1) = -8,46556 p-valor 0,0000 Regressão de Dickey-Fuller MQO, usando as observações 2-300 (T = 299) Variável dependente: d_Y coeficiente erro padrão razão-t p-valor ---------------------------------------------------------- Y_1 −0,387829 0,0458126 −8,466 9,02e-015 *** Com base no resultado do teste ADF, informe se a série é estacionária. R.: A série é estacionária, pois, rejeitamos a hipótese nula de raiz unitária para o teste ADF. Para chegar a essa resposta, tomamos como base a regressão sem tendência e sem constante, com estatística de teste tau_nc(1) = –8,46556 e p – valor 0,0000. b) Identificação da ordem do processo ARMA(p,q): outra série temporal foi gerada, dessa vez com 200 observações. A série Xt apresentou o seguinte correlograma: 5 ECONOMETRIA II Com base no correlograma acima, identifique qual o processo ARMA(p,q) gerou a série Xt e justifique a sua resposta. R.: Trata-se de um processo MA(1), pois, a FAC trunca na primeira defasagem enquanto a FACP declina exponencialmente. c) Uma série Zt foi gerada através de uma simulação. Verificou-se que a série não tem problemas de raiz unitária e que foi gerada através de um processo AR(1). Com base nessa série, estimou-se o modelo AR(1), cujo resultado encontra-se a seguir: 6 ECONOMETRIA II Funções calculadas: 18 Cálculos de gradientes: 6 Modelo 1: ARMA, usando as observações 1-500 Estimado usando o filtro de Kalman (Máxima verossimilhança exata) Variável dependente: Z Erros padrão baseados na hessiana coeficiente erro padrão z p-valor ---------------------------------------------------------- const −0,0158780 0,132509 −0,1198 0,9046 phi_1 0,682088 0,0325622 20,95 1,99e-097 *** Média var. dependente −0,017399 D.P. var. dependente 1,297107 Média de inovações −0,000022 D.P. das inovações 0,945999 Log da verossimilhança −682,0256 Critério de Akaike 1370,051 Critério de Schwarz 1382,695 Critério Hannan-Quinn 1375,013 Real Imaginária Módulo Frequência ----------------------------------------------------------- AR Raiz 1 1,4661 0,0000 1,4661 0,0000 ----------------------------------------------------------- Em relação às condições de estabilidade, informe se o modelo AR(1) estimado é estável. Para isso, considere o resultado do modelo estimado e as seguintes informações: Teste da normalidade dos resíduos - Hipótese nula: o erro tem distribuição Normal Estatística de teste: Qui-quadrado(2) = 2,02159 com p-valor = 0,36393 7 ECONOMETRIA II R.: A primeira condição de estabilidade é |Φ1| <1 e a raiz característica deve ser maior do que um em módulo para que o modelo. Ambos os fatos são verificados no modelo estimado. As outras duas condições de estabilidade são a normalidade dos resíduos e a ausência de autocorrelação, que podem ser vistos a partir do teste de normalidade acima e do correlograma. Portanto, conclui-se que o modelo estimado é estável. TÓPICO 3 1 Considere o modelo de regressão linear: Ct = a1 + a2Yt + ut, t = 1, ..., T, em que: Ct é o consumo pessoal em t, Yt é a renda pessoal em t, e ut é o termo de erro aleatório. É correto afirmar que: a) (F) Se Ct e Yt são I(1), então ut será obrigatoriamente estacionário. b) (V) Se o Ct e Yt são integradas, mas com ordens de integração diferentes, então a regressão será inválida. c) (V) Se Ct e Yt são I(1), então um teste de raiz unitária aplicado aos resíduos da regressão poderá identificar a presença de cointegração entre as variáveis. d) (V) Se Ct e Yt são I(1), mas os resíduos são I(0), então há cointegração entre as variáveis. e) (F) Se Ct e Yt são I(1) e os resíduos também são I(1), então a regressão de ΔCt em ΔYt é inválida. 2 Quais os passos para estimar um modelo VAR? R.: Para estimar um modelo VAR, devemos seguir os seguintes passos: 1- Verificar se as séries são estacionárias. 2- Se as variáveis não forem estacionárias, modificamos o modelo a fim de incorporar as séries em primeira diferença. 3- Escolher o grau de defasagem das séries no modelo. 4- Estimamos o modelo VAR na defasagem escolhida no passo 3. 3 Por que incluímos defasagens das variáveis no modelo VAR? Como definimos a quantidade de defasagens a ser empregada? 8 ECONOMETRIA II UNIDADE 2 TÓPICO 1 1 Sobre modelos econométricos dinâmicos (autorregressivos e com defasagens distribuídas), avalie as afirmações a seguir informando V para as sentenças verdadeiras e F para as falsas. a) (V) O modelo de Koyck não fará muito sentido se alguns dos coeficientes defasados forem positivos e outros negativos. Resposta: (V)Ao presumir valores não negativos para λ Koyck exclui a mudança de sinal dos β. b) (F) Tecnicamente não é possível converter um modelo de defasagens distribuídas em um modelo autorregressivo. Resposta: (F) Pela transformação de Koyck, começamos com um modelo de defasagens distribuídas e acabamos em um modelo autorregressivo. c) (V) Na abordagem de Koyck e no modelo de expectativas adaptativas, o método de mínimos quadrados ordinários não é o mais indicado para a estimação dos coeficientes. Resposta: (V) Porque o termo de erro é correlacionado com a variável dependente defasada. d) (V) Por outro lado, o método de mínimos quadrados ordinários é perfeitamente aplicável ao modelo de ajustamento parcial. 2 Imagine o seguinte modelo de expectativas adaptativas: Yt = β0 + β1Xt + ut R.: O objetivo é usar tantas defasagens quanto for necessário para que o modelo VAR gere ruídos brancos. Para definir a quantidade de defasagens usamos os critérios de informação Akaike e Schwarz, entre outros. 4 Após a estimação do VAR, quais os testes de diagnóstico devemos empregar? R.: O primeiro procedimento é verificar se o modelo é estável e estacionário. Se as raízes inversas do VAR estão dentro do círculo unitário, concluímos que o modelo é estável e estacionário. Além da estabilidade e da estacionariedade, verificamos se os resíduos não são autocorrelacionados e se têm distribuição normal, ou seja, verificamos se os resíduos são ruído banco. * 9 ECONOMETRIA II onde Yt representa os gastos em investimentos em instalações e equipamentos fixos na indústria de transformação, Xt as vendas desejadas, e ut o termo de erro. Suponha também que as expectativas das vendas sejam formadas da seguinte forma: Xt = yXt + (1 – y)Xt–1 Com base na hipótese das expectativas adaptativas, considerando a forma econometricamente estimável do modelo Yt = yβ0 + yβ1Xt + (1–y)Yt–1 + vt, com vt = ut – (1 – y)ut–1, e dados obtidos no Economic Report of the President para o período 1970-1991, obteve-se os seguintes resultados: Yt = 15,1040 + 0,6293Xt + 0,2717Yt–1 (–3,194) (6,433) (2,365) Onde todos os coeficientes estimados são estatisticamente significativos. São CORRETAS as afirmativas: a) (V) Se, ao invés de estimar um modelo de expectativas adaptativas, tivéssemos estimado um modelo de Koyck, a taxa de declínio da defasagem distribuída seria 0,2717. b) (F) No caso do modelo de expectativas adaptativas, o coeficiente de expectativas é igual a 0,2717, o que significa que aproximadamente 27% da discrepância entre os gastos de investimentos previstos e o esperado desaparecerá em um ano. R.: Em um modelo de expectativas adaptativas, Yt = yβ0 + yβ1Xt + (1 – y)Yt–1 + vt, com vt = ut – (1–y)ut–1, então, o coeficiente estimado de Yt–1 é (1 – y), portanto, o coeficiente de expectativas é (1 – 0,2717) = 0,7283. c) (V) Se o resultado se referisse a um modelo de ajustamento parcial, poderíamos dizer que, a relação entre investimentos e vendas de longo prazo seria Yt = –20,738 + 0,864Xt. d) (V) Como o modelo de expectativas adaptativas foi estimado por mínimos quadrados ordinários, podemos dizer que os coeficientes estimados são não apenas viesados, mas também não são consistentes. e) (V) Uma alternativa seria estimar o modelo de regressão pelo método de variáveis instrumentais. * * * 10 ECONOMETRIA II TÓPICO 2 1 Em modelos de equações simultâneas, são corretas as afirmativas a seguir: a) (V) O problema da identificação precede o da estimação. b) (F) Se a condição de ordem for satisfeita, a condição de posto também será satisfeita. A condição de ordem é uma condição necessária, mas não suficiente para identificação. c) (F) Os estimadores de mínimos quadrados indiretos e os de mínimos quadrados em dois estágios são não tendenciosos e consistentes independentemente do tamanho da amostra. A não tendenciosidade dos estimadores de MQI em amostras pequenas não são válidas. d) (V) Se uma equação é exatamente identificada, os métodos de mínimos quadrados indiretos e de dois estágios produzem resultados idênticos. Pode ser empregado para estimar equações exatamente identificadas; neste caso MQI e MQ2E darão estimativas idênticas. e) (F) O método de mínimos quadrados indiretos pode ser aplicado tanto a equações exatamente identificados quanto a equações superidentificadas. R.: a) V; b) F (a condição de ordem é uma condição necessária, mas não suficiente para identificação); c) F (a não tendenciosidade dos estimadores de MQI em amostras pequenas não são válidas); d) V (pode ser empregado para estimar equações exatamente identificadas; neste caso MQI e MQ2E darão estimativas idênticas) e) F (o MQI aplicado a uma equação superidentificada não é possível, haja vista que há duas estimações para β21). 2 Considere o seguinte modelo de equações simultâneas: Y1t = δ1Y2t + α11X1t + u1t (1) Y2t = δ2Y3t + α22X2t + u2t (2) Y3t = δ3Y2t + α31X1t + α32X2t + u3t (3) Em que Y1t, Y2t e Y3t são variáveis endógenas, X1t e X2t são variáveis exógenas, e u1t, u2t e u3t são os termos de erro. Indique se cada uma das afirmações a seguir é verdadeira (V) ou falsa (F): 11 ECONOMETRIA II a) (V) A condição de ordem para identificação de equações simultâneas é satisfeita pelas equações (1) e (2), mas não é satisfeita pela equação (3). b) (F) A equação (2) será identificada, pela condição de ordem, caso acrescentemos a variável X1t naquela equação. c) (F) Suponha que a condição de ordem afirmasse que a equação (1) é identificada, enquanto a condição de posto afirmasse que ela não é identificada. Neste caso, devemos sempre confiar na condição de ordem, que é uma condição suficiente para a identificação. d) (F) Podemos estimar a equação (3) por Mínimos Quadrados Indiretos (MQI). e) (F) A equação (2) pode ser estimado por Mínimos Quadrados Ordinários. R.: a) V (g = 3, portanto g-1 = 2. Para a equação (1) -> k = 2 = g-1 => equação exatamente identificada. Para a equação (2) -> k = 2 = g-1 => equação exatamente identificada. Para a equação (3) -> k = 1 < g-1 => equação subidentificada); b) F (Equação (2) com o acrescimento da varável X1t => Y2t = δ2Y3t + α21X1t + α22X2t + u2t. k = 1 < g-1 => equação subidentificada); c) F (a condição de ordem é uma condição necessária, mas não suficiente para identificação); d) F (como a equação é subidentificada, só poderíamos empregar o método das variáveis instrumentais, pois MQI é indicado quando a equação é exatamente identificada); e) F (na equação (2), Y3t e o termo de erro u2t são correlacionados, violando a hipótese do modelo clássico de regressão linear que diz que as variáveis explicativas não podem ter correlação com o termo de erro, por isso não podemos aplicar o método de MQO). TÓPICO 3 1 Retome os dados do Quadro 10 desse tópico para dar sequência no teste de causalidade de Granger. Naquela oportunidade, vimos que o teste de seleção de defasagens do VAR nos indicou que a defasagem ótima pelo critério de Akaike era de 7 períodos. Rode o teste de causalidade de Granger para 7 defasagens, utilizando o resultado da estimação pelo VAR, sem constante e discuta o resultado obtido. R.: Resultado do teste de Granger para 7 defasagens através da estimação do VAR: 12 ECONOMETRIA II Sistema VAR, grau de defasagem 7 Estimativas MQO, observações 1997:4-2014:3 (T = 68) Equação 1: Poup Testes-F com zero restrições: Todas as defasagens de Inv F(7, 54) = 1,5342 [0,1756] Equação 2: Inv Testes-F com zero restrições: Todas as defasagens de Poup F(7, 54) = 1,5633 [0,1664] Utilizando 7 defasagens, não podemos rejeitar a hipótese nula de que há uma relação de independência entre as variáveis no sentido de Granger. 2 Outra forma de rodar o teste de causalidade de Granger é através da digitação das linhas de comando no console Gretl ou na janela de scripts. Escreva o script para o teste de Granger com 7 defasagens. R.: Para 7 defasagens usamos o seguinte script: # Esse script tem comoH_0: Investimento não causa no sentido de Granger a Poupança # Teste com sete defasagens ols Poup Poup(-1) Poup(-2) Poup(-3) Poup(-4) Poup(-5) Poup(-6) Poup(-7) scalar SQR_R1 = $ess ols Poup Inv(-1) Inv(-2) Inv(-3) Inv(-4) Inv(-5) Inv(-6) Inv(-7) Poup(-1) Poup(-2) Poup(-3) Poup(-4) Poup(-5) Poup(-6) Poup(-7) scalar SQR_IR1 = $ess # Teste F com m = 7 e n-k = 68-14=54 genr Fstat1 = ((SQR_R1-SQR_IR1)/7)/(SQR_IR1/54) #P-Valor para a estatística F com 7 e 54 graus de liberdade pvalue F 7 54 Fstat1 # # Esse script tem como H_0: Poupança não causa no sentido de Granger o Investimento 13 ECONOMETRIA II # Teste com sete defasagens ols Inv Inv(-1) Inv(-2) Inv(-3) Inv(-4) Inv(-5) Inv(-6) Inv(-7) scalar SQR_R2 = $ess ols Inv Inv(-1) Inv(-2) Inv(-3) Inv(-4) Inv(-5) Inv(-6) Inv(-7) Poup(-1) Poup(-2) Poup(-3) Poup(-4) Poup(-5) Poup(-6) Poup(-7) scalar SQR_IR2 = $ess # Teste F com m = 7 e n-k = 68-14=54 genr Fstat2 = ((SQR_R2-SQR_IR2)/7)/(SQR_IR2/54) #P-Valor para a estatística F com 7 e 54 graus de liberdade pvalue F 7 54 Fstat2 3 Para essa atividade, você utilizará os dados do quadro a seguir. QUADRO 17 – MORTALIDADE INFANTIL E PNB PER CAPITA FONTE: Gujarati e Porter (2011, p. 187) Obs MI PNCpc Obs MI PNCpc Obs MI PNCpc 1 128 1870 23 126 560 45 37 1730 2 204 130 24 12 4240 46 103 780 3 202 30 25 167 240 47 67 1300 4 197 570 26 135 430 48 143 930 5 96 2050 27 107 3020 49 83 690 6 209 200 28 72 1420 50 223 200 7 170 670 29 128 420 51 240 450 8 240 300 30 27 19830 52 312 280 9 241 120 31 152 420 53 12 4430 10 55 290 32 224 530 54 52 270 11 75 1180 33 142 8640 55 79 1340 12 129 900 34 104 350 56 61 670 13 24 1730 35 287 230 57 168 410 14 165 1150 36 41 1620 58 28 4370 15 94 1160 37 312 190 59 121 1310 16 96 1270 38 77 2090 60 115 1470 17 148 580 39 142 900 61 186 300 18 98 660 40 262 230 62 47 3630 19 161 420 41 215 140 63 178 220 20 118 1080 42 246 330 64 142 560 21 269 290 43 191 1010 22 189 270 44 182 300 14 ECONOMETRIA II OBS.: MI = mortalidade infantil: número anual de óbitos de crianças menores de 5 anos por 1.000 nascidos vivos dos Estados Unidos. PNBpc = PNB per capita em 1980 dos Estados Unidos. Ao estimar a regressão MIi = α + βPNBpci + ui obtemos o seguinte resultado com os coeficientes estimados estatisticamente significativos ao nível de 1% de significância: MIi = 157,402 – 0,0114PNCpci Você deverá montar a seguinte simulação de Monte Carlo apresentando o script: a) Gerar 10 conjuntos de 64 observações para o termo de erro, com distribuição normal, média zero e variância 70. Para isso, use o comando “series ui = normal(0,70)”, com i = 1, 2, ..., 10. b) Simule uma variável dependente, ys = 157.402 – 0.0114 * PNCpc, atentando para o fato de que no Gretl, a vírgula separadora de casas decimais deve ser substituída por ponto. c) Construa 10 variáveis y, sendo yi = ys + ui, para cada i = 1, 2, ..., 10. d) Rode 10 regressões por mínimos quadrados ordinários, usando a expressão ols yi const PNCpc, onde i = 1, 2, ..., 10. Após cada regressão, você deve armazenar os coeficientes da constante e do PNCpc com os comandos: scalar ai = $coeff(const) para a constante, scalar bi = $coeff(PNCpc) para o coeficiente angular e scalar sigi = $sigma^2 para a variância, com i = 1, 2, ..., 10. e) Liste todos os coeficientes estimados através do comando print ai bi sigi. f) Com o uso de uma calculadora ou de uma planilha eletrônica, calcule as médias dos coeficientes estimados e da variância estimada e compare com os resultados obtidos a partir dos parâmetros utilizados para se construir a simulação. R.: Script para rodar o experimento de Monte Carlo: 15 ECONOMETRIA II # Geramos os 10 conjuntos de 64 observações para o termo de erro, com distribuição normal, média zero e variância 70. # series u1 = normal(0,70) series u2 = normal(0,70) series u3 = normal(0,70) series u4 = normal(0,70) series u5 = normal(0,70) series u6 = normal(0,70) series u7 = normal(0,70) series u8 = normal(0,70) series u9 = normal(0,70) series u10 = normal(0,70) # # Vamos informar ao Gretl que a variável dependente é formada pela equação: # series ys = 157.402 - 0.0114*PNCpc # # Vamos gerar valores para y1, y2, ..., y10, formado pelo ys mais o respectivo termo de erro. # y1 = ys + u1 y2 = ys + u2 y3 = ys + u3 y4 = ys + u4 y5 = ys + u5 y6 = ys + u6 y7 = ys + u7 y8 = ys + u8 y9 = ys + u9 y10 = ys + u10 # # Agora vamos rodar as regressões individuais e salvar cada coeficiente estimado # ols y1 const PNCpc scalar a1 = $coeff(const) scalar b1 = $coeff(PNCpc) scalar sig1 = $sigma^2 ols y2 const PNCpc scalar a2 = $coeff(const) scalar b2 = $coeff(PNCpc) scalar sig2 = $sigma^2 ols y3 const PNCpc scalar a3 = $coeff(const) scalar b3 = $coeff(PNCpc) scalar sig3 = $sigma^2 ols y4 const PNCpc scalar a4 = $coeff(const) scalar b4 = $coeff(PNCpc) 16 ECONOMETRIA II scalar sig4 = $sigma^2 ols y5 const PNCpc scalar a5 = $coeff(const) scalar b5 = $coeff(PNCpc) scalar sig5 = $sigma^2 ols y6 const PNCpc scalar a6 = $coeff(const) scalar b6 = $coeff(PNCpc) scalar sig6 = $sigma^2 ols y7 const PNCpc scalar a7 = $coeff(const) scalar b7 = $coeff(PNCpc) scalar sig7 = $sigma^2 ols y8 const PNCpc scalar a8 = $coeff(const) scalar b8 = $coeff(PNCpc) scalar sig8 = $sigma^2 ols y9 const PNCpc scalar a9 = $coeff(const) scalar b9 = $coeff(PNCpc) scalar sig9 = $sigma^2 ols y10 const PNCpc scalar a10 = $coeff(const) scalar b10 = $coeff(PNCpc) scalar sig10 = $sigma^2 # # Vamos listar todos os coeficientes estimados e os valores das variâncias # print a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 sig1 sig2 sig3 sig4 sig5 sig6 sig7 sig8 sig9 sig10 Cálculo das médias: a1 = 164,61888 b1 = -0,00667 sig1 4998,832 a2 = 150,98791 b2 = -0,01146 sig2 4808,426 a3 = 153,50644 b3 = -0,00659 sig3 5906,876 a4 = 169,11214 b4 = -0,01219 sig4 6088,806 a5 = 153,56345 b5 = -0,01112 sig5 5546,94 a6 = 153,694 b6 = -0,009 sig6 4356,784 a7 = 141,33217 b7 = -0,00799 sig7 3869,675 a8 = 156,90551 b8 = -0,01279 sig8 4288,189 a9 = 163,71527 b9 = -0,01519 sig9 5194,889 a10 150,39025 b10 -0,00907 sig10 4551,964 Média 155,782602 Média -0,01021 Média 4961,138 17 ECONOMETRIA II 4 Com base no Quadro 17 do exercício anterior, estime o modelo de regressão MIi = α + βPNBpci + ui por mínimos quadrados ordinári- os e simule um intervalo de confiança para o coeficiente β, através do método de bootstrap, simulando erros normais e com 10.000 repetições (reamostragem). R.: Modelo estimado por MQO: Modelo 3: MQO, usando as observações 1-64 Variável dependente: MI coeficiente erro padrão razão-t p-valor ---------------------------------------------------------- const 157,402 9,83276 16,01 1,07e-023 *** PNCpc −0,0113839 0,00322857 −3,526 0,0008 *** Média var. dependente 141,5000 D.P. var. dependente 75,97807 Soma resíd. quadrados 302932,2 E.P. da regressão 69,89995 R-quadrado 0,167032 R-quadrado ajustado 0,153597 F(1, 62) 12,43261 P-valor(F) 0,000800 Log da verossimilhança −361,6083 Critério de Akaike 727,2165 Critério de Schwarz 731,5343 Critério Hannan-Quinn 728,9175 Intervalo de confiança gerado pelo método de bootstrap: Para o coeficiente em PNCpc (estimativa pontual -0,0113839): Intervalo de confiança de 95% = de -0,0177655 a -0,00497657 Baseado em 9999 replicações, com erros normais simulados. 18 ECONOMETRIA II UNIDADE 3 TÓPICO 1 1 Sobre o agrupamento independente de cortes transversais ao longo do tempo, avalie as afirmações a seguir respondendo V para verdadeiro e F para falso. a) (V) A diferença entre agrupamento de cortes transversais ao longo do tempo e dados em painel é que o primeiro é extraído de forma aleatória e independente entre períodos enquanto, no segundo, busca-se acompanhar os mesmos indivíduos ao longo do tempo. b) (F) Um conjunto de dados sobre eleitores coletados fazendo-se uma seleção aleatória de pessoas de uma população na eleição de 2014,e depois, essas mesmas pessoas são entrevistadas na eleição de 2018, é um exemplo de agrupamento independente de cortes transversais ao longo do tempo porque se refere a dois períodos de tempo distintos. c) (F) Uma das razões para coletarmos dados de corte agrupados de forma independente ao longo do tempo é aumentar o tamanho da amostra. No entanto, mesmo que tenhamos uma amostra extremamente grande, ainda assim teremos dificuldade em obter estimadores mais precisos e estatísticas de teste mais poderosas, assintoticamente falando, do que se usarmos somente dados de corte ou séries temporais. d) (V) Em dados de cortes transversais independentes ao longo do tempo, não acompanhamos os mesmos indivíduos entre os períodos distintos de tempo, por isso não faz sentido fazer a diferenciação de pares de observações distintas ao longo do tempo. 2 Ainda sobre modelos painel, classifique as sentenças a seguir em V para verdadeiras e F para as falsas: a) (V) Um experimento natural ocorre quando um evento exógeno, como, por exemplo, uma mudança de política do governo, altera o meio no qual os agentes operam. b) (F) A existência de dois grupos e períodos de tempo distintos é suficiente para a utilização do método de diferenças-em-diferenças. c) (V) Para que possamos estimar consistentemente nosso modelo por MQO agrupado, deverá ser válida a hipótese que o efeito fixo não observado é não correlacionado com as variáveis explicativas ao longo do tempo (Assumindo que o erro idiossincrático também não tenha correlação com tais variáveis). 19 ECONOMETRIA II d) (F) O teste de Hausman serve para testar se o estimador de efeitos fixos é consistente. 3 Estamos lidando com dados de dois períodos de tempo e 50 unidades de corte, representando estados. Estimamos dois modelos, um pelo método de painel de efeitos fixos e comparamos os resultados com o segundo, estimado considerando efeitos aleatórios. Os resultados são os seguintes: Coeficientes estimados Efeitos fixos Efeitos aleatórios β0 13,7883 (2,172)** 5,8405 (5,433)*** δ0d90 0,0979 (0,1906) -0,9971 (-4,664)*** baixpesoit 0,2950 (0,8370) 0,8193 (7,658)*** rendpcit -0,0003 (-1,928)* 0,000 (0,2125) medicit -0,0055 (-0,1685) -0,0081 (-2,172)** Obs.: Entre parênteses estão as estatísticas t, ***, ** e * indicam significância estatística a 1, 5 e 10% respectivamente. Os seguintes testes estatísticos foram empregados: Teste para diferenciar grupos de intercepções no eixo x=0 Hipótese nula: Os grupos têm a mesma intercepção no eixo x=0 Estatística de teste: F(49, 46) = 6,12419 com valor p = P(F(49, 46) > 6,12419) = 0,0000 Teste Breusch-Pagan - Hipótese nula: Variância do erro de unidade-específica = 0 Estatística de teste assimptótica: Qui-quadrado(1) = 23,8693 com valor p = 0,0000 Teste Hausman - Hipótese nula: As estimativas MQG são consistentes Estatística de teste assimptótica: Qui-quadrado(4) = 6,81765 com valor p = 0,145844 Com base nos resultados, classifique as sentenças a seguir em V para verdadeiras e F para as falsas: a) (F) Se tivéssemos que escolher entre os dois modelos, escolheríamos o de efeitos fixos. b) (V) Os estimadores de efeitos aleatórios gerados por MQG são consistentes (não viesados) e distribuídos normal e assintoticamente conforme N fica maior com T fixo. 20 ECONOMETRIA II TÓPICO 2 Para essa autoatividade, estamos interessados em estudar o resultado de uma eleição, por estado, que ocorreu nos EUA em 1976. Para tanto, os seguintes dados são usados: Y = é a variável resultado, que assume valor igual a 1 caso o voto popular for a favor do candidato democrata (Jimmy Carter) e 0 se o voto for a favor do candidato republicano (Gerry Ford). Income = renda média em 1975. School = número mediano de anos de escolaridade completados por pessoas com 18 anos de idade ou mais. Urban = porcentagem da população que vive em área urbana. A renda média dos estados em 1975 era de $ 13.963, o tempo médio de escolaridade era de 12,48 anos e 59,39% da população americana vivia nas áreas urbanas dos estados. Os resultados dos modelos de Probabilidade Linear, Logit e Probit são apresentados a seguir. Variável dependente: Y ---------------------------------------------------- MPL (MQO) Logit Probit ---------------------------------------------------- const 24,37** 149,8** 87,30** (5,370) (3,216) (3,531) income 0,0000 0,0000 0,0000 (0,4689) (0,2210) (0,1230) school -1,970** -12,39** -7,200** (-5,106) (-3,117) (-3,422) urban 0,00757** 0,05657** 0,03315** (3,304) (2,154) (2,222) ---------------------------------------------------- n 51 51 51 R² 0,4909 0,4391 0,4442 R² Ajustado 0,4583 0,3256 0,3307 Count R² 76,5% 76,5% Critério Akaike 47,425 47,560 47,199 Razão Verossimilhança 30,96[0,00] 31,32[0,00] ---------------------------------------------------- Estatísticas-t entre ( ) *, ** indicam significância num nível de 10 e 5 por cento Para logit e probit, o R-quadrado é o pseudo-R-quadrado de McFadden 21 ECONOMETRIA II Com base nas estimações dos modelos, pede-se: 1 Como você interpreta o sinal dos coeficientes estimados com relação ao aumento ou diminuição da probabilidade do candidato democrata Jimmy Carter receber votos? R.: Eleitores com renda média mais altas e que moram na cidade aumentam a probabilidade de votar em Jimmy Carter, enquanto eleitores com maior grau de instrução diminuem a probabilidade de votos em Carter. 2 Com base no modelo Logit, estime a probabilidade efetiva do candidato democrata ser eleito no estado de New York, sabendo que os valores das variáveis explicativas para aquele estado são: Income = 15.288 School = 12,5 Urban = 88,4 R.: Considerando a equação ( ) ( )0 1 2 3 1| 1 NY i i income school urban P E Y X e β β β β− + + + = = + ( ) ( ) ( ) ( )( )149,8 0,00*15.288 12,39*12,5 0,5657*88,4 1| 1 NY i iP E Y X e− + + − + = = + ( ) ( )0,0742 1| 1NY i i P E Y X e− − = = + ( )| 0, 4815 NY i iP E Y X= = Portanto, a probabilidade do estado de NY votar em Jimmy Carter é de 48,15%. 3 Você acredita que estimar o modelo de probabilidade linear estimado por MQO é adequado? Caso sua resposta seja sim, diga o porquê. Caso seja não, diga o porquê e informe qual seria a alternativa para estimar este modelo. R.: Ao estimar o modelo por MQO, temos dois problemas. O primeiro é a distribuição do termo de erro que não é normal (distribuição de Bernoulli) e a segunda é a variância do erro que é heteroscedástica. Com isso, apesar dos estimadores de MQO serem não tendenciosos, eles não são eficientes (não têm variância mínima). A saída é estimar por Mínimos Quadrados Ponderados. 22 ECONOMETRIA II 4 Com base nos resultados apresentados, qual dos três modelos estimados você escolheria para dar sequência ao seu estudo e por quê? R.: Como o modelo estimado por MQO não é adequado, o Cout R2 é igual nos modelos Logit e Probit e a Razão de Verossimilhança é estatisticamente significativa, usamos o critério de informação de Akaike para definir o modelo mais parcimonioso. Neste caso, o modelo a ser escolhido é o Probit. 5 Se você tivesse que traçar uma estratégia de marketing para o Jimmy Carter, com base nos resultados obtidos, visando ganhar as eleições nos EUA, em que você concentraria a sua campanha, na população de maior renda, com maior escolaridade ou nos moradores da área urbana? Comente. R.: Essa é uma questão subjetiva, depende da capacidade de argumentação dos alunos. Em geral, como a maior parte da população está concentrada nos centros urbanos, parece óbvio concentrar a campanha nas cidades ao invés do interior. Por outro lado, como ele perde voto entre os que têm um nível escolar maior, umaestratégia interessante seria concentrar esforços nesses eleitores, visando reduzir a sua rejeição entre eles. TÓPICO 3 Em relação ao conteúdo desenvolvido no Tópico 3, responda às questões a seguir. 1 Sobre a estimação por máxima verossimilhança, classifique as sentenças a seguir em V para verdadeira e F para as falsas. a) (F) O método de máxima verossimilhança é uma técnica desenvolvida exclusivamente para se estimar modelos econométricos não lineares b) (V) Se conhecermos a distribuição de probabilidade de uma população qualquer de dados, os parâmetros estimados a partir de uma amostra aleatória maximizam a probabilidade de que esses valores obtidos seguem a distribuição da população em questão. c) (V) Os coeficientes gerados pelo método de MQO e máxima verossimilhança são semelhantes quando ui~N(0, σ 2) 23 ECONOMETRIA II d) (F) Em amostras grandes, os estimadores de máxima verossimilhança são tendenciosos e inconsistentes, motivo pelo qual empregamos o método de mínimos quadrados ordinários. 2 A estatística é dividida em duas grandes vertentes. Indique quais são elas e qual a principal diferença entre essas vertentes. R.: A estatística pode ser dividida em estatística clássica e estatística bayesiana. Na análise clássica, o parâmetro β é uma estimativa pontual, obtida com base em uma amostra da população, obtida de forma aleatória. Do ponto de vista da análise bayesiana, não obtemos um estimador pontual para o parâmetro β, mas sim uma função de densidade para β, chamada de função de densidade posterior. A diferença entre essas duas abordagens é que, na abordagem bayesiana, a função de densidade posterior não se relaciona ao β, porque não é uma distribuição amostral, mas se relaciona ao β da população. 3 Cite as etapas da técnica bayesiana. R.: 1) Formalização da distribuição posterior, 2) obtém-se a distribuição posterior, e 3) combinar a distribuição posterior com uma função de perda esperada ou uma função de utilidade. 4 Uma das formas de expresser o teorema de Bayes do ponto de vista da econometria bayesiana é fazendo: Prob(Parâmetros|Dados) α Prob(Dados|Parâmetros) x Prob(Parâmetros) Explique o que significa essa expressão matemática. R.: Essa expressão é lida como: “o posterior é proporcional à probabilidade vezes o anterior”. A primeira parte é a distribuição posterior, ou seja, a probabilidade de se encontrar os parâmetros após se observar os dados. A segunda parte da expressão é a distribuição anterior, ou seja, a probabilidade de se encontrar os parâmetros antes de se observar os dados. 24 ECONOMETRIA II 5 Defina big data e mineração de dados. R.: Big data é um conjunto de dados cujo tamanho está além da capacidade que os tradicionais softwares de banco de dados têm para capturar, armazenar, gerenciar e analisar. A mineração de dados é um processo sistemático, interativo e iterativo de preparação e extração de conhecimentos a partir do big data. 6 Na mineração de dados, há uma multidisciplinaridade, dentro da qual a econometria pode ser facilmente inserida. Cite as disciplinas que compõem a mineração de dados. R.: Estatística, matemática, engenharia, inteligência artificial, banco de dados, sistemas de informação e visualização.
Compartilhar