Conceitos de Séries Temporais e Metodologia Box-Jenkins

•

ULBRA

Ricardo Medeiros

25/06/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 25 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 25 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 25 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Gestão de Processos

31.859 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

ECONOMETRIA II
2019
Prof. Vanderlei Kleinschmidt
GABARITO DAS 
AUTOATIVIDADES
2
ECONOMETRIA II
UNIDADE 1
TÓPICO 1
1 Sobre os conceitos preliminares relativos às séries temporais, 
avalie as afirmações a seguir respondendo V para verdadeiro e F 
para falso.
a) (V) As séries temporais apresentam alguns padrões de comportamento, 
tais como tendência, sazonalidade e ciclo.
b) (F) É importante ressaltar que estas componentes ocorrem de forma 
isolada, ou seja, se uma série apresenta um componente de 
tendência, não terá um componente de ciclo ou sazonal embutido na 
mesma série.
c) (V) A distinção entre o processo estocástico e sua realização é parecida 
com a distinção entre a população e a amostra de dados em cortes 
transversais. Do mesmo modo que utilizamos as amostras de dados 
para extrair inferências sobre a população, utilizamos, em séries 
temporais, a realização para extrair inferências sobre o processo 
estocástico subjacente.
d) (F) Um processo de série temporal é estacionário se apresentar 
tendências aparentes, e média variante ao longo do tempo. 
e) (V) Uma sequência {εt} é um ruído branco se cada valor nela tiver média 
zero, variância constante e não for correlacionado com qualquer 
realização da própria série (autocorrelação igual a zero).
2 Dê o significado dos seguintes termos:
a) Estacionariedade.
b) Regressão espúria.
c) Série temporal.
R.: 
a) Um processo estocástico Yt, é fracamente estacionário ou covariância 
estacionária se satisfizer as seguintes condições:
i) E[Yt] é independente de t;
ii) Var[Yt] é uma constante finita, positiva e independente de t;
iii) Cov[Yt,Ya] é uma função de | t −s|, mas não de t ou s.
3
ECONOMETRIA II
TÓPICO 2 
1 A abordagem padrão para análise de séries temporais estacionárias 
é a metodologia Box-Jenkins (1970). Essa abordagem permite que 
valores futuros de uma série sejam previstos tomando por base 
apenas seus valores presentes e passados. O primeiro passo dessa 
abordagem consiste em identificar as ordens p e q do modelo.
 Com base nessa metodologia, relacione a coluna da direita com a 
coluna da esquerda:
b) Podem-se encontrar relações econométricas entre duas ou mais variáveis 
econômicas sem qualquer relação de causalidade entre uma e outra por 
puro acaso.
c) Uma série temporal é uma sequência de dados numéricos na qual cada 
item é associado a um instante particular no tempo.
1) (5)
Função de autocorrelação: truncada na defasagem 
q.
Função de autocorrelação parcial: declina 
exponencialmente.
2) (3) ARMA (1, 1)
3) (2) MA (1) 
4) Modelo AR(p) (1) AR (1)
5) Modelo MA(q) (4)
Função de autocorrelação: declina 
exponencialmente.
Função de autocorrelação parcial: truncada na 
defasagem p.
1t t tY c Yφ ε−= + +
1t t tY µ ε θε −= + +
1 1 1 1t t t tY c Yφ θ ε ε− −= + + +
2 Com base na metodologia Box-Jenkins, responda às questões a 
seguir:
a) Raiz unitária: com base em uma simulação contendo 300 observações, 
gerou-se uma série temporal Yt. O teste ADF foi rodado sobre a série 
Yt a fim de apurar se há problemas de raiz unitária nessa série. O 
resultado apurado foi o seguinte:
4
ECONOMETRIA II
Teste Aumentado de Dickey-Fuller para Y
hipótese nula de raiz unitária: a = 1
 teste sem constante 
 estatística de teste: tau_nc(1) = -8,46556
 p-valor 0,0000
Regressão de Dickey-Fuller
MQO, usando as observações 2-300 (T = 299)
Variável dependente: d_Y
 coeficiente erro padrão razão-t p-valor 
 ----------------------------------------------------------
 Y_1 −0,387829 0,0458126 −8,466 9,02e-015 ***
Com base no resultado do teste ADF, informe se a série é estacionária.
R.: A série é estacionária, pois, rejeitamos a hipótese nula de raiz unitária 
para o teste ADF. Para chegar a essa resposta, tomamos como base 
a regressão sem tendência e sem constante, com estatística de teste 
tau_nc(1) = –8,46556 e p – valor 0,0000.
b) Identificação da ordem do processo ARMA(p,q): outra série temporal 
foi gerada, dessa vez com 200 observações. A série Xt apresentou o 
seguinte correlograma:
5
ECONOMETRIA II
Com base no correlograma acima, identifique qual o processo 
ARMA(p,q) gerou a série Xt e justifique a sua resposta.
R.: Trata-se de um processo MA(1), pois, a FAC trunca na primeira 
defasagem enquanto a FACP declina exponencialmente.
c) Uma série Zt foi gerada através de uma simulação. Verificou-se que 
a série não tem problemas de raiz unitária e que foi gerada através 
de um processo AR(1).
Com base nessa série, estimou-se o modelo AR(1), cujo 
resultado encontra-se a seguir: 
6
ECONOMETRIA II
Funções calculadas: 18
Cálculos de gradientes: 6
Modelo 1: ARMA, usando as observações 1-500
Estimado usando o filtro de Kalman (Máxima verossimilhança exata)
Variável dependente: Z
Erros padrão baseados na hessiana
 coeficiente erro padrão z p-valor 
 ----------------------------------------------------------
 const −0,0158780 0,132509 −0,1198 0,9046 
 phi_1 0,682088 0,0325622 20,95 1,99e-097 ***
Média var. dependente −0,017399 D.P. var. dependente 1,297107
Média de inovações −0,000022 D.P. das inovações 0,945999
Log da verossimilhança −682,0256 Critério de Akaike 1370,051
Critério de Schwarz 1382,695 Critério Hannan-Quinn 1375,013
 Real Imaginária Módulo Frequência
 -----------------------------------------------------------
 AR
 Raiz 1 1,4661 0,0000 1,4661 0,0000
 -----------------------------------------------------------
Em relação às condições de estabilidade, informe se o modelo 
AR(1) estimado é estável. Para isso, considere o resultado do modelo 
estimado e as seguintes informações:
Teste da normalidade dos resíduos -
Hipótese nula: o erro tem distribuição Normal
Estatística de teste: Qui-quadrado(2) = 2,02159 com p-valor = 0,36393
7
ECONOMETRIA II
R.: A primeira condição de estabilidade é |Φ1| <1 e a raiz característica deve 
ser maior do que um em módulo para que o modelo. Ambos os fatos são 
verificados no modelo estimado.
 As outras duas condições de estabilidade são a normalidade dos 
resíduos e a ausência de autocorrelação, que podem ser vistos a partir 
do teste de normalidade acima e do correlograma.
 Portanto, conclui-se que o modelo estimado é estável.
TÓPICO 3 
1 Considere o modelo de regressão linear: Ct = a1 + a2Yt + ut, t = 1, ..., 
T, em que: Ct é o consumo pessoal em t, Yt é a renda pessoal em t, e 
ut é o termo de erro aleatório.
É correto afirmar que:
a) (F) Se Ct e Yt são I(1), então ut será obrigatoriamente estacionário.
b) (V) Se o Ct e Yt são integradas, mas com ordens de integração diferentes, 
então a regressão será inválida.
c) (V) Se Ct e Yt são I(1), então um teste de raiz unitária aplicado aos 
resíduos da regressão poderá identificar a presença de cointegração 
entre as variáveis.
d) (V) Se Ct e Yt são I(1), mas os resíduos são I(0), então há cointegração 
entre as variáveis.
e) (F) Se Ct e Yt são I(1) e os resíduos também são I(1), então a regressão 
de ΔCt em ΔYt é inválida.
2 Quais os passos para estimar um modelo VAR?
R.: Para estimar um modelo VAR, devemos seguir os seguintes passos:
1- Verificar se as séries são estacionárias.
2- Se as variáveis não forem estacionárias, modificamos o modelo a fim de 
incorporar as séries em primeira diferença. 
3- Escolher o grau de defasagem das séries no modelo. 
4- Estimamos o modelo VAR na defasagem escolhida no passo 3.
3 Por que incluímos defasagens das variáveis no modelo VAR? Como 
definimos a quantidade de defasagens a ser empregada?
8
ECONOMETRIA II
UNIDADE 2
TÓPICO 1 
1 Sobre modelos econométricos dinâmicos (autorregressivos e com 
defasagens distribuídas), avalie as afirmações a seguir informando 
V para as sentenças verdadeiras e F para as falsas.
a) (V) O modelo de Koyck não fará muito sentido se alguns dos coeficientes 
defasados forem positivos e outros negativos.
 Resposta: (V)Ao presumir valores não negativos para λ Koyck exclui a 
mudança de sinal dos β.
b) (F) Tecnicamente não é possível converter um modelo de defasagens 
distribuídas em um modelo autorregressivo.
 Resposta: (F) Pela transformação de Koyck, começamos com um modelo 
de defasagens distribuídas e acabamos em um modelo autorregressivo.
c) (V) Na abordagem de Koyck e no modelo de expectativas adaptativas, 
o método de mínimos quadrados ordinários não é o mais indicado 
para a estimação dos coeficientes.
 Resposta: (V) Porque o termo de erro é correlacionado com a variável 
dependente defasada.
d) (V) Por outro lado, o método de mínimos quadrados ordinários é 
perfeitamente aplicável ao modelo de ajustamento parcial.
2 Imagine o seguinte modelo de expectativas adaptativas:
Yt = β0 + β1Xt + ut
R.: O objetivo é usar tantas defasagens quanto for necessário para que o 
modelo VAR gere ruídos brancos. Para definir a quantidade de defasagens 
usamos os critérios de informação Akaike e Schwarz, entre outros.
4 Após a estimação do VAR, quais os testes de diagnóstico devemos 
empregar?
R.: O primeiro procedimento é verificar se o modelo é estável e estacionário. 
Se as raízes inversas do VAR estão dentro do círculo unitário, concluímos 
que o modelo é estável e estacionário. 
 Além da estabilidade e da estacionariedade, verificamos se os resíduos 
não são autocorrelacionados e se têm distribuição normal, ou seja, 
verificamos se os resíduos são ruído banco.
*
9
ECONOMETRIA II
onde Yt representa os gastos em investimentos em instalações e 
equipamentos fixos na indústria de transformação, Xt as vendas 
desejadas, e ut o termo de erro. Suponha também que as expectativas 
das vendas sejam formadas da seguinte forma:
Xt = yXt + (1 – y)Xt–1
Com base na hipótese das expectativas adaptativas, 
considerando a forma econometricamente estimável do modelo Yt = 
yβ0 + yβ1Xt + (1–y)Yt–1 + vt, com vt = ut – (1 – y)ut–1, e dados obtidos no 
Economic Report of the President para o período 1970-1991, obteve-se 
os seguintes resultados:
Yt = 15,1040 + 0,6293Xt + 0,2717Yt–1
 (–3,194) (6,433) (2,365)
Onde todos os coeficientes estimados são estatisticamente 
significativos. São CORRETAS as afirmativas:
a) (V) Se, ao invés de estimar um modelo de expectativas adaptativas, 
tivéssemos estimado um modelo de Koyck, a taxa de declínio da 
defasagem distribuída seria 0,2717.
b) (F) No caso do modelo de expectativas adaptativas, o coeficiente de 
expectativas é igual a 0,2717, o que significa que aproximadamente 
27% da discrepância entre os gastos de investimentos previstos e o 
esperado desaparecerá em um ano.
R.: Em um modelo de expectativas adaptativas, Yt = yβ0 + yβ1Xt + (1 – y)Yt–1 
+ vt, com vt = ut – (1–y)ut–1, então, o coeficiente estimado de Yt–1 é (1 – y), 
portanto, o coeficiente de expectativas é (1 – 0,2717) = 0,7283.
c) (V) Se o resultado se referisse a um modelo de ajustamento parcial, 
poderíamos dizer que, a relação entre investimentos e vendas de 
longo prazo seria Yt = –20,738 + 0,864Xt.
d) (V) Como o modelo de expectativas adaptativas foi estimado por mínimos 
quadrados ordinários, podemos dizer que os coeficientes estimados 
são não apenas viesados, mas também não são consistentes.
e) (V) Uma alternativa seria estimar o modelo de regressão pelo método de 
variáveis instrumentais.
* *
*
10
ECONOMETRIA II
TÓPICO 2 
1 Em modelos de equações simultâneas, são corretas as afirmativas a 
seguir:
a) (V) O problema da identificação precede o da estimação.
b) (F) Se a condição de ordem for satisfeita, a condição de posto também 
será satisfeita. A condição de ordem é uma condição necessária, mas 
não suficiente para identificação.
c) (F) Os estimadores de mínimos quadrados indiretos e os de mínimos 
quadrados em dois estágios são não tendenciosos e consistentes 
independentemente do tamanho da amostra. A não tendenciosidade 
dos estimadores de MQI em amostras pequenas não são válidas.
d) (V) Se uma equação é exatamente identificada, os métodos de mínimos 
quadrados indiretos e de dois estágios produzem resultados 
idênticos. Pode ser empregado para estimar equações exatamente 
identificadas; neste caso MQI e MQ2E darão estimativas idênticas.
e) (F) O método de mínimos quadrados indiretos pode ser aplicado 
tanto a equações exatamente identificados quanto a equações 
superidentificadas.
R.: a) V; b) F (a condição de ordem é uma condição necessária, mas 
não suficiente para identificação); c) F (a não tendenciosidade dos 
estimadores de MQI em amostras pequenas não são válidas); d) V (pode 
ser empregado para estimar equações exatamente identificadas; neste 
caso MQI e MQ2E darão estimativas idênticas) e) F (o MQI aplicado a 
uma equação superidentificada não é possível, haja vista que há duas 
estimações para β21).
2 Considere o seguinte modelo de equações simultâneas:
Y1t = δ1Y2t + α11X1t + u1t (1)
Y2t = δ2Y3t + α22X2t + u2t (2)
Y3t = δ3Y2t + α31X1t + α32X2t + u3t (3)
Em que Y1t, Y2t e Y3t são variáveis endógenas, X1t e X2t são 
variáveis exógenas, e u1t, u2t e u3t são os termos de erro.
Indique se cada uma das afirmações a seguir é verdadeira (V) 
ou falsa (F):
11
ECONOMETRIA II
a) (V) A condição de ordem para identificação de equações simultâneas é 
satisfeita pelas equações (1) e (2), mas não é satisfeita pela equação (3).
b) (F) A equação (2) será identificada, pela condição de ordem, caso 
acrescentemos a variável X1t naquela equação.
c) (F) Suponha que a condição de ordem afirmasse que a equação (1) é 
identificada, enquanto a condição de posto afirmasse que ela não 
é identificada. Neste caso, devemos sempre confiar na condição de 
ordem, que é uma condição suficiente para a identificação.
d) (F) Podemos estimar a equação (3) por Mínimos Quadrados Indiretos 
(MQI).
e) (F) A equação (2) pode ser estimado por Mínimos Quadrados Ordinários.
R.: a) V (g = 3, portanto g-1 = 2. Para a equação (1) -> k = 2 = g-1 => equação 
exatamente identificada. Para a equação (2) -> k = 2 = g-1 => equação 
exatamente identificada. Para a equação (3) -> k = 1 < g-1 => equação 
subidentificada); b) F (Equação (2) com o acrescimento da varável X1t => 
Y2t = δ2Y3t + α21X1t + α22X2t + u2t. k = 1 < g-1 => equação subidentificada); 
c) F (a condição de ordem é uma condição necessária, mas não 
suficiente para identificação); d) F (como a equação é subidentificada, 
só poderíamos empregar o método das variáveis instrumentais, pois 
MQI é indicado quando a equação é exatamente identificada); e) F (na 
equação (2), Y3t e o termo de erro u2t são correlacionados, violando a 
hipótese do modelo clássico de regressão linear que diz que as variáveis 
explicativas não podem ter correlação com o termo de erro, por isso não 
podemos aplicar o método de MQO).
TÓPICO 3 
1 Retome os dados do Quadro 10 desse tópico para dar sequência 
no teste de causalidade de Granger. Naquela oportunidade, vimos 
que o teste de seleção de defasagens do VAR nos indicou que a 
defasagem ótima pelo critério de Akaike era de 7 períodos. Rode 
o teste de causalidade de Granger para 7 defasagens, utilizando 
o resultado da estimação pelo VAR, sem constante e discuta o 
resultado obtido.
R.: Resultado do teste de Granger para 7 defasagens através da estimação 
do VAR:
12
ECONOMETRIA II
Sistema VAR, grau de defasagem 7
Estimativas MQO, observações 1997:4-2014:3 (T = 68)
Equação 1: Poup
Testes-F com zero restrições:
Todas as defasagens de Inv F(7, 54) = 1,5342 [0,1756]
Equação 2: Inv
Testes-F com zero restrições:
Todas as defasagens de Poup F(7, 54) = 1,5633 [0,1664]
 Utilizando 7 defasagens, não podemos rejeitar a hipótese nula de 
que há uma relação de independência entre as variáveis no sentido de 
Granger.
2 Outra forma de rodar o teste de causalidade de Granger é através da 
digitação das linhas de comando no console Gretl ou na janela de 
scripts. Escreva o script para o teste de Granger com 7 defasagens.
R.: Para 7 defasagens usamos o seguinte script:
# Esse script tem comoH_0: Investimento não causa no sentido de Granger a Poupança
# Teste com sete defasagens
ols Poup Poup(-1) Poup(-2) Poup(-3) Poup(-4) Poup(-5) Poup(-6) Poup(-7)
scalar SQR_R1 = $ess
ols Poup Inv(-1) Inv(-2) Inv(-3) Inv(-4) Inv(-5) Inv(-6) Inv(-7) Poup(-1) Poup(-2) Poup(-3) 
Poup(-4) Poup(-5) Poup(-6) Poup(-7)
scalar SQR_IR1 = $ess
# Teste F com m = 7 e n-k = 68-14=54
genr Fstat1 = ((SQR_R1-SQR_IR1)/7)/(SQR_IR1/54)
#P-Valor para a estatística F com 7 e 54 graus de liberdade
pvalue F 7 54 Fstat1
#
# Esse script tem como H_0: Poupança não causa no sentido de Granger o Investimento
13
ECONOMETRIA II
# Teste com sete defasagens
ols Inv Inv(-1) Inv(-2) Inv(-3) Inv(-4) Inv(-5) Inv(-6) Inv(-7)
scalar SQR_R2 = $ess
ols Inv Inv(-1) Inv(-2) Inv(-3) Inv(-4) Inv(-5) Inv(-6) Inv(-7) Poup(-1) Poup(-2) Poup(-3) 
Poup(-4) Poup(-5) Poup(-6) Poup(-7)
scalar SQR_IR2 = $ess
# Teste F com m = 7 e n-k = 68-14=54
genr Fstat2 = ((SQR_R2-SQR_IR2)/7)/(SQR_IR2/54)
#P-Valor para a estatística F com 7 e 54 graus de liberdade
pvalue F 7 54 Fstat2
3 Para essa atividade, você utilizará os dados do quadro a seguir.
QUADRO 17 – MORTALIDADE INFANTIL E PNB PER CAPITA
FONTE: Gujarati e Porter (2011, p. 187)
Obs MI PNCpc Obs MI PNCpc Obs MI PNCpc
1 128 1870 23 126 560 45 37 1730
2 204 130 24 12 4240 46 103 780
3 202 30 25 167 240 47 67 1300
4 197 570 26 135 430 48 143 930
5 96 2050 27 107 3020 49 83 690
6 209 200 28 72 1420 50 223 200
7 170 670 29 128 420 51 240 450
8 240 300 30 27 19830 52 312 280
9 241 120 31 152 420 53 12 4430
10 55 290 32 224 530 54 52 270
11 75 1180 33 142 8640 55 79 1340
12 129 900 34 104 350 56 61 670
13 24 1730 35 287 230 57 168 410
14 165 1150 36 41 1620 58 28 4370
15 94 1160 37 312 190 59 121 1310
16 96 1270 38 77 2090 60 115 1470
17 148 580 39 142 900 61 186 300
18 98 660 40 262 230 62 47 3630
19 161 420 41 215 140 63 178 220
20 118 1080 42 246 330 64 142 560
21 269 290 43 191 1010
22 189 270 44 182 300
14
ECONOMETRIA II
OBS.: MI = mortalidade infantil: número anual de óbitos de crianças 
menores de 5 anos por 1.000 nascidos vivos dos Estados Unidos.
PNBpc = PNB per capita em 1980 dos Estados Unidos.
Ao estimar a regressão MIi = α + βPNBpci + ui obtemos o 
seguinte resultado com os coeficientes estimados estatisticamente 
significativos ao nível de 1% de significância:
MIi = 157,402 – 0,0114PNCpci
Você deverá montar a seguinte simulação de Monte Carlo 
apresentando o script:
a) Gerar 10 conjuntos de 64 observações para o termo de erro, com 
distribuição normal, média zero e variância 70. Para isso, use o 
comando “series ui = normal(0,70)”, com i = 1, 2, ..., 10.
b) Simule uma variável dependente, ys = 157.402 – 0.0114 * PNCpc, 
atentando para o fato de que no Gretl, a vírgula separadora de casas 
decimais deve ser substituída por ponto.
c) Construa 10 variáveis y, sendo yi = ys + ui, para cada i = 1, 2, ..., 10.
d) Rode 10 regressões por mínimos quadrados ordinários, usando 
a expressão ols yi const PNCpc, onde i = 1, 2, ..., 10. Após cada 
regressão, você deve armazenar os coeficientes da constante e do 
PNCpc com os comandos: scalar ai = $coeff(const) para a constante, 
scalar bi = $coeff(PNCpc) para o coeficiente angular e scalar sigi = 
$sigma^2 para a variância, com i = 1, 2, ..., 10.
e) Liste todos os coeficientes estimados através do comando print ai bi 
sigi.
f) Com o uso de uma calculadora ou de uma planilha eletrônica, calcule as 
médias dos coeficientes estimados e da variância estimada e compare 
com os resultados obtidos a partir dos parâmetros utilizados para se 
construir a simulação.
R.: Script para rodar o experimento de Monte Carlo:
15
ECONOMETRIA II
# Geramos os 10 conjuntos de 64 observações para o termo de erro, com distribuição 
normal, média zero e variância 70.
#
series u1 = normal(0,70)
series u2 = normal(0,70)
series u3 = normal(0,70)
series u4 = normal(0,70)
series u5 = normal(0,70)
series u6 = normal(0,70)
series u7 = normal(0,70)
series u8 = normal(0,70)
series u9 = normal(0,70)
series u10 = normal(0,70)
#
# Vamos informar ao Gretl que a variável dependente é formada pela equação:
#
series ys = 157.402 - 0.0114*PNCpc
#
# Vamos gerar valores para y1, y2, ..., y10, formado pelo ys mais o respectivo termo de 
erro.
#
y1 = ys + u1
y2 = ys + u2
y3 = ys + u3
y4 = ys + u4
y5 = ys + u5
y6 = ys + u6
y7 = ys + u7
y8 = ys + u8
y9 = ys + u9
y10 = ys + u10
#
# Agora vamos rodar as regressões individuais e salvar cada coeficiente estimado
#
ols y1 const PNCpc
scalar a1 = $coeff(const)
scalar b1 = $coeff(PNCpc)
scalar sig1 = $sigma^2
ols y2 const PNCpc
scalar a2 = $coeff(const)
scalar b2 = $coeff(PNCpc)
scalar sig2 = $sigma^2
ols y3 const PNCpc
scalar a3 = $coeff(const)
scalar b3 = $coeff(PNCpc)
scalar sig3 = $sigma^2
ols y4 const PNCpc
scalar a4 = $coeff(const)
scalar b4 = $coeff(PNCpc)
16
ECONOMETRIA II
scalar sig4 = $sigma^2
ols y5 const PNCpc
scalar a5 = $coeff(const)
scalar b5 = $coeff(PNCpc)
scalar sig5 = $sigma^2
ols y6 const PNCpc
scalar a6 = $coeff(const)
scalar b6 = $coeff(PNCpc)
scalar sig6 = $sigma^2
ols y7 const PNCpc
scalar a7 = $coeff(const)
scalar b7 = $coeff(PNCpc)
scalar sig7 = $sigma^2
ols y8 const PNCpc
scalar a8 = $coeff(const)
scalar b8 = $coeff(PNCpc)
scalar sig8 = $sigma^2
ols y9 const PNCpc
scalar a9 = $coeff(const)
scalar b9 = $coeff(PNCpc)
scalar sig9 = $sigma^2
ols y10 const PNCpc
scalar a10 = $coeff(const)
scalar b10 = $coeff(PNCpc)
scalar sig10 = $sigma^2
#
# Vamos listar todos os coeficientes estimados e os valores das variâncias
#
print a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 sig1 sig2 sig3 sig4 
sig5 sig6 sig7 sig8 sig9 sig10
Cálculo das médias:
a1 = 164,61888 b1 = -0,00667 sig1 4998,832
a2 = 150,98791 b2 = -0,01146 sig2 4808,426
a3 = 153,50644 b3 = -0,00659 sig3 5906,876
a4 = 169,11214 b4 = -0,01219 sig4 6088,806
a5 = 153,56345 b5 = -0,01112 sig5 5546,94
a6 = 153,694 b6 = -0,009 sig6 4356,784
a7 = 141,33217 b7 = -0,00799 sig7 3869,675
a8 = 156,90551 b8 = -0,01279 sig8 4288,189
a9 = 163,71527 b9 = -0,01519 sig9 5194,889
a10 150,39025 b10 -0,00907 sig10 4551,964
Média 155,782602 Média -0,01021 Média 4961,138
17
ECONOMETRIA II
4 Com base no Quadro 17 do exercício anterior, estime o modelo de 
regressão MIi = α + βPNBpci + ui por mínimos quadrados ordinári-
os e simule um intervalo de confiança para o coeficiente β, através 
do método de bootstrap, simulando erros normais e com 10.000 
repetições (reamostragem).
R.: Modelo estimado por MQO:
Modelo 3: MQO, usando as observações 1-64
Variável dependente: MI
 coeficiente erro padrão razão-t p-valor 
 ----------------------------------------------------------
 const 157,402 9,83276 16,01 1,07e-023 ***
 PNCpc −0,0113839 0,00322857 −3,526 0,0008 ***
Média var. dependente 141,5000 D.P. var. dependente 75,97807
Soma resíd. quadrados 302932,2 E.P. da regressão 69,89995
R-quadrado 0,167032 R-quadrado ajustado 0,153597
F(1, 62) 12,43261 P-valor(F) 0,000800
Log da verossimilhança −361,6083 Critério de Akaike 727,2165
Critério de Schwarz 731,5343 Critério Hannan-Quinn 728,9175
Intervalo de confiança gerado pelo método de bootstrap:
Para o coeficiente em PNCpc (estimativa pontual -0,0113839):
 Intervalo de confiança de 95% = de -0,0177655 a -0,00497657
Baseado em 9999 replicações, com erros normais simulados.
18
ECONOMETRIA II
UNIDADE 3
TÓPICO 1
1 Sobre o agrupamento independente de cortes transversais ao 
longo do tempo, avalie as afirmações a seguir respondendo V para 
verdadeiro e F para falso.
a) (V) A diferença entre agrupamento de cortes transversais ao longo do 
tempo e dados em painel é que o primeiro é extraído de forma 
aleatória e independente entre períodos enquanto, no segundo, 
busca-se acompanhar os mesmos indivíduos ao longo do tempo.
b) (F) Um conjunto de dados sobre eleitores coletados fazendo-se uma 
seleção aleatória de pessoas de uma população na eleição de 2014,e depois, essas mesmas pessoas são entrevistadas na eleição 
de 2018, é um exemplo de agrupamento independente de cortes 
transversais ao longo do tempo porque se refere a dois períodos de 
tempo distintos.
c) (F) Uma das razões para coletarmos dados de corte agrupados de forma 
independente ao longo do tempo é aumentar o tamanho da amostra. 
No entanto, mesmo que tenhamos uma amostra extremamente grande, 
ainda assim teremos dificuldade em obter estimadores mais precisos e 
estatísticas de teste mais poderosas, assintoticamente falando, do que 
se usarmos somente dados de corte ou séries temporais.
d) (V) Em dados de cortes transversais independentes ao longo do tempo, 
não acompanhamos os mesmos indivíduos entre os períodos 
distintos de tempo, por isso não faz sentido fazer a diferenciação de 
pares de observações distintas ao longo do tempo.
2 Ainda sobre modelos painel, classifique as sentenças a seguir em V 
para verdadeiras e F para as falsas:
a) (V) Um experimento natural ocorre quando um evento exógeno, como, 
por exemplo, uma mudança de política do governo, altera o meio no 
qual os agentes operam.
b) (F) A existência de dois grupos e períodos de tempo distintos é suficiente 
para a utilização do método de diferenças-em-diferenças.
c) (V) Para que possamos estimar consistentemente nosso modelo por 
MQO agrupado, deverá ser válida a hipótese que o efeito fixo não 
observado é não correlacionado com as variáveis explicativas ao 
longo do tempo (Assumindo que o erro idiossincrático também não 
tenha correlação com tais variáveis).
19
ECONOMETRIA II
d) (F) O teste de Hausman serve para testar se o estimador de efeitos fixos 
é consistente.
3 Estamos lidando com dados de dois períodos de tempo e 50 unidades 
de corte, representando estados. Estimamos dois modelos, um pelo 
método de painel de efeitos fixos e comparamos os resultados com 
o segundo, estimado considerando efeitos aleatórios. 
 Os resultados são os seguintes:
Coeficientes estimados Efeitos fixos Efeitos aleatórios
β0
13,7883
(2,172)**
5,8405
(5,433)***
δ0d90
0,0979
(0,1906)
-0,9971
(-4,664)***
baixpesoit
0,2950
(0,8370)
0,8193
(7,658)***
rendpcit
-0,0003
(-1,928)*
0,000
(0,2125)
medicit
-0,0055
(-0,1685)
-0,0081
(-2,172)**
Obs.: Entre parênteses estão as estatísticas t, ***, ** e * indicam 
significância estatística a 1, 5 e 10% respectivamente.
Os seguintes testes estatísticos foram empregados:
Teste para diferenciar grupos de intercepções no eixo x=0
Hipótese nula: Os grupos têm a mesma intercepção no eixo x=0
Estatística de teste: F(49, 46) = 6,12419
com valor p = P(F(49, 46) > 6,12419) = 0,0000
Teste Breusch-Pagan -
Hipótese nula: Variância do erro de unidade-específica = 0
Estatística de teste assimptótica: Qui-quadrado(1) = 23,8693
com valor p = 0,0000
Teste Hausman -
Hipótese nula: As estimativas MQG são consistentes
Estatística de teste assimptótica: Qui-quadrado(4) = 6,81765
com valor p = 0,145844
Com base nos resultados, classifique as sentenças a seguir em 
V para verdadeiras e F para as falsas:
a) (F) Se tivéssemos que escolher entre os dois modelos, escolheríamos o 
de efeitos fixos.
b) (V) Os estimadores de efeitos aleatórios gerados por MQG 
são consistentes (não viesados) e distribuídos normal e 
assintoticamente conforme N fica maior com T fixo.
20
ECONOMETRIA II
TÓPICO 2 
Para essa autoatividade, estamos interessados em estudar o 
resultado de uma eleição, por estado, que ocorreu nos EUA em 1976. 
Para tanto, os seguintes dados são usados:
Y = é a variável resultado, que assume valor igual a 1 caso o voto 
popular for a favor do candidato democrata (Jimmy Carter) e 0 se o 
voto for a favor do candidato republicano (Gerry Ford).
Income = renda média em 1975. 
School = número mediano de anos de escolaridade completados por 
pessoas com 18 anos de idade ou mais. 
Urban = porcentagem da população que vive em área urbana. 
A renda média dos estados em 1975 era de $ 13.963, o tempo 
médio de escolaridade era de 12,48 anos e 59,39% da população americana 
vivia nas áreas urbanas dos estados. Os resultados dos modelos de 
Probabilidade Linear, Logit e Probit são apresentados a seguir.
Variável dependente: Y
----------------------------------------------------
 MPL (MQO) Logit Probit 
----------------------------------------------------
const 24,37** 149,8** 87,30**
 (5,370) (3,216) (3,531)
income 0,0000 0,0000 0,0000 
 (0,4689) (0,2210) (0,1230)
school -1,970** -12,39** -7,200**
 (-5,106) (-3,117) (-3,422)
urban 0,00757** 0,05657** 0,03315**
 (3,304) (2,154) (2,222)
----------------------------------------------------
n 51 51 51
R² 0,4909 0,4391 0,4442
R² Ajustado 0,4583 0,3256 0,3307
Count R² 76,5% 76,5%
Critério Akaike 47,425 47,560 47,199
Razão Verossimilhança 30,96[0,00] 31,32[0,00]
----------------------------------------------------
Estatísticas-t entre ( ) 
*, ** indicam significância num nível de 10 e 5 por cento
Para logit e probit, o R-quadrado é o pseudo-R-quadrado de McFadden
21
ECONOMETRIA II
Com base nas estimações dos modelos, pede-se:
1 Como você interpreta o sinal dos coeficientes estimados com 
relação ao aumento ou diminuição da probabilidade do candidato 
democrata Jimmy Carter receber votos?
R.: Eleitores com renda média mais altas e que moram na cidade aumentam 
a probabilidade de votar em Jimmy Carter, enquanto eleitores com maior 
grau de instrução diminuem a probabilidade de votos em Carter.
2 Com base no modelo Logit, estime a probabilidade efetiva do 
candidato democrata ser eleito no estado de New York, sabendo que 
os valores das variáveis explicativas para aquele estado são:
Income = 15.288
School = 12,5
Urban = 88,4
R.: Considerando a equação
( ) ( )0 1 2 3 
1| 
1 NY i i income school urban
P E Y X
e β β β β− + + +
= =
+
( ) ( ) ( ) ( )( )149,8 0,00*15.288 12,39*12,5 0,5657*88,4
1| 
1
NY i iP E Y X
e− + + − +
= =
+
( ) ( )0,0742
1| 
1NY i i
P E Y X
e− −
= =
+
( )| 0, 4815 NY i iP E Y X= =
 Portanto, a probabilidade do estado de NY votar em Jimmy Carter é 
de 48,15%.
3 Você acredita que estimar o modelo de probabilidade linear estimado 
por MQO é adequado? Caso sua resposta seja sim, diga o porquê. 
Caso seja não, diga o porquê e informe qual seria a alternativa para 
estimar este modelo.
R.: Ao estimar o modelo por MQO, temos dois problemas. O primeiro é a 
distribuição do termo de erro que não é normal (distribuição de Bernoulli) 
e a segunda é a variância do erro que é heteroscedástica. Com isso, 
apesar dos estimadores de MQO serem não tendenciosos, eles não são 
eficientes (não têm variância mínima). A saída é estimar por Mínimos 
Quadrados Ponderados.
22
ECONOMETRIA II
4 Com base nos resultados apresentados, qual dos três modelos 
estimados você escolheria para dar sequência ao seu estudo e 
por quê?
R.: Como o modelo estimado por MQO não é adequado, o Cout R2 é igual nos 
modelos Logit e Probit e a Razão de Verossimilhança é estatisticamente 
significativa, usamos o critério de informação de Akaike para definir o 
modelo mais parcimonioso. Neste caso, o modelo a ser escolhido é o Probit.
5 Se você tivesse que traçar uma estratégia de marketing para o Jimmy 
Carter, com base nos resultados obtidos, visando ganhar as eleições 
nos EUA, em que você concentraria a sua campanha, na população 
de maior renda, com maior escolaridade ou nos moradores da área 
urbana? Comente.
R.: Essa é uma questão subjetiva, depende da capacidade de argumentação 
dos alunos. Em geral, como a maior parte da população está concentrada 
nos centros urbanos, parece óbvio concentrar a campanha nas cidades 
ao invés do interior. Por outro lado, como ele perde voto entre os que 
têm um nível escolar maior, umaestratégia interessante seria concentrar 
esforços nesses eleitores, visando reduzir a sua rejeição entre eles.
TÓPICO 3
Em relação ao conteúdo desenvolvido no Tópico 3, responda 
às questões a seguir. 
1 Sobre a estimação por máxima verossimilhança, classifique as 
sentenças a seguir em V para verdadeira e F para as falsas. 
a) (F) O método de máxima verossimilhança é uma técnica desenvolvida 
exclusivamente para se estimar modelos econométricos não lineares
b) (V) Se conhecermos a distribuição de probabilidade de uma população 
qualquer de dados, os parâmetros estimados a partir de uma amostra 
aleatória maximizam a probabilidade de que esses valores obtidos 
seguem a distribuição da população em questão.
c) (V) Os coeficientes gerados pelo método de MQO e máxima 
verossimilhança são semelhantes quando ui~N(0, σ
2)
23
ECONOMETRIA II
d) (F) Em amostras grandes, os estimadores de máxima verossimilhança 
são tendenciosos e inconsistentes, motivo pelo qual empregamos o 
método de mínimos quadrados ordinários.
2 A estatística é dividida em duas grandes vertentes. Indique quais 
são elas e qual a principal diferença entre essas vertentes.
R.: A estatística pode ser dividida em estatística clássica e estatística 
bayesiana. 
 Na análise clássica, o parâmetro β é uma estimativa pontual, obtida com 
base em uma amostra da população, obtida de forma aleatória. 
 Do ponto de vista da análise bayesiana, não obtemos um estimador 
pontual para o parâmetro β, mas sim uma função de densidade para β, 
chamada de função de densidade posterior.
 A diferença entre essas duas abordagens é que, na abordagem bayesiana, 
a função de densidade posterior não se relaciona ao β, porque não é 
uma distribuição amostral, mas se relaciona ao β da população.
3 Cite as etapas da técnica bayesiana.
R.: 1) Formalização da distribuição posterior, 2) obtém-se a distribuição 
posterior, e 3) combinar a distribuição posterior com uma função de 
perda esperada ou uma função de utilidade.
4 Uma das formas de expresser o teorema de Bayes do ponto de vista 
da econometria bayesiana é fazendo:
Prob(Parâmetros|Dados) α Prob(Dados|Parâmetros) x 
Prob(Parâmetros) 
 Explique o que significa essa expressão matemática.
R.: Essa expressão é lida como: “o posterior é proporcional à probabilidade 
vezes o anterior”. A primeira parte é a distribuição posterior, ou seja, a 
probabilidade de se encontrar os parâmetros após se observar os dados. A 
segunda parte da expressão é a distribuição anterior, ou seja, a probabilidade 
de se encontrar os parâmetros antes de se observar os dados.
24
ECONOMETRIA II
5 Defina big data e mineração de dados.
R.: Big data é um conjunto de dados cujo tamanho está além da capacidade 
que os tradicionais softwares de banco de dados têm para capturar, 
armazenar, gerenciar e analisar.
 A mineração de dados é um processo sistemático, interativo e iterativo 
de preparação e extração de conhecimentos a partir do big data.
6 Na mineração de dados, há uma multidisciplinaridade, dentro da 
qual a econometria pode ser facilmente inserida. Cite as disciplinas 
que compõem a mineração de dados.
R.: Estatística, matemática, engenharia, inteligência artificial, banco de 
dados, sistemas de informação e visualização.