Buscar

Aula_7

Prévia do material em texto

1
Aula 7 – Econometria
Profa. Dra. Margarida Garcia de Figueiredo
margaridagf@ufmt.br
mgfiguei@gmail.com
03/07/2014
2
ESPECIFICAÇÃO DE MODELO E TESTE 
DIAGNÓSTICO
CRITÉRIOS DE ESCOLHA OU DE SELEÇÃO DE MODELOS
Um modelo escolhido para análise aplicada deve satisfazer
alguns critérios:
1. Ser confirmado pelos dados (as previsões feitas com base
no modelo devem ser logicamente possíveis).
2. Ser consistente com a teoria (ele deve fazer sentido do ponto
de vista econômico).
3. Ter regressores fracamente exógenos (os regressores não
devem ser correlacionados com o termo de erro).
3
ESPECIFICAÇÃO DE MODELO E TESTE 
DIAGNÓSTICO
4. Apresentar suporte estatístico (teste t e teste F).
5. Mostrar consistência de dados (os resíduos estimados do
modelo devem ser puramente aleatórios: tecnicamente,
ruídos brancos). Se o modelo estimado for adequado, os
resíduos estimados devem se comportar como ruídos
brancos.
CRITÉRIOS DE ESCOLHA OU DE SELEÇÃO DE MODELOS
4
ESPECIFICAÇÃO DE MODELO E TESTE 
DIAGNÓSTICO
Plotar resíduos estimados do modelo:
-20,0000
-15,0000
-10,0000
-5,0000
0,0000
5,0000
10,0000
15,0000
20,0000
𝐸 𝜀𝑡 = 0
𝑣𝑎𝑟 𝜀𝑡 = 𝜎
2
𝑐𝑜𝑣 𝜀𝑡 , 𝜀𝑡+𝑠 = 0 𝑠 ≠ 0
Um termo de erro com 
estas propriedades é 
chamado de ruído
branco
CRITÉRIOS DE ESCOLHA OU DE SELEÇÃO DE MODELOS
5
• Na prática, nunca teremos a certeza absoluta
de que o modelo que estamos testando
empiricamente é de fato o verdadeiro.
• Teoria econômica ou trabalhos anteriores:
formulamos um modelo que julgamos ser capaz
de explicar o fenômeno estudado.
• Após a obtenção dos resultados, submetemos o
modelo aos testes empíricos (teste t, teste F,
R2, critérios, análise dos resíduos) para verificar
se o mesmo está adequado.
ESPECIFICAÇÃO DE MODELO E TESTE 
DIAGNÓSTICO
6
• Diagnósticos razoavelmente bons: afirmamos
que o modelo escolhido é uma representação
adequada da realidade
• Resultados não promissores: preocupação
quanto à adequação do modelo e procura de
soluções
ESPECIFICAÇÃO DE MODELO E TESTE 
DIAGNÓSTICO
 Erro de especificação?
 Violação de alguma premissa básica?
7
ESPECIFICAÇÃO DE MODELO E TESTE 
DIAGNÓSTICO
1. Omissão de variável relevante
2. Inclusão de variável irrelevante
3. Adoção da forma funcional errada
4. Erros de medida
TIPOS DE ERROS DE ESPECIFICAÇÃO
8
1. Omissão de variável relevante
• Estimar a quantidade demandada de um determinado 
produto
 tttt RPQ  210
Modelo
correto
 ttt PQ  10
Modelo
estimado
9
1. Omissão de variável relevante
As consequências da omissão da variável renda no modelo
seriam:
1. Os estimadores de 𝛼0 e 𝛼1 serão tendenciosos e inconsistentes.
2. A variância do erro 𝜎2 será estimada incorretamente (será
tendenciosa).
3. Os procedimentos usuais de intervalo de confiança e teste de
hipóteses provavelmente darão conclusões enganosas a respeito
da significância estatística dos parâmetros estimados.
4. As previsões alicerçadas no modelo incorreto não serão
confiáveis.
10
2. Inclusão de variável irrelevante
• Ao invés de omitir a variável renda, incluir uma terceira
variável, por exemplo, o número de pessoas em cada
família (N)
  NRPQ tt ttt 3210
As consequências serão menos graves:
1. Os estimadores continuam não-tendenciosos e consistentes.
2. A variância do erro será estimada corretamente.
3. Porém, os parâmetros estimados serão ineficientes. A variância
dos parâmetros estimados será elevada, tendendo a fazer com
que os mesmos sejam não significativos de acordo com o teste
“t”.
11
3. Adoção da forma funcional errada
 






X
Y
2
21
1
  XXY 33221 lnln
  XXY 33221ln
  XY 221 lnlnln
Diferentes
Formas
Funcionais
12
4. Erros de medida
• Supomos que a variável dependente Y e as variáveis
explicativas X1, X2, ..., Xn, sejam medidas sem qualquer
erro.
• Supomos que os valores destas variáveis adotadas no
modelo não sejam valores “chutados”, extrapolados,
interpolados ou arredondados de algum modo
sistemático.
• Infelizmente, na prática não se atinge este ideal por uma
série de razões, como erros por inexistência de
respostas, erros de relatório, erros de cálculo, etc.
13
4. Erros de medida
AS CONSEQUÊNCIAS ASSOCIADAS AOS ERROS DE
MEDIDA SÃO:
• Erros de medida na variável dependente Y: os
estimadores de MQO serão não-viesados e
consistentes, porém, eles serão menos eficientes, uma
vez que as variâncias dos parâmetros estimados serão
maiores.
• Erros de medida nas variáveis independentes X:
quando ocorrerem, os estimadores de MQO serão
enviesados e inconsistentes.
14
Muitas vezes, erros de especificação 
surgem sem percebermos, talvez devido a 
nossa incapacidade de formular o modelo 
tão precisamente quanto possível, porque 
a teoria que fundamenta é fraca ou por 
não termos o tipo certo de dados para 
testar o modelo. A questão relevante, 
porém, não é como se cometem tais erros 
(já que em geral os cometemos), mas sim 
como detectá-los
ESPECIFICAÇÃO DE MODELO E TESTE 
DIAGNÓSTICO
15
TESTES PARA DETECÇÃO DE 
ERROS DE ESPECIFICAÇÃO
FERRAMENTAS DE DIAGNÓSTICO
16
DETECÇÃO DE ERROS DE ESPECIFICAÇÃO 
Ferramentas de Diagnóstico
DETECÇÃO DA PRESENÇA DE VARIÁVEIS DESNECESSÁRIAS
Imagine que formulamos o seguinte modelo:
𝑌𝑖 = 𝛽1 + 𝛽2𝑋2𝑖 + ⋯+ 𝛽𝑘𝑋𝑘𝑖 + 𝜀𝑖
Dado esse modelo, podemos verificar se um ou mais
regressores são realmente significativos através dos testes t
e F.
Porém, não devemos utilizar estes testes para construir de modo
iterativo um modelo.
Essa estratégia de construção de modelo é conhecida como
“abordagem de baixo para cima” ou “garimpagem de dados”.
17
DETECÇÃO DE ERROS DE ESPECIFICAÇÃO 
Ferramentas de Diagnóstico
DETECÇÃO DA PRESENÇA DE VARIÁVEIS DESNECESSÁRIAS
Muitos pesquisadores criticam a prática da “garimpagem de
dados”.
Uma das razões para se condenar esta prática está relacionada à
alteração do nível de significância (𝛼 ) para realização dos
testes t e F.
Na presença da “garimpagem de dados”, os níveis convencionais
de significância ( 𝛼 𝑖𝑔𝑢𝑎𝑙 𝑎 1%, 5% 𝑜𝑢 10% ) não são os
verdadeiros níveis de significância.
18
DETECÇÃO DE ERROS DE ESPECIFICAÇÃO 
Ferramentas de Diagnóstico
DETECÇÃO DA PRESENÇA DE VARIÁVEIS DESNECESSÁRIAS
Lovell (1983) sugeriu que se houver c regressores candidatos dentre os
quais k são eleitos (𝑘 ≤ 𝑐) com base na “garimpagem de dados”, então
o verdadeiro nível de significância (𝛼∗) está relacionado com o nível de
significância nominal (𝛼) do seguinte modo:
𝛼∗ ≈ 𝑐 𝑘 𝛼
Por exemplo, se 𝑐 = 15, 𝑘 = 5 e 𝛼 = 5% , o verdadeiro nível de
significância é 15 5 5 = 15%.
Portanto, se um pesquisador garimpa e seleciona 5 de 15 regressores,
encontrando um modelo ajustado a 5% de significância, a conclusão
deve ser vista com cautela, pois o verdadeiro nível de significância é
15%.
Se não houver a “garimpagem de dados” e 𝑐 = 𝑘 , então 𝛼 = 𝛼∗.
19
DETECÇÃO DE ERROS DE ESPECIFICAÇÃO
Ferramentas de Diagnóstico
Embora a “garimpagem de dados” seja
um método criticado por alguns
pesquisadores, na prática é um método
bastante utilizado em econometria
aplicada, e a sua utilização tem sido
defendida por diversos pesquisadores.
20
DETECÇÃO DE ERROS DE ESPECIFICAÇÃO 
Ferramentas de Diagnóstico
TESTES PARA VERIFICAR A OMISSÃO DE VARIÁVEIS E A FORMA 
FUNCIONAL INCORRETA
• (i) Exame dos resíduos; 
• (ii) Estatística d de Durbin-Watson; 
• (iii) Teste RESET de Ramsey; 
• (iv) Teste do multiplicador de Lagrange
21
DETECÇÃO DOS ERROSDE 
ESPECIFICAÇÃO
(i) EXAME DOS RESÍDUOS:
Se plotarmos o gráfico dos resíduos da 
regressão (contra as observações), ele nos dá
um bom diagnóstico visual para a presença de 
erros de especificação.
Os resíduos de modelos mal especificados
apresentam acentuadas oscilações cíclicas.
22
DETECÇÃO DOS ERROS DE 
ESPECIFICAÇÃO
(i) EXAME DOS RESÍDUOS:
Exemplo: Função de custo total (onde Y representa o custo total e X a 
produção)
Y = Custo total
X = Produção
Y X X² X³
193 1 1 1
226 2 4 8
240 3 9 27
244 4 16 64
257 5 25 125
260 6 36 216
274 7 49 343
297 8 64 512
350 9 81 729
420 10 100 1000
23
DETECÇÃO DOS ERROS DE 
ESPECIFICAÇÃO
(i) EXAME DOS RESÍDUOS:
• Exemplo: Função de custo total (onde Y representa o custo total e 
X a produção)
 iiiii XXXY  342321
 iii XY  21
 iiii XXY  2321
Recorrer ao exame dos resíduos
FORMA LINEAR
FORMA QUADRÁTICA
FORMA CÚBICA
24
DETECÇÃO DOS ERROS DE 
ESPECIFICAÇÃO
Exame dos resíduos: Implementação no GretL
Rodar o modelo normalmente, depois plota o gráfico
dos resíduos.
Gráficos…
Gráfico dos resíduos…
Por número de observação…
OK
25
DETECÇÃO DOS ERROS DE 
ESPECIFICAÇÃO
Exame dos resíduos: Implementação no GretL
26
EXAME DOS RESÍDUOS: FORMA LINEAR
27
EXAME DOS RESÍDUOS: FORMA QUADRÁTICA
28
EXAME DOS RESÍDUOS: FORMA CÚBICA
Obs: comportamento de ruído branco
29
DETECÇÃO DOS ERROS DE 
ESPECIFICAÇÃO
Trata-se de um teste geral para detecção
de erros de especificação, proposto pelo
pesquisador Ramsey. É um dos testes 
mais aplicados na literatura.
(iii) TESTE RESET DE RAMSEY:
30
DETECÇÃO DOS ERROS DE 
ESPECIFICAÇÃO
TESTE RESET DE RAMSEY: Continua exemplo do custo
de produção
 iii XY  21
Sugere que: se incluirmos, de algum modo, o Yest como um
regressor do modelo, isto elevará o valor do R2.
Se este aumento for 
estatisticamente significativo, 
provavelmente a função
tenha sido mal especificada.
Idéia que está por trás do 
teste RESET
(1)
ei
Yest
(forma linear)
31
DETECÇÃO DOS ERROS DE 
ESPECIFICAÇÃO
TESTE RESET DE RAMSEY: etapas de sua aplicação
1. Estimamos o modelo normalmente, de acordo com a função (1), 
e obtemos os valores de 𝑌𝑖 (Yi estimados)
2. Reestimamos o modelo incluindo e como regressores
adicionais, portanto, calculamos:
^
3
Y i
^
2
Y i
  ^ 34^
2
321 YYXY i ii
ii
(2)
32
DETECÇÃO DOS ERROS DE ESPECIFICAÇÃO
Teste RESET de Ramsey: etapas de sua aplicação Exemplo Função Custo
Obs Y X Yest Y
2
est Y
3
est
1 193 1 186 34.745 6.476.461
2 226 2 206 42.573 8.784.321
3 240 3 226 51.197 11.584.085
4 244 4 246 60.614 14.923.275
5 257 5 266 70.827 18.849.413
6 260 6 286 81.834 23.410.019
7 274 7 306 93.636 28.652.616
8 297 8 326 106.233 34.624.725
9 350 9 346 119.624 41.373.868
10 420 10 366 133.810 48.947.566
 iii XY  21
 𝑌𝑖 = 166,47 + 19,9𝑋𝑖
(Calcular para cada observação)
Novo Modelo:
  ^ 34^
2
321 YYXY i ii
ii
Segunda etapa da aplicação
Feito isso, calculamos
o R2 para os dois
modelos: o modelo
original (velho) e o 
modelo incluindo os
novos regressores
(novo)
“velho”
“novo”
Modelo Original:
33
DETECÇÃO DOS ERROS DE 
ESPECIFICAÇÃO
TESTE RESET DE RAMSEY: etapas de sua aplicação
3. Chamamos o R2 obtido de (2) de R2novo e o obtido de (1) de
R2velho. Então, podemos aplicar um teste de hipóteses do
tipo F para verificar se existe diferença estatisticamente
significativa entre os dois valores de R2.
Se existir diferença estatisticamente significativa entre os dois
valores de R2, isso significa que havíamos cometido um erro de 
especificação ao estimar o modelo original.
34
O teste de hipóteses do tipo F
RRH novovelho
22
0 : 
RRH novovelhoA
22: 
A Hipótese nula diz que o o modelo foi
corretamente especificado
A Hipótese alternativa diz que
cometemos um erro de especificação
2. Calcula a estatística de teste:
3. Consulta o valor crítico de F na tabela:
Ftab = ?
m = no de regressores do novo modelo
n-p = obs – parâm (do novo modelo)
Alfa a 1%, 5% ou 10%
pnR
mRR
F
novo
velhonovo
calc



/)1(
/)(
2
22
1. Estabelece as hipóteses:
35
Fcalc > Ftab
Rejeita-se a hipótese nula, 
concluindo que os dois 
parâmetros do novo 
modelo são 
estatisticamente 
significativos e, portanto, 
de fato a especificação do 
modelo estava errada.
4. Verifica o resultado do teste com base no valor crítico
O teste de hipóteses do tipo F
36
DETECÇÃO DOS ERROS DE 
ESPECIFICAÇÃO
EXEMPLO: Função custo total na forma linear
 iii XY  21
  ^ 34^
2
321 YYXY i ii
ii
R2velho = 0,840891 
R2novo = 0,998341 
pnR
mRR
F
novo
velhonovo
calc



/)1(
/)(
2
22 𝑭𝒄𝒂𝒍𝒄 =
0,9983 − 0,8408 /3
 1 − 0,9983 (10 − 4)
= 𝟏𝟖𝟗, 𝟖𝟏
𝑭𝒄𝒓í𝒕𝒊𝒄𝒐 = 𝟗, 𝟕𝟖 𝑝𝑎𝑟𝑎 𝛼 = 1%
𝐹𝑐𝑎𝑙𝑐 > 𝐹𝑐𝑟í𝑡𝑖𝑐𝑜 ∴ 𝑅𝑒𝑗𝑒𝑖𝑡𝑎 𝐻0 𝑎 1% 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐â𝑛𝑐𝑖𝑎
Conclusão: o modelo linear está incorretamente especificado
37
DETECÇÃO DOS ERROS DE 
ESPECIFICAÇÃO
Observações sobre o Teste RESET de Ramsey
O teste RESET indica apenas se o modelo está
especificado incorretamente ou não, porém, não diz nada 
quanto ao tipo de erro de especificação que está
ocorrendo: (1) omissão de variável relevante ou (2) forma 
funcional incorreta.
A alternativa seria incluir outras variáveis ou tentar utilizar
outra forma funcional, enfim, ir testando até encontrar a 
solução do problema. Em geral, começamos pela inclusão
de algumas variáveis.
38
ATENÇÃO
Não confundir o teste t (feito para 
verificar se cada parâmetro é 
estatisticamente significativo) e o teste 
F (feito para testar a significância 
estatística global do modelo) 
com o teste RESET.
39
ATENÇÃO
Todos são Testes de Hipóteses, e 
devem seguir aquela sequência já 
conhecida para testes de hipóteses, 
porém, cada um tem um propósito e 
um significado diferente.
40
O teste t (significância individual dos parâmetros)
0:0  jH
0: 
jAH
A Hipótese nula diz que o parâmetro em
questão não é estatisticamente significativo
Hipótese alternativa diz que o parâmetro em
questão é estatisticamente significativo
s
t
j
j
calc
^
^



Calcula a estatística de teste:
Consulta o valor crítico de t na tabela:
ttab = ?
GL = n – p
Alfa a 1%, 5% ou 10%
Se o tcalc > ttab
Rejeita H0
concluindo que o 
parâmetro é 
estatisticamente 
significativo a XX% 
de probabilidade
41
O teste F (significância global do modelo)
A Hipótese nula diz que todos os
parâmetros são iguais a zero
Hipótese alternativa diz que pelo menos
um parâmetro seja diferente de zero
Calcula a estatística de teste:
Consulta o valor crítico de F na tabela:
Ftab = ?
p-1
n – p
Alfa a 1%, 5% ou 10%
Se o Fcalc > Ftab
Rejeita H0
concluindo que o 
modelo é 
estatisticamente 
significativo a XX% 
de probabilidade
𝐻0: 𝛽0=0; 𝛽1=0;...; 𝛽𝑘=0
𝐻𝐴: 𝑝𝑒𝑙𝑜 𝑚𝑒𝑛𝑜𝑠 𝑢𝑚 𝛽𝑖 ≠ 0
𝐹𝑐𝑎𝑙𝑐 =
𝑆𝑄𝑅𝑒𝑔
𝑝 − 1
𝑆𝑄𝑅𝑒𝑠
𝑛 − 𝑝
42
O teste RESET (também é um teste F)
RRH novovelho
22
0 : 
RRH novovelhoA
22: 
A Hipótese nula diz que o o modelo foi
corretamente especificado
A Hipótese alternativa diz que
cometemos um erro de especificação
Calcula a estatística de teste:
Consulta o valor crítico de t na tabela:
Ftab = ?
m = no de regressores do novo modelo
n-p = obs – parâm do novomodelo
Alfa a 1%, 5% ou 10%
Se o Fcalc > Ftab
Rejeita H0
concluindo que de 
fato cometemos um 
erro de 
especificação, com 
XX% de 
probabilidade.
pnR
mRR
F
novo
velhonovo
calc



/)1(
/)(
2
22
43
ATENÇÃO
Na saída dos programas (GretL, Eviews, etc.) 
devemos olhar para o valor do p referente ao teste, e 
seguir aquela regra de multiplicar o valor por 100.
0 < p < 1
1 < p < 5
5 < p < 10
Rejeita H0 a 1% de significância
Rejeita H0 a 5% de significância
Rejeita H0 a 10% de significância
Em todos estes casos, sempre que o resultado apontar para 
estatisticamente significativo, devemos rejeitar a Hipótese Nula (H0)
e tirar a conclusão com base no que diz H0
44
TESTE RESET DE RAMSEY: Implementação no GretL
Rodar o modelo normalmente, depois faz o teste.
Testes…
RESET de Ramsey…
Quadrados e cubos…
OK
DETECÇÃO DOS ERROS DE 
ESPECIFICAÇÃO
45
Teste RESET de Ramsey: Implementação no GretL
Janela da 
equação
estimada
46
Teste RESET de Ramsey: Implementação no GretL
Clicar em OK 
para realização
do teste. 
Aparece a janela
com o resultado
do teste.
47
Teste RESET de Ramsey: Implementação no GretL
Rejeita H0 a 1% de significância 
concluindo pela presença de erro de 
especificação
Forma Linear
48
Teste RESET de Ramsey: Implementação no GretL
Testando o modelo da 
função de custo na 
forma cúbica
49
Teste RESET de Ramsey: Implementação no GretL
Não rejeita H0 concluindo 
pela ausência de erro de 
especificação
Forma Cúbica
50
TESTE RESET DE RAMSEY: Implementação no Eviews
Rodar o modelo normalmente, depois faz o teste.
View…
Stability Diagnostics…
Ramsey RESET Test…
Number of fitted terms: 2
DETECÇÃO DOS ERROS DE 
ESPECIFICAÇÃO
51
TESTE RESET DE RAMSEY: Implementação no Eviews
Janela da 
equação
estimada
52
TESTE RESET DE RAMSEY: Implementação no Eviews
Clicar em OK 
para realização
do teste.
Aparece a janela
com o resultado
do teste.
53
CRITÉRIOS PARA SELEÇÃO DE 
MODELOS CONCORRENTES
• Existem alguns critérios utilizados para escolher entre
modelos concorrentes e/ou comparar modelos para
fins de previsão.
• Dentre os vários critérios empregados para esta
finalidade, examinaremos três:
1. Critério de R2 ajustado
2. Critério de Informação de Akaike (CIA)
3. Critério de Informação de Schwarz (CIS)
54
CRITÉRIOS PARA SELEÇÃO DE 
MODELOS CONCORRENTES
• Critério do R2 ajustado
)1(
)(
Re
1
2



n
SQTot
pn
sSQ
R
O critério será: quanto mais próximo de 1 for o 
R2, melhor será o ajustamento, lembrando que o 
regressando tem de ser o mesmo para que a 
comparação seja válida
55
CRITÉRIOS PARA SELEÇÃO DE 
MODELOS CONCORRENTES
• Critério de Informação de Akaike (CIA)
n
SQR
eCIA
nk /2
O critério será: quanto menor for o CIA, melhor
será o ajustamento, lembrando que o 
regressando tem de ser o mesmo para que a 
comparação seja válida













n
SQR
n
k
CIA ln
2
ln
k é o número de parâmetros
n é o número de observações
56
CRITÉRIOS PARA SELEÇÃO DE 
MODELOS CONCORRENTES
• Critério de Informação de Schwarz (CIS)
n
SQR
nCIS
nk /
O critério será: quanto menor for o CIS, melhor será
o ajustamento, lembrando que o regressando tem de 
ser o mesmo para que a comparação seja válida







n
SQR
n
n
k
CIS lnlnln
k é o número de parâmetros
n é o número de observações
57
CRITÉRIOS PARA SELEÇÃO DE 
MODELOS CONCORRENTES
Exemplo de Custo Total
Gretl
58
CRITÉRIOS PARA SELEÇÃO DE MODELOS 
CONCORRENTES
Obs Y X X2 X3
1 193 1 1 1
2 226 2 4 8
3 240 3 9 27
4 244 4 16 64
5 257 5 25 125
6 260 6 36 216
7 274 7 49 343
8 297 8 64 512
9 350 9 81 729
10 420 10 100 1000
Exemplo: Custo total de produção
Função linear:
Função quadrática:
Função Cúbica:
𝑌 = 𝛼0+𝛼1X+𝜀
𝑌 = 𝛽0+𝛽1X+𝛽2𝑋
2+𝜀
𝑌 = 𝛾0+𝛾1X+𝛾2𝑋
2+ 𝛾3𝑋
3+𝜀
59
CRITÉRIOS PARA SELEÇÃO DE MODELOS 
CONCORRENTES
60
CRITÉRIOS PARA SELEÇÃO DE MODELOS 
CONCORRENTES
61
CRITÉRIOS PARA SELEÇÃO DE MODELOS 
CONCORRENTES
62
CRITÉRIOS PARA SELEÇÃO DE MODELOS 
CONCORRENTES
R2 ajustado Schwarz Akaike
Linear 0,82 97,29 96,68
Quadrático 0,91 91,60 90,70
Cúbico 0,99 56,27 55,06
Comparação entre os critérios

Continue navegando