Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Aula 7 – Econometria Profa. Dra. Margarida Garcia de Figueiredo margaridagf@ufmt.br mgfiguei@gmail.com 03/07/2014 2 ESPECIFICAÇÃO DE MODELO E TESTE DIAGNÓSTICO CRITÉRIOS DE ESCOLHA OU DE SELEÇÃO DE MODELOS Um modelo escolhido para análise aplicada deve satisfazer alguns critérios: 1. Ser confirmado pelos dados (as previsões feitas com base no modelo devem ser logicamente possíveis). 2. Ser consistente com a teoria (ele deve fazer sentido do ponto de vista econômico). 3. Ter regressores fracamente exógenos (os regressores não devem ser correlacionados com o termo de erro). 3 ESPECIFICAÇÃO DE MODELO E TESTE DIAGNÓSTICO 4. Apresentar suporte estatístico (teste t e teste F). 5. Mostrar consistência de dados (os resíduos estimados do modelo devem ser puramente aleatórios: tecnicamente, ruídos brancos). Se o modelo estimado for adequado, os resíduos estimados devem se comportar como ruídos brancos. CRITÉRIOS DE ESCOLHA OU DE SELEÇÃO DE MODELOS 4 ESPECIFICAÇÃO DE MODELO E TESTE DIAGNÓSTICO Plotar resíduos estimados do modelo: -20,0000 -15,0000 -10,0000 -5,0000 0,0000 5,0000 10,0000 15,0000 20,0000 𝐸 𝜀𝑡 = 0 𝑣𝑎𝑟 𝜀𝑡 = 𝜎 2 𝑐𝑜𝑣 𝜀𝑡 , 𝜀𝑡+𝑠 = 0 𝑠 ≠ 0 Um termo de erro com estas propriedades é chamado de ruído branco CRITÉRIOS DE ESCOLHA OU DE SELEÇÃO DE MODELOS 5 • Na prática, nunca teremos a certeza absoluta de que o modelo que estamos testando empiricamente é de fato o verdadeiro. • Teoria econômica ou trabalhos anteriores: formulamos um modelo que julgamos ser capaz de explicar o fenômeno estudado. • Após a obtenção dos resultados, submetemos o modelo aos testes empíricos (teste t, teste F, R2, critérios, análise dos resíduos) para verificar se o mesmo está adequado. ESPECIFICAÇÃO DE MODELO E TESTE DIAGNÓSTICO 6 • Diagnósticos razoavelmente bons: afirmamos que o modelo escolhido é uma representação adequada da realidade • Resultados não promissores: preocupação quanto à adequação do modelo e procura de soluções ESPECIFICAÇÃO DE MODELO E TESTE DIAGNÓSTICO Erro de especificação? Violação de alguma premissa básica? 7 ESPECIFICAÇÃO DE MODELO E TESTE DIAGNÓSTICO 1. Omissão de variável relevante 2. Inclusão de variável irrelevante 3. Adoção da forma funcional errada 4. Erros de medida TIPOS DE ERROS DE ESPECIFICAÇÃO 8 1. Omissão de variável relevante • Estimar a quantidade demandada de um determinado produto tttt RPQ 210 Modelo correto ttt PQ 10 Modelo estimado 9 1. Omissão de variável relevante As consequências da omissão da variável renda no modelo seriam: 1. Os estimadores de 𝛼0 e 𝛼1 serão tendenciosos e inconsistentes. 2. A variância do erro 𝜎2 será estimada incorretamente (será tendenciosa). 3. Os procedimentos usuais de intervalo de confiança e teste de hipóteses provavelmente darão conclusões enganosas a respeito da significância estatística dos parâmetros estimados. 4. As previsões alicerçadas no modelo incorreto não serão confiáveis. 10 2. Inclusão de variável irrelevante • Ao invés de omitir a variável renda, incluir uma terceira variável, por exemplo, o número de pessoas em cada família (N) NRPQ tt ttt 3210 As consequências serão menos graves: 1. Os estimadores continuam não-tendenciosos e consistentes. 2. A variância do erro será estimada corretamente. 3. Porém, os parâmetros estimados serão ineficientes. A variância dos parâmetros estimados será elevada, tendendo a fazer com que os mesmos sejam não significativos de acordo com o teste “t”. 11 3. Adoção da forma funcional errada X Y 2 21 1 XXY 33221 lnln XXY 33221ln XY 221 lnlnln Diferentes Formas Funcionais 12 4. Erros de medida • Supomos que a variável dependente Y e as variáveis explicativas X1, X2, ..., Xn, sejam medidas sem qualquer erro. • Supomos que os valores destas variáveis adotadas no modelo não sejam valores “chutados”, extrapolados, interpolados ou arredondados de algum modo sistemático. • Infelizmente, na prática não se atinge este ideal por uma série de razões, como erros por inexistência de respostas, erros de relatório, erros de cálculo, etc. 13 4. Erros de medida AS CONSEQUÊNCIAS ASSOCIADAS AOS ERROS DE MEDIDA SÃO: • Erros de medida na variável dependente Y: os estimadores de MQO serão não-viesados e consistentes, porém, eles serão menos eficientes, uma vez que as variâncias dos parâmetros estimados serão maiores. • Erros de medida nas variáveis independentes X: quando ocorrerem, os estimadores de MQO serão enviesados e inconsistentes. 14 Muitas vezes, erros de especificação surgem sem percebermos, talvez devido a nossa incapacidade de formular o modelo tão precisamente quanto possível, porque a teoria que fundamenta é fraca ou por não termos o tipo certo de dados para testar o modelo. A questão relevante, porém, não é como se cometem tais erros (já que em geral os cometemos), mas sim como detectá-los ESPECIFICAÇÃO DE MODELO E TESTE DIAGNÓSTICO 15 TESTES PARA DETECÇÃO DE ERROS DE ESPECIFICAÇÃO FERRAMENTAS DE DIAGNÓSTICO 16 DETECÇÃO DE ERROS DE ESPECIFICAÇÃO Ferramentas de Diagnóstico DETECÇÃO DA PRESENÇA DE VARIÁVEIS DESNECESSÁRIAS Imagine que formulamos o seguinte modelo: 𝑌𝑖 = 𝛽1 + 𝛽2𝑋2𝑖 + ⋯+ 𝛽𝑘𝑋𝑘𝑖 + 𝜀𝑖 Dado esse modelo, podemos verificar se um ou mais regressores são realmente significativos através dos testes t e F. Porém, não devemos utilizar estes testes para construir de modo iterativo um modelo. Essa estratégia de construção de modelo é conhecida como “abordagem de baixo para cima” ou “garimpagem de dados”. 17 DETECÇÃO DE ERROS DE ESPECIFICAÇÃO Ferramentas de Diagnóstico DETECÇÃO DA PRESENÇA DE VARIÁVEIS DESNECESSÁRIAS Muitos pesquisadores criticam a prática da “garimpagem de dados”. Uma das razões para se condenar esta prática está relacionada à alteração do nível de significância (𝛼 ) para realização dos testes t e F. Na presença da “garimpagem de dados”, os níveis convencionais de significância ( 𝛼 𝑖𝑔𝑢𝑎𝑙 𝑎 1%, 5% 𝑜𝑢 10% ) não são os verdadeiros níveis de significância. 18 DETECÇÃO DE ERROS DE ESPECIFICAÇÃO Ferramentas de Diagnóstico DETECÇÃO DA PRESENÇA DE VARIÁVEIS DESNECESSÁRIAS Lovell (1983) sugeriu que se houver c regressores candidatos dentre os quais k são eleitos (𝑘 ≤ 𝑐) com base na “garimpagem de dados”, então o verdadeiro nível de significância (𝛼∗) está relacionado com o nível de significância nominal (𝛼) do seguinte modo: 𝛼∗ ≈ 𝑐 𝑘 𝛼 Por exemplo, se 𝑐 = 15, 𝑘 = 5 e 𝛼 = 5% , o verdadeiro nível de significância é 15 5 5 = 15%. Portanto, se um pesquisador garimpa e seleciona 5 de 15 regressores, encontrando um modelo ajustado a 5% de significância, a conclusão deve ser vista com cautela, pois o verdadeiro nível de significância é 15%. Se não houver a “garimpagem de dados” e 𝑐 = 𝑘 , então 𝛼 = 𝛼∗. 19 DETECÇÃO DE ERROS DE ESPECIFICAÇÃO Ferramentas de Diagnóstico Embora a “garimpagem de dados” seja um método criticado por alguns pesquisadores, na prática é um método bastante utilizado em econometria aplicada, e a sua utilização tem sido defendida por diversos pesquisadores. 20 DETECÇÃO DE ERROS DE ESPECIFICAÇÃO Ferramentas de Diagnóstico TESTES PARA VERIFICAR A OMISSÃO DE VARIÁVEIS E A FORMA FUNCIONAL INCORRETA • (i) Exame dos resíduos; • (ii) Estatística d de Durbin-Watson; • (iii) Teste RESET de Ramsey; • (iv) Teste do multiplicador de Lagrange 21 DETECÇÃO DOS ERROSDE ESPECIFICAÇÃO (i) EXAME DOS RESÍDUOS: Se plotarmos o gráfico dos resíduos da regressão (contra as observações), ele nos dá um bom diagnóstico visual para a presença de erros de especificação. Os resíduos de modelos mal especificados apresentam acentuadas oscilações cíclicas. 22 DETECÇÃO DOS ERROS DE ESPECIFICAÇÃO (i) EXAME DOS RESÍDUOS: Exemplo: Função de custo total (onde Y representa o custo total e X a produção) Y = Custo total X = Produção Y X X² X³ 193 1 1 1 226 2 4 8 240 3 9 27 244 4 16 64 257 5 25 125 260 6 36 216 274 7 49 343 297 8 64 512 350 9 81 729 420 10 100 1000 23 DETECÇÃO DOS ERROS DE ESPECIFICAÇÃO (i) EXAME DOS RESÍDUOS: • Exemplo: Função de custo total (onde Y representa o custo total e X a produção) iiiii XXXY 342321 iii XY 21 iiii XXY 2321 Recorrer ao exame dos resíduos FORMA LINEAR FORMA QUADRÁTICA FORMA CÚBICA 24 DETECÇÃO DOS ERROS DE ESPECIFICAÇÃO Exame dos resíduos: Implementação no GretL Rodar o modelo normalmente, depois plota o gráfico dos resíduos. Gráficos… Gráfico dos resíduos… Por número de observação… OK 25 DETECÇÃO DOS ERROS DE ESPECIFICAÇÃO Exame dos resíduos: Implementação no GretL 26 EXAME DOS RESÍDUOS: FORMA LINEAR 27 EXAME DOS RESÍDUOS: FORMA QUADRÁTICA 28 EXAME DOS RESÍDUOS: FORMA CÚBICA Obs: comportamento de ruído branco 29 DETECÇÃO DOS ERROS DE ESPECIFICAÇÃO Trata-se de um teste geral para detecção de erros de especificação, proposto pelo pesquisador Ramsey. É um dos testes mais aplicados na literatura. (iii) TESTE RESET DE RAMSEY: 30 DETECÇÃO DOS ERROS DE ESPECIFICAÇÃO TESTE RESET DE RAMSEY: Continua exemplo do custo de produção iii XY 21 Sugere que: se incluirmos, de algum modo, o Yest como um regressor do modelo, isto elevará o valor do R2. Se este aumento for estatisticamente significativo, provavelmente a função tenha sido mal especificada. Idéia que está por trás do teste RESET (1) ei Yest (forma linear) 31 DETECÇÃO DOS ERROS DE ESPECIFICAÇÃO TESTE RESET DE RAMSEY: etapas de sua aplicação 1. Estimamos o modelo normalmente, de acordo com a função (1), e obtemos os valores de 𝑌𝑖 (Yi estimados) 2. Reestimamos o modelo incluindo e como regressores adicionais, portanto, calculamos: ^ 3 Y i ^ 2 Y i ^ 34^ 2 321 YYXY i ii ii (2) 32 DETECÇÃO DOS ERROS DE ESPECIFICAÇÃO Teste RESET de Ramsey: etapas de sua aplicação Exemplo Função Custo Obs Y X Yest Y 2 est Y 3 est 1 193 1 186 34.745 6.476.461 2 226 2 206 42.573 8.784.321 3 240 3 226 51.197 11.584.085 4 244 4 246 60.614 14.923.275 5 257 5 266 70.827 18.849.413 6 260 6 286 81.834 23.410.019 7 274 7 306 93.636 28.652.616 8 297 8 326 106.233 34.624.725 9 350 9 346 119.624 41.373.868 10 420 10 366 133.810 48.947.566 iii XY 21 𝑌𝑖 = 166,47 + 19,9𝑋𝑖 (Calcular para cada observação) Novo Modelo: ^ 34^ 2 321 YYXY i ii ii Segunda etapa da aplicação Feito isso, calculamos o R2 para os dois modelos: o modelo original (velho) e o modelo incluindo os novos regressores (novo) “velho” “novo” Modelo Original: 33 DETECÇÃO DOS ERROS DE ESPECIFICAÇÃO TESTE RESET DE RAMSEY: etapas de sua aplicação 3. Chamamos o R2 obtido de (2) de R2novo e o obtido de (1) de R2velho. Então, podemos aplicar um teste de hipóteses do tipo F para verificar se existe diferença estatisticamente significativa entre os dois valores de R2. Se existir diferença estatisticamente significativa entre os dois valores de R2, isso significa que havíamos cometido um erro de especificação ao estimar o modelo original. 34 O teste de hipóteses do tipo F RRH novovelho 22 0 : RRH novovelhoA 22: A Hipótese nula diz que o o modelo foi corretamente especificado A Hipótese alternativa diz que cometemos um erro de especificação 2. Calcula a estatística de teste: 3. Consulta o valor crítico de F na tabela: Ftab = ? m = no de regressores do novo modelo n-p = obs – parâm (do novo modelo) Alfa a 1%, 5% ou 10% pnR mRR F novo velhonovo calc /)1( /)( 2 22 1. Estabelece as hipóteses: 35 Fcalc > Ftab Rejeita-se a hipótese nula, concluindo que os dois parâmetros do novo modelo são estatisticamente significativos e, portanto, de fato a especificação do modelo estava errada. 4. Verifica o resultado do teste com base no valor crítico O teste de hipóteses do tipo F 36 DETECÇÃO DOS ERROS DE ESPECIFICAÇÃO EXEMPLO: Função custo total na forma linear iii XY 21 ^ 34^ 2 321 YYXY i ii ii R2velho = 0,840891 R2novo = 0,998341 pnR mRR F novo velhonovo calc /)1( /)( 2 22 𝑭𝒄𝒂𝒍𝒄 = 0,9983 − 0,8408 /3 1 − 0,9983 (10 − 4) = 𝟏𝟖𝟗, 𝟖𝟏 𝑭𝒄𝒓í𝒕𝒊𝒄𝒐 = 𝟗, 𝟕𝟖 𝑝𝑎𝑟𝑎 𝛼 = 1% 𝐹𝑐𝑎𝑙𝑐 > 𝐹𝑐𝑟í𝑡𝑖𝑐𝑜 ∴ 𝑅𝑒𝑗𝑒𝑖𝑡𝑎 𝐻0 𝑎 1% 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐â𝑛𝑐𝑖𝑎 Conclusão: o modelo linear está incorretamente especificado 37 DETECÇÃO DOS ERROS DE ESPECIFICAÇÃO Observações sobre o Teste RESET de Ramsey O teste RESET indica apenas se o modelo está especificado incorretamente ou não, porém, não diz nada quanto ao tipo de erro de especificação que está ocorrendo: (1) omissão de variável relevante ou (2) forma funcional incorreta. A alternativa seria incluir outras variáveis ou tentar utilizar outra forma funcional, enfim, ir testando até encontrar a solução do problema. Em geral, começamos pela inclusão de algumas variáveis. 38 ATENÇÃO Não confundir o teste t (feito para verificar se cada parâmetro é estatisticamente significativo) e o teste F (feito para testar a significância estatística global do modelo) com o teste RESET. 39 ATENÇÃO Todos são Testes de Hipóteses, e devem seguir aquela sequência já conhecida para testes de hipóteses, porém, cada um tem um propósito e um significado diferente. 40 O teste t (significância individual dos parâmetros) 0:0 jH 0: jAH A Hipótese nula diz que o parâmetro em questão não é estatisticamente significativo Hipótese alternativa diz que o parâmetro em questão é estatisticamente significativo s t j j calc ^ ^ Calcula a estatística de teste: Consulta o valor crítico de t na tabela: ttab = ? GL = n – p Alfa a 1%, 5% ou 10% Se o tcalc > ttab Rejeita H0 concluindo que o parâmetro é estatisticamente significativo a XX% de probabilidade 41 O teste F (significância global do modelo) A Hipótese nula diz que todos os parâmetros são iguais a zero Hipótese alternativa diz que pelo menos um parâmetro seja diferente de zero Calcula a estatística de teste: Consulta o valor crítico de F na tabela: Ftab = ? p-1 n – p Alfa a 1%, 5% ou 10% Se o Fcalc > Ftab Rejeita H0 concluindo que o modelo é estatisticamente significativo a XX% de probabilidade 𝐻0: 𝛽0=0; 𝛽1=0;...; 𝛽𝑘=0 𝐻𝐴: 𝑝𝑒𝑙𝑜 𝑚𝑒𝑛𝑜𝑠 𝑢𝑚 𝛽𝑖 ≠ 0 𝐹𝑐𝑎𝑙𝑐 = 𝑆𝑄𝑅𝑒𝑔 𝑝 − 1 𝑆𝑄𝑅𝑒𝑠 𝑛 − 𝑝 42 O teste RESET (também é um teste F) RRH novovelho 22 0 : RRH novovelhoA 22: A Hipótese nula diz que o o modelo foi corretamente especificado A Hipótese alternativa diz que cometemos um erro de especificação Calcula a estatística de teste: Consulta o valor crítico de t na tabela: Ftab = ? m = no de regressores do novo modelo n-p = obs – parâm do novomodelo Alfa a 1%, 5% ou 10% Se o Fcalc > Ftab Rejeita H0 concluindo que de fato cometemos um erro de especificação, com XX% de probabilidade. pnR mRR F novo velhonovo calc /)1( /)( 2 22 43 ATENÇÃO Na saída dos programas (GretL, Eviews, etc.) devemos olhar para o valor do p referente ao teste, e seguir aquela regra de multiplicar o valor por 100. 0 < p < 1 1 < p < 5 5 < p < 10 Rejeita H0 a 1% de significância Rejeita H0 a 5% de significância Rejeita H0 a 10% de significância Em todos estes casos, sempre que o resultado apontar para estatisticamente significativo, devemos rejeitar a Hipótese Nula (H0) e tirar a conclusão com base no que diz H0 44 TESTE RESET DE RAMSEY: Implementação no GretL Rodar o modelo normalmente, depois faz o teste. Testes… RESET de Ramsey… Quadrados e cubos… OK DETECÇÃO DOS ERROS DE ESPECIFICAÇÃO 45 Teste RESET de Ramsey: Implementação no GretL Janela da equação estimada 46 Teste RESET de Ramsey: Implementação no GretL Clicar em OK para realização do teste. Aparece a janela com o resultado do teste. 47 Teste RESET de Ramsey: Implementação no GretL Rejeita H0 a 1% de significância concluindo pela presença de erro de especificação Forma Linear 48 Teste RESET de Ramsey: Implementação no GretL Testando o modelo da função de custo na forma cúbica 49 Teste RESET de Ramsey: Implementação no GretL Não rejeita H0 concluindo pela ausência de erro de especificação Forma Cúbica 50 TESTE RESET DE RAMSEY: Implementação no Eviews Rodar o modelo normalmente, depois faz o teste. View… Stability Diagnostics… Ramsey RESET Test… Number of fitted terms: 2 DETECÇÃO DOS ERROS DE ESPECIFICAÇÃO 51 TESTE RESET DE RAMSEY: Implementação no Eviews Janela da equação estimada 52 TESTE RESET DE RAMSEY: Implementação no Eviews Clicar em OK para realização do teste. Aparece a janela com o resultado do teste. 53 CRITÉRIOS PARA SELEÇÃO DE MODELOS CONCORRENTES • Existem alguns critérios utilizados para escolher entre modelos concorrentes e/ou comparar modelos para fins de previsão. • Dentre os vários critérios empregados para esta finalidade, examinaremos três: 1. Critério de R2 ajustado 2. Critério de Informação de Akaike (CIA) 3. Critério de Informação de Schwarz (CIS) 54 CRITÉRIOS PARA SELEÇÃO DE MODELOS CONCORRENTES • Critério do R2 ajustado )1( )( Re 1 2 n SQTot pn sSQ R O critério será: quanto mais próximo de 1 for o R2, melhor será o ajustamento, lembrando que o regressando tem de ser o mesmo para que a comparação seja válida 55 CRITÉRIOS PARA SELEÇÃO DE MODELOS CONCORRENTES • Critério de Informação de Akaike (CIA) n SQR eCIA nk /2 O critério será: quanto menor for o CIA, melhor será o ajustamento, lembrando que o regressando tem de ser o mesmo para que a comparação seja válida n SQR n k CIA ln 2 ln k é o número de parâmetros n é o número de observações 56 CRITÉRIOS PARA SELEÇÃO DE MODELOS CONCORRENTES • Critério de Informação de Schwarz (CIS) n SQR nCIS nk / O critério será: quanto menor for o CIS, melhor será o ajustamento, lembrando que o regressando tem de ser o mesmo para que a comparação seja válida n SQR n n k CIS lnlnln k é o número de parâmetros n é o número de observações 57 CRITÉRIOS PARA SELEÇÃO DE MODELOS CONCORRENTES Exemplo de Custo Total Gretl 58 CRITÉRIOS PARA SELEÇÃO DE MODELOS CONCORRENTES Obs Y X X2 X3 1 193 1 1 1 2 226 2 4 8 3 240 3 9 27 4 244 4 16 64 5 257 5 25 125 6 260 6 36 216 7 274 7 49 343 8 297 8 64 512 9 350 9 81 729 10 420 10 100 1000 Exemplo: Custo total de produção Função linear: Função quadrática: Função Cúbica: 𝑌 = 𝛼0+𝛼1X+𝜀 𝑌 = 𝛽0+𝛽1X+𝛽2𝑋 2+𝜀 𝑌 = 𝛾0+𝛾1X+𝛾2𝑋 2+ 𝛾3𝑋 3+𝜀 59 CRITÉRIOS PARA SELEÇÃO DE MODELOS CONCORRENTES 60 CRITÉRIOS PARA SELEÇÃO DE MODELOS CONCORRENTES 61 CRITÉRIOS PARA SELEÇÃO DE MODELOS CONCORRENTES 62 CRITÉRIOS PARA SELEÇÃO DE MODELOS CONCORRENTES R2 ajustado Schwarz Akaike Linear 0,82 97,29 96,68 Quadrático 0,91 91,60 90,70 Cúbico 0,99 56,27 55,06 Comparação entre os critérios
Compartilhar