Baixe o app para aproveitar ainda mais
Prévia do material em texto
Tópico 8 – Problema de especificação de dados Bibliografia: WOOLDRIDGE, J.M. Introdução à Econometria: uma abordagem moderna. 4ª ed. São Paulo: Pioneira Thomson Learning, 22015. (capítulo 9). Propriedades do método MQO quando há erros de medida Em alguns casos, não podemos coletar dados da variável que verdadeiramente afeta o comportamento econômico. Quando utilizamos uma medida imprecisa de uma variável em um modelo de regressão, nosso modelo conterá um erro de medida. O intuito aqui é de estimar as consequências do erro de medida para a estimação do MQO e inferir o tamanho do viés. O problema do erro de medida tem estrutura estatística similar ao problema da variável omitida e sua substituição pela variável proxy. Erros de Medida Porém, o problema da variável omitida e do erro de medida são conceitualmente diferentes. No caso da variável proxy, procuramos uma variável que é associada à variável não observada. Por exemplo, a idade é uma proxy de experiência, por exemplo. No caso do erro de medida, a variável que não observamos tem significado quantitativo bem definido (como o ganho marginal do imposto ou a renda anual), mas as medidas sobre elas podem conter erros. Exemplo: a renda anula registrada é uma medida da renda anual efetiva, ao passo que a pontuação de QI é uma proxy da aptidão. Erros de Medida na Variável Dependente Vamos chamar de 𝑦∗a variável na população que queremos explicar: 𝑦∗ = 𝛽0 + 𝛽1𝑥1 +⋯+ 𝛽𝑘𝑥𝑘 + 𝑢 (16) Supomos que satisfaz as hipóteses de Gauss-Markov. O erro de medida na população é definido como a diferença entre o valor observado (𝑦) e o valor real (𝑒0 = 𝑦 − 𝑦 ∗). Exemplo: considerando que 𝑦 seja é poupança anual registrada. Infelizmente, as famílias não declaram com perfeição suas poupanças anuais; é fácil deixar categorias de fora ou superestimar o montante contribuído para determinado fundo. Geralmente, podemos esperar que 𝑦 e 𝑦∗ sejam diferentes, pelo menos em alguns subconjuntos de famílias na população. Erros de Medida na Variável Dependente O erro de medida na população é definido como a diferença entre o valor observado (𝑦) e o valor real (𝑒0 = 𝑦 − 𝑦 ∗). Ele está associados a outros fatores. Para obter um modelo que pode ser estimado, escrevemos: 𝑦∗ = 𝑦 − 𝑒0 , inserimos essa expressão na equação (16) e reorganizamos para obter: 𝑦 = 𝛽0 + 𝛽1𝑥1 +⋯+ 𝛽𝑘𝑥𝑘 + 𝑢 + 𝑒0 (17) O termo de erro será: 𝑢 + 𝑒0 . Como 𝑦, 𝑥1, 𝑥2, … , 𝑥𝑘 são observadas, podemos estimar este modelo por MQO. Na verdade, simplesmente ignoramos o fato de que 𝑦 é uma medida imperfeita de 𝑦∗e prosseguimos da maneira habitual. Erros de Medida na Variável Dependente Quando o método MQO com 𝑦 em lugar de 𝑦∗ produz estimadores consistentes de 𝛽𝑗? Como o modelo original satisfaz as hipóteses de Gauss- Markov, u tem média zero e é não correlacionado com cada 𝑥𝑗. Mais importante é a suposição de que o erro de medida (𝑒0) é estatisticamente independente das variáveis explicativas (𝑥𝑗). Se isso for verdade, então os estimadores MQO de 𝑦 em lugar de 𝑦∗são não viesados e consistentes. Além disso, os procedimentos de inferência do método MQO (estatísticas t, Fe LM) são válidos. Erros de Medida na Variável Dependente Se 𝑒0 e 𝑢 forem não correlacionados, então: 𝑉𝑎𝑟 𝑢 + 𝑒0 = 𝜎𝑢 2 + 𝜎0 2 > 𝜎𝑢 2 (18) Isso significa que o erro de medida na variável dependente resulta em uma variância de erro maior do que quando não ocorre nenhum erro. Isso produz variâncias maiores dos estimadores MQO, ou seja, maiores erros-padrão e menores estatísticas t. A única forma de evitar esse problema é coletar dados melhores. O ponto principal é que o erro de medida na variável dependente pode causar vieses no método MQO se ele for sistematicamente relacionado com uma ou mais variáveis explicativas. Se o erro de medida for apenas um erro de informação aleatório que seja independente das variáveis explicativas, como muitas vezes é presumido, o método MQO é perfeitamente apropriado. Erros de Medida na Variável Explicativa O erro de medida em uma variável explicativa tem sido considerado um problema mais importante do que o erro de medida em uma variável dependente. Um modelo de regressão simples que satisfaz pelo menos as quatro hipóteses de Gauss-Markov produz estimadores de 𝛽0 e 𝛽1 não viesados e consistentes: 𝑦 = 𝛽0 + 𝛽1𝑥1 ∗ + 𝑢 (19) O problema é que 𝑥1 ∗ não é observado. Por exemplo, ao invés da verdadeira renda (𝑥1 ∗), temos somente a renda declarada (𝑥1). O erro de medida na população é: 𝑒1 = 𝑥1 − 𝑥1 ∗. E pode ser positivo, negativo ou zero. Assumimos que o erro de medida médio na população é zero: 𝐸 𝑒1 = 0. Além disso, assumimos que 𝑢 é não-correlacionado com 𝑥1 ∗ e 𝑥1. Erros de Medida na Variável Explicativa Em termos de expectativa condicional, podemos escrevê-la como 𝐸 𝑦 𝑥1 ∗, 𝑥1 = 𝐸(𝑦|𝑥1 ∗) → 𝑥1não afeta 𝑦 após ter-se controlado 𝑥1 ∗. Queremos saber as propriedades de MQO se substituirmos 𝑥1 ∗ por 𝑥1 e executarmos a regressão de 𝑦 sobre 𝑥1. As propriedades dependerão das suposições que fizermos sobre o erro de medida (𝑒1). Duas hipóteses opostas têm sido enfatizadas na literatura econométrica. Erros de Medida na Variável Explicativa A primeira hipótese: 𝐶𝑜𝑣 𝑥1, 𝑒1 = 0 → 𝑒1 é não correlacionada com a medida observada 𝑥1. Da relação 𝑒1 = 𝑥1 − 𝑥1 ∗, se 𝐶𝑜𝑣 𝑥1, 𝑒1 = 0 for verdadeira, então 𝑒1deve ser correlacionado com a variável não observada 𝑥1 ∗. Para determinar as hipóteses de MQO neste caso, escrevemos 𝑥1 ∗ = 𝑥1 − 𝑒1 e inserimos na equação (19): 𝑦 = 𝛽0 + 𝛽1𝑥1 + (𝑢 − 𝛽1𝑒1) (21) Como assumimos que tanto 𝑢 quanto 𝑒1têm média zero e são não- correlacionados com 𝑥1, então 𝑢 − 𝛽1𝑒1 tem média zero e é não correlacionado com 𝑥1. Então, a estimação de MQO com 𝑥1 em lugar 𝑥1 ∗ produz um estimador consistente de 𝛽0 e 𝛽1. Erros de Medida na Variável Explicativa Como 𝑢 é não correlacionado com 𝑒1, a variância do erro na equação anterior é 𝑉𝑎𝑟 𝑢 − 𝛽1𝑒1 = 𝜎𝑢 2 + 𝛽1 2𝜎𝑒1 2 . Assim, Exceto quando 𝛽1 = 0, o erro de medida aumenta a variância do erro. Porém, isso não afeta nenhuma das propriedades MQO, mas as variâncias dos betas estimados (e os erros-padrão) serão maiores do que se observarmos 𝑥1 ∗ diretamente. Erros de Medida na Variável Explicativa Segunda hipótese : erro clássico nas variáveis (ECV) é o erro de medida não correlacionado com a variável explicativa não-observada x1 ∗ : 𝐶𝑜𝑣 𝑥1 ∗, 𝑒1 = 0. Neste caso, a medida observada é a soma da variável explicativa verdadeira com o erro de medida: 𝑥1 = 𝑥1 ∗ + 𝑒1. E em seguida presumindo que os dois componentes de 𝑥1 são não correlacionados (sempre supomos que 𝑢 é não correlacionado com 𝑥1 ∗ e 𝑥1, e , portanto, com 𝑒1). Então, se a hipótese: 𝐶𝑜𝑣 𝑥1 ∗, 𝑒1 = 0 for válida, então 𝑥1 e 𝑒1 devem ser correlacionado. 𝐶𝑜𝑣 𝑥1, 𝑒1 = 𝐸 𝑥1𝑒1 = 𝐸 𝑥1 ∗𝑒1 + 𝐸 𝑒1 2 = 0 + 𝜎𝑒1 2 = 𝜎𝑒1 2 (22) Assim, a covariância entre 𝑥1 e 𝑒1 é igual à variância do erro de medida sob a hipótese erro clássico nas variáveis . Erros de Medida na Variável Explicativa Considerando a equação 21, podemos ver que a correlação entre 𝑥1 e 𝑒1causará problemas. Como 𝑢 e 𝑥1 são não correlacionadas, a covariância entre 𝑥1 e o erro composto 𝑢 − 𝛽1𝑒1 é : 𝐶𝑜𝑣 𝑥1, 𝑢 − 𝛽1𝑒1 = −𝛽1𝐶𝑜𝑣 𝑥1, 𝑒1 = −𝛽1𝜎𝑒1 2 (23) Assim, no caso de erro clássico nas variáveis , a regressão de MQO de 𝑦 sobre 𝑥1 produz um estimador viesado e inconsistente, pois 𝑒1 é correlacionado com 𝑥1 . Isso significa que, em geral, todos os estimadores MQO serãoviesados, e não somente መ𝛽1. SobCEV: 𝑝𝑙𝑖𝑚 መ𝛽1 = 𝛽1( 𝜎 𝑥1 ∗ 2 𝜎 𝑥1 ∗ 2 +𝜎𝑒1 2 ) Assim 𝑝𝑙𝑖𝑚 está sempre mais perto de zero que 𝛽1 . Este é o chamado viés de atenuação no MQO devido erros clássico nas variáveis: em médias média (ou em amostras de grandes dimensões), o efeito estimado de MQO será atenuado. Soluções para o viés de erros nas variáveis A melhor forma de resolver o problemas de erros nas variáveis é obter uma medida precisa de 𝑥. Se for impossível, contudo, há métodos econométricos que podem ser utilizados para diminuir o viés de erros nas variáveis. Um desses métodos é a regressão de variáveis instrumentais (VI). Isso depende de haver outra variável (“a variável instrumental”) correlacionada ao valor efetivo 𝑥𝑖 , mas não correlacionada ao erro de medida. Um segundo método é o desenvolvimento de um modelo matemático do erro de medida e, se possível, a utilização das fórmulas resultantes para ajustar as estimativas.
Compartilhar