Baixe o app para aproveitar ainda mais
Prévia do material em texto
Econometria Alexandre Gori Maia 2014 Sumário 1. Correlação e Regressão Linear Simples ................................................................................. 9 Introdução ................................................................................................................................... 9 1.1. Correlação ........................................................................................................................ 9 1.2. Regressão Linear Simples .............................................................................................. 15 1.3. Método de Mínimos Quadrados Ordinários ................................................................... 18 1.3.1. Definição ................................................................................................................. 19 1.3.2. Aplicação do MQO na regressão linear simples ..................................................... 20 1.3.3. Propriedades dos Estimadores de Mínimos Quadrados Ordinários ........................ 22 Exercícios .................................................................................................................................. 23 Respostas................................................................................................................................... 25 2. Inferência com os Estimadores de MQO .............................................................................. 26 Introdução ................................................................................................................................. 26 2.1. Teorema de Gauss-Markov ............................................................................................ 26 2.2. Significância das estimativas ......................................................................................... 30 2.3. Distribuição amostral dos estimadores ....................................................................... 30 2.4. Variância dos estimadores .......................................................................................... 31 2.5. Teste de hipóteses para os coeficientes ...................................................................... 33 2.6. Intervalo de confiança para os coeficientes ................................................................ 36 Exercícios .................................................................................................................................. 38 Respostas................................................................................................................................... 39 3. Intervalos de Confiança e Previsão para os Valores de Y ..................................................... 50 Introdução ................................................................................................................................. 50 3.1. Intervalos para valores individuais e para a média aritmética ....................................... 50 3.2. Intervalo de confiança para o valor previsto de Y .......................................................... 52 3.3. Intervalo de previsão para valores individuais de Yi ...................................................... 54 3.4. Propriedades das estimativas por intervalo .................................................................... 55 Exercícios .................................................................................................................................. 57 Respostas................................................................................................................................... 58 4. Formas Funcionais ................................................................................................................ 61 Introdução ................................................................................................................................. 61 4.1. Modelo Linear ................................................................................................................ 61 4.2. Modelo Log-Lin ............................................................................................................. 63 4.3. Modelo Lin-Log ............................................................................................................. 65 4.4. Modelo Log-Log ............................................................................................................ 67 Exercícios .................................................................................................................................. 69 Respostas................................................................................................................................... 70 5. Análise de Variância ............................................................................................................. 71 Introdução ................................................................................................................................. 71 5.1. Soma dos Quadrados ...................................................................................................... 71 5.2. Coeficiente de Determinação ......................................................................................... 75 5.3. Análise de Variância (ANOVA) .................................................................................... 77 Exercícios .................................................................................................................................. 80 Respostas................................................................................................................................... 81 6. Introdução à Regressão Linear Múltipla ............................................................................... 86 Introdução ................................................................................................................................. 86 6.1. Estimadores de MQO ..................................................................................................... 86 6.2. Estimadores de MQO a partir de notação matricial ....................................................... 89 6.3. O uso de variáveis centradas .......................................................................................... 93 Exercícios .................................................................................................................................. 97 Respostas................................................................................................................................. 100 8. Análise de Variância para Regressão Linear Múltipla ....................................................... 106 Introdução ............................................................................................................................... 106 8.1. Coeficiente de determinação e estatística F ................................................................. 106 8.2. Coeficiente de determinação ajustado .......................................................................... 110 Exercícios ................................................................................................................................ 112 Respostas................................................................................................................................. 115 9. Inferência em Regressão Linear Múltipla ........................................................................... 117 Introdução ............................................................................................................................... 117 8.1. Matriz de variância e covariância e teste t para k ....................................................... 117 9.1. Inferência para combinação linear dos parâmetros ...................................................... 1219.1.2. Teste de hipóteses para combinação linear dos parâmetros ..................................... 122 9.2. Intervalo de confiança para valor previsto ................................................................... 124 Exercícios ................................................................................................................................ 126 Respostas................................................................................................................................. 128 10. Contribuição Marginal ..................................................................................................... 130 Introdução ............................................................................................................................... 130 10.1. ANOVA para contribuição marginal ........................................................................ 130 10.2. Correlação parcial ..................................................................................................... 135 Exercícios ................................................................................................................................ 137 Respostas................................................................................................................................. 139 11. Multicolinearidade ........................................................................................................... 140 Introdução ............................................................................................................................... 140 11.1. Definição .................................................................................................................. 141 11.2. Fator Inflacionário da Variância ............................................................................... 144 11.3. Identificação da multicolinearidade .......................................................................... 146 11.4. Correção da multicolinearidade ................................................................................ 147 Exercícios ................................................................................................................................ 150 Respostas................................................................................................................................. 153 12. Variáveis Binárias ............................................................................................................ 158 Introdução ............................................................................................................................... 158 12.1. Variáveis binárias para representar 2 categorias ...................................................... 159 12.2. Variáveis binárias para representar múltiplas categorias ......................................... 161 12.3. Interpretação de coeficientes de binárias em equações semi-logarítmicas ............... 164 12.4. Outras aplicações das variáveis binárias .................................................................. 166 12.5. Teste de mudança estrutural ..................................................................................... 170 Exercícios ................................................................................................................................ 174 Respostas................................................................................................................................. 177 13. Heterocedasticidade ......................................................................................................... 178 Introdução ............................................................................................................................... 178 13.1. Definição .................................................................................................................. 178 13.2. Identificação ............................................................................................................. 181 13.2.2. Análise Gráfica .................................................................................................. 181 13.2.3. Teste de Goldfeld-Quandt ................................................................................. 184 13.2.4. Teste de Breusch-Pagan .................................................................................... 186 13.2.5. Teste de White ................................................................................................... 188 13.3. Mínimos Quadrados Ponderados .............................................................................. 190 13.3.2. Função de heterocedasticidade conhecida......................................................... 192 13.3.3. Função de heterocedasticidade desconhecida – Mínimos Quadrados Generalizados Factíveis ...................................................................................................... 194 13.4. Estimadores Robustos da Variância ......................................................................... 196 Exercícios ................................................................................................................................ 198 Respostas................................................................................................................................. 201 14. Autocorrelação ................................................................................................................. 202 Introdução ............................................................................................................................... 202 14.1. Definição .................................................................................................................. 202 14.2. Identificação ............................................................................................................. 205 14.2.2. Análise Gráfica ..................................................................................................... 206 14.2.3. Teste t para regressores estritamente exógenos .................................................... 207 14.2.4. Teste de Durbin-Watson para um MCRL ............................................................. 209 14.2.5. Teste de Breusch-Godfrey para ordens superiores ............................................... 213 14.3. Mínimos Quadrados Generalizados .......................................................................... 215 14.3.2. Coeficiente de autocorrelação conhecido .......................................................... 217 14.3.3. Coeficiente de autocorrelação desconhecido .................................................... 219 14.4. Estimadores Robustos da Variância ......................................................................... 221 Exercícios ................................................................................................................................ 222 Respostas................................................................................................................................. 224 15. Equações Simultâneas ...................................................................................................... 227 Introdução ............................................................................................................................... 227 15.1. Origem do problema ................................................................................................. 228 15.2. Definição .................................................................................................................. 230 15.3. Mínimos Quadrados Indiretos .................................................................................. 233 15.4. Identificação .............................................................................................................235 15.5. Estimação por Variáveis Instrumentais .................................................................... 242 15.6. Mínimos Quadrados em dois Estágios (MQ2E) ....................................................... 245 15.7. Teste de endogeneidade ............................................................................................ 247 Exercícios ................................................................................................................................ 250 Respostas................................................................................................................................. 252 16. Estacionariedade .............................................................................................................. 254 Introdução ............................................................................................................................... 254 16.1. Processos estocásticos .............................................................................................. 255 16.2. Estacionariedade ....................................................................................................... 256 16.2.2. Definição ............................................................................................................... 256 16.2.3. Raiz Unitária ......................................................................................................... 258 16.2.4. Terminologia ......................................................................................................... 262 16.3. Função de autocorrelação ......................................................................................... 265 16.4. Teste de raiz unitária ................................................................................................. 267 16.4.2. Teste de Dickey-Fuller .......................................................................................... 268 16.4.3. Teste de Dickey-Fuller aumentado ....................................................................... 270 Exercícios ................................................................................................................................ 272 Respostas................................................................................................................................. 273 17. Cointegração .................................................................................................................... 274 Introdução ............................................................................................................................... 274 17.1. Relação espúria ......................................................................................................... 274 17.2. Modelo de tendência estacionária ............................................................................. 276 17.2.2. Coeficiente de determinação para regressando com tendência ............................. 277 17.3. Modelo de diferença estacionária ............................................................................. 279 17.4. Cointegração ............................................................................................................. 280 17.4.2. Modelo de correção de erros ................................................................................. 285 Exercícios ................................................................................................................................ 286 Respostas................................................................................................................................. 288 18. Modelos ARIMA ............................................................................................................. 290 Introdução ............................................................................................................................... 290 18.1. Modelo Autorregressivo (AR) .................................................................................. 290 18.2. Modelo de Médias Móveis (MA) ............................................................................. 293 18.3. Modelo Autorregressivo e de Médias Móveis (ARMA) .......................................... 294 18.4. Modelo Autorregressivo Integrado e de Médias Móveis (ARIMA) ........................ 295 Exercícios ................................................................................................................................ 299 Respostas................................................................................................................................. 300 Referências .............................................................................................................................. 301 Econometria Regressão Linear Simples 8 PARTE I Regressão Linear Simples Econometria Alexandre Gori Maia 9 1. Correlação e Regressão Linear Simples Introdução O termo regressão foi originalmente proposto por Francis Galton em seu trabalho Regression Towards Mediocrity in Hereditary Stature, publicado no Journal of the Anthropological Institute of Great Britain and Ireland, em 1886. Galton analisou a relação entre a estatura média dos pais de uma família e a de seus filhos adultos. Como se esperava, observou que, em geral, pais altos têm filhos altos e pais baixos têm filhos baixos. Também verificou que os filhos de pais altos não são tão altos quanto seus pais, assim como os filhos de pais baixos não são tão baixos quanto seus pais. Em outras palavras, a estatura dos filhos tendia a regredir à estatura média da população, comportamento que Galton denominou regressão à mediocridade1. A estatística moderna reserva, entretanto, o termo regressão ao estudo da relação de dependência de uma variável, a variável dependente, em função de uma ou mais variáveis, as variáveis explanatórias. O objetivo dessas análises é estimar ou prever o valor médio da variável dependente a partir de variações na variável explanatória, ou independente. Para melhor compreender os objetivos e aplicações da regressão em estatística, será inicialmente apresentada a análise de correlação, estreitamente relacionada à análise de regressão, mas conceitualmente muito diferente. Posteriormente, descrevem-se alguns conceitos e técnicas iniciais da regressão aplicada às relações lineares entre duas variáveis, a regressão linear simples. 1.1.Correlação Uma técnica simples para identificar possíveis padrões de associação entre duas variáveis quantitativas é o diagrama de dispersão. A Figura 1 apresenta três diagramas com diferentes padrões de dispersão entre duas variáveis X e Y. No primeiro observa-se uma tendência de associação linear positiva, ou seja, aumentando o valor de X, o valor de Y também tende a aumentar. No segundo, a associação assemelha-se a uma parábola, ou seja, Y aumenta com X até determinado ponto, quando, então, passa a diminuir. No último não há associação aparente entre as variáveis Y e X, pois os pontos não apresentam qualquer tendência particular. 1 Medíocre no sentido de médio ou mediano, algo que está entre pequeno e grande, segundo definição do dicionário Michaelis da Língua Portuguesa. Econometria Regressão Linear Simples 10 (1) Entre os muitos tipos de associações entre duas variáveis, a mais simples e frequente é a linear. A associação de dependência linear pode ser positiva, quando os valores de Y e X são diretamente proporcionais2, ou negativa, quando os valores de Y e X são inversamente proporcionais. Uma medida simples para quantificar a relação de dependência linear entre X e Y é a covariância. Dado N pares de valores de uma população (X1, Y1), ..., (XN, YN), a covariância entre X e Y será dada por: N YX Ni YiXi XY 1 ))(( (2) Onde X e Y são, respectivamente, as médias populacionais de X e Y. Quando se trata de uma amostra de n pares de valores de X e Y, com médias amostrais equivalentes a X e Y , a estimativa da covariância será dada por: 1 ))(( ˆ 1 n YYXX n i ii XY (3) Valores negativos da covariância sugerem relação de dependência linear negativa; valores positivos sugerem dependência linear positiva; e valores muito próximos de zero sugerem ausência de dependência linear. Observe que a covariância é uma média dos produtos em relação aos valores centrados de X e Y (desvios em relação às respectivas médias). Para simplificar as representações, esses valores centrados podem ser representados pelas minúsculas x e y: )( XXx ii e )( YYy ii (4) E a covariância, expressa em valores centrados, será dada por: 2 Aumentando X, aumenta o valor de Y. Econometria Alexandre Gori Maia 11 1 ˆ 1 n yx n i ii XY (5) Graficamente, os valores centrados representam uma mudança de eixos no diagrama de dispersão, que passam a ter origem nas médias de X e Y, mas sem alterar o padrão de associação: (6) Observe agora que, no diagrama formado pelos eixos x e y, pontos com padrão de associação linear positiva tendem a concentrar-se no 1º e 3º quadrantes, onde as coordenadas apresentam o mesmo sinal e, portanto, o produto xiyi, ou ))(( YYXX ii , será sempre positivo. Ou seja, a covariância será positiva. Analogamente, pontos com padrão de associação linear negativa concentrar-se-ão no 2º e 4º quadrantes, onde as coordenadas apresentam sinais diferentes e o produto xiyi, será sempre negativo (primeiro gráfico da Figura 7). Na ausência de padrões de associação linear (segundo e terceiro gráficos da Figura 7), produtos com sinais negativos tendem a compensar aqueles com sinais positivos e a covariância será próxima de zero. (7) Exemplo 1. Uma amostra de 10 ocupados ofereceu os seguintes valores para anos de escolaridade (X) e rendimento mensal (Y): X 0 3 5 7 7 9 11 13 15 15 Y 240 240 440 300 640 870 700 1800 2400 240 Econometria Regressão Linear Simples 12 O diagrama de dispersão e a covariância entre as duas variáveis seriam dados por: 110 )787240)(5,815(...)787240)(5,80( ˆ XY 3,2348 9 21135 ˆ XY Os resultados sugerem, portanto, uma associação linear positiva entre anos de escolaridade e rendimento, ou seja, se os anos de escolaridade aumentarem, a tendência é que os rendimentos também aumentem. Exemplo 2. Uma amostra hipotética apresentou os seguintes dados para o rendimento (X) e um indicador de felicidade, com escala entre 0 e 10 (Y), de 10 indivíduos: X 240 300 440 640 700 870 1500 1800 2400 2900 Y 1 3 4 7 7 8 7 7 5 2 O diagrama de dispersão e a covariância entre as duas variáveis serão dados por: 110 )1,52)(11792900(...)1,51)(1179240( ˆ XY 2,1 9 11 ˆ XY Embora o valor da covariância seja positivo, ele é baixo e, visualmente, observa-se que a associação entre as variáveis não é linear, mas sim quadrática. Embora a covariância permita identificar a presença e o sentido da associação linear, não permite avaliar seu grau de associação, ou seja, o quão próximo os pontos estão de uma reta. Isso porque a amplitude de variação da covariância depende das escalas de medida de X e Y e, consequentemente, de seus desvios em relação às respectivas médias (x e y). Por exemplo, no primeiro exemplo tínhamos uma covariância dada pelo produto de anos (escolaridade) por reais (rendimento) e, no segundo caso, pelo produto de reais (rendimento) por uma escala de felicidade (0..10). Não poderíamos, portanto, comparar as duas covariâncias e afirmar qual delas apresenta o Econometria Alexandre Gori Maia 13 maior grau de associação linear. A medida derivada do produto de variáveis com um maior grau de dispersão tenderia, naturalmente, a apresentar um maior valor de covariância. Para contornar esse problema e medir o grau de associação linear entre duas variáveis, utilizamos a correlação linear. A correlação () é uma medida padronizada (adimensional) de associação linear entre duas variáveis, obtida ao se ponderar a covariância pelo produto dos desvios padrão de X e Y (X e Y, respectivamente): YX XY (8) Outra maneira de enxergar a correlação é como uma média do produto dos desvios padronizados de X e Y. Em outras palavras, de (2), (4) e (8) teremos: N i Y i X i YX N i ii YX N i ii yx NN yx N yx 1 1 1 11 (9) Que pode ainda ser expressa apenas em função dos valores xi, yi e seus respectivos quadrados: N i i N i i N i ii N i i N i i N i ii yx yx N y N x N yx 1 2 1 2 1 1 2 1 2 1 (10) Para um conjunto de dados da amostra, teremos: YX XY SS r ̂ (11) Ou ainda: n i Y i X i S y S x n r 11 1 n i i n i i n i ii yx yx 1 2 1 2 1 (12) Graficamente, significa que, enquanto a covariância mede a aproximação dos desvios em relação a uma reta, a correlação medirá a aproximação dos desvios padronizados em relação a uma reta. Mantém-se a proporcionalidade e se elimina as distorções das diferentes escalas de medida, passando todas a referir-se a unidades de desvios padrão: Econometria Regressão Linear Simples 14 (13) A correlação assume valores entre -1 e +1 (inclusive) e permite uma interpretação intuitiva do grau de associação linear entre duas variáveis. Quão mais próximo o valor estiver dos extremos, mais próxima a dispersão dos pontos estará de uma reta com inclinação negativa (-1) ou positiva (+1). (14) Importante assinalar que a correlação não capta a proporcionalidade da associação, mas sim o grau de associação linear. Em outras palavras, uma correlação forte significa que, dadas variações em X, será muito provável que haja variações (positivas ou negativas) em Y, não importa em que razão (quanto Y irá variar em função de variações em X). Uma correlação nula também não implica necessariamente ausência de associação entre duas variáveis, já que a correlação refere-se exclusivamente à associação linear. Exemplo 3. Supondo a amostra de 10 observações para anos de escolaridade (X) e rendimento mensal (Y) do Exemplo (1), teríamos: 1,5XS e 3,739YS 628,0 )3,739)(1,5( 3,2348ˆ YX XY SS r Econometria Alexandre Gori Maia 15 Ou seja, há um forte grau de associação linear entre anos de escolaridade e rendimento, sugerindo, por exemplo, que o aumento dos anos de escolaridade implicará, muito provavelmente, no aumento da renda. Exemplo 4. A partir dos dados do Exemplo (2), sobre renda (X) e felicidade (Y), teríamos: 4,928XS e 5,2YS 001,0 )5,2)(4,928( 2,1ˆ YX XY SS r Ou seja, não há qualquer associação linear entre anos de escolaridade e rendimento, sugerindo, por exemplo, que o aumento da renda não implicará, necessariamente, em variações proporcionais na felicidade. 1.2.Regressão Linear Simples Embora a correlação seja uma medida útil do grau de associação entre duas variáveis, não explica algumas questões fundamentais, como: i) qual seria a variação em Y dada uma variação em X? ii) Qual o valor esperado de Y dado um de X? Para responder essas e outras questões, devemos realizar uma análise de regressão linear. A regressão linear simples pressupõe que a relação entre Y e X na população seja dada pela equação3: iii eXY (15) Onde Y é chamado de variável dependente, explicada ou regressando; X é a variável independente, explanatória ou regressor; e é o erro aleatório não explicado pelomodelo; é termo constante ou intercepto; e é o coeficiente angular ou coeficiente de regressão. Em outras palavras, a função de regressão linear estabelece que cada valor de Yi pode ser dado a partir de uma função linear de um valor controlado de Xi mais um erro não previsto pelo modelo ei (Figura 16). 3 O termo linear refere-se aos coeficientes unitários dos parâmetros e . Modelos em que os coefecientes não apresentam expoente unitário são chamados de modelos de regressão não lineares. Econometria Regressão Linear Simples 16 (16) O erro ei representa variáveis omitidas ou mesmo dificuldades para mensurar aquelas presentes no modelo. O modelo de regressão pressupõe que o efeito do erro seja mínimo e que este tenha uma natureza estocástica e esteja aleatoriamente distribuído em torno da reta de regressão, como representa a Figura 17. (17) Exemplo 5. Podemos pressupor que rendimento mensal (Y) seja determinado pelos anos de escolaridade (X) segundo a relação linear: iii eXY Assim, pressupomos que o rendimento de um ocupado seja dado em função (linear) de seus anos de escolaridade mais um fator não observado ei. Os erros ei representam outras informações não previstas pelo modelo que também afetam o rendimento, tais como experiência profissional, aptidão, tipo de ocupação e características socioeconômicas do local de moradia. Um pressuposto central da análise de regressão é que a reta de regressão representa a esperança condicional de Y dado um valor de X. Em outras palavras, representa o valor médio de Y caso o valor de X seja igual a Xi (Figura 16). A representação formal para essa esperança condicional será dada por: Econometria Alexandre Gori Maia 17 ii XXYE )/( ou ii XYE )( (18) Podemos também demonstrar, sem muita dificuldade, que se a reta de regressão representa a esperança condicional de Yi, então a esperança condicional dos erros será igual a 0. Em outras palavras: )( iii XYe 0)()()()()]([)|( iiiiiii YEYEXEYEXYEXeE 0)()|( iii eEXeE (19) Esse pressuposto é denominado de média condicional zero dos erros, segundo o qual os erros não estão associados aos valores das variáveis independentes. Para compreendermos seu significado, vamos supor uma aplicação da análise de regressão onde a variável Xi representa os anos de escolaridade de um ocupado e Yi seu rendimento. Poderíamos ter um comportamento não observado nos erros (ei), aptidão, por exemplo, que seja maior para pessoas com elevada escolaridade e menor para pessoas com baixa escolaridade. Em outras palavras, teríamos E(ei)>0 para valores elevados de Xi e E(ei)<0 para valores baixos de Xi, ou seja E(ei|Xi)0. O problema é que, quando formos analisar um modelo de regressão, não saberemos se os rendimentos mais elevados se devem a uma maior escolaridade ou uma maior aptidão. A relação de determinação entre escolaridade e renda poderia, assim, estar viesada. Compreendido esse pressuposto muito importate da análise de regressão (que será ainda abordado futuramente), voltemos agora à análise da reta de regressão. A equação (15) permite uma interpretação muito intuitiva da relação entre Y e X. O intercepto , por exemplo, representa o valor esperado de Y quando o valor controlado de X for nulo. O coeficiente angular , por sua vez, representa a variação marginal no valor esperado de Y dada uma variação unitária em X. Isso porque, se desejamos estimar a variação marginal no valor esperado de Y - E(Y) - dada uma variação infinitesimal em X - X - basta calcularmos a derivada de E(Y/X) em função de X: )0()0/(YE e X X X XYE X XYE )()|()|( (20) Econometria Regressão Linear Simples 18 Uma diferença importante entre regressão e correlação está na forma com que as variáveis são tratadas. Na regressão, pressupomos que a variável dependente seja, assim como os resíduos, de natureza estocástica. Já a variável independente é considerada como um valor fixo, controlado pelo pesquisador. Seria o caso, por exemplo, de controlarmos o nível de fertilizante em um solo (variável independente) e verificarmos a produtividade resultante (variável dependente). Para cada nível de fertilizante teríamos variações aleatórias na produtividade, das quais poderíamos estimar os valores médios. Não seria adequado, por sua vez, tentarmos controlar a produtividade para verificarmos as variações no nível de fertilizante. A correlação, por sua vez, não estabelece qualquer distinção entre as variáveis X e Y. Quando trabalhamos com dados de uma amostra, a representação da função de regressão (amostral) será dada por: iii eXY ˆ ˆˆ (21) Onde ̂ e ̂ são estimadores amostrais para os coeficientes do modelo de regressão e iê é o resíduo amostral4. Por sua vez, o valor previsto pela função de regressão amostral será dado por: ii XY ˆˆˆ (22) Exemplo 6. Seja a relação do rendimento mensal (Y) com função dos anos de escolaridade (X): iii eXY Assim, o rendimento esperado para aqueles trabalhadores não remunerados seria dado por e, para cada ano adicional de escolaridade, haveria uma variação marginal de reais no rendimento esperado. 1.3.Método de Mínimos Quadrados Ordinários Estabelecida a relação linear entre Y e X, o próximo passo é estimar a função de regressão com base em informações da amostra da maneira mais exata e eficiente possível. O método mais 4 O termo erro costuma ser reservado à função de regressão da população e resíduo para a função de regressão da amostra. Econometria Alexandre Gori Maia 19 utilizado é o de mínimos quadrados ordinários (MQO), dada sua relativa simplicidade operacional e resultados que, satisfeitas algumas condições, são os mais acurados (exatos) e eficientes (variância mínima) existentes (essas condições serão abordadas posteriormente). O método utiliza princípios matemáticos para ajustar uma função a uma série de valores observados em uma amostra, utilizando procedimentos que minimizam a soma dos erros de previsão ao quadrado, ou seja, a soma quadrática das diferenças entre os valores observados na amostra e os estimados pela função. O método de mínimos quadrados é uma das ferramentas mais importantes da estatística moderna e sua descoberta envolveu uma das disputas mais famosas da história da estatística. Adrien Marie Legendre foi o primeiro a publicar a técnica, em 1805, em seu livro Nouvelles Méthodes pour la Determination des Orbites de Comètes, mas Johann Carl Friedrich Gauss clamou a descoberta da técnica que dizia utilizar desde 1795, também em problemas de Astronomia e Física, embora publicada apenas em 1809. 1.3.1. Definição Seja um conjunto de observações (Yi) e uma função matemática f() utilizada para prever os valores de Yi na população Em outras palavras: ii efY )( (23) Onde ei é o erro de previsão, ou seja, a diferença entre o valor observado Yi e aquele previsto pela função f(): )(fYe ii (24) O método de mínimos quadrados estimará o parâmetro de tal forma que a soma dos erros de previsão ei ao quadrado seja mínima. Para isso, o primeiro passo é obter a função que define a soma dos erros ao quadrado que, assim como f(), também dependerá de . Essa função é chamada de Erro Quadrático Total (EQT): n i i n i i fYeEQT 1 2 1 2 )]([)( (25) Dependendo do valor de , teremos um valor para o EQT. O objetivo é encontrar um valor para , ou *, de tal forma que o EQT seja mínimo. Como se trata de uma função côncava para Econometria Regressão Linear Simples 20 cima5, seu valor mínimo será obtido igualando-se a primeira derivada da função em relação aoparâmetro a zero. 0 )( d dEQT (26) 1.3.2. Aplicação do MQO na regressão linear simples A partir de um conjunto de observações da amostra, o método de mínimos quadrados ajustará a reta que apresentar as menores distâncias quadráticas entre os valores observados de Yi e seus valores previstos ( iŶ ). Obterá, assim, os estimadores dos parâmetros e de tal forma que a soma dos erros quadráticos seja a mínima possível, ou seja, minimizando a função de EQT: eEQT n i i 1 2ˆ YYEQT n i ii 1 2]ˆ[ XβαYEQT n i ii 1 2)]ˆˆ([ (27) Para minimizar a função de EQT, deve-se igualar a zero as derivadas parciais em relação a e . n i ii XY 1 0)1)](ˆˆ([2 ˆ EQT (28) n i iii XXY 1 0))](ˆˆ([2 ˆ EQT (29) Desenvolvendo as expressões (28) e (29) chegaremos aos estimadores de MQO ̂ e ̂ . 5 Verifique que o sinal associado ao termo quadrático 2 será sempre positivo. Econometria Alexandre Gori Maia 21 XβY ˆˆ (30) n 1i 22 i n 1i ii XnX YXnYX β̂ (31) Aplicando-se algumas identidades algébricas, podemos ainda simplicar a representação do estimador ̂ para6: n i i n i ii n i i n i ii n i i n i i n i i n i i n i ii n i i n i ii x yx XX YYXX XXn YXYXn XnX YXnYX β 1 2 1 1 2 1 2 11 2 111 2 1 2 1 )( ))(( )( ˆ (32) Conforme a conveniência analítica, pode-se demonstrar que ̂ pode ainda ser dado por: n i i n i ii n i i n i ii n i i n i ii x Yx x yX x yx β 1 2 1 1 2 1 1 2 1ˆ (33) Exemplo 6. A partir das informações da amostra apresentas no Exemplo (1), podemos estimar os parâmetros para o ajuste de regressão linear entre o rendimento mensal (Y) e os anos de escolaridade (X): iii eXY ˆ ˆˆ Onde: 62,7ˆ787ˆ (85)β 69,91 5,230 21135ˆ n 1i 2 i n 1i ii x yx β Sendo então o ajuste de MQO dado por: ii XY 69,9162,7 ˆ 6 Dica: faça o caminho contrário da demostração, partindo da forma simplificada, para facilitar a compreensão. Econometria Regressão Linear Simples 22 Em outras palavras, o rendimento esperado para quem não possui escolaridade seria de 7,62 reais e, para cada ano adicional de escolaridade, esperaria-se um acréscimo de 91,69 reais no rendimento. 1.3.3. Propriedades dos Estimadores de Mínimos Quadrados Ordinários A partir de desenvolvimento algébrico, podemos derivar algumas importantes propriedades do ajuste de MQO. Propriedade 1. O valor médio dos resíduos será igual a zero. Da equação (28) para os estimadores de mínimos quadrados pode-se demonstrar que a soma e, consequentemente, o valor médio dos resíduos será igual a zero: n i ii Xβα(Y 1 0)1)](ˆˆ[2 0ˆ]ˆ[ 11 n i i n i ii eYY (34) Propriedade 2. Os resíduos não estão correlacionados aos valores de Xi. Dada a definição de covariância, para demonstrarmos que não há relação entre êi e Xi, precisamos provar que: n i ii XXee1 0))(ˆ( Como a soma dos resíduos é igual a zero, teremos simplesmente que provar: 0ˆˆˆ 11111 n i ii n i n i i n i i n i ii XeXeXeeXXe Utilizando agora os resultados da equação (29) para os estimadores de mínimos quadrados podemos demostrar que: n i iii XXβαY 1 0))](ˆˆ([2 0))(ˆ())(ˆ( 11 n i ii n i iii XeXYY (35) Essas duas primeiras propriedade (Propriedade 1 e 2) são muito importantes na análise de regressão e denominadas condições de primeira ordem dos estimadores de mínimos quadrados. Propriedade 3. A reta de regressão passará pelas médias aritméticas de X e Y. Econometria Alexandre Gori Maia 23 Das equações (22) e (30) podemos demonstrar que, quando o valor controlado de Xi for equivalente à média de X, o valor esperado de Yi será igual à média de Y. ii XY ˆˆˆ ii XβXβYY ˆˆˆ XβXβYYi ˆˆˆ YYi ˆ (35) Propriedade 4. Os resíduos não estão correlacionados aos valores previstos de Yi. Devemos provar que: 0ˆˆ)ˆ(ˆ 11 n i ii n i ii YeYYe De (22) e (35), teremos que: 0ˆˆˆˆ)ˆˆ(ˆˆˆ 1111 n i ii n i i n i ii n i ii XeeXeYe (36) Exercícios 1. Dados os estimadores de MQO do ajuste ii XY ˆˆˆ , prove que ii xy ̂ˆ . 2. Observaram-se os gastos per capita com alimentação (Y) e a renda mensal per capita (X) em uma amostra de 5 famílias: Y 60 80 90 110 160 X 100 200 200 400 400 a. Esboce e análise o gráfico de dispersão para as variáveis em questão; b. Estime e analise a covariância e a correlação entre as variáveis; c. Estime por MQO os parâmetros do modelo de regressão linear simples para prever o gasto com alimentação (Y) em função da renda (X); d. Interprete os parâmetros do modelo de regressão; e. Estime os resíduos associados a cada estimativa para os gastos com alimentação; f. Qual o gasto esperado com alimentação para uma família com renda per capita de 2.000 reais? Econometria Regressão Linear Simples 24 3. Uma amostra de quatro anos de uma economia fictícia forneceu os seguintes dados: Y (Consumo, bilhões de US$) 1 1 2 4 X (Taxa de juros, % a.a.) 8 7 6 5 Agora suponha que a relação entre as variáveis seja dada por: ttt eXY a. Estime os coeficientes do modelo por MQO; b. Interprete as estimativas dos coeficientes; c. Qual seria o consumo esperado para a economia caso a taxa de juros baixasse para 4% a.a.? 4. Uma amostra de 5 observações forneceu as seguintes informações para preço (X) e quantidade consumida (Y) de determinado produto: Preço 0 1 2 3 4 Quantidade 4 2 2 1 1 Suponha que a relação entre as variáveis seja dada por: iii eXY a. Defina a função de Erro Quadrático Total; b. Estime os coeficientes por MQO; c. Interprete as estimativas de MQO para os parâmetros do modelo; d. Estime o valor do EQT assumindo as estimativas de MQO. Seria possível observar um valor inferior ao obtido? Explique. e. Estime o consumo esperado caso o preço do produto seja igual a 4,5; f. Se o custo de produção é igual a 2 por unidade, calcule o lucro esperado caso o preço de venda seja igual a 3. 5. (ANPEC, 1992) Responda Falso ou Verdadeiro. O custo total, C, de uma indústria e sua produção, X, têm uma relação linear do tipo ttt eXC . Para se ajustar esse modelo por mínimos quadrados ordinários é preciso assumir certas hipóteses como: a. A variável independente X seja aleatória. b. Os erros tenham média zero. Econometria Alexandre Gori Maia 25 c. Os erros sigam uma distribuição normal. d. A variável independente X seja independente do temo erro. Respostas 2) b. 4500ˆ XY ; r=0,88; c. 35ˆ ; 25,0 ˆ ; e. ê={0; –5; 5; –25; 25}; f. 535ˆ Y 3) a. 5,8ˆ ; 1ˆ ; c. 5,4ˆ iY 4) a. 2)]ˆˆ([ ii XYEQT ; b. 4,3ˆ ; 7,0ˆ ; d. EQT=1,1; d. 25,0ˆ iY ; f. 1,3 5) a. F; b. V; c. F.; d. V Econometria Propriedades dos Estimadores 26 2. Inferência com os Estimadores de MQO Introdução Após estimar os coeficientes de um modelo de regressão, deve-se verificar o grau de confiabilidade dos resultados, ou seja, verificar em que medida as estimativas obtidas na amostra aproximam-se dos reais parâmetros da população. Para cumprir com esse objetivo, serão realizados testes de hipóteses e intervalos de confiança para os reais parâmetros do modelo regressão linear simples a partir das estimativas de MQO. Para viabilizar essas análises, é fundamental conhecer algumas importantes propriedadesestatísticas dos estimadores de MQO. A contribuição mais importante para essa análise foi dada em 1821, quando Gauss demontrou que, sob determinadas premissas, as estimativas de MQO seriam não viesadas e de mínima variância. Posteriormente, em 1912, Markov desenvolveu de maneira mais usual esse mesmo teorema, que passou a ser conhecido como teorema de Gauss- Markov. 2.1.Teorema de Gauss-Markov Qunado elaboramos um modelo de regressão linear simples pressupomos que, na população, Y seja dado por uma função linear de X segundo a equação: iii eXY (1) Em primeiro lugar, devemos estar cientes que uma população pode gerar amostras diferentes. Assim, embora na população os valores de e sejam constantes, ou seja, há apenas uma reta para o conjunto de dados da população, na amostra estaremos sujeitos à aleatoriedade da seleção e, assim, as estimativas dos coeficientes ̂ e ̂ poderão assumir quaisquer valores segundo uma dada distribuição de probabilidade. Em outras palavras, poderemos ter retas diferentes dependendo da amostra selecionada (Figura 2). Econometria Alexandre Gori Maia 27 (2) Em segundo lugar, devemos considerar que, para uma dada amostra selecionada, outras técnicas poderiam ser aplicadas para obter os estimadores dos coeficientes e , não apenas o MQO7, as quais não necessariamente chegariam aos mesmos resultados. Em outras palavras, para uma dada amostra, poderíamos ter diferentes retas amostrais, dependendo da técnica utilizada. O que garante que os estimadores de MQO serão mais confiáveis que outros estimadores é uma série de condições estabelecidas pelo Teorema de Gauss-Markov. Segundo o Teorema de Gauss-Markov, cinco pressupostos básicos devem ser satisfeitos para que os estimadores de MQO sejam os Melhores Estimadores Lineares Não Viesados (MELNV) ou, em ingês, Best Linear Unbiased Estimator (BLUE). Ser linear, significa que os estimadores de e serão funções lineares da variável aleatória Y8. Ser não viesado significa que o valor esperado do estimador de MQO será igual ao parâmetro da população (equação 3) e ser o melhor estimador significa que sua variabiliadde será a mínima possível (equação 4). )ˆ(E e )ˆ(E (3) )ˆ()ˆ( VV e )ˆ()ˆ( VV (4) Onde ˆ e ˆ são quaisquer outros estimadores lineares que não aqueles obtidos pelo MQO. Os cinco pressupostos para que os estimadores de MQO sejam os MELNV são: i) Relação linear entre Y e X: 7 Entre as técnicas alternativas, destaque para o Método de Máxima Verossimilhança e o Método de Momentos. 8 Pressupondo que os valores de X sejam controlados (não aleatórios), é fácil demonstrar que os estimadores de MQO são funções lineares de Y. Econometria Propriedades dos Estimadores 28 A relação entre Y e X na população é representada por uma função com coeficientes lineares9. A linearidade nas variáveis, por sua vez, não é necessária, já que essas podem ser algebricamente transformadas em novas variáveis que apresentem relação linear entre si. Por exemplo, o modelo iii eXY 2 não é linear no regressor, mas, se criarmos a variável 2ii XZ , então a relação iii eZY será linear (esse tema será abordado posteriormente). ii) Os valores de X são fixos em repetidas amostras e não aleatórios: Pressupõe que cada variável independente possa ser controlada pelo pesquisador, ou seja, este pode mudar seu valor de acordo com os objetivos da pesquisa. O caso característico é o de um estudo experimental, onde o pesquisador seleciona aleatoriamente os elementos amostrais que sofrerão um efeito controlado X e observa os valores resultantes de Y. Por exemplo, o pesquisador seleciona aleatoriamente as parcelas de terra que receberão uma determinada quantidade de fertilizantes (X) e observa suas respectivas produções (Y). Embora essa premissa seja necessária para demonstração de várias propriedades estatísticas, não é verdadeiramente essencial, tampouco factível na maioria dos estudos econômicos. Em muitas situações, pode ser pouco ético ou inviável controlar o efeito de X. Por exemplo, não seria factível selecionar aleatoriamente pessoas que receberiam uma determinada quantidade de educação (X) para avaliar seus efeitos sobre o rendimento no trabalho (Y). Em estudos não experimentais, quando não controlamos os valores de X, mas os observamos aleatoriamente, devermos ter cuidados especiais para que as relações de causa e efeito não sejam viesadas (tema a ser abordado posteriormente). iii) Esperança condicional dos erros igual a zero: Em outras palavras, E(e/Xi) = E(ei) = 0. É o mesmo que afirmar que a esperança condicional de Y é definida pela reta de regressão, ou seja, E(Y/Xi)=E(Yi)=+Xi. Significa que os valores dos erros não podem estar associados aos valores de Xi. Caso contrário, as relações de causa e efeito podem estar viesadas. Não é um problema em estudos experimentais, quando conseguimos controlar os valores de 9 Expoentes dos coeficientes iguais a 1. Econometria Alexandre Gori Maia 29 X e esses são considerados como constantes10. Entretanto, quando trabalhamos com estudos não experimentais, devemos nos precaver para que não haja fatores não controlados pelo modelo (e) afetando simutaneamente Y e X. Seria o caso, por exemplo, da aptidão, variável não controlada em um modelo de determinação da renda (presente, assim, nos erros e), que poderia afetar simultaneamente a renda (Y) e os anos de estudo (X). Por definição, os estimadores de MQO pressupõem a ausência de correlação entre os resíduos (êi) e a variável independente (Xi) 11. Caso a ausência de correlação não se concretize na população, os estimadores de MQO serão viesados; iv) A variabilidade dos erros é constante, qualquer que seja X: Em outras palavras, significa afirmar que a variância condicional dos erros seja dada por 2222 )()]([)()()|( iiiii eEeEeEeVarXeVar . Quando a dispersão dos erros é a mesma em todos os pontos de X dizemos que os erros são homocedáticos (homo=igual; cedásticia=dispersão). Caso contrário, dizemos que se tratam de erros heterocedásticos, ou seja, 22 )( iieE . v) Os erros são não autocorrelacionados: Em outras palavras, Cov(ei,ej)=E(eiej)E(ei)E(ej)=0 para todos ij. Representa independência entre observações da amostra, não havendo quaquer tipo de relação entre seus erros. A autocorrelação é, entretanto, frequente em análises de séries temporais (correlação serial) ou dados espaciais (correlação espacial); Enquanto os três primeiros pressupostos são necessários para que os estimadores sejam não viesados, os dois últimos são necessários para que estes sejam os mais eficientes12. Em adição a esses cinco pressupostos, é ainda importante que os erros estejam normalmente distribuídos para viabilizar a aplicação de testes de hipóteses e intervalos de confiança aos coeficientes do modelo de regressão (a ser visto no próximo tópico). Modelos 10 Lembre-se que a associação entre uma constante (X) e uma variável aleatório (e) será sempre nula. 11 É uma das condições de primeira ordem dos estimadores de MQO. 12 Para os leitores familiarizados com álgebra, as demonstrações dessas propriedades podem ser consultadas nos Apêndices A e B. Econometria Propriedades dos Estimadores 30 baseados nessas seis pressuposições são chamados de Modelos Clássicos de Regressão Linear (MCRL). Uma propriedade adicional muito importante dos estimadores de MQO sob a premissas de um MCRL é que esses serão os mais eficientes (apresentarão variância mínima) entre quaisquer estimadores não viesados de , não apenas entre os estimadores lineares, como pressupõe o teorema de Gauss-Markov. 2.2.Significância das estimativasUma vez que os valores das estimativas de e (Equação 1) dependem da amostra selecionada, devemos considerar suas variabilidades para saber se há evidências estatísticas de que os respectivos parâmetros na população são diferentes de zero. Caso tenhamos, por exemplo, evidências estatísticas que o parâmetro seja diferente de zero, significaria poder afirmar que a reta da população tem uma inclinação positiva ou negativa e, consequentemente, que há relação linear entre Y e X. Analogamente, caso haja evidências estatísticas que o parâmetro seja diferente de zero, significaria poder afirmar que a reta da população não passa pela origem dos eixos e, consequentemente, que o valor esperado de Y para um X nulo seja diferente de zero. Graficamente, temos possíveis representações dessas situações na Figura 5. (5) Para verificar se os parâmetros do modelo de regressão são iguais ou não a zero, é conveniente desenvolvermos testes de hipóteses às estimativas obtidas por ̂ e ̂ . A aplicação desses testes viabilizar-se-á caso conheçamos: i) as distribuições de probabilidade dos estimadores; ii) as estimativas para os parâmetros dessas distribuições. 2.3.Distribuição amostral dos estimadores Sob um pressuposto mais geral do Teorema do Limite Central, pode-se afirmar que a soma de variáveis independentes e igualmente distribuídas terá uma distribuição normal. Assim, os erros Econometria Alexandre Gori Maia 31 ei, por serem considerados uma soma de diferentes fatores não observáveis afetando a variabilidade de Y, também estariam normalmente distribuídos em torno de uma média zero13. Dizer que os erros possuem distribuição normal com média zero é o mesmo que afirmar que os valores de Yi se distribuem normalmente em torno da reta de regressão (Figura 6). Ademais, a normalidade dos erros (e dos valores de Yi em torno da reta) implicaria ainda que os estimadores de MQO estariam normalmente distribuídos, já que esses são combinações lineares dos valores de Yi (ver Apêndice A). Pressupondo ainda que os estimadores de MQO sejam não viesados, como sugere o Teorema de Gauss-Markov, teríamos que os estimadores de um MCRL estariam normalmente distribuídos em torno dos reais parâmetros e . ),0(~ 2Nei ),(~ˆ 2̂ N ),(~ˆ 2 ̂ N (6) 2.4.Variância dos estimadores Conhecidas as funções de densidade de probabilidade (fdp) dos erros e dos estimadores de MQO (6), o próximo passo é definir os parâmetros dessas fdp para viabilizar a inferência estatística, em especial, a aplicação de testes de hipóteses e intervalos de confiança. Os três parâmetros necssários são14: i) a variância dos erros ou variância da regressão (2); ii) a variância do estimador ̂ ( 2̂ ); iii) a variância do estimador ̂ ( 2 ̂ ). A variância dos erros representa a dispersão quadrática média dos erros em torno da reta de regressão. Como usualmente desconhecemos o real valor de 2 na população, precisamos de 13 Deve-se, entretanto, destacar que essa pressuposição nem sempre é verdadeira, sobretudo para amostras pequenas, dependendo da composição dos fatores não observáveis (caso esses não sejam aditivos, por exemplo) e de suas respectivas distribuições de probabilidade. Há testes estatísticos apropriados para verificar até que ponto a distribuição dos resíduos se aproxima de uma normal e se tal pressuposição pode ser considerada verdadeira. 14 Os valores dos parâmetros e não são necessários já que o objetivo dos testes de hipóteses e dos intervalos de confiança é justamente inferir sobre seus reais valores. Econometria Propriedades dos Estimadores 32 um estimador para estimá-lo a partir dos resíduos da amostra. Como demonstrado no Apêndice C, o estimador não viesado de 2 a partir dos resíduos do MQO será dada por: 2 ˆ ˆ 2 2 n ei (7) O denominador n–2 representa o número de graus de liberdade dos resíduos e significa que, caso se conheça n–2 valores dos resíduos, os outros dois seriam automaticamente determinados a partir de restrições impostas às propriedades matemáticas dos estimadores de MQO15. A raiz quadrada da variância da regressão, ou ̂ , é chamada de erro padrão da regressão e é uma medida da dispersão média dos resíduos. Como o cálculo do numerador da equação (7), 2iê , pode ser demasiadamente trabalhoso, uma equação igualmente válida é dada por: iiii yxye ̂ˆ 22 (8) Não é difícil demonstrar a relação estabelecida acima. Basta utilizarmos a expressão definida no Apêndice C para iii exy ˆ ˆ e lembrarmos que 2 ˆ i ii x yx : 22222 ˆˆ2)ˆ(ˆ iiiiiii xyxyxye 222 2 2 2 22 )( )()( 2ˆ i i ii i ii ii x x yx x yx ye iii i ii ii yxy x yx ye ̂ )( ˆ 2 2 2 22 (9) As variâncias dos estimadores ̂ e ̂ ( 2̂ e 2 ̂ ) representam as dispersões quadráticas médias destes em função da aleatoriedade da amostra. Serão dadas por (ver demonstrações no Apêndice B): 2 2 2 2)ˆ()ˆ( i i xn X EVar e 2 2 2)ˆ()ˆ( ix EVar (10) Seus estimadores são obtidos substituindo 2 por 2̂ : 15 São duas as restrições impostas aos resíduos: i) êi=0; ii) êiXi=0. Econometria Alexandre Gori Maia 33 2 2 2 2 2 2 2 ˆ ˆ 1 ˆ ii i x X nxn X S e 2 2 2 ˆ ˆ 1 ix S (11) As raízes quadradas dessas variâncias ( ̂S e ̂S ) são chamadas de erros padrão dos estimadores. A partir dos estimadores obtidos em (11) podemos derivar algumas importantes propriedades matemáticas: i. Quanto maior o erro padrão da regressão, menos precisa será a estimativa dos parâmetros: em outras palavras, quanto mais dispersos estiverem os valores observados em torno da reta de regressão, mais dispersas serão as estimativas de MQO. Algebricamente, pode-se observar essa propriedade a partir do numerador das equações em (11). ii. Quanto maior a variabilidade observada para os valores de X, mais precisa será a estimativa dos parâmetros: a variabilidade dos valores amostrados de X é uma importante medida da qualidade do ajuste. Baixa dispersão de X indica que a amostra não representa uma relevante amplitude de valores. Matematicamente, a dispersão de X será medida pelo denominador 2ix das equações em (11); iii. Quanto maior o tamanho da amostra, maior a variabilidade observada para X e mais precisas serão as estimativas dos parâmetros: a maior representatividade da amostra garante uma maior amplitude de comportamentos considerados. Matematicamente, essa relação é dada pelos denominadores n e 2ix das equações em (11). 2.5.Teste de hipóteses para os coeficientes O teste de hipóteses para os coeficientes do modelo de regressão usualmente é utilizado para verificar se há evidências, com base em estimativas observadas na amostra, que seus valores na população sejam diferentes de zero. Assim, as hipóteses a serem testadas seriam: 0: 0: 1 0 H H e 0: 0: 1 0 H H (12) Econometria Propriedades dos Estimadores 34 Embora menos frequentes, podem ainda ser elaborados testes para verificar se os parâmetros e são diferentes, maiores ou menores que quaisquer outras constantes que não o zero. Pressupondo a veracidade das hipóteses nulas e conhecendo algumas das propriedades dos estimadores de MQO, teremos as seguintes distribuições de probabilidade para as estatísticas de teste: ),0(~ˆ 2 ̂ N e ),0(~ ˆ 2 ̂ N (13) A partir de então, os passos para resolução serão análogos aos de qualquer teste de hipóteses: i) observar estimativa para a estatística de teste na amostra ( ̂ e ̂ ); ii) calcular valor p,probabilidade de erro ao se rejeitar H0, ou seja, afirmar que o valor do parâmetro é diferente de zero. Como a real variância dos coeficientes é desconhecida, o uso de suas estimativas amostrais 2 ̂S e 2 ̂ S exigirá ainda o uso da distribuição t de Student para o cálculo da probabilidade de erro, como exemplifica a Figura (14). Os graus de liberdade são os mesmos obtidos para a variância amostral da regressão (Equação 7), ou seja, n–2. (14) Rejeitar H0 significa afirmar que a estimativa de é significativa, ou, no caso do coeficiente angular, que a variável independente X é significativa no modelo. Exemplo 1. Obeservou-se o consumo mensal de energia (Y, em Kwh) e o total de horas que o ar condicionado permaneceu ligado (X, em h) em uma amostra de 21 domicílios. Os valores observados e as estimativas de MQO para o ajuste linear foram: Econometria Alexandre Gori Maia 35 i KWh (Y) AC (X) i KWh (Y) AC (X) 1 35 1,5 12 77 7,5 2 17 2,0 13 62 7,5 3 57 2,5 14 65 7,5 4 63 4,5 15 66 8,0 5 66 5,0 16 65 8,0 6 33 5,0 17 75 8,0 7 79 6,0 18 94 8,5 8 43 6,0 19 85 12,0 9 33 6,0 20 94 12,5 10 78 6,5 21 93 13,5 11 82 7,5 iii eXY ˆ34,585,27 Em outras palavras, espera-se que para cada hora adicional com o ar condicionado ligado o consumo de energia aumente, em média, 5,34 KWh. O consumo esperado para um domicílio que não utilize o ar condicionado é de 27,85 KWh. As estimativas da variância e do erro padrão da regressão serão dadas por: 89,208 19 91,3968 221 )96,6()61,0(...)53,21()86,0( 2 ˆ ˆ 22222 2 n ei 45,1489,208ˆ O erro padrão é uma estimativa do erro médio de previsão do modelo, ou seja, de aproximadamente 14,45 KWh. O próximo passo é estimar as variâncias dos coeficientes do modelo para verificar se as estimativas de e são significativas, ou seja, se são estatisticamente diferentes de zero. Essas serão dadas por: 2 22 2 2 2 2 2 ˆ 81,794,6089,208 )6,6(...)4,5( 9,6 21 1 ˆ 1 ix X n S 2 2 2 2 ˆ 03,106,1 6,196 89,208ˆ 1 ix S Pode-se então, finalmente, verificar se as estimativas são significativas aplicando-se o teste de hipóteses para aos coeficientes do modelo: Econometria Propriedades dos Estimadores 36 O valor p associado ao teste para o coeficiente é de 0,2%, ou seja, a probabilidade de erro ao afirmarmos que o intercepto é diferente de zero é de apenas 0,2%. Sendo assim, pode-se afirmar que residências que não utilizam ar condicionado (X=0) possuem um consumo de energia diferente de zero, já que outros aparelhos estariam influenciando o consumo. Por sua vez, o valor p associado ao teste para o coeficiente é aproximadamente nulo. Em outras palavras, se afirmarmos que é diferente de zero, ou seja, que o número de horas com ar condicionado ligado tenha relação linear com o consumo de energia, a chance de estarmos errados seria praticamente nula. 2.6.Intervalo de confiança para os coeficientes Outra técnica de inferência estatística clássica que pode ser aplicada às estimativas dos coeficientes do modelo de regressão é o intervalo de confiança. Dado um nível de confiança , o intervalo de confiança definirá intervalos que, em repetidas amostras de tamanho n, conterá o real parâmetro da população em das situações. Antes de verificarmos as estimativas de intervalo para os coeficientes do modelo de regressão, vale a pena relembrar alguns cuidados especiais na sua interpretação. Primeiro, como o parâmetro a ser estimado é uma constante e não uma variável aleatória, não podemos afirmar que este tenha de probabilidade de pertencer a um intervalo. O parâmetro estará contido (probabilidade 1) ou não (probabilidade 0) em um intervalo. Segundo, uma vez estimado o intervalo com os valores de uma determinada amostra, não podemos afirmar que o intervalo estimado tenha de probabilidade de conter o parâmetro, já que, uma vez definidos os limites do Econometria Alexandre Gori Maia 37 intervalo, esses conterão (probabilidade igual a 1) ou não (probabilidade igual a 0) o parâmetro da população. Sabendo que os estimadores de MQO seguem uma distribuição normal sob as premissas do MCRL, os intervalos de confiança para os parâmetros e seriam dados por: (15) Onde Z é o número de desvios padrão, obtido da distribuição Z~N(0,1), que se deve estar afastado do centro da distribuição para que se tenha de probabilidade entre os dois extremos do intervalo. Entretanto, como os reais valores 2̂ e 2 ̂ são desconhecidos, o uso das estimativas obtidas pelos estimadores 2̂S e 2 ̂ S implicará na consideração da estatística t de student em substituição à Z. Assim, os intervalos de confiança para os parâmetros e serão dados por: ]ˆˆ[),( ˆ2ˆ2 αnαn Stα; St αIC ]ˆ;ˆ[),( ˆ2ˆ2 StStγIC nn (16) Onde tn–2 é o valor da distribuição t de student com n–2 graus de liberdade para que se tenha de probabilidade entre os dois extremos do intervalo. Exemplo 2. Para estimar intervalos com confiança de 95% para os parâmetro do modelo da relação linear entre consumo mensal de energia (Y, em Kwh) e o total de horas que o ar condicionado permaneceu ligado (X, em h), teríamos: )]817(8527);817(8527[),( 1919 ,t,,t,IC )]031(345)031(345[),( 1919 ,t,; ,t,IC Para uma confiança de 95%, por exemplo, os intervalos seriam dados por: ]19,44;51,11[)]81,7(09,285,27);81,7(09,285,27[), γIC( ]50,7;18,3[)]03,1(09,234,5);03,1(09,234,5[), γIC( Econometria Propriedades dos Estimadores 38 O intervalo determinado pelos valores 11,51 a 44,19 KWh é uma estimativa de um intervalo que, em repetidas amostras de tamanho 21, conteria o real valor do parâmetro em 95% das situações. Por sua vez, o intervalo definido pelos valores 3,18 a 7,50 KWh é uma estimativa do intervalo de 95% de confiança para o parâmetro . Exercícios 1. Sejam os gastos per capita com alimentação (Y) e a renda mensal per capita (X) em uma amostra de 5 famílias: Y 60 80 90 110 160 X 100 200 200 400 400 a. Estime a variância dos coeficientes do modelo de regressão linear simples para prever o gasto com alimentação (Y) em função da renda (X). b. As estimativas dos coeficientes são significativas? Interprete. c. Defina intervalos com confiança de 95% para os parâmetros do modelo. Interprete seus resultados. d. Existe alguma associação entre os resultados dos testes de hipóteses (b) e dos intervalos de confiança (c)? 2. Seja a amostra de quatro anos de uma economia fictícia: Y (Consumo, bilhões de US$) 1 1 2 4 X (Taxa de juros, % a.a.) 8 7 6 5 Agora suponha que a relação entre as variáveis seja dada por: ttt eXY a. Teste a hipótese de que o coeficiente angular é menor que zero; b. Interprete o valor p obtido no teste acima; 3. Seja a amostra de 5 observações para preço (X) e quantidade consumida (Y) de determinado produto: Preço 0 1 2 3 4 Econometria Alexandre Gori Maia 39 Quantidade 4 2 2 1 1 Suponha que a relação entre as variáveis seja dada por: iii eXY a. Há evidências estatísticas para afirmar que a quantidade consumida dependa do preço do produto? Interprete o nível de significância. b. Estime e interprete um intervalo de 95% de confiança para a o efeito do preço sobre a quantidade consumida. 4. A partir de uma amostra de n elementos, foi estimada uma regressão linear simples, pelo método de mínimos quadrados, obtendo-se o resultado: XY 1 ˆˆˆ . A seguir, a mesma regressão foi estimada sabendo-se que a reta de regressão da população passa pela origem das coordenadas (termo constante = 0), obtendo-se o resultado: XY 2 ˆˆ . Pode-se afirmar que: a. 21 ˆˆ . b. A reta de regressão passa pelas médias amostrais de Y e X, mesmo que o modelo não tenha intercepto. c. No primeiro modelo, quanto maior for a variação da variável explicativa, maior será a precisão com que o coeficiente angular pode ser estimado. 5. (ANPEC, 1996) Suponha que, num modelo de regressão linear simples, o regressor seja correlacionado com o termo erro. Sobre o estimador de MQO, podemos afirmar: a. É, em geral, viesado. b. Não é possível de ser obtido. c. É não viesado, porém não é eficiente. d. É consistente. Respostas 1) a. 22ˆ 22,22S ; 22 ˆ 08,0S ; b. : p=0,213; : p=0,049; c. IC(, 95%)=[–35,70; 105,70]; IC(, 95%)=[0,003; 0,497] 2) a. 22ˆ 32,0S ; t=–3,16; p=0,044 Econometria Propriedades dos Estimadores 40 3) a. Sim; t=–3,656; p=0,035; b. IC(,95%)=[–1,309;–0,091] 4) a. F; b. F; c. V 5) a. V; b. F; c. F; d. F Econometria Alexandre Gori Maia 41 Apêndice A – Valor Esperado e Exatidão dos Estimadores de MQO Para demonstrarmos algebricamente que os estimadores de MQO são não viesados caso os pressupostos (i) a (iii) do teorema de Gauss-Markov sejam válidos, comecemos pela representação do coeficiente angular: n i i n i ii x Yx β 1 2 1ˆ Para simplificar a demonstração, vamos denominar n j j i i x x z 1 2 e teremos n i iiYzβ 1 ˆ Pressuposto i: supondo a relação linear entre as variáveis, iii eXY , teremos: n i ii n i ii n i i n i ii n i ii n i i n i iii n i ii ezXzzezXzzeXzYzβ 11111111 )(ˆ O primeiro termo, n i iz 1 , será igual a zero, pois 0 0 )( 1 2 1 2 1 n i i n i i n i i xx XX O segundo termo, n i ii Xz 1 , sera igual a , pois 22 1 2 2 1 2 1 2 11 2 11 2 1 2 1 1 2 1 22)( )( XnXnX XnX XXXX XXX XX XXX x Xx n i i n i i n i n i i n i i n i i n i i n i i n i ii n i i n i ii Assim, teremos: n i iiezβ 1 ˆ Agora, para calcularmos o valor esperado de ̂ : n i ii n i ii ezEezEβE 11 )ˆ( Pressuposto ii: se consideramos os valores de X fixos, não aleatórios, teremos: Econometria Propriedades dos Estimadores 42 n i ii eEzβE 1 )()ˆ( Pressuposto iii: e se a esperança condicional dos erros for zero, teremos finalmente: n i izβE 1 0)ˆ( A demonstração para o intercepto é mais simples. Primeiro, o estimador de MQO será: XY ˆˆ Pressuposto i: supondo que a relação linear entre Y e X, iii eXY , se calcularmos o valor médio de cada lado da equação teremos: eXY Substituindo o valor de Y na equação do estimador de : eXXeX )ˆ(ˆ)(ˆ Assim, a esperança de ̂ será: )()]ˆ()()[()()]ˆ([)()ˆ( eEEEXEeEXEEE Pressuposto iii: dada a esperança condicional (e incondicional) zero dos erros, teremos que 0)( eE Presspostos i a iii: ademais, caso os pressupostos (i) a (iii) sejam satisfeitos, sabemos que )ˆ(βE . Então o valor esperado de ̂ será: 00)()ˆ( XEE Econometria Alexandre Gori Maia 43 Apêndice B – Variância e Eficiência dos Estimadores de MQO Para demonstrarmos algebricamente que os estimadores de MQO são eficientes caso os pressupostos (i) a (iii) do teorema de Gauss-Markov sejam válidos, precisamos inicialmente calcular suas variâncias. Começando pelo coeficiente angular: 2)]ˆ(ˆ[)ˆ( βEβEβVar Pressupostos i a iii: supondo ββE )ˆ( e n i iiezβ 1 ˆ , então: )2...2...()()ˆ()ˆ( 112121 222 1 2 1 2 1 2 nnnnnn n i ii eezzeezzezezEezEββEβVar Pressuposto ii: considerando que os valores de X sejam controlados, então )()( iiii eEzezE e: )(2...)(2)(...)()ˆ( 112121 222 1 2 1 nnnnnn eeEzzeeEzzeEzeEzβVar Pressuposto iv: caso a variância dos erros será constante para qualquer i, ou seja 22 )( ieE e: n i n ij jiji n i i eeEzzzβVar 1 1 1 22 )(2)ˆ( Pressuposto v: caso os erros sejam não autocorrelacionados, ou seja, 0)( ji eeE para ij, então: 2 1 2 1 2 2 1 22 1 22)ˆ( n i i n i in i i n i i x x zzβVar E: n i ix βVar 1 2 2 )ˆ( Para agora demonstrarmos que a variância dos estimador de MQO para é a menor entre os estimadores lineares não viesados de , comecemos pela representação desse primeiro dada por: Econometria Propriedades dos Estimadores 44 n i iiYzβ 1 ˆ Que é, naturalmente, uma função linear da variável aleatória Yi. Agora, vamos generalizar a representação de outro estimador linear para por: n i iiYwβ 1 *ˆ Ou seja, uma função linear de Yi segundo um fator de ponderação wi. A esperança deste estimador genérico será dada por: n i ii n i i n i ii n i i n i ii n i ii n i ii XwwXwwXEwYEwYwEβE 1111111 * )()()()ˆ( Primeiro, as condições necessária para que *β̂ seja não vieasado, ou seja ββE )ˆ( * , são: 0 1 n i iw e 1 1 n i ii Xw E, dessas igualdades, derivamos ainda que: 1 111 n i i n i ii n i ii wXXwxw Cientes dessas condições, vamos agora estimar a variância de *̂ : n i ii n i ii YVarwYwVarβVar 1 2 1 * )()()ˆ( Como Var(Yi) = Var(ei)=2, então n i iwβVar 1 22* )ˆ( Agora vamos realizar um malabarismo algébrico, incluindo o termo zi na equação sem comprometer a igualdade: n i iii zzwβVar 1 22* )()ˆ( Desenvolvendo, teremos: Econometria Alexandre Gori Maia 45 n i iiiiii zzwzzwβVar 1 222* ])(2)[()ˆ( n i i n i iii n i ii zzwzzwβVar 1 22 1 22 1 22* )(2)()ˆ( O segundo termo será zero, pois 0 11 )( 1 2 1 2 2 1 2 1 2 1 2 1 1 2 n i i n i i n i i n i i n i i n i iin i iii xxx x x xw zwz Assim, a variância *̂ de resume-se a: n i i n i ii n i i n i ii x zwzzwβVar 1 2 2 1 22 1 22 1 22* )()()ˆ( Como o segundo termo da equação ( n i ix 1 22 ) é constante, a variância de *̂ será minimizada quando ii zw . Em outra palavras, o estimador linear não viesado de de mínima variância é justamente o ̂ , pois: ̂ˆ 11 * n i ii n i ii YzYwβ A demonstração da eficiência do estimador intercepto segue o mesmo raciocínio. Vamos, entretanto, apenas apresentar o desenvolvimento para o estimador de sua variância: 2)]ˆ([)ˆ( EEVar Pressupostos i a iii: supondo )ˆ(E e eX )ˆ(ˆ , então: )(])ˆ([2)ˆ(])ˆ([)ˆ()ˆ( 22222 eEeXEEXeXEEVar O segundo termo é igual a zero pois 0)( eE . Ademais, sabendo que )ˆ()ˆ()ˆ( 22 VarEE , teremos: 2 1 2 2 )( 1 )ˆ()ˆ( n i ieE n VarXVar Econometria Propriedades dos Estimadores 46 Pressuposto iv e v: caso a variância dos erros seja constante, 22 )( ieE , e os erros sejam não correlacionados, 0)( ji eeE , teremos: 2 2 1 2 2 2 1 2 2 1 2 2 2 )( 1 )ˆ( n n x XeE n x XVar n i i n i in i i E: 2 1 2 2 ) 1 ()ˆ( n x X Var n i i A demonstração que a variância do estimador de MQO para é a menor entre os estimadores lineares não viesados de , segue os mesmos passos da obtida para , embora não seja aqui apresentada. Econometria Alexandre Gori Maia 47 Apêndice C – Variância dos erros Devemos demonstrar que 2 ˆ ˆ 1 2 2
Compartilhar