Econometria apostila Gori

•
UNICAMP

BIANCA VASCONCELOS
22/09/2020
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 302 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 302 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 302 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Econometria

6.233 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
Econometria 
 
 
Alexandre Gori Maia 
 
2014 
 
 
 
 
 
 
Sumário 
1. Correlação e Regressão Linear Simples ................................................................................. 9 
Introdução ................................................................................................................................... 9 
1.1. Correlação ........................................................................................................................ 9 
1.2. Regressão Linear Simples .............................................................................................. 15 
1.3. Método de Mínimos Quadrados Ordinários ................................................................... 18 
1.3.1. Definição ................................................................................................................. 19 
1.3.2. Aplicação do MQO na regressão linear simples ..................................................... 20 
1.3.3. Propriedades dos Estimadores de Mínimos Quadrados Ordinários ........................ 22 
Exercícios .................................................................................................................................. 23 
Respostas................................................................................................................................... 25 
2. Inferência com os Estimadores de MQO .............................................................................. 26 
Introdução ................................................................................................................................. 26 
2.1. Teorema de Gauss-Markov ............................................................................................ 26 
2.2. Significância das estimativas ......................................................................................... 30 
2.3. Distribuição amostral dos estimadores ....................................................................... 30 
2.4. Variância dos estimadores .......................................................................................... 31 
2.5. Teste de hipóteses para os coeficientes ...................................................................... 33 
2.6. Intervalo de confiança para os coeficientes ................................................................ 36 
Exercícios .................................................................................................................................. 38 
Respostas................................................................................................................................... 39 
3. Intervalos de Confiança e Previsão para os Valores de Y ..................................................... 50 
Introdução ................................................................................................................................. 50 
3.1. Intervalos para valores individuais e para a média aritmética ....................................... 50 
3.2. Intervalo de confiança para o valor previsto de Y .......................................................... 52 
3.3. Intervalo de previsão para valores individuais de Yi ...................................................... 54 
3.4. Propriedades das estimativas por intervalo .................................................................... 55 
Exercícios .................................................................................................................................. 57 
Respostas................................................................................................................................... 58 
4. Formas Funcionais ................................................................................................................ 61 
Introdução ................................................................................................................................. 61 
 
 
4.1. Modelo Linear ................................................................................................................ 61 
4.2. Modelo Log-Lin ............................................................................................................. 63 
4.3. Modelo Lin-Log ............................................................................................................. 65 
4.4. Modelo Log-Log ............................................................................................................ 67 
Exercícios .................................................................................................................................. 69 
Respostas................................................................................................................................... 70 
5. Análise de Variância ............................................................................................................. 71 
Introdução ................................................................................................................................. 71 
5.1. Soma dos Quadrados ...................................................................................................... 71 
5.2. Coeficiente de Determinação ......................................................................................... 75 
5.3. Análise de Variância (ANOVA) .................................................................................... 77 
Exercícios .................................................................................................................................. 80 
Respostas................................................................................................................................... 81 
6. Introdução à Regressão Linear Múltipla ............................................................................... 86 
Introdução ................................................................................................................................. 86 
6.1. Estimadores de MQO ..................................................................................................... 86 
6.2. Estimadores de MQO a partir de notação matricial ....................................................... 89 
6.3. O uso de variáveis centradas .......................................................................................... 93 
Exercícios .................................................................................................................................. 97 
Respostas................................................................................................................................. 100 
8. Análise de Variância para Regressão Linear Múltipla ....................................................... 106 
Introdução ............................................................................................................................... 106 
8.1. Coeficiente de determinação e estatística F ................................................................. 106 
8.2. Coeficiente de determinação ajustado .......................................................................... 110 
Exercícios ................................................................................................................................ 112 
Respostas................................................................................................................................. 115 
9. Inferência em Regressão Linear Múltipla ........................................................................... 117 
Introdução ............................................................................................................................... 117 
8.1. Matriz de variância e covariância e teste t para k ....................................................... 117 
9.1. Inferência para combinação linear dos parâmetros ...................................................... 1219.1.2. Teste de hipóteses para combinação linear dos parâmetros ..................................... 122 
 
 
9.2. Intervalo de confiança para valor previsto ................................................................... 124 
Exercícios ................................................................................................................................ 126 
Respostas................................................................................................................................. 128 
10. Contribuição Marginal ..................................................................................................... 130 
Introdução ............................................................................................................................... 130 
10.1. ANOVA para contribuição marginal ........................................................................ 130 
10.2. Correlação parcial ..................................................................................................... 135 
Exercícios ................................................................................................................................ 137 
Respostas................................................................................................................................. 139 
11. Multicolinearidade ........................................................................................................... 140 
Introdução ............................................................................................................................... 140 
11.1. Definição .................................................................................................................. 141 
11.2. Fator Inflacionário da Variância ............................................................................... 144 
11.3. Identificação da multicolinearidade .......................................................................... 146 
11.4. Correção da multicolinearidade ................................................................................ 147 
Exercícios ................................................................................................................................ 150 
Respostas................................................................................................................................. 153 
12. Variáveis Binárias ............................................................................................................ 158 
Introdução ............................................................................................................................... 158 
12.1. Variáveis binárias para representar 2 categorias ...................................................... 159 
12.2. Variáveis binárias para representar múltiplas categorias ......................................... 161 
12.3. Interpretação de coeficientes de binárias em equações semi-logarítmicas ............... 164 
12.4. Outras aplicações das variáveis binárias .................................................................. 166 
12.5. Teste de mudança estrutural ..................................................................................... 170 
Exercícios ................................................................................................................................ 174 
Respostas................................................................................................................................. 177 
13. Heterocedasticidade ......................................................................................................... 178 
Introdução ............................................................................................................................... 178 
13.1. Definição .................................................................................................................. 178 
13.2. Identificação ............................................................................................................. 181 
13.2.2. Análise Gráfica .................................................................................................. 181 
 
 
13.2.3. Teste de Goldfeld-Quandt ................................................................................. 184 
13.2.4. Teste de Breusch-Pagan .................................................................................... 186 
13.2.5. Teste de White ................................................................................................... 188 
13.3. Mínimos Quadrados Ponderados .............................................................................. 190 
13.3.2. Função de heterocedasticidade conhecida......................................................... 192 
13.3.3. Função de heterocedasticidade desconhecida – Mínimos Quadrados 
Generalizados Factíveis ...................................................................................................... 194 
13.4. Estimadores Robustos da Variância ......................................................................... 196 
Exercícios ................................................................................................................................ 198 
Respostas................................................................................................................................. 201 
14. Autocorrelação ................................................................................................................. 202 
Introdução ............................................................................................................................... 202 
14.1. Definição .................................................................................................................. 202 
14.2. Identificação ............................................................................................................. 205 
14.2.2. Análise Gráfica ..................................................................................................... 206 
14.2.3. Teste t para regressores estritamente exógenos .................................................... 207 
14.2.4. Teste de Durbin-Watson para um MCRL ............................................................. 209 
14.2.5. Teste de Breusch-Godfrey para ordens superiores ............................................... 213 
14.3. Mínimos Quadrados Generalizados .......................................................................... 215 
14.3.2. Coeficiente de autocorrelação conhecido .......................................................... 217 
14.3.3. Coeficiente de autocorrelação desconhecido .................................................... 219 
14.4. Estimadores Robustos da Variância ......................................................................... 221 
Exercícios ................................................................................................................................ 222 
Respostas................................................................................................................................. 224 
15. Equações Simultâneas ...................................................................................................... 227 
Introdução ............................................................................................................................... 227 
15.1. Origem do problema ................................................................................................. 228 
15.2. Definição .................................................................................................................. 230 
15.3. Mínimos Quadrados Indiretos .................................................................................. 233 
15.4. Identificação .............................................................................................................235 
15.5. Estimação por Variáveis Instrumentais .................................................................... 242 
 
 
15.6. Mínimos Quadrados em dois Estágios (MQ2E) ....................................................... 245 
15.7. Teste de endogeneidade ............................................................................................ 247 
Exercícios ................................................................................................................................ 250 
Respostas................................................................................................................................. 252 
16. Estacionariedade .............................................................................................................. 254 
Introdução ............................................................................................................................... 254 
16.1. Processos estocásticos .............................................................................................. 255 
16.2. Estacionariedade ....................................................................................................... 256 
16.2.2. Definição ............................................................................................................... 256 
16.2.3. Raiz Unitária ......................................................................................................... 258 
16.2.4. Terminologia ......................................................................................................... 262 
16.3. Função de autocorrelação ......................................................................................... 265 
16.4. Teste de raiz unitária ................................................................................................. 267 
16.4.2. Teste de Dickey-Fuller .......................................................................................... 268 
16.4.3. Teste de Dickey-Fuller aumentado ....................................................................... 270 
Exercícios ................................................................................................................................ 272 
Respostas................................................................................................................................. 273 
17. Cointegração .................................................................................................................... 274 
Introdução ............................................................................................................................... 274 
17.1. Relação espúria ......................................................................................................... 274 
17.2. Modelo de tendência estacionária ............................................................................. 276 
17.2.2. Coeficiente de determinação para regressando com tendência ............................. 277 
17.3. Modelo de diferença estacionária ............................................................................. 279 
17.4. Cointegração ............................................................................................................. 280 
17.4.2. Modelo de correção de erros ................................................................................. 285 
Exercícios ................................................................................................................................ 286 
Respostas................................................................................................................................. 288 
18. Modelos ARIMA ............................................................................................................. 290 
Introdução ............................................................................................................................... 290 
18.1. Modelo Autorregressivo (AR) .................................................................................. 290 
18.2. Modelo de Médias Móveis (MA) ............................................................................. 293 
 
 
18.3. Modelo Autorregressivo e de Médias Móveis (ARMA) .......................................... 294 
18.4. Modelo Autorregressivo Integrado e de Médias Móveis (ARIMA) ........................ 295 
Exercícios ................................................................................................................................ 299 
Respostas................................................................................................................................. 300 
Referências .............................................................................................................................. 301 
 
 
Econometria Regressão Linear Simples 
 
8 
 
 
PARTE I 
 
Regressão Linear Simples 
 
Econometria Alexandre Gori Maia 
 
9 
 
1. Correlação e Regressão Linear Simples 
 
Introdução 
O termo regressão foi originalmente proposto por Francis Galton em seu trabalho 
Regression Towards Mediocrity in Hereditary Stature, publicado no Journal of the 
Anthropological Institute of Great Britain and Ireland, em 1886. Galton analisou a relação entre 
a estatura média dos pais de uma família e a de seus filhos adultos. Como se esperava, observou 
que, em geral, pais altos têm filhos altos e pais baixos têm filhos baixos. Também verificou que os 
filhos de pais altos não são tão altos quanto seus pais, assim como os filhos de pais baixos não são 
tão baixos quanto seus pais. Em outras palavras, a estatura dos filhos tendia a regredir à estatura 
média da população, comportamento que Galton denominou regressão à mediocridade1. 
A estatística moderna reserva, entretanto, o termo regressão ao estudo da relação de 
dependência de uma variável, a variável dependente, em função de uma ou mais variáveis, as 
variáveis explanatórias. O objetivo dessas análises é estimar ou prever o valor médio da variável 
dependente a partir de variações na variável explanatória, ou independente. 
Para melhor compreender os objetivos e aplicações da regressão em estatística, será 
inicialmente apresentada a análise de correlação, estreitamente relacionada à análise de regressão, 
mas conceitualmente muito diferente. Posteriormente, descrevem-se alguns conceitos e técnicas 
iniciais da regressão aplicada às relações lineares entre duas variáveis, a regressão linear simples. 
 
1.1.Correlação 
 Uma técnica simples para identificar possíveis padrões de associação entre duas variáveis 
quantitativas é o diagrama de dispersão. A Figura 1 apresenta três diagramas com diferentes 
padrões de dispersão entre duas variáveis X e Y. No primeiro observa-se uma tendência de 
associação linear positiva, ou seja, aumentando o valor de X, o valor de Y também tende a 
aumentar. No segundo, a associação assemelha-se a uma parábola, ou seja, Y aumenta com X até 
determinado ponto, quando, então, passa a diminuir. No último não há associação aparente entre 
as variáveis Y e X, pois os pontos não apresentam qualquer tendência particular. 
 
1 Medíocre no sentido de médio ou mediano, algo que está entre pequeno e grande, segundo definição do dicionário 
Michaelis da Língua Portuguesa. 
Econometria Regressão Linear Simples 
 
10 
 
 
 
(1) 
 
 Entre os muitos tipos de associações entre duas variáveis, a mais simples e frequente é a 
linear. A associação de dependência linear pode ser positiva, quando os valores de Y e X são 
diretamente proporcionais2, ou negativa, quando os valores de Y e X são inversamente 
proporcionais. 
Uma medida simples para quantificar a relação de dependência linear entre X e Y é a 
covariância. Dado N pares de valores de uma população (X1, Y1), ..., (XN, YN), a covariância entre 
X e Y será dada por: 
 
N
YX
Ni
YiXi
XY



 1
))(( 
 
(2) 
 Onde X e Y são, respectivamente, as médias populacionais de X e Y. 
 Quando se trata de uma amostra de n pares de valores de X e Y, com médias amostrais 
equivalentes a X e Y , a estimativa da covariância será dada por: 
 
1
))((
ˆ 1





n
YYXX
n
i
ii
XY

 
(3) 
 Valores negativos da covariância sugerem relação de dependência linear negativa; valores 
positivos sugerem dependência linear positiva; e valores muito próximos de zero sugerem ausência 
de dependência linear. 
Observe que a covariância é uma média dos produtos em relação aos valores centrados de 
X e Y (desvios em relação às respectivas médias). Para simplificar as representações, esses valores 
centrados podem ser representados pelas minúsculas x e y: 
 )( XXx ii  e )( YYy ii  (4) 
 E a covariância, expressa em valores centrados, será dada por: 
 
2 Aumentando X, aumenta o valor de Y. 
Econometria Alexandre Gori Maia 
 
11 
 
 
1
ˆ 1




n
yx
n
i
ii
XY 
(5) 
Graficamente, os valores centrados representam uma mudança de eixos no diagrama de 
dispersão, que passam a ter origem nas médias de X e Y, mas sem alterar o padrão de associação: 
 
 
(6) 
 
Observe agora que, no diagrama formado pelos eixos x e y, pontos com padrão de 
associação linear positiva tendem a concentrar-se no 1º e 3º quadrantes, onde as coordenadas 
apresentam o mesmo sinal e, portanto, o produto xiyi, ou ))(( YYXX ii  , será sempre positivo. 
Ou seja, a covariância será positiva. 
Analogamente, pontos com padrão de associação linear negativa concentrar-se-ão no 2º e 
4º quadrantes, onde as coordenadas apresentam sinais diferentes e o produto xiyi, será sempre 
negativo (primeiro gráfico da Figura 7). Na ausência de padrões de associação linear (segundo e 
terceiro gráficos da Figura 7), produtos com sinais negativos tendem a compensar aqueles com 
sinais positivos e a covariância será próxima de zero. 
 
 
(7) 
 
Exemplo 1. Uma amostra de 10 ocupados ofereceu os seguintes valores para anos de escolaridade 
(X) e rendimento mensal (Y): 
 
X 0 3 5 7 7 9 11 13 15 15 
Y 240 240 440 300 640 870 700 1800 2400 240 
Econometria Regressão Linear Simples 
 
12 
 
O diagrama de dispersão e a covariância entre as duas variáveis seriam dados por: 
 
 
110
)787240)(5,815(...)787240)(5,80(
ˆ


XY 
3,2348
9
21135
ˆ XY 
 
Os resultados sugerem, portanto, uma associação linear positiva entre anos de escolaridade 
e rendimento, ou seja, se os anos de escolaridade aumentarem, a tendência é que os rendimentos 
também aumentem. 
 
Exemplo 2. Uma amostra hipotética apresentou os seguintes dados para o rendimento (X) e um 
indicador de felicidade, com escala entre 0 e 10 (Y), de 10 indivíduos: 
X 240 300 440 640 700 870 1500 1800 2400 2900 
Y 1 3 4 7 7 8 7 7 5 2 
O diagrama de dispersão e a covariância entre as duas variáveis serão dados por: 
 
 
110
)1,52)(11792900(...)1,51)(1179240(
ˆ


XY 
2,1
9
11
ˆ XY 
 
Embora o valor da covariância seja positivo, ele é baixo e, visualmente, observa-se que a 
associação entre as variáveis não é linear, mas sim quadrática. 
 
Embora a covariância permita identificar a presença e o sentido da associação linear, não 
permite avaliar seu grau de associação, ou seja, o quão próximo os pontos estão de uma reta. Isso 
porque a amplitude de variação da covariância depende das escalas de medida de X e Y e, 
consequentemente, de seus desvios em relação às respectivas médias (x e y). Por exemplo, no 
primeiro exemplo tínhamos uma covariância dada pelo produto de anos (escolaridade) por reais 
(rendimento) e, no segundo caso, pelo produto de reais (rendimento) por uma escala de felicidade 
(0..10). Não poderíamos, portanto, comparar as duas covariâncias e afirmar qual delas apresenta o 
Econometria Alexandre Gori Maia 
 
13 
 
maior grau de associação linear. A medida derivada do produto de variáveis com um maior grau 
de dispersão tenderia, naturalmente, a apresentar um maior valor de covariância. 
Para contornar esse problema e medir o grau de associação linear entre duas variáveis, 
utilizamos a correlação linear. A correlação () é uma medida padronizada (adimensional) de 
associação linear entre duas variáveis, obtida ao se ponderar a covariância pelo produto dos desvios 
padrão de X e Y (X e Y, respectivamente): 
 
YX
XY


  (8) 
Outra maneira de enxergar a correlação é como uma média do produto dos desvios 
padronizados de X e Y. Em outras palavras, de (2), (4) e (8) teremos: 
 







N
i Y
i
X
i
YX
N
i
ii
YX
N
i
ii
yx
NN
yx
N
yx
1
1
1
11

 
(9) 
Que pode ainda ser expressa apenas em função dos valores xi, yi e seus respectivos 
quadrados: 
 









N
i i
N
i i
N
i ii
N
i i
N
i i
N
i ii
yx
yx
N
y
N
x
N
yx
1
2
1
2
1
1
2
1
2
1
 (10) 
Para um conjunto de dados da amostra, teremos: 
 
YX
XY
SS
r
̂
 (11) 
Ou ainda: 
 


n
i Y
i
X
i
S
y
S
x
n
r
11
1




n
i i
n
i i
n
i ii
yx
yx
1
2
1
2
1 (12) 
Graficamente, significa que, enquanto a covariância mede a aproximação dos desvios em 
relação a uma reta, a correlação medirá a aproximação dos desvios padronizados em relação a uma 
reta. Mantém-se a proporcionalidade e se elimina as distorções das diferentes escalas de medida, 
passando todas a referir-se a unidades de desvios padrão: 
Econometria Regressão Linear Simples 
 
14 
 
 
 
(13) 
 
A correlação assume valores entre -1 e +1 (inclusive) e permite uma interpretação intuitiva 
do grau de associação linear entre duas variáveis. Quão mais próximo o valor estiver dos extremos, 
mais próxima a dispersão dos pontos estará de uma reta com inclinação negativa (-1) ou positiva 
(+1). 
 
 
(14) 
 
Importante assinalar que a correlação não capta a proporcionalidade da associação, mas 
sim o grau de associação linear. Em outras palavras, uma correlação forte significa que, dadas 
variações em X, será muito provável que haja variações (positivas ou negativas) em Y, não importa 
em que razão (quanto Y irá variar em função de variações em X). Uma correlação nula também 
não implica necessariamente ausência de associação entre duas variáveis, já que a correlação 
refere-se exclusivamente à associação linear. 
 
Exemplo 3. Supondo a amostra de 10 observações para anos de escolaridade (X) e rendimento 
mensal (Y) do Exemplo (1), teríamos: 
 
1,5XS e 3,739YS 
628,0
)3,739)(1,5(
3,2348ˆ

YX
XY
SS
r

 
 
Econometria Alexandre Gori Maia 
 
15 
 
Ou seja, há um forte grau de associação linear entre anos de escolaridade e rendimento, sugerindo, 
por exemplo, que o aumento dos anos de escolaridade implicará, muito provavelmente, no 
aumento da renda. 
 
Exemplo 4. A partir dos dados do Exemplo (2), sobre renda (X) e felicidade (Y), teríamos: 
 
4,928XS e 5,2YS 
001,0
)5,2)(4,928(
2,1ˆ

YX
XY
SS
r

 
 
Ou seja, não há qualquer associação linear entre anos de escolaridade e rendimento, sugerindo, por 
exemplo, que o aumento da renda não implicará, necessariamente, em variações proporcionais na 
felicidade. 
 
1.2.Regressão Linear Simples 
 Embora a correlação seja uma medida útil do grau de associação entre duas variáveis, não 
explica algumas questões fundamentais, como: i) qual seria a variação em Y dada uma variação 
em X? ii) Qual o valor esperado de Y dado um de X? Para responder essas e outras questões, 
devemos realizar uma análise de regressão linear. 
A regressão linear simples pressupõe que a relação entre Y e X na população seja dada pela 
equação3: 
 iii eXY   (15) 
Onde Y é chamado de variável dependente, explicada ou regressando; X é a variável 
independente, explanatória ou regressor; e é o erro aleatório não explicado pelomodelo;  é termo 
constante ou intercepto; e  é o coeficiente angular ou coeficiente de regressão. Em outras palavras, 
a função de regressão linear estabelece que cada valor de Yi pode ser dado a partir de uma função 
linear de um valor controlado de Xi mais um erro não previsto pelo modelo ei (Figura 16). 
 
3 O termo linear refere-se aos coeficientes unitários dos parâmetros  e . Modelos em que os coefecientes não 
apresentam expoente unitário são chamados de modelos de regressão não lineares. 
Econometria Regressão Linear Simples 
 
16 
 
 
 
(16) 
 
O erro ei representa variáveis omitidas ou mesmo dificuldades para mensurar aquelas 
presentes no modelo. O modelo de regressão pressupõe que o efeito do erro seja mínimo e que este 
tenha uma natureza estocástica e esteja aleatoriamente distribuído em torno da reta de regressão, 
como representa a Figura 17. 
 
 
(17) 
 
Exemplo 5. Podemos pressupor que rendimento mensal (Y) seja determinado pelos anos de 
escolaridade (X) segundo a relação linear: 
 iii eXY   
Assim, pressupomos que o rendimento de um ocupado seja dado em função (linear) de seus anos 
de escolaridade mais um fator não observado ei. Os erros ei representam outras informações não 
previstas pelo modelo que também afetam o rendimento, tais como experiência profissional, 
aptidão, tipo de ocupação e características socioeconômicas do local de moradia. 
 
Um pressuposto central da análise de regressão é que a reta de regressão representa a 
esperança condicional de Y dado um valor de X. Em outras palavras, representa o valor médio de 
Y caso o valor de X seja igual a Xi (Figura 16). A representação formal para essa esperança 
condicional será dada por: 
Econometria Alexandre Gori Maia 
 
17 
 
 ii XXYE  )/( ou ii XYE  )( (18) 
Podemos também demonstrar, sem muita dificuldade, que se a reta de regressão representa 
a esperança condicional de Yi, então a esperança condicional dos erros será igual a 0. Em outras 
palavras: 
 
)( iii XYe   
 0)()()()()]([)|(  iiiiiii YEYEXEYEXYEXeE  
0)()|(  iii eEXeE 
(19) 
Esse pressuposto é denominado de média condicional zero dos erros, segundo o qual os 
erros não estão associados aos valores das variáveis independentes. Para compreendermos seu 
significado, vamos supor uma aplicação da análise de regressão onde a variável Xi representa os 
anos de escolaridade de um ocupado e Yi seu rendimento. Poderíamos ter um comportamento não 
observado nos erros (ei), aptidão, por exemplo, que seja maior para pessoas com elevada 
escolaridade e menor para pessoas com baixa escolaridade. Em outras palavras, teríamos E(ei)>0 
para valores elevados de Xi e E(ei)<0 para valores baixos de Xi, ou seja E(ei|Xi)0. O problema é 
que, quando formos analisar um modelo de regressão, não saberemos se os rendimentos mais 
elevados se devem a uma maior escolaridade ou uma maior aptidão. A relação de determinação 
entre escolaridade e renda poderia, assim, estar viesada. 
Compreendido esse pressuposto muito importate da análise de regressão (que será ainda 
abordado futuramente), voltemos agora à análise da reta de regressão. A equação (15) permite uma 
interpretação muito intuitiva da relação entre Y e X. O intercepto , por exemplo, representa o 
valor esperado de Y quando o valor controlado de X for nulo. O coeficiente angular , por sua vez, 
representa a variação marginal no valor esperado de Y dada uma variação unitária em X. Isso 
porque, se desejamos estimar a variação marginal no valor esperado de Y - E(Y) - dada uma 
variação infinitesimal em X - X - basta calcularmos a derivada de E(Y/X) em função de X: 
 
 
   )0()0/(YE 
e 
 











X
X
X
XYE
X
XYE )()|()|(
 
(20) 
Econometria Regressão Linear Simples 
 
18 
 
 
Uma diferença importante entre regressão e correlação está na forma com que as variáveis 
são tratadas. Na regressão, pressupomos que a variável dependente seja, assim como os resíduos, 
de natureza estocástica. Já a variável independente é considerada como um valor fixo, controlado 
pelo pesquisador. Seria o caso, por exemplo, de controlarmos o nível de fertilizante em um solo 
(variável independente) e verificarmos a produtividade resultante (variável dependente). Para cada 
nível de fertilizante teríamos variações aleatórias na produtividade, das quais poderíamos estimar 
os valores médios. Não seria adequado, por sua vez, tentarmos controlar a produtividade para 
verificarmos as variações no nível de fertilizante. A correlação, por sua vez, não estabelece 
qualquer distinção entre as variáveis X e Y. 
Quando trabalhamos com dados de uma amostra, a representação da função de regressão 
(amostral) será dada por: 
 iii eXY ˆ
ˆˆ   (21) 
Onde ̂ e ̂ são estimadores amostrais para os coeficientes do modelo de regressão e iê 
é o resíduo amostral4. Por sua vez, o valor previsto pela função de regressão amostral será dado 
por: 
 ii XY 
ˆˆˆ  (22) 
 
Exemplo 6. Seja a relação do rendimento mensal (Y) com função dos anos de escolaridade (X): 
 iii eXY   
Assim, o rendimento esperado para aqueles trabalhadores não remunerados seria dado por  e, 
para cada ano adicional de escolaridade, haveria uma variação marginal de  reais no rendimento 
esperado. 
 
1.3.Método de Mínimos Quadrados Ordinários 
Estabelecida a relação linear entre Y e X, o próximo passo é estimar a função de regressão 
com base em informações da amostra da maneira mais exata e eficiente possível. O método mais 
 
4 O termo erro costuma ser reservado à função de regressão da população e resíduo para a função de regressão da 
amostra. 
Econometria Alexandre Gori Maia 
 
19 
 
utilizado é o de mínimos quadrados ordinários (MQO), dada sua relativa simplicidade operacional 
e resultados que, satisfeitas algumas condições, são os mais acurados (exatos) e eficientes 
(variância mínima) existentes (essas condições serão abordadas posteriormente). O método utiliza 
princípios matemáticos para ajustar uma função a uma série de valores observados em uma 
amostra, utilizando procedimentos que minimizam a soma dos erros de previsão ao quadrado, ou 
seja, a soma quadrática das diferenças entre os valores observados na amostra e os estimados pela 
função. 
O método de mínimos quadrados é uma das ferramentas mais importantes da estatística 
moderna e sua descoberta envolveu uma das disputas mais famosas da história da estatística. 
Adrien Marie Legendre foi o primeiro a publicar a técnica, em 1805, em seu livro Nouvelles 
Méthodes pour la Determination des Orbites de Comètes, mas Johann Carl Friedrich Gauss 
clamou a descoberta da técnica que dizia utilizar desde 1795, também em problemas de 
Astronomia e Física, embora publicada apenas em 1809. 
 
1.3.1. Definição 
 Seja um conjunto de observações (Yi) e uma função matemática f() utilizada para prever 
os valores de Yi na população Em outras palavras: 
 ii efY  )( (23) 
Onde ei é o erro de previsão, ou seja, a diferença entre o valor observado Yi e aquele previsto 
pela função f(): 
 )(fYe ii  (24) 
O método de mínimos quadrados estimará o parâmetro  de tal forma que a soma dos erros 
de previsão ei ao quadrado seja mínima. Para isso, o primeiro passo é obter a função que define a 
soma dos erros ao quadrado que, assim como f(), também dependerá de . Essa função é chamada 
de Erro Quadrático Total (EQT): 
 


n
i
i
n
i
i fYeEQT
1
2
1
2 )]([)(  (25) 
Dependendo do valor de , teremos um valor para o EQT. O objetivo é encontrar um valor 
para , ou *, de tal forma que o EQT seja mínimo. Como se trata de uma função côncava para 
Econometria Regressão Linear Simples 
 
20 
 
cima5, seu valor mínimo será obtido igualando-se a primeira derivada da função em relação aoparâmetro a zero. 
 
 
0
)(



d
dEQT
 (26) 
 
1.3.2. Aplicação do MQO na regressão linear simples 
A partir de um conjunto de observações da amostra, o método de mínimos quadrados 
ajustará a reta que apresentar as menores distâncias quadráticas entre os valores observados de Yi 
e seus valores previstos ( iŶ ). Obterá, assim, os estimadores dos parâmetros  e  de tal forma que 
a soma dos erros quadráticos seja a mínima possível, ou seja, minimizando a função de EQT: 
 
 
 eEQT
n
i
i


1
2ˆ 
 YYEQT
n
i
ii


1
2]ˆ[ 
 XβαYEQT
n
i
ii


1
2)]ˆˆ([ 
(27) 
 
Para minimizar a função de EQT, deve-se igualar a zero as derivadas parciais em relação a 
 e . 
   
 n
i ii
XY
 1
0)1)](ˆˆ([2 
 ˆ
 EQT 


 (28) 
   
 n
i iii
XXY
 1
0))](ˆˆ([2 
 ˆ
 EQT 


 (29) 
Desenvolvendo as expressões (28) e (29) chegaremos aos estimadores de MQO ̂ e ̂ . 
 
5 Verifique que o sinal associado ao termo quadrático 2 será sempre positivo. 
Econometria Alexandre Gori Maia 
 
21 
 
 XβY ˆˆ  (30) 
 







n
1i
22
i
n
1i
ii
XnX
YXnYX
β̂ (31) 
Aplicando-se algumas identidades algébricas, podemos ainda simplicar a representação do 
estimador ̂ para6: 
 















 









n
i
i
n
i
ii
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
ii
x
yx
XX
YYXX
XXn
YXYXn
XnX
YXnYX
β
1
2
1
1
2
1
2
11
2
111
2
1
2
1
)(
))((
)(
ˆ (32) 
Conforme a conveniência analítica, pode-se demonstrar que ̂ pode ainda ser dado por: 
 











 
n
i
i
n
i
ii
n
i
i
n
i
ii
n
i
i
n
i
ii
x
Yx
x
yX
x
yx
β
1
2
1
1
2
1
1
2
1ˆ (33) 
 
Exemplo 6. A partir das informações da amostra apresentas no Exemplo (1), podemos estimar os 
parâmetros para o ajuste de regressão linear entre o rendimento mensal (Y) e os anos de 
escolaridade (X): 
 iii eXY ˆ
ˆˆ   
Onde: 
 62,7ˆ787ˆ  (85)β 
 69,91
5,230
21135ˆ 




n
1i
2
i
n
1i
ii
x
yx
β 
Sendo então o ajuste de MQO dado por: 
 ii XY 69,9162,7
ˆ  
 
6 Dica: faça o caminho contrário da demostração, partindo da forma simplificada, para facilitar a compreensão. 
Econometria Regressão Linear Simples 
 
22 
 
Em outras palavras, o rendimento esperado para quem não possui escolaridade seria de 7,62 reais 
e, para cada ano adicional de escolaridade, esperaria-se um acréscimo de 91,69 reais no 
rendimento. 
 
1.3.3. Propriedades dos Estimadores de Mínimos Quadrados Ordinários 
A partir de desenvolvimento algébrico, podemos derivar algumas importantes propriedades 
do ajuste de MQO. 
 
Propriedade 1. O valor médio dos resíduos será igual a zero. 
Da equação (28) para os estimadores de mínimos quadrados pode-se demonstrar que a 
soma e, consequentemente, o valor médio dos resíduos será igual a zero: 
 
  
n
i ii
Xβα(Y
1
0)1)](ˆˆ[2 
0ˆ]ˆ[ 11   
n
i i
n
i ii eYY 
(34) 
 
Propriedade 2. Os resíduos não estão correlacionados aos valores de Xi. 
Dada a definição de covariância, para demonstrarmos que não há relação entre êi e Xi, 
precisamos provar que: 
   
n
i ii XXee1 0))(ˆ( 
Como a soma dos resíduos é igual a zero, teremos simplesmente que provar: 
 0ˆˆˆ 11111   
n
i ii
n
i
n
i i
n
i i
n
i ii XeXeXeeXXe 
Utilizando agora os resultados da equação (29) para os estimadores de mínimos quadrados 
podemos demostrar que: 
 
  
n
i iii
XXβαY
1
0))](ˆˆ([2 
0))(ˆ())(ˆ( 11   
n
i ii
n
i iii XeXYY 
(35) 
 
 Essas duas primeiras propriedade (Propriedade 1 e 2) são muito importantes na análise de 
regressão e denominadas condições de primeira ordem dos estimadores de mínimos quadrados. 
 
Propriedade 3. A reta de regressão passará pelas médias aritméticas de X e Y. 
Econometria Alexandre Gori Maia 
 
23 
 
Das equações (22) e (30) podemos demonstrar que, quando o valor controlado de Xi for 
equivalente à média de X, o valor esperado de Yi será igual à média de Y. 
 
 
ii XY 
ˆˆˆ  
ii XβXβYY
ˆˆˆ  
XβXβYYi
ˆˆˆ  
YYi 
ˆ 
(35) 
 
Propriedade 4. Os resíduos não estão correlacionados aos valores previstos de Yi. 
Devemos provar que: 
 0ˆˆ)ˆ(ˆ 11   
n
i ii
n
i ii YeYYe 
De (22) e (35), teremos que: 
 0ˆˆˆˆ)ˆˆ(ˆˆˆ 1111   
n
i ii
n
i i
n
i ii
n
i ii XeeXeYe  (36) 
 
Exercícios 
1. Dados os estimadores de MQO do ajuste ii XY 
ˆˆˆ  , prove que ii xy ̂ˆ  . 
 
2. Observaram-se os gastos per capita com alimentação (Y) e a renda mensal per capita (X) em 
uma amostra de 5 famílias: 
Y 60 80 90 110 160 
X 100 200 200 400 400 
a. Esboce e análise o gráfico de dispersão para as variáveis em questão; 
b. Estime e analise a covariância e a correlação entre as variáveis; 
c. Estime por MQO os parâmetros do modelo de regressão linear simples para prever 
o gasto com alimentação (Y) em função da renda (X); 
d. Interprete os parâmetros do modelo de regressão; 
e. Estime os resíduos associados a cada estimativa para os gastos com alimentação; 
f. Qual o gasto esperado com alimentação para uma família com renda per capita de 
2.000 reais? 
 
Econometria Regressão Linear Simples 
 
24 
 
3. Uma amostra de quatro anos de uma economia fictícia forneceu os seguintes dados: 
Y (Consumo, bilhões de US$) 1 1 2 4 
X (Taxa de juros, % a.a.) 8 7 6 5 
 Agora suponha que a relação entre as variáveis seja dada por: 
ttt eXY   
a. Estime os coeficientes do modelo por MQO; 
b. Interprete as estimativas dos coeficientes; 
c. Qual seria o consumo esperado para a economia caso a taxa de juros baixasse para 
4% a.a.? 
 
4. Uma amostra de 5 observações forneceu as seguintes informações para preço (X) e quantidade 
consumida (Y) de determinado produto: 
Preço 0 1 2 3 4 
Quantidade 4 2 2 1 1 
 Suponha que a relação entre as variáveis seja dada por: 
iii eXY   
a. Defina a função de Erro Quadrático Total; 
b. Estime os coeficientes por MQO; 
c. Interprete as estimativas de MQO para os parâmetros do modelo; 
d. Estime o valor do EQT assumindo as estimativas de MQO. Seria possível observar 
um valor inferior ao obtido? Explique. 
e. Estime o consumo esperado caso o preço do produto seja igual a 4,5; 
f. Se o custo de produção é igual a 2 por unidade, calcule o lucro esperado caso o 
preço de venda seja igual a 3. 
 
5. (ANPEC, 1992) Responda Falso ou Verdadeiro. O custo total, C, de uma indústria e sua 
produção, X, têm uma relação linear do tipo ttt eXC   . Para se ajustar esse modelo por 
mínimos quadrados ordinários é preciso assumir certas hipóteses como: 
a. A variável independente X seja aleatória. 
b. Os erros tenham média zero. 
Econometria Alexandre Gori Maia 
 
25 
 
c. Os erros sigam uma distribuição normal. 
d. A variável independente X seja independente do temo erro. 
 
Respostas 
2) b. 4500ˆ XY ; r=0,88; c. 35ˆ  ; 25,0
ˆ  ; e. ê={0; –5; 5; –25; 25}; f. 535ˆ Y 
3) a. 5,8ˆ  ; 1ˆ  ; c. 5,4ˆ iY 
4) a.   2)]ˆˆ([ ii XYEQT  ; b. 4,3ˆ  ; 7,0ˆ  ; d. EQT=1,1; d. 25,0ˆ iY ; f. 1,3 
5) a. F; b. V; c. F.; d. V 
Econometria Propriedades dos Estimadores 
 
26 
 
2. Inferência com os Estimadores de MQO 
 
Introdução 
Após estimar os coeficientes de um modelo de regressão, deve-se verificar o grau de 
confiabilidade dos resultados, ou seja, verificar em que medida as estimativas obtidas na amostra 
aproximam-se dos reais parâmetros da população. Para cumprir com esse objetivo, serão 
realizados testes de hipóteses e intervalos de confiança para os reais parâmetros do modelo 
regressão linear simples a partir das estimativas de MQO. 
Para viabilizar essas análises, é fundamental conhecer algumas importantes propriedadesestatísticas dos estimadores de MQO. A contribuição mais importante para essa análise foi dada 
em 1821, quando Gauss demontrou que, sob determinadas premissas, as estimativas de MQO 
seriam não viesadas e de mínima variância. Posteriormente, em 1912, Markov desenvolveu de 
maneira mais usual esse mesmo teorema, que passou a ser conhecido como teorema de Gauss-
Markov. 
 
2.1.Teorema de Gauss-Markov 
Qunado elaboramos um modelo de regressão linear simples pressupomos que, na 
população, Y seja dado por uma função linear de X segundo a equação: 
 iii eXY   (1) 
 Em primeiro lugar, devemos estar cientes que uma população pode gerar amostras 
diferentes. Assim, embora na população os valores de  e  sejam constantes, ou seja, há apenas 
uma reta para o conjunto de dados da população, na amostra estaremos sujeitos à aleatoriedade da 
seleção e, assim, as estimativas dos coeficientes ̂ e ̂ poderão assumir quaisquer valores segundo 
uma dada distribuição de probabilidade. Em outras palavras, poderemos ter retas diferentes 
dependendo da amostra selecionada (Figura 2). 
 
Econometria Alexandre Gori Maia 
 
27 
 
 
 
(2) 
 
 Em segundo lugar, devemos considerar que, para uma dada amostra selecionada, outras 
técnicas poderiam ser aplicadas para obter os estimadores dos coeficientes  e , não apenas o 
MQO7, as quais não necessariamente chegariam aos mesmos resultados. Em outras palavras, para 
uma dada amostra, poderíamos ter diferentes retas amostrais, dependendo da técnica utilizada. O 
que garante que os estimadores de MQO serão mais confiáveis que outros estimadores é uma série 
de condições estabelecidas pelo Teorema de Gauss-Markov. 
Segundo o Teorema de Gauss-Markov, cinco pressupostos básicos devem ser satisfeitos 
para que os estimadores de MQO sejam os Melhores Estimadores Lineares Não Viesados 
(MELNV) ou, em ingês, Best Linear Unbiased Estimator (BLUE). Ser linear, significa que os 
estimadores de  e  serão funções lineares da variável aleatória Y8. Ser não viesado significa que 
o valor esperado do estimador de MQO será igual ao parâmetro da população (equação 3) e ser o 
melhor estimador significa que sua variabiliadde será a mínima possível (equação 4). 
  )ˆ(E e  )ˆ(E (3) 
 )ˆ()ˆ(  VV e )ˆ()ˆ(  VV (4) 
 Onde  ˆ e  ˆ são quaisquer outros estimadores lineares que não aqueles obtidos pelo 
MQO. 
 Os cinco pressupostos para que os estimadores de MQO sejam os MELNV são: 
 
i) Relação linear entre Y e X: 
 
7 Entre as técnicas alternativas, destaque para o Método de Máxima Verossimilhança e o Método de Momentos. 
8 Pressupondo que os valores de X sejam controlados (não aleatórios), é fácil demonstrar que os estimadores de MQO 
são funções lineares de Y. 
Econometria Propriedades dos Estimadores 
 
28 
 
A relação entre Y e X na população é representada por uma função com coeficientes 
lineares9. A linearidade nas variáveis, por sua vez, não é necessária, já que essas 
podem ser algebricamente transformadas em novas variáveis que apresentem 
relação linear entre si. Por exemplo, o modelo iii eXY 
2 não é linear no 
regressor, mas, se criarmos a variável 2ii XZ  , então a relação iii eZY   
será linear (esse tema será abordado posteriormente). 
ii) Os valores de X são fixos em repetidas amostras e não aleatórios: 
Pressupõe que cada variável independente possa ser controlada pelo pesquisador, 
ou seja, este pode mudar seu valor de acordo com os objetivos da pesquisa. O caso 
característico é o de um estudo experimental, onde o pesquisador seleciona 
aleatoriamente os elementos amostrais que sofrerão um efeito controlado X e 
observa os valores resultantes de Y. Por exemplo, o pesquisador seleciona 
aleatoriamente as parcelas de terra que receberão uma determinada quantidade de 
fertilizantes (X) e observa suas respectivas produções (Y). Embora essa premissa 
seja necessária para demonstração de várias propriedades estatísticas, não é 
verdadeiramente essencial, tampouco factível na maioria dos estudos econômicos. 
Em muitas situações, pode ser pouco ético ou inviável controlar o efeito de X. Por 
exemplo, não seria factível selecionar aleatoriamente pessoas que receberiam uma 
determinada quantidade de educação (X) para avaliar seus efeitos sobre o 
rendimento no trabalho (Y). Em estudos não experimentais, quando não 
controlamos os valores de X, mas os observamos aleatoriamente, devermos ter 
cuidados especiais para que as relações de causa e efeito não sejam viesadas (tema 
a ser abordado posteriormente). 
iii) Esperança condicional dos erros igual a zero: 
Em outras palavras, E(e/Xi) = E(ei) = 0. É o mesmo que afirmar que a esperança 
condicional de Y é definida pela reta de regressão, ou seja, E(Y/Xi)=E(Yi)=+Xi. 
Significa que os valores dos erros não podem estar associados aos valores de Xi. 
Caso contrário, as relações de causa e efeito podem estar viesadas. Não é um 
problema em estudos experimentais, quando conseguimos controlar os valores de 
 
9 Expoentes dos coeficientes iguais a 1. 
Econometria Alexandre Gori Maia 
 
29 
 
X e esses são considerados como constantes10. Entretanto, quando trabalhamos com 
estudos não experimentais, devemos nos precaver para que não haja fatores não 
controlados pelo modelo (e) afetando simutaneamente Y e X. Seria o caso, por 
exemplo, da aptidão, variável não controlada em um modelo de determinação da 
renda (presente, assim, nos erros e), que poderia afetar simultaneamente a renda (Y) 
e os anos de estudo (X). Por definição, os estimadores de MQO pressupõem a 
ausência de correlação entre os resíduos (êi) e a variável independente (Xi)
11. Caso 
a ausência de correlação não se concretize na população, os estimadores de MQO 
serão viesados; 
iv) A variabilidade dos erros é constante, qualquer que seja X: 
Em outras palavras, significa afirmar que a variância condicional dos erros seja 
dada por 
2222 )()]([)()()|(  iiiii eEeEeEeVarXeVar . Quando a 
dispersão dos erros é a mesma em todos os pontos de X dizemos que os erros são 
homocedáticos (homo=igual; cedásticia=dispersão). Caso contrário, dizemos que 
se tratam de erros heterocedásticos, ou seja, 
22 )( iieE  . 
v) Os erros são não autocorrelacionados: 
Em outras palavras, Cov(ei,ej)=E(eiej)E(ei)E(ej)=0 para todos ij. Representa 
independência entre observações da amostra, não havendo quaquer tipo de relação 
entre seus erros. A autocorrelação é, entretanto, frequente em análises de séries 
temporais (correlação serial) ou dados espaciais (correlação espacial); 
 
Enquanto os três primeiros pressupostos são necessários para que os estimadores sejam 
não viesados, os dois últimos são necessários para que estes sejam os mais eficientes12. 
Em adição a esses cinco pressupostos, é ainda importante que os erros estejam 
normalmente distribuídos para viabilizar a aplicação de testes de hipóteses e intervalos de 
confiança aos coeficientes do modelo de regressão (a ser visto no próximo tópico). Modelos 
 
10 Lembre-se que a associação entre uma constante (X) e uma variável aleatório (e) será sempre nula. 
11 É uma das condições de primeira ordem dos estimadores de MQO. 
12 Para os leitores familiarizados com álgebra, as demonstrações dessas propriedades podem ser consultadas nos 
Apêndices A e B. 
Econometria Propriedades dos Estimadores 
 
30 
 
baseados nessas seis pressuposições são chamados de Modelos Clássicos de Regressão Linear 
(MCRL). Uma propriedade adicional muito importante dos estimadores de MQO sob a premissas 
de um MCRL é que esses serão os mais eficientes (apresentarão variância mínima) entre quaisquer 
estimadores não viesados de , não apenas entre os estimadores lineares, como pressupõe o 
teorema de Gauss-Markov. 
 
2.2.Significância das estimativasUma vez que os valores das estimativas de  e  (Equação 1) dependem da amostra 
selecionada, devemos considerar suas variabilidades para saber se há evidências estatísticas de que 
os respectivos parâmetros na população são diferentes de zero. Caso tenhamos, por exemplo, 
evidências estatísticas que o parâmetro  seja diferente de zero, significaria poder afirmar que a 
reta da população tem uma inclinação positiva ou negativa e, consequentemente, que há relação 
linear entre Y e X. Analogamente, caso haja evidências estatísticas que o parâmetro  seja diferente 
de zero, significaria poder afirmar que a reta da população não passa pela origem dos eixos e, 
consequentemente, que o valor esperado de Y para um X nulo seja diferente de zero. Graficamente, 
temos possíveis representações dessas situações na Figura 5. 
 
 
(5) 
 
 Para verificar se os parâmetros do modelo de regressão são iguais ou não a zero, é 
conveniente desenvolvermos testes de hipóteses às estimativas obtidas por ̂ e ̂ . A aplicação 
desses testes viabilizar-se-á caso conheçamos: i) as distribuições de probabilidade dos estimadores; 
ii) as estimativas para os parâmetros dessas distribuições. 
 
2.3.Distribuição amostral dos estimadores 
Sob um pressuposto mais geral do Teorema do Limite Central, pode-se afirmar que a soma 
de variáveis independentes e igualmente distribuídas terá uma distribuição normal. Assim, os erros 
Econometria Alexandre Gori Maia 
 
31 
 
ei, por serem considerados uma soma de diferentes fatores não observáveis afetando a variabilidade 
de Y, também estariam normalmente distribuídos em torno de uma média zero13. 
Dizer que os erros possuem distribuição normal com média zero é o mesmo que afirmar 
que os valores de Yi se distribuem normalmente em torno da reta de regressão (Figura 6). Ademais, 
a normalidade dos erros (e dos valores de Yi em torno da reta) implicaria ainda que os estimadores 
de MQO estariam normalmente distribuídos, já que esses são combinações lineares dos valores de 
Yi (ver Apêndice A). Pressupondo ainda que os estimadores de MQO sejam não viesados, como 
sugere o Teorema de Gauss-Markov, teríamos que os estimadores de um MCRL estariam 
normalmente distribuídos em torno dos reais parâmetros  e . 
 
 
),0(~ 2Nei 
),(~ˆ 2̂ N 
),(~ˆ 2
̂
 N 
(6) 
 
2.4.Variância dos estimadores 
Conhecidas as funções de densidade de probabilidade (fdp) dos erros e dos estimadores de 
MQO (6), o próximo passo é definir os parâmetros dessas fdp para viabilizar a inferência 
estatística, em especial, a aplicação de testes de hipóteses e intervalos de confiança. Os três 
parâmetros necssários são14: i) a variância dos erros ou variância da regressão (2); ii) a variância 
do estimador ̂ ( 2̂ ); iii) a variância do estimador ̂ (
2
̂
 ). 
A variância dos erros representa a dispersão quadrática média dos erros em torno da reta 
de regressão. Como usualmente desconhecemos o real valor de 2 na população, precisamos de 
 
13 Deve-se, entretanto, destacar que essa pressuposição nem sempre é verdadeira, sobretudo para amostras pequenas, 
dependendo da composição dos fatores não observáveis (caso esses não sejam aditivos, por exemplo) e de suas 
respectivas distribuições de probabilidade. Há testes estatísticos apropriados para verificar até que ponto a distribuição 
dos resíduos se aproxima de uma normal e se tal pressuposição pode ser considerada verdadeira. 
14 Os valores dos parâmetros  e  não são necessários já que o objetivo dos testes de hipóteses e dos intervalos de 
confiança é justamente inferir sobre seus reais valores. 
Econometria Propriedades dos Estimadores 
 
32 
 
um estimador para estimá-lo a partir dos resíduos da amostra. Como demonstrado no Apêndice C, 
o estimador não viesado de 2 a partir dos resíduos do MQO será dada por: 
 
2
ˆ
ˆ
2
2



n
ei (7) 
O denominador n–2 representa o número de graus de liberdade dos resíduos e significa 
que, caso se conheça n–2 valores dos resíduos, os outros dois seriam automaticamente 
determinados a partir de restrições impostas às propriedades matemáticas dos estimadores de 
MQO15. A raiz quadrada da variância da regressão, ou ̂ , é chamada de erro padrão da regressão 
e é uma medida da dispersão média dos resíduos. 
Como o cálculo do numerador da equação (7),  2iê , pode ser demasiadamente trabalhoso, 
uma equação igualmente válida é dada por: 
   iiii yxye ̂ˆ
22
 (8) 
Não é difícil demonstrar a relação estabelecida acima. Basta utilizarmos a expressão 
definida no Apêndice C para iii exy ˆ
ˆ   e lembrarmos que 



2
ˆ
i
ii
x
yx
 : 
 
  22222 ˆˆ2)ˆ(ˆ iiiiiii xyxyxye  





  222
2
2
2
22
)(
)()(
2ˆ i
i
ii
i
ii
ii x
x
yx
x
yx
ye 



  iii
i
ii
ii yxy
x
yx
ye ̂
)(
ˆ 2
2
2
22 
(9) 
As variâncias dos estimadores ̂ e ̂ ( 2̂ e 
2
̂
 ) representam as dispersões quadráticas 
médias destes em função da aleatoriedade da amostra. Serão dadas por (ver demonstrações no 
Apêndice B): 
 
2
2
2
2)ˆ()ˆ( 



i
i
xn
X
EVar e 


2
2
2)ˆ()ˆ(
ix
EVar

 (10) 
Seus estimadores são obtidos substituindo 
2 por 2̂ : 
 
15 São duas as restrições impostas aos resíduos: i) êi=0; ii) êiXi=0. 
Econometria Alexandre Gori Maia 
 
33 
 
 
2
2
2
2
2
2
2
ˆ ˆ
1
ˆ 











ii
i
x
X
nxn
X
S e 


2
2
2
ˆ
ˆ
1
ix
S


 (11) 
As raízes quadradas dessas variâncias ( ̂S e ̂S ) são chamadas de erros padrão dos 
estimadores. 
A partir dos estimadores obtidos em (11) podemos derivar algumas importantes 
propriedades matemáticas: 
 
i. Quanto maior o erro padrão da regressão, menos precisa será a estimativa dos 
parâmetros: em outras palavras, quanto mais dispersos estiverem os valores 
observados em torno da reta de regressão, mais dispersas serão as estimativas de 
MQO. Algebricamente, pode-se observar essa propriedade a partir do numerador 
das equações em (11). 
ii. Quanto maior a variabilidade observada para os valores de X, mais precisa será a 
estimativa dos parâmetros: a variabilidade dos valores amostrados de X é uma 
importante medida da qualidade do ajuste. Baixa dispersão de X indica que a 
amostra não representa uma relevante amplitude de valores. Matematicamente, a 
dispersão de X será medida pelo denominador  2ix das equações em (11); 
iii. Quanto maior o tamanho da amostra, maior a variabilidade observada para X e mais 
precisas serão as estimativas dos parâmetros: a maior representatividade da amostra 
garante uma maior amplitude de comportamentos considerados. Matematicamente, 
essa relação é dada pelos denominadores n e  2ix das equações em (11). 
 
2.5.Teste de hipóteses para os coeficientes 
O teste de hipóteses para os coeficientes do modelo de regressão usualmente é utilizado 
para verificar se há evidências, com base em estimativas observadas na amostra, que seus valores 
na população sejam diferentes de zero. Assim, as hipóteses a serem testadas seriam: 
 





0:
0:
1
0


H
H
 e 





0:
0:
1
0


H
H
 (12) 
Econometria Propriedades dos Estimadores 
 
34 
 
Embora menos frequentes, podem ainda ser elaborados testes para verificar se os 
parâmetros  e  são diferentes, maiores ou menores que quaisquer outras constantes que não o 
zero. 
Pressupondo a veracidade das hipóteses nulas e conhecendo algumas das propriedades dos 
estimadores de MQO, teremos as seguintes distribuições de probabilidade para as estatísticas de 
teste: 
 ),0(~ˆ
2
̂ N e ),0(~
ˆ 2
̂
 N (13) 
A partir de então, os passos para resolução serão análogos aos de qualquer teste de 
hipóteses: i) observar estimativa para a estatística de teste na amostra ( ̂ e ̂ ); ii) calcular valor 
p,probabilidade de erro ao se rejeitar H0, ou seja, afirmar que o valor do parâmetro é diferente de 
zero. Como a real variância dos coeficientes é desconhecida, o uso de suas estimativas amostrais 
2
̂S e 
2
̂
S exigirá ainda o uso da distribuição t de Student para o cálculo da probabilidade de erro, 
como exemplifica a Figura (14). Os graus de liberdade são os mesmos obtidos para a variância 
amostral da regressão (Equação 7), ou seja, n–2. 
 
 
(14) 
 
Rejeitar H0 significa afirmar que a estimativa de  é significativa, ou, no caso do coeficiente 
angular, que a variável independente X é significativa no modelo. 
 
Exemplo 1. Obeservou-se o consumo mensal de energia (Y, em Kwh) e o total de horas que o ar 
condicionado permaneceu ligado (X, em h) em uma amostra de 21 domicílios. Os valores 
observados e as estimativas de MQO para o ajuste linear foram: 
Econometria Alexandre Gori Maia 
 
35 
 
 
i 
KWh 
(Y) 
AC 
(X) 
i 
KWh 
(Y) 
AC 
(X) 
1 35 1,5 12 77 7,5 
2 17 2,0 13 62 7,5 
3 57 2,5 14 65 7,5 
4 63 4,5 15 66 8,0 
5 66 5,0 16 65 8,0 
6 33 5,0 17 75 8,0 
7 79 6,0 18 94 8,5 
8 43 6,0 19 85 12,0 
9 33 6,0 20 94 12,5 
10 78 6,5 21 93 13,5 
11 82 7,5 
 
 
iii eXY ˆ34,585,27  
 
 
Em outras palavras, espera-se que para cada hora adicional com o ar condicionado ligado o 
consumo de energia aumente, em média, 5,34 KWh. O consumo esperado para um domicílio que 
não utilize o ar condicionado é de 27,85 KWh. 
As estimativas da variância e do erro padrão da regressão serão dadas por: 
 
89,208
19
91,3968
221
)96,6()61,0(...)53,21()86,0(
2
ˆ
ˆ
22222
2 






n
ei 
45,1489,208ˆ  
 
O erro padrão é uma estimativa do erro médio de previsão do modelo, ou seja, de aproximadamente 
14,45 KWh. 
O próximo passo é estimar as variâncias dos coeficientes do modelo para verificar se as estimativas 
de  e  são significativas, ou seja, se são estatisticamente diferentes de zero. Essas serão dadas 
por: 
 
2
22
2
2
2
2
2
ˆ 81,794,6089,208
)6,6(...)4,5(
9,6
21
1
ˆ
1



















ix
X
n
S 
2
2
2
2
ˆ 03,106,1
6,196
89,208ˆ
1

 ix
S


 
 
Pode-se então, finalmente, verificar se as estimativas são significativas aplicando-se o teste de 
hipóteses para aos coeficientes do modelo: 
Econometria Propriedades dos Estimadores 
 
36 
 
 
 
 
 
O valor p associado ao teste para o coeficiente  é de 0,2%, ou seja, a probabilidade de erro ao 
afirmarmos que o intercepto é diferente de zero é de apenas 0,2%. Sendo assim, pode-se afirmar 
que residências que não utilizam ar condicionado (X=0) possuem um consumo de energia diferente 
de zero, já que outros aparelhos estariam influenciando o consumo. 
Por sua vez, o valor p associado ao teste para o coeficiente  é aproximadamente nulo. Em outras 
palavras, se afirmarmos que  é diferente de zero, ou seja, que o número de horas com ar 
condicionado ligado tenha relação linear com o consumo de energia, a chance de estarmos errados 
seria praticamente nula. 
 
2.6.Intervalo de confiança para os coeficientes 
Outra técnica de inferência estatística clássica que pode ser aplicada às estimativas dos 
coeficientes do modelo de regressão é o intervalo de confiança. Dado um nível de confiança , o 
intervalo de confiança definirá intervalos que, em repetidas amostras de tamanho n, conterá o real 
parâmetro da população em  das situações. 
Antes de verificarmos as estimativas de intervalo para os coeficientes do modelo de 
regressão, vale a pena relembrar alguns cuidados especiais na sua interpretação. Primeiro, como o 
parâmetro a ser estimado é uma constante e não uma variável aleatória, não podemos afirmar que 
este tenha  de probabilidade de pertencer a um intervalo. O parâmetro estará contido 
(probabilidade 1) ou não (probabilidade 0) em um intervalo. Segundo, uma vez estimado o 
intervalo com os valores de uma determinada amostra, não podemos afirmar que o intervalo 
estimado tenha  de probabilidade de conter o parâmetro, já que, uma vez definidos os limites do 
Econometria Alexandre Gori Maia 
 
37 
 
intervalo, esses conterão (probabilidade igual a 1) ou não (probabilidade igual a 0) o parâmetro da 
população. 
Sabendo que os estimadores de MQO seguem uma distribuição normal sob as premissas 
do MCRL, os intervalos de confiança para os parâmetros  e  seriam dados por: 
 
 
(15) 
 
Onde Z é o número de desvios padrão, obtido da distribuição Z~N(0,1), que se deve estar 
afastado do centro da distribuição para que se tenha  de probabilidade entre os dois extremos do 
intervalo. Entretanto, como os reais valores 2̂ e 
2
̂
 são desconhecidos, o uso das estimativas 
obtidas pelos estimadores 2̂S e 
2
̂
S implicará na consideração da estatística t de student em 
substituição à Z. Assim, os intervalos de confiança para os parâmetros  e  serão dados por: 
 
]ˆˆ[),( ˆ2ˆ2 αnαn Stα; St αIC   
]ˆ;ˆ[),( ˆ2ˆ2   StStγIC nn   
(16) 
Onde tn–2 é o valor da distribuição t de student com n–2 graus de liberdade para que se 
tenha  de probabilidade entre os dois extremos do intervalo. 
 
Exemplo 2. Para estimar intervalos com confiança de 95% para os parâmetro do modelo da relação 
linear entre consumo mensal de energia (Y, em Kwh) e o total de horas que o ar condicionado 
permaneceu ligado (X, em h), teríamos: 
 
)]817(8527);817(8527[),( 1919 ,t,,t,IC  
)]031(345)031(345[),( 1919 ,t,; ,t,IC  
 
Para uma confiança de 95%, por exemplo, os intervalos seriam dados por: 
 
]19,44;51,11[)]81,7(09,285,27);81,7(09,285,27[),  γIC( 
]50,7;18,3[)]03,1(09,234,5);03,1(09,234,5[),  γIC( 
 
Econometria Propriedades dos Estimadores 
 
38 
 
O intervalo determinado pelos valores 11,51 a 44,19 KWh é uma estimativa de um intervalo que, 
em repetidas amostras de tamanho 21, conteria o real valor do parâmetro  em 95% das situações. 
Por sua vez, o intervalo definido pelos valores 3,18 a 7,50 KWh é uma estimativa do intervalo de 
95% de confiança para o parâmetro . 
 
Exercícios 
 
1. Sejam os gastos per capita com alimentação (Y) e a renda mensal per capita (X) em uma 
amostra de 5 famílias: 
Y 60 80 90 110 160 
X 100 200 200 400 400 
a. Estime a variância dos coeficientes do modelo de regressão linear simples para 
prever o gasto com alimentação (Y) em função da renda (X). 
b. As estimativas dos coeficientes são significativas? Interprete. 
c. Defina intervalos com confiança de 95% para os parâmetros do modelo. Interprete 
seus resultados. 
d. Existe alguma associação entre os resultados dos testes de hipóteses (b) e dos 
intervalos de confiança (c)? 
 
2. Seja a amostra de quatro anos de uma economia fictícia: 
Y (Consumo, bilhões de US$) 1 1 2 4 
X (Taxa de juros, % a.a.) 8 7 6 5 
 Agora suponha que a relação entre as variáveis seja dada por: 
ttt eXY   
a. Teste a hipótese de que o coeficiente angular é menor que zero; 
b. Interprete o valor p obtido no teste acima; 
 
3. Seja a amostra de 5 observações para preço (X) e quantidade consumida (Y) de determinado 
produto: 
Preço 0 1 2 3 4 
Econometria Alexandre Gori Maia 
 
39 
 
Quantidade 4 2 2 1 1 
 Suponha que a relação entre as variáveis seja dada por: 
iii eXY   
a. Há evidências estatísticas para afirmar que a quantidade consumida dependa do 
preço do produto? Interprete o nível de significância. 
b. Estime e interprete um intervalo de 95% de confiança para a o efeito do preço sobre 
a quantidade consumida. 
 
4. A partir de uma amostra de n elementos, foi estimada uma regressão linear simples, pelo 
método de mínimos quadrados, obtendo-se o resultado: XY 1
ˆˆˆ   . A seguir, a mesma 
regressão foi estimada sabendo-se que a reta de regressão da população passa pela origem das 
coordenadas (termo constante = 0), obtendo-se o resultado: XY 2
ˆˆ  . Pode-se afirmar que: 
a. 21
ˆˆ  . 
b. A reta de regressão passa pelas médias amostrais de Y e X, mesmo que o modelo 
não tenha intercepto. 
c. No primeiro modelo, quanto maior for a variação da variável explicativa, maior 
será a precisão com que o coeficiente angular pode ser estimado. 
 
5. (ANPEC, 1996) Suponha que, num modelo de regressão linear simples, o regressor seja 
correlacionado com o termo erro. Sobre o estimador de MQO, podemos afirmar: 
a. É, em geral, viesado. 
b. Não é possível de ser obtido. 
c. É não viesado, porém não é eficiente. 
d. É consistente. 
 
Respostas 
1) a. 22ˆ 22,22S ; 
22
ˆ 08,0S ; b. : p=0,213; : p=0,049; c. IC(, 95%)=[–35,70; 105,70]; IC(, 
95%)=[0,003; 0,497] 
2) a. 22ˆ 32,0S ; t=–3,16; p=0,044 
Econometria Propriedades dos Estimadores 
 
40 
 
3) a. Sim; t=–3,656; p=0,035; b. IC(,95%)=[–1,309;–0,091] 
4) a. F; b. F; c. V 
5) a. V; b. F; c. F; d. F 
 
 
Econometria Alexandre Gori Maia 
 
41 
 
Apêndice A – Valor Esperado e Exatidão dos Estimadores de MQO 
Para demonstrarmos algebricamente que os estimadores de MQO são não viesados caso os 
pressupostos (i) a (iii) do teorema de Gauss-Markov sejam válidos, comecemos pela 
representação do coeficiente angular: 




n
i
i
n
i
ii
x
Yx
β
1
2
1ˆ 
Para simplificar a demonstração, vamos denominar 



n
j
j
i
i
x
x
z
1
2
 e teremos 


n
i
iiYzβ
1
ˆ 
Pressuposto i: supondo a relação linear entre as variáveis, iii eXY   , teremos: 



n
i
ii
n
i
ii
n
i
i
n
i
ii
n
i
ii
n
i
i
n
i
iii
n
i
ii ezXzzezXzzeXzYzβ
11111111
)(ˆ  
O primeiro termo, 

n
i
iz
1
 , será igual a zero, pois 0
0
)(
1
2
1
2
1 





n
i
i
n
i
i
n
i
i
xx
XX
 
O segundo termo, 

n
i
ii Xz
1
 , sera igual a , pois 
 

























22
1
2
2
1
2
1
2
11
2
11
2
1
2
1
1
2
1
22)(
)(
XnXnX
XnX
XXXX
XXX
XX
XXX
x
Xx
n
i
i
n
i
i
n
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
ii
 
Assim, teremos: 



n
i
iiezβ
1
ˆ  
Agora, para calcularmos o valor esperado de ̂ : 
















 

n
i
ii
n
i
ii ezEezEβE
11
)ˆ(  
Pressuposto ii: se consideramos os valores de X fixos, não aleatórios, teremos: 
Econometria Propriedades dos Estimadores 
 
42 
 



n
i
ii eEzβE
1
)()ˆ(  
Pressuposto iii: e se a esperança condicional dos erros for zero, teremos finalmente: 
  

n
i
izβE
1
0)ˆ( 
 
A demonstração para o intercepto é mais simples. Primeiro, o estimador de MQO será: 
XY  ˆˆ  
Pressuposto i: supondo que a relação linear entre Y e X, iii eXY   , se calcularmos o 
valor médio de cada lado da equação teremos: 
eXY   
Substituindo o valor de Y na equação do estimador de : 
eXXeX  )ˆ(ˆ)(ˆ  
Assim, a esperança de ̂ será: 
)()]ˆ()()[()()]ˆ([)()ˆ( eEEEXEeEXEEE   
Pressuposto iii: dada a esperança condicional (e incondicional) zero dos erros, teremos que 
0)( eE 
Presspostos i a iii: ademais, caso os pressupostos (i) a (iii) sejam satisfeitos, sabemos que 
)ˆ(βE . Então o valor esperado de ̂ será: 
  00)()ˆ( XEE 
 
 
Econometria Alexandre Gori Maia 
 
43 
 
Apêndice B – Variância e Eficiência dos Estimadores de MQO 
Para demonstrarmos algebricamente que os estimadores de MQO são eficientes caso os 
pressupostos (i) a (iii) do teorema de Gauss-Markov sejam válidos, precisamos inicialmente 
calcular suas variâncias. Começando pelo coeficiente angular: 
2)]ˆ(ˆ[)ˆ( βEβEβVar  
Pressupostos i a iii: supondo ββE )ˆ( e 


n
i
iiezβ
1
ˆ  , então: 
)2...2...()()ˆ()ˆ( 112121
222
1
2
1
2
1
2
nnnnnn
n
i
ii eezzeezzezezEezEββEβVar 

  
Pressuposto ii: considerando que os valores de X sejam controlados, então )()( iiii eEzezE  e: 
)(2...)(2)(...)()ˆ( 112121
222
1
2
1 nnnnnn eeEzzeeEzzeEzeEzβVar  
Pressuposto iv: caso a variância dos erros será constante para qualquer i, ou seja 
22 )( ieE e: 





n
i
n
ij
jiji
n
i
i eeEzzzβVar
1
1
1
22 )(2)ˆ(  
Pressuposto v: caso os erros sejam não autocorrelacionados, ou seja, 0)( ji eeE para ij, 
então: 
2
1
2
1
2
2
1
22
1
22)ˆ(















n
i
i
n
i
in
i
i
n
i
i
x
x
zzβVar  
E: 



n
i
ix
βVar
1
2
2
)ˆ(

 
 
Para agora demonstrarmos que a variância dos estimador de MQO para  é a menor entre os 
estimadores lineares não viesados de , comecemos pela representação desse primeiro dada 
por: 
Econometria Propriedades dos Estimadores 
 
44 
 



n
i
iiYzβ
1
ˆ 
Que é, naturalmente, uma função linear da variável aleatória Yi. 
Agora, vamos generalizar a representação de outro estimador linear para  por: 



n
i
iiYwβ
1
*ˆ 
Ou seja, uma função linear de Yi segundo um fator de ponderação wi. 
A esperança deste estimador genérico será dada por: 



n
i
ii
n
i
i
n
i
ii
n
i
i
n
i
ii
n
i
ii
n
i
ii XwwXwwXEwYEwYwEβE
1111111
* )()()()ˆ( 
 
Primeiro, as condições necessária para que *β̂ seja não vieasado, ou seja ββE )ˆ( * , são: 
0
1


n
i
iw e 
1
1


n
i
ii Xw 
E, dessas igualdades, derivamos ainda que: 
1
111
 

n
i
i
n
i
ii
n
i
ii wXXwxw 
Cientes dessas condições, vamos agora estimar a variância de *̂ : 



n
i
ii
n
i
ii YVarwYwVarβVar
1
2
1
* )()()ˆ( 
Como Var(Yi) = Var(ei)=2, então 


n
i
iwβVar
1
22* )ˆ(  
Agora vamos realizar um malabarismo algébrico, incluindo o termo zi na equação sem 
comprometer a igualdade: 



n
i
iii zzwβVar
1
22* )()ˆ(  
Desenvolvendo, teremos: 
Econometria Alexandre Gori Maia 
 
45 
 
 

n
i
iiiiii zzwzzwβVar
1
222* ])(2)[()ˆ(  



n
i
i
n
i
iii
n
i
ii zzwzzwβVar
1
22
1
22
1
22* )(2)()ˆ(  
O segundo termo será zero, pois 
0
11
)(
1
2
1
2
2
1
2
1
2
1
2
1
1
2 




















n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
iin
i
iii
xxx
x
x
xw
zwz 
Assim, a variância *̂ de resume-se a: 





n
i
i
n
i
ii
n
i
i
n
i
ii
x
zwzzwβVar
1
2
2
1
22
1
22
1
22* )()()ˆ(

 
Como o segundo termo da equação ( 

n
i
ix
1
22 ) é constante, a variância de *̂ será minimizada 
quando ii zw  . Em outra palavras, o estimador linear não viesado de  de mínima variância é 
justamente o ̂ , pois: 
̂ˆ
11
*  

n
i
ii
n
i
ii YzYwβ 
 
A demonstração da eficiência do estimador intercepto segue o mesmo raciocínio. Vamos, 
entretanto, apenas apresentar o desenvolvimento para o estimador de sua variância: 
2)]ˆ([)ˆ(  EEVar  
Pressupostos i a iii: supondo  )ˆ(E e eX  )ˆ(ˆ  , então: 
)(])ˆ([2)ˆ(])ˆ([)ˆ()ˆ( 22222 eEeXEEXeXEEVar   
O segundo termo é igual a zero pois 0)( eE . 
Ademais, sabendo que )ˆ()ˆ()ˆ( 22  VarEE  , teremos: 
2
1
2
2 )(
1
)ˆ()ˆ( 


n
i
ieE
n
VarXVar  
Econometria Propriedades dos Estimadores 
 
46 
 
Pressuposto iv e v: caso a variância dos erros seja constante, 22 )( ieE , e os erros sejam não 
correlacionados, 0)( ji eeE , teremos: 
2
2
1
2
2
2
1
2
2
1
2
2
2 )(
1
)ˆ(
n
n
x
XeE
n
x
XVar
n
i
i
n
i
in
i
i

 






 
E: 
2
1
2
2
)
1
()ˆ( 
n
x
X
Var
n
i
i



 
 
A demonstração que a variância do estimador de MQO para  é a menor entre os estimadores 
lineares não viesados de , segue os mesmos passos da obtida para , embora não seja aqui 
apresentada. 
 
 
Econometria Alexandre Gori Maia 
 
47 
 
Apêndice C – Variância dos erros 
Devemos demonstrar que 
2
ˆ
ˆ 1
2
2