Buscar

Econometria revisão

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 77 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 77 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 77 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
 
 
 
 
 
 
 
 
 
 
 
 
 
MMMUUULLLTTTIIICCCOOOLLLIIINNNEEEAAARRRIIIDDDAAADDDEEE 
 
AAAUUUTTTOOOCCCOOORRRRRREEELLLAAAÇÇÇÃÃÃOOO SSSEEERRRIIIAAALLL 
 
HHHEEETTTEEERRROOOCCCEEEDDDAAASSSTTTIIICCCIIIDDDAAADDDEEE 
 
EEEQQQUUUAAAÇÇÇÕÕÕEEESSS SSSIIIMMMUUULLLTTTÂÂÂNNNEEEAAASSS 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
SÉRIE TÉCNICA SOBRE ECONOMETRIA 
 
Ulisses Silva da Cunha, Dr. 
 
 
 
Manaus 
2008 
 
 
 
 
UNIVERSIDADE FEDERAL DO AMAZONAS 
CURSO DE ENGENHARIA FLORESTAL 
TTTOOOPPPIIICCCOOOSSS DDDEEE EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
 
MULTICOLINEARIDADE 
 
CONCEITO 
 
 Em sua maioria, os dados econômicos utilizados para estimar relações econômicas 
são não-experimentais. Quando os dados resultam de um experimento não-controlado, 
muitas das variáveis econômicas podem ser influenciadas pela multicolinearidade. 
 Como exemplo, suponha uma relação que explique a produção ao longo do tempo 
com função das diversas quantidades de insumos empregadas. Há certos fatores de produção 
(insumos), tais como capital e trabalho, que são usados em proporções relativamente fixas. À 
medida que a produção aumenta, as quantidades de dois ou mais desses insumos, refletem 
aumentos proporcionais. As relações proporcionais entre variáveis constituem o próprio tipo 
de relações sistemáticas que caracterizam a colinearidade. 
 Portanto, multicolinearidade refere-se à correlação entre duas variáveis explicativas, 
envolvendo ou entre uma delas e as demais, incluídas na equação de um modelo. Isso 
significa que a multicolinearidade ocorre quando, por exemplo, duas variáveis x1 e x2 
medem aproximadamente o mesmo fenômeno. 
 Deve-se notar também que, não são apenas as relações entre variáveis em uma 
amostra que dificultam o isolamento dos efeitos separados de variáveis explicativas 
individuais em um modelo econômico. Ocorre um problema similar quando os valores de 
uma variável explicativa não variam muito dentro da amostra de dados, como consequência 
dessa pequena variação, torna-se difícil isolar seu impacto. 
 Este fenômeno acontece quando as variáveis explicativas apresentam forte 
correlação linear. Como consequência tem-se o aumento da variância da estimativa e, 
portanto, do erro-padrão. Assim, o valor da estatística t reduz-se e, às vezes, a hipótese da 
nulidade pode ser aceita, quando deveria ser rejeitada. 
 O caso clássico de multicolinearidade ocorre quando nenhuma das variáveis 
explicativas na regressão é estatísticamente significante. 
 Desse modo, diz-se que duas ou mais variáveis explicativas são perefeitamente 
colineares se uma ou mais das variáveis puderem ser expressas como uma combinação linear 
da (s) outra (s) variável (eis). 
 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Multicolinearidade 
 
2 
 
 
CONSEQUÊNCIAS ESTATÍSTICAS DA COLINEARIDADE 
 
 Sempre que há uma ou mais relações lineares exatas entre as variáveis explicativas, 
existe a condição de colinearidade exata, ou seja r, = ± 1. Neste caso, o estimador de 
mínimos quadrados não é definido. 
 Quando existem dependências lineares quase exatas entre as variáveis explicativas, 
algumas variâncias, desvios padrão e covariâncias dos estimadores de mínimos quadrados 
podem ser grandes. 
 Desse modo, grandes desvios padrões para os estimadores de mínimos quadrados 
implicam em alta variabilidade amostral, instabilidade dos coeficientes estimados em relação 
a pequenas variações na amostra ou na especificação do modelo, intervalos de estimação 
dilatados e informações relativamente imprecisas proporcionadas pelos dados amostrais 
sobre os parâmetros. 
 Quando os desvios padrões do estimador são grandes, é possível que os testes t 
usuais levem à conclusão de que as estimativas dos parâmetros não são significativamente 
diferentes de zero. Esse resultado pode ocorrer mesmo diante de valores de R2 ou F 
elevados, o que faz com que as variáveis colineares não proporcionem informação suficiente 
para estimar seus efeitos separados, ainda que a teoria econômica indique sua importância na 
relação. 
 Apesar das dificuldades em isolar os efeitos de variáveis individuais em amostras, é 
possível fazer previsões precisas se a natureza da relação de colinearidade permanece a 
mesma dentro das futuras observações amostrais. Por exemplo, em uma função agregada de 
produção em que os insumos trabalho e capital são quase colineares, é possível fazer 
previsões precisas da produção para uma determinada proporção entre os insumos, mas não 
para várias combinações de insumos. 
 
IDENTIFICANDO E SUAVIZANDO A COLINEARIDADE 
 
 Uma forma simples de detectar relações colineares é utilizar o coeficiente de 
correlação amostral entre pares de variáveis explicativas, com a restrição de que as relações 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Multicolinearidade 
 
3 
 
de multicolinearidade pode envolver mais de duas variáveis explicativas, o que pode ser 
difícil de detectar mediante o uso de correlações aos pares. Essas correlações amostrais são 
medidas descritivas de associação linear. 
 NOTA : Uma regra empírica de uso comum é que um coeficiente de correlação entre 
duas variáveis explicativas superior a 0,80 ou 0,90 em valor absoluto indica forte associação 
linear e uma relação de colinearidade potencialmente prejudicial. 
 Um processo alternativo, simples e efetivo, de identificação da presença de 
colinearidade consiste em estimar as chamadas regressões auxiliares, nas quais, combina-se 
cada uma das variáveis explicativas com as variáveis explicativas restantes. 
 Se dessas estimativas resultarem um valor de R2 elevado, acima de 0,80, a 
implicação é de que grande parte da variação da variável explicativa tomada como variável 
resposta, é explicada pela variação das outras variáveis. 
 O problema da multicolinearidade é que os dados não contêm informação sobre os 
efeitos individuais das variáveis explicativas suficiente para estimar com precisão todos 
parâmetros do modelo estatístico. Porém, a solução que consiste em obter mais informações 
para incluí-las na análise, nem sempre é possível em economia, pois o cruzamento de dados 
é dispendioso e, em termos de séries temporais, deve-se aguardar os resultados. Por outro 
lado, a opção de obtenção de dados por processo não-experimental pode resultar na mesma 
relação de colinearidade e não dar grande contribuição na forma de informações novas e 
independentes. 
 A presença da multicolinearidade pode interferir na precisão dos estimadores dos 
coeficientes de regressão. 
 
 A multicolinearidade pode ser investigada através de três casos, a saber: 
 
 1. Ausência de multicolinearidade – é o caso típico de correlação nula, ou seja, as 
variáveis explicativas guardam uma relação de ortogonalidade entre si. 
 
 2. Multicolinearidade perfeita – ocorre quando ri,j = 1 ou –1. Neste caso, não é 
possível estimar os parâmetros, pois, o determinante da matriz X’X é nulo. 
 
 3. Multicolinearidade imperfeita – ocorre quando ri,j varia de 0 a 1 ou de 0 a –1, o 
que é mais freqüente. 
 
 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Multicolinearidade 
 
4 
 
 
 Indicadores da presença de multicolinearidade 
 
 1. Ocorrência de valores próximo de 1 ou –1, para os valores de ri,j entre pares de 
variáveis explicativas (xi,xj). O coeficiente de correlação linear ri,j é dado por 
 
 21ji
xxxx
xxxx
r
n
1k
n
1k
2
jkj
2iki
n
1k
jkjiki
ji ,,
)()(
))((
, =
−−
−−
=
∑ ∑
∑
= =
= (1) 
 ou mais precisamente 
 
 ∑ ∑
∑
⋅
=
2
j
2
i
ji
ij
xx
xx
r (2) 
 
IMPACTO DA MULTICOLINEARIDADE SOBRE A VARIÂNCIA DOS PARÂMETROS 
ESTIMADOS 
 
 Seja dado o seguinte modelo contendo duas variáveis explicativas : 
 
 exbxbby 22110 +++= (3) 
 
 Estimando os parâmetros para o modelo centrado na média, tem-se 
 
 )()( 222111 xxbxxbyy −+−=− (4) 
 
 ⎥⎦
⎤⎢⎣
⎡= ∑∑
∑∑
2
221
21
2
1
xxx
xxx
XX' (5) 
 
 A estimativa do parâmetro b1 será dado por 
 
 ∑ ∑ ∑
∑
−= 2212221
2
2
1 xxxx
x
b
)(
ˆ (6) 
 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Multicolinearidade 
 
5 
 
 
∑ ∑ ∑
∑∑ ∑
∑
⎟⎟⎠
⎞
⎜⎜⎝
⎛
⋅
−
=
−
=
22
2
2
1
2
212
12
2
2
212
1
1
xx
xx
1x
1
x
xx
x
1b
)(
)()(
ˆ (7) 
 
)( 212
2
1
2
2
1 r1
1
x
ss −×= ∑ (8) 
 
 A partir da expressão (8), mantidos constantes s2 e ∑ 21x , pode-se analisar a 
sensibilidade da variância s1 de 1bˆ em função do grau de multicolinearidade indicada por 
r212. 
 
 a. Se r212=0, então a multicolinearidade não existirá. Nesse caso, tem-se: 
 
 ∑= 21
2
2
1 x
ss (9) 
 
 Observa-se que s21 é a variância da estimativa do parâmetro 1bˆ 
 
 b. Se Se r212=1, então a multicolinearidade será perfeita e s21 → ∞: 
 
 É quando o determinante X’X =0 e a matriz inversa torna-se singular 
 
 c. Se 0 <r212<1, existirá algum grau de multicolinearidade a ser investigado. 
Portanto, a variância s21 será mais elevada do que ocorreria, caso a multicolinearidade não 
existisse, ou seja 
 
 ∞<<∑
2
12
1
2
s
x
s (10) 
 
 Trata-se de caso típico de colinearidade imperfeita e mais freqüente em econometria 
aplicada. 
 
 
 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Multicolinearidade 
 
6 
 
DIAGNÓSTICO DA MULTICOLINEARIDADE 
 
 O problema da multicolinearidade pode ser diagnosticado de várias formas. Em 
geral, as consequências que exigem maiores preocupações ocorrem na medida em que: 
 
 a) Ocorram não-significâncias de variáveis explicativas com sinais incorretos para 
algumas delas, ainda que R2 seja elevado; 
 
 b) Aumento do grau de correlação simples entre as variáveis explicativas; 
 
 c) Inconsistência dos parâmetros estimados, a qual pode ser em função do tamanho 
da amostra, adição ou omissão de variáveis no modelo; 
 
 d) Determinante da matriz de coeficientes com tendência a valores próximo de zero; 
 
 O diagnóstico mais comum é obtido ao se constatar que nenhuma das variáveis 
explicativas é estatisticamente significativa e, algumas apresentam sinais incorretos, ainda 
que para um R2 >0,7. 
 Explorando o grau do determinante da matriz de coeficientes das variáveis 
explicativas, FARRAR e GLAUBER (1967) propuseram um teste visando detectar a 
extensão da multicolinearidade. Esses dois autores formularam, também, testes para localizar 
e identificar o padrão do problema diagnosticado. 
 Existem críticas sobre esses testes, WICHERS (1975, p. 367) observa que o teste 
para verificar a extensão da multicolinearidade não é confiável, se a distribuição subjacente 
não for claramente normal, o que pode ocorrer, por exemplo, no caso de o modelo incorporar 
variáveis dummies. 
 Apesar dessas objeções, é fato que esses testes fornecem informações valiosas a 
respeito do problema da multicolinearidade. Assim, apresentam-se, a seguir, a definição das 
estatísticas e a forma de realização dos testes. 
 
TESTE PARA DETECTAR A EXTENSÃO DA MULTICOLINEARIDADE 
 
 A estatística para a realização do teste de FARRAR e GLAUBER é definida pela 
seguinte fórmula : 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Multicolinearidade 
 
7 
 
 
⎥⎥
⎥⎥
⎦
⎤
⎢⎢
⎢⎢
⎣
⎡
⋅⎥⎦
⎤⎢⎣
⎡
+−−−=
1
1
1
526
11
21
221
112
2
L
MM
L
L
kk
k
k
rr
rr
rr
LnknX det)( (11) 
onde 
n = tamanho da amostra 
k = número de variáveis explicativas 
Ln = logaritmo neperiano 
det = determinante 
rij = coeficiente de correlação simples entre Xi e Xj, isto é ∑ ∑
∑
⋅
=
22
ji
ji
ij XX
XXr 
 A estatística Χ2 tem distribuição qui-quadrado com [k(k-1)]/2 graus de liberdade 
 
TESTE DE LOCALIZAÇÃO E DO PADRÃO DA COLINEARIDADE 
 
 Esse teste visa identificar quais variáveis são mais afetadas pela multicolinearidade. 
Usa-se a estatística F para comparar os resultados 
 ),,,(
,,,.
,,,.
ki
kn
R
k
R
F
ki
ki
L
L
L
21
1
1
2
21
2
21
≠
−
−
−= (12) 
 
onde os índices denotam as variáveis Xi (i=1,2,...,k) e R2i.1,2,...,k indicam o coeficiente de 
determinação correspondente à regressão de Xi em relação às demais variáveis explicativas. 
 A hipótese a ser testada é formulada da seguinte maneira : 
 
 H0 : R2i.1,2,...,k = 0 (a variável Xi não é afetada pela multicolinearidade) 
 H1 : R2i.1,2,...,k ≠ 0 (a variável Xi é afetada pela multicolinearidade) 
 
 O valor observado de F é comparado com o valor crítico Fc, com k-1 e n-k graus de 
liberdade. 
 Se F>Fc, os valores de X são multicolineares com dado nível de probabilidade de 
erro, a variável X é significativamente afetada pela multicolinearidade. Caso F ≤ Fc, os X 
não são multicolineares e o problema não afeta significativamente a variável Xi 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Multicolinearidade 
 
8 
 
 O cálculo da estatística F pode, alternativamente, ser feito mediante a utilização do 
procedimento sugerido por JOHNSTON (APUD ROSSI, 1977, p. 382), o qual segue os 
seguintes passos : 
 
 i) Regride-se cada X sobre as demais variáveis explicativas, como mostrado a seguir 
para um modelo com k variáveis explicativas : 
 
 kkXbXbXbbX 1313212101 ++++= Lˆ 
 kkXbXbXbbX 2323222202 ++++= Lˆ 
 MM 
 1133220 −−++++= kkkkkkk XbXbXbbX Lˆ 
 
 ii) Calcula-se a estatística F correspondente a cada uma dessas equações, usando-a 
para a realização do teste. 
 
 Esse procedimento permite localizar entre as variáveis explicativas as mais afetadas 
pela multicolinearidade em função dos valores calculados de F. O teste de significância é 
realizado, usando-se k-1 e n-k-2 como graus de liberdade do numerador e do denominador, 
respectivamente. 
 Para testar o padrão de multicolinearidade, podem ser utilizadas as k equações 
estimadas, adotando-se o seguinte procedimento : 
 
 i) Calculam-se os coeficientes de correlação parcial r2ij, que corresponde ao produto 
bij bji, isto é : 
 
 r2ij = bij bji (i, j = 1, 2, ... , k) (13) 
 
 ii) Testa-se a significância do efeito de cada variável X incluída na equação 
estimada, utilizando-se a estatística t. Note-se que tij = tji 
 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Multicolinearidade 
 
9 
 
 iii) As variáveis que apresentarem efeitos estatisticamente significativos, em 
determinada equação, serão as responsáveis pela multicolinearidade em Xi 
 
 Coeficientes de correlação parcial 
 
 
))((
)(
. 2
23
2
13
2
2313122
312 11 rr
rrrr −−
−= (14) 
 
))((
)(
..
...
. 2
423
2
413
2
4234133122
3412 11 rr
rrrr −−
−= (15) 
 
 Neste exemplo equação (15), 1 seria a variável resposta e 2 a variável explicativa“ativa”, 3 e 4 seriam variáveis explicativas “passivas”. 
 
TRATAMENTO DA MULTICOLINEARIDADE 
 
 A solução da multicolinearidade depende da extensão do problema, da 
disponibilidade de outras fontes de dados (amostras maiores, amostras em cross section), da 
importância das variáveis multicolineares, do propósito da função que se deseja estimar e de 
outras considerações. 
 
 Quando a multicolinearidade afeta seriamente os coeficientes estimados, alguma 
solução adequada deve ser analisada. 
 
 A multicolinearidade não é um problema de solução simples e, os procedimentos no 
sentido de corrigir seus efeitos devem estar bem fundamentados. 
 
 A exclusão de variáveis explicativas pode causar os seguintes impactos: 
 
 Erro de especificação, se a escolha recair sobre uma variável importante 
 O uso de razões pode favorecer a heterocedasticidade 
 O uso de primeiras diferenças pode causar problemas de autocorrelação serial. 
 
 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Multicolinearidade 
 
10 
 
MEDIDAS CORRETIVAS PARA RESOLVER O PROBLEMA DA MULTICOLINEARIDADE 
 
1. Aumentar os dados com novas observações especialmente planejadas, visando corrigir 
eventuais dependências que foram verificadas entre as variáveis do modelo. Todavia, essa 
recomendação nem sempre é aplicável, dado os custos adicionais ou possíveis restrições 
técnicas que relacionam as variáveis explicativas. 
 
2. Recorrer a teste mais robustos como análise de componentes principais, a fim de que 
possa ser investigada a contribuição de cada variável no modelo, o que poderá sugerir a 
eliminação de variáveis e um ajuste apenas para aquelas variáveis de maior importância. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Multicolinearidade 
 
11 
 
E X E R C Í C I O S 
 
1. Considere funções de produção da forma Q = f (L,K), onde Q é a medida do produto e L e 
K são os insumos trabalho e capital, respectivamente. Uma forma funcional popular é a 
equação de Cobb – Douglas 
 
 teKLnLLnQLn +β+β+β= )()()( 321 
 a) Com os dados do arquivo cobb.dat, estime a função produção de Cobb – Douglas. 
Há evidência de multicolinearidade ? 
Solução : 
 
(0,69)(0,68)(-0,24)
33,12F0,6680,48770,5590-0,1287 2 ==++= RKLnLLnQLn )()()( 
 TESTE DO GRAU DE EXTENSÃO DA MULTICOLINEARIDADE 
 
 Sabendo-se que r12 = -0,9026 e aplicando-se a fórmula (11) , obtém-se : 
 ⎥⎦
⎤⎢⎣
⎡
−
−⋅⎥⎦
⎤⎢⎣
⎡
+−−−= 190260
902601
5226
11332
,
,
det
)*(
LnX (16) 
 [ ] 108,57700,0284
5226
11332 =⋅⎥⎦
⎤⎢⎣
⎡
+−−−= det)*( LnX (17) 
 Com o nível de significância de 5% e 1 grau de liberdade [k(k-1)/2], o valor crítico 
tabelado X2 é de 3,841. Como X2 observado é 108,5770, rejeita-se a hipótese nula de 
ausência de multicolinearidade ao nível de 5%. 
 Neste caso, passaremos a realizar os testes de localização e do padrào da 
multicolinearidade 
 
 TESTE DE LOCALIZAÇÃO E DO PADRÃO DA MULTICOLINEARIDADE 
 
 As equações de cada variável explicativa sobre as demais são : 
 
 
(32,54)(6,59)
1058,95F0,9710,84980,5109 2 ==+= RKLnLLn )()( 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Multicolinearidade 
 
12 
 
 A partir dos testes F realizados, conclui-se que a variável mais afetada pela 
multicolinearidade uma vez que Fc(1,31) = 4,17 e sendo F>Fc, os valores de LN(L) e LN(K) 
são multicolineares com 5% de nível de probabilidade de erro. 
 
 b) Reestime o modelo com a restrição de retornos constantes para escala, isto é, 
132 =β+β ,e comente os resultados 
 
Solução : 
 
2. Utilizando os dados da Tabela 4, faça os testes de extensão, de localização e do padrão de 
multicolinearidade da equação de demanda de automóveis 
 teYPQ +β+β+β= 321 
 
(-1,03)(-1,93)(2,41)
2532103,0735-9,6679-1863,88 2 ,, === FRYPQ 
 
TABELA 4 – QUANTIDADE VENDIDA DE AUTOMÓVEIS (Q), PREÇO REAL (P) E PRODUTO INTERNO 
BRUTO (Y), 1970/1987. 
 
 
Ano 
Quantidade Vendida 
(Mil Unidades) 
(Q) 
Índice de Preço 
Real (1978/1979=100) 
(P) 
Índice do PIB 
(1978/1979=100) 
(Y) 
1970 309 132,4 49,3 
1971 395 124,6 54,9 
1972 457 119,4 61,5 
1973 558 114,9 70,0 
1974 640 106,3 75,9 
1975 661 113,2 79,7 
1976 695 100,7 87,9 
1977 679 99,9 92,2 
1978 798 100,0 96,7 
1979 827 100,0 103,3 
1980 793 84,5 112,8 
1981 448 91,8 107,9 
1982 556 101,8 108,6 
1983 608 94,0 104,8 
1984 532 86,2 110,1 
1985 602 80,0 119,3 
1986 672 82,0 128,4 
1987 411 98,6 133,0 
 
Solução : 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Multicolinearidade 
 
13 
 
 
 TESTE DO GRAU DE EXTENSÃO DA MULTICOLINEARIDADE 
 
 Sabendo-se que r12 = -0,9026 e aplicando-se a fórmula (11) , obtém-se : 
 ⎥⎦
⎤⎢⎣
⎡
−
−⋅⎥⎦
⎤⎢⎣
⎡
+−−−= 190260
902601
5226
11182
,
,
det
)*(
LnX (16) 
 [ ] 26,13230,1853
5226
11182 =⋅⎥⎦
⎤⎢⎣
⎡
+−−−= det)*( LnX (17) 
 Com o nível de significância de 5% e 1 grau de liberdade [k(k-1)/2], o valor crítico 
tabelado X2 é de 3,841. Como X2 observado é 26,132, rejeita-se a hipótese nula de ausência 
de multicolinearidade ao nível de 5%. 
 Neste caso, passaremos a realizar os testes de localização e do padrào da 
multicolinearidade 
 
 TESTE DE LOCALIZAÇÃO E DO PADRÃO DA MULTICOLINEARIDADE 
 
 As equações de cada variável explicativa sobre as demais são : 
 
 
8,39)- ((24,39)
539405154152 YP ,,ˆ −= R2 = 0,8032 F = 70,3618 
 A partir dos testes F realizados, conclui-se que a variável mais afetada pela 
multicolinearidade uma vez que Fc(1,16) = 4,49 e sendo F>Fc, os valores de P e Y são 
multicolineares com 5% de nível de probabilidade de erro. 
 Com relação ao padrão de multicolinearuidade, os coeficientes de correlação parcial 
com as respectivas estatísticas t são mostrados na tabela 8 
 
Variáveis 
Variáveis Y 
P r212.3 = 0,8147 
(8,39) 
 
 Os testes t realizados, ao nível de significância de 5%, revelam que a 
multicolinearidade ocorre devido à elevada correlação parcial entre as variáveis P e Y. Por 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Multicolinearidade 
 
14 
 
isso, os coeficientes de correlação parcial (0,9026 = 0,90260,5) e simples entre P e Y (0,9026) 
são iguais. 
 Em resumo, a conclusão geral é que : 
 
 a) Existe elevado grau de colinearidade entre as variáveis explicativas incluídas na 
equação, pois a hipótese de ausência do problema foi rejeitada ao nível de 5% de 
significância. 
 b) A multicolinearidade afeta as duas variáveis explicativas P e Y 
 c) A multicolinearidade é decorrente da correlação perfeita existente entre as 
variáveis P e Y 
UNIVERSIDADE FEDERAL DO AMAZONAS 
CURSO DE ENGENHARIA FLORESTAL 
TTTOOOPPPIIICCCOOOSSS DDDEEE EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
 
AUTOCORRELAÇÃO 
 
 
CONCEITO 
 
 Nos modelos de regressão linear múltipla assume-se que os componentes do erro 
aleatório εi são variáveis aleatórias não correlacionadas. No entanto, muitas aplicações de 
análise de regressão, principalmente em economia e administração, envolvem dados para os 
quais esta suposição não é válida. 
 Quando isto ocorre significa que as variáveis explicativas e a variável resposta são 
dependentes do tempo, o que gera uma estrutura de correlação entre os termos de erro do 
modelo.Autocorrelação significa então, dependência temporal dos valores sucessivos dos 
resíduos. Em Econometria é considerado um dos problemas mais sérios. Isto decorre do fato 
de que, em muitos modelos econométricos, o erro aleatório εi são variáveis 
autocorrelacionadas. Nestes casos, as variáveis explicativas e a variável resposta são 
dependentes do tempo, o que gera um estrutura de correlação entre os termos de erro do 
modelo. No entanto, os testes diagnósticos e os métodos de soluções são bastante eficientes. 
 Em termos formais e considerando o modelo linear simples ttt ebXaY ++= , a 
autocorrelação serial implica E(eiej) ≠ 0 para i ≠ j. A ausência de autocorrelação significa, 
portanto, E(eiej) = 0 para i ≠ j. 
 
 
 Figura 1 – Ausência de Autocorrelação Figura 2 – Presença de Autocorrelação 
 Fonte : MATOS (1997, p. 134) 
AS VARIÁVEIS QUE APRESENTAM CORRELAÇÃO AO LONGO DO 
TEMPO SÃO DENOMINADAS VARIÁVEIS AUTOCORRELACIONADAS 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Autocorrelação 
 
16 
 
FONTES DE AUTOCORRELAÇÃO 
 
 São fontes de autocorrelação a omissão de alguma variável importante, a má 
especificação da forma matemática e do termo aleatório e ajustes imperfeitos de observações 
estatísticas (interpolação, desestacionalização). 
 
CONSEQUÊNCIAS 
 
 Quando os resíduos são autocorrelacionados, as estimativas de mínimos quadrados 
ordinários dos parâmetros não apresentam variância mínima, além de seu erro-padrão ser 
viesado, o que conduz a testes e intervalos de confiança incorretos. 
 Na autocorrelação positiva, os erros-padrões são subestimados e, consequentemente, 
os valores da estatística t, superestimados e reciprocamente, os erros-padrões são 
superestimados e, consequentemente, os valores da estatística t, subestimados quando a 
autocorrelação for negativa. Este fato permite concluir que a autocorrelação positiva oferece 
maiores riscos de erro, pois, no caso do teste t, existirá o risco de rejeitar-se a hipótese nula 
de ausência de efeito, quando se deveria aceitá-la. 
 ♦ Omissão de variável explicativa 
 As variáveis econômicas tendem a ser autocorrelacionadas. Assim, as omissão de 
uma ou mais variáveis explicativas refletirá, obviamente, no termo residual εt, cujos valores 
tendem a ser autocorrelacionados entre si. 
 ♦ Má especificação da forma matemática 
 Dependendo da estrutura dos dados, deve-se conduzir análise exploratória para 
identificar o modelo mais apropriado. 
 
 ♦ Má especificação do verdadeiro erro aleatório 
 Em muitos casos, para valores sucessivos, os verdadeiros valores de εt podem não 
ser independentes. Mesmo fatores puramente randômicos (guerras, estiagens, greves) 
poderão exercer efeitos que se propagam ao longo de vários períodos de tempo. 
 
 ♦ Ajuste imperfeito de séries estatísticas 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Autocorrelação 
 
17 
 
 Muitos dados publicados contêm interpolações ou smoothing (suavização), as quais 
poderão tornar as disturbâncias aleatórias correlacionadas entre si ao longo do tempo. 
 
DIAGNÓSTICO DA AUTOCORRELAÇÃO 
 
 Dentre os procedimentos estatísticos existentes para determinar se os termos do erro 
são nã-correlacionados, vamos utilizar o teste Durbin – Watson. O teste considera que os 
dados são gerados pelo seguinte modelo autoregressivo de 1ª ordem : 
 n21txxxy ttkk2t21t10t ,,, LL =+++++= εββββ (1) 
 Os termos do erro εt são gerados de acordo com a equação 
 t1tt w+= −ρεε (2) 
 onde 1<ρ é denominado de parâmetro de autocorrelação e wt são variáveis 
aleatórias ~ N(0,σ2). Se ρ = 0, então εt = wt, o que significa que os erros são não – 
correlacionados e o modelo em análise é apropriado. Se ρ > 0, diz-se que existe 
autocorrelação positiva. Se ρ < 0, diz-se que a autocorrelação é negativa, embora situações 
deste tipo sejam pouco frequentes. 
 
 ♦ Detecção de autocorrelação positiva 
 
 No teste de Durbin – Watson para a detecção da presença de autocorrelação 
positiva, as hipóteses consideradas são : 
 H0 : ρ = 0 contra H1 : ρ > 0 
 
 Para testar as hipóteses, aplica-se o teste Durbin – Watson, após o ajuste do modelo. 
 
∑
∑
=
=
−−
= n
1t
2
t
n
2t
2
1tt
e
ee
d
)(
 (3) 
onde et é o t-ésimo resíduo associado ao modelo ajustado 
 
 O desenvolvimento de (3) mostra que quando o número de amostras n é grande, o 
somatório de et tende a ser igual ao somatório de et-1, donde obtem-se : 
 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Autocorrelação 
 
18 
 
 
∑
∑∑
∑
∑ ∑∑
=
=
−
=
=
= =
−
=
− −
=
−+
= n
1t
2
t
n
2t
1tt
2
n
2t
t
n
1t
2
t
n
2t
n
2t
1tt
2
n
2t
1t
2
t
e
ee2e2
e
ee2ee
d
)()()(
 (4) 
 )()( r12
e
ee
12d n
1t
2
t
n
2t
1tt
−=−=
∑
∑
=
=
−
 (5) 
 
onde r é a estimativa do parâmetro ρ na equação (2) 
 
 Portanto 
 ? Se r = 0, então d = 2 (ausência de autocorrelação) 
 ? Se r = 1, então d = 0 (autocorrelação positiva) 
 ? Se r = -1, então d = 4 (autocorrelação negativa) 
 
 Assim, se 0 < d < 2, existe algum grau de autocorrelação positiva, sendo mais forte à 
medida que d se aproxima de zero. 
 Se 2 < d < 4, a autocorrelação será negativa, ficando mais elevada à medida que d se 
aproxima de 4. 
 O valor calculado de d é comparado com os limites inferior (di) e superior (du) da 
tabela de valores críticos. 
 
 
 
 
 
 
 
 FIGURA 1 – TESTE DE AUTOCORRELAÇÃO DE Durbin - Watson 
 Fonte : MATOS (1997, p. 137) 
 Os limites di e du são usados para testar a autocorrelação positiva (d<2), enquanto os 
limites (4-du) e (4-di) permitem investigar a autocorrelação negativa (d>2). 
 Assim, para um nível de signficância de 5%, o teste é realizado da seguinte forma : 
(i (ii (iii (iv (v
di du 4-du 4-di2
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Autocorrelação 
 
19 
 
 
 ? Autocorrelação positiva 
 
 ? Se d < di (região i), rejeita-se a H0 ( hipótese de ausência de autocorrelação) 
 ? Se di < d < du (região ii), o teste não é conclusivo 
 ? Se d > du, (região iii), aceita-se H0 e rejeita-se H1 
 
 ? Autocorrelação negativa 
 
 ? Se d < (4-du), região iii, aceita-se H0 
 ? Se 4-du < d < 4-di, regiãi iv, o teste não é conclusivo 
 ? Se d > 4 – di, região v, rejeita-se H0 e H1 
 
 Pode ocorrer que du > d ou 4-du < d, dependendo do tamanho da amostra e do 
número de variáveis explicativas. ã medida que o número de amostras aumenta, o problema 
desaparece. 
 A consequência imediata é que a hipótese nula de ausência de autocorrelação será 
sempre aceita rejeitada, quando o número de observações for inferior a 15. A aceitação do 
teste será a aceitação de H0 ou a não - conclusão. 
 Se o modelo incorporar variáveis endógenas defasadas, o valor da estatística d 
aproximar-se-á de 2, mesmo que os erros sejam serialmente correlacionados. Neste caso, o 
teste de Durbin – Watson não será eficaz. 
 O próprio DURBIN (1970) propôs outro teste para avaliar a autocorrelação nesses 
casos (apud Pindyck, Rubinfeld, 1986 : 194 – 195), a saber : 
 
 
)ˆvar(bT1
Trh ⋅−= (6) 
onde 
r = estimativa do parâmetro ρ na equação (2) 
=)ˆvar(b variância do coeficiente da variável endógena defasada 
T = número de observações 
 
 Usando-se a relação (5), resulta : 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAAAutocorrelação 
 
20 
 
 
)ˆvar(
)/(
bT1
T
2d1h
⋅−
−= (7) 
 
 DURBIN mostrou que a estatística h apresenta distribuição aproximadamente normal 
e variância unitária. Dessa forma, a ausência de autocorrelação serial é aceita, em dado nível 
de significância quando h < Zc (Zc é o valor crítico da distribuição normal reduzida). Como 
consequência, o método dos mínimos quadrados ordinários poderá ser usado para estimar os 
parâmetros de modelos que contenham variáveis endógenas defasadas como regressores. 
 
 NOTA : A presença da autocorrelação positiva exerce um grande efeito sobre a 
qualidade das estimativas de mínimos quadrados para β0, β1, ..., βk, que deixam de ser boas 
estimativas para estes parâmetros. Além disso, os intervalos de confiança e teste de hipóteses 
baseados nas distribuições t e F, deixam de ser apropriados. 
 
 ♦ Detecção de autocorrelação negativa 
 
 H0 : ρ = 0 contra H1 ρ < 0 
 A estatística do teste é dada por : 
 d’ = 4 - d 
 Regra de decisão válida para autocorrelação positiva e negativa1 
 
 ? Se d > dα, S Aceita-se H1 
 ? Se d > dα, I Rejeita-se H0 
 ? Se dα, I ≤ d ≤ dα, S o teste não é conclusivo2 
 
 A autocorrelação negativa é dita de 1ª ordem, porque o resíduo em t, εt é função do 
resíduo do período imediatamente anterior t-1, εt-1. 
 Os valores críticos dα, I e dα, S, para vários tamanhos amostrais (n) estão na tabela de 
valores críticos em anexo. 
__________ 
1 Neste caso, basta substituir d por d’ 
2 Recomenda-se coletar mais dados para estabelecer uma conclusão 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Autocorrelação 
 
21 
 
 
 Detecção de autocorrelação bilateral (positiva e negativa) 
 
 H0 : ρ = 0 contra H1 ρ ≠ 0 
 
 Regra de decisão : Realizar simultâneamente os testes de hipóteses para 
autocorrelação positiva e negativa e considerar 2α como nível de significância, onde α é o 
teste de significância associado a cada um dos testes unilaterais. 
 NOTA : Quando o teste de Durbin – Watson indicar a presença da autocorrelação, há 
duas abordagens gerais a serem consideradas: 
 
 i) Se a autocorrelação estiver presente devido à omissão de uma variável regressora 
e se esta variável puder ser identificada e incluída no modelo, a autocorrelação 
provavelmente será eliminada. 
 
 ii) Se o problema da autocorrelação não puder ser resolvido por meio inclusão de 
novas variáveis, então deve ser escolhido um tipo de modelo apropriado que 
possa incorporar a estrutura da autocorrelação. 
 
 TESTE DE GODFREY 
 
 Tal teste consiste, inicialmente, em regredir a seguinte equação : 
 
 tmtk2t31t2t0t vebebebbXbY ++++++= −−− L (8) 
 
onde : et-1 = 0, e1, e2, ..., en-1 
 et-2 = 0, 0, e1, e2, ..., en-2 
 et-m = 0, 0, 0, ..., en-p-1, en-p 
 
 O teste de significância em termos das variáveis adicionais em termos dos resíduos 
defasados serve, também, como diagnóstico da autocorrelação serial, na medida em que 
revela ou não a existência de relação de significância entre Yt e os resíduos et 
 A versão mais simples em termos de aplicação do teste de Godfrey consiste em 
acrescentar à equação (8) apenas et-1, o que permite testar a maioria dos casos de 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Autocorrelação 
 
22 
 
autocorrelação, sendo o diagnóstico da autocorrelação feito a partir da significância desse 
regressor. 
 O teste com a inclusão adicional de resíduos com defasagens maiores do que 1 
reuqer o uso da estatística F para verificar a significância de q variáveis adicionais (q > k). 
 A principal vantagem desse teste é que pode ser aplicado sem restrições, a modelos 
que incluem variáveis dependentes defasadas. 
 
CORREÇÃO DO PROBLEMA DA AUTOCORRELAÇÃO 
 
 Uma vez diagnosticada a autocorrelação serial, é possível eliminar seus efeitos 
através de transformação das variáveis, como segue : 
 
 ttt ebXaY ++= (9) 
 
onde et é gerado por um processo auto-regressivo de primeira ordem do tipo 
 
 t1tt vree += − (10) 
 
 Substituindo-se (10) em (9), obtém-se : 
 t1ttt vrebXaY +++= − (11) 
 Com uma defasagem , a equação (9) pode ser escrita : 
 1t1t1t1t1t1t bXaYeebXaY −−−−−− −−=∴++= (12) 
 Substituindo a segunda expressão de (12) em (11) e reordenando os termos, resulta : 
 t1t1ttt vbrXrarYbXaY +−−++= −− (13) 
 t1tt1tt vrXXbr1arYY +−+−=− −− )()( (13.1) 
 Atribuindo-se a Yt – rYt-1 = Wt a(1-r) = a’ (Xt-rXt-1) = Zt, temos a equação 
transformada : 
 Wt = a’+bZt + vt 
 NOTA : O mesmo raciocínio aplica-se a mais de uma variável explicativa. 
 
 Existem vários métodos que abordaremos a seguir, usados para estimar o parâmetro 
r. Evidentemente que, no caso de a autocorrelação ser proveniente de omissão de variáveis 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Autocorrelação 
 
23 
 
relevantes ou da má especificação da forma funcional, esses problemas deverão ser tratados 
antes da aplicação de qualquer correção. 
 
MÉTODOS DE CORREÇÃO DA AUTOCORRELAÇÃO 
 
 Para corrigir a autocorrelação serial são utilizados com maior frequência os 
seguintes métodos, dentre os vários existentes : 
 
 ? MÉTODO INTERATIVO DE COCHRANE – ORCUTT 
 
 A estimativa de r nesse método segue os seguintes passos : 
 
 ii) Estima-se normalmente a equação pelo método dos mínimos quadrados 
ordinários; 
 
 ii) Utilizam-se, em seguida, os resíduos obtidos para estimar r, mediante o emprego 
da seguinte fórmula : 
 
 nt
e
eer
t
tt ,,,ˆ L32
1
2
1 == ∑
∑
−
− (14) 
 iii) Usa-se r em (14) para fazer as transformações referidas em (13.1) 
 iv) estima-se a equação transformada pelo método dos mínimos quadrados 
ordinários; 
 
 v) Testa-se a presença ou não da autocorrelação; 
 vi) Repete-se o processo, se necessário, até a eliminação do problema 
 
 ? MÉTODO DE DOIS ESTÁGIOS DE DURBIN 
 
 A aplicação desse método consiste nos seguintes passos : 
 
 i) Transforma-se a equação (13.1), obtendo-se : 
 
 ii) Estima-se r, coeficiente de Yt-1 na equação anterior 
 
 iii) Fazem-se as transformações requeridas por (13.1), obtendo-se a expressão, cuja 
estimativa será a equação corrigida : 
 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Autocorrelação 
 
24 
 
 tv1ktXrkXkb1t2Xrt2X2b1t1Xrt1X1br1a1trYtY +−−++−−+−−+−=−− )ˆ()ˆ()ˆ()ˆ( L (15) 
 
 
Atribuindo-se : 
 
 
 
 
 
 
 
 tem-se a equação transformada : 
 
 tktkt22t110t vZbZbZbbW +++++= L (16) 
 
 A fimde evitar a perda das primeiras observações, pode-se expressá-las por : 
 
 n21ir1XZr1YW 21i1i
2
tt ,,,ˆˆ L=−=−= (17) 
 
 Maddala (1978, p. 278) argumenta que tal procedimento para recuperar as primeiras 
observações das variáveis pode ser adotado em qualquer método de correção. 
 
 ? MÉTODO DAS PRIMEIRAS DIFERENÇAS 
 
 Nesse método, pressupõe que se r=1, então a equação transformada será : 
 
 tu1ktXkXkb1t2Xt2X2b1t1Xt1X1b1tYtY +−−++−−+−−=−− )()()( L (18) 
 
 
 
 
 
 
 
)ˆ( r1ab0 −= 
1ttt YrYW −−= ˆ 
1t1t1t1 XrXZ −−= ˆ 
1t2t2t2 XrXZ −−= ˆ 
. . . 
1ktktkt XrXZ −−= ˆ 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Autocorrelação 
 
25 
 
E X E R C Í C I O S 
 
1. Considere a função investimento 
 
 tttt eRYI +β+β+β= 321 
onde 
It = Investimento no ano t 
Yt = PIB do ano t 
Rt = Taxa de juros no ano t 
 
 O arquivo inv.dat apresenta 30 observaçõessobre I, Y e R. Com esses dados : 
 a) Ache as estimativas de mínimos quadrados de β1, β2 e β3 e relate os resultados na 
forma usual. Comente a confiabilidade estatística implícita dos resultados. As 
estimativas de β2 e β3 têm os sinais esperados ? 
 
(-1,46)(10,72)(2,48)
59,980,8030,1842-0,76996,2249 2 ==+= FRRYI ttt 
 
 b) Faça o gráfico dos resíduos de mínimos quadrados. Os resíduos sugerem a 
existência de autocorrelação ? Sim, o gráfico mostra haver indícios de 
autocorrelação positiva. 
-3
-2
-1
0
1
2
3
0 10 20 30 40
It
R
es
íd
uo
s
 
FIGURA 3 – RESÍDUOS NÃO CORRIGIDOS EM FUNÇÃO DA VARIÁVEL 
RESPOSTA It 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Autocorrelação 
 
26 
 
 c) Aplique o teste de DURBIN – WATSON para verificar a existência de autocorrelação 
positiva 
 
∑
∑
=
=
−−
= n
1t
2
t
n
2t
2
1tt
e
ee
d
)(
 ∴ 8520
3358299
0799255 ,
,
, ==d 
 d = 0,852 ? d < 2 
 n =30 e k = 2, donde di = 1,284 du = 1,567 
iu ddd −<<− 44 ∴ 2,7162,433 <<d 
 
 Como d = 0,852 < 2, isso indica autocorrelação positiva e como d não pertence à 
região não conclusiva 2,7162,433 << d , aceita-se a hipótese de autocorrelação positiva ao 
nível de probabilidade de 5%. 
 
 d) Reestime o modelo após corrigí-lo quanto à autocorrelação. Relate os resultados. 
Assinale quaisquer diferenças entre esses resultados e os resultados da parte (a). 
Sugira como os resultados obtidos na parte (a) poderiam ser enganosos. 
 
 Correção da autocorrelação serial pelo método interativo de Cochrane - Orcutt 
 
 nt
e
eer
t
tt ,,,ˆ L32
1
2
1 == ∑
∑
−
− ∴ 0,5677
296,0964
168,1018 ==rˆ 
 As primeiras observações serão corrigidas por : 
 
 211 1 rIW ˆ−= 9,4956770111,53 21 =−= ,W 
 211 1 rYZ ˆ−= 7,065677018,58 21 =−= ,Z 
 211 1 rRS ˆ−= 14,925677011218 21 =−= ,,S 
 
 As demais observações serão corrigidas através das seguintes expressões : 
 
 156770 −−= ttt IIW , 156770 −−= ttt YYZ , 156770 −−= ttt RRS , 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Autocorrelação 
 
27 
 
 Equação corrigida 
 
(-3,141)(5,550)(2,302)
19,390,5590,2542-0,74953,4354 2 ==+= FRRYI ttt 
-3
-2
-1
0
1
2
3
0 5 10 15 20 25 30 35
It
R
es
íd
uo
s
 
FIGURA 4 – RESÍDUOS CORRIGIDOS EM FUNÇÃO DA VARIÁVEL RESPOSTA It 
 
 e) Preveja o nível de investimento do próximo ano, dado que os valores 
correspondentes de Y e R são Y = 36 e R = 14. Compare essa previsão com a que 
seria obtida se não se levasse em conta a autocorrelação. 
 
 O investimento seria de 31,36 se não fosse considerada a autocorrelação, com a 
correção esse valor passará a ser 26,86, o que elimina a possibilidade de se fazer uma 
previsão equivocada com uma margem de erro de 14% além do valor esperado, ou seja, 
estaríamos induzindo uma superestimativa. 
 
2. A partir dos dados da Tabela 6, solicita-se : 
 
 a) Estimar a equação de demanda de automóveis e testar a autocorrelação serial 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Autocorrelação 
 
28 
 
TABELA 4 – QUANTIDADE VENDIDA DE AUTOMÓVEIS (Q), PREÇO REAL (P) E PRODUTO INTERNO 
BRUTO (Y), 1970/1987. 
 
 
Ano 
Quantidade Vendida 
(MIl Unidades) 
(Q) 
Índice de Preço 
Real (1978/1979=100) 
(P) 
Índice do PIB 
(1978/1979=100) 
(Y) 
1970 309 132,4 49,3 
1971 395 124,6 54,9 
1972 457 119,4 61,5 
1973 558 114,9 70,0 
1974 640 106,3 75,9 
1975 661 113,2 79,7 
1976 695 100,7 87,9 
1977 679 99,9 92,2 
1978 798 100,0 96,7 
1979 827 100,0 103,3 
1980 793 84,5 112,8 
1981 448 91,8 107,9 
1982 556 101,8 108,6 
1983 608 94,0 104,8 
1984 532 86,2 110,1 
1985 602 80,0 119,3 
1986 672 82,0 128,4 
1987 411 98,6 133,0 
 
 Estimativa da equação de demanda de automóveis 
 
18n9220d(-1,03)(-1,93)(2,41)
2532103,0735-9,6679-1863,88 2
==
===
,
,, FRYPQ 
 A seguir serão feitos os testes de autocorrelação 
 
 TESTE DE PRESENÇA OU AUSÊNCIA DE AUTOCORRELAÇÃO 
 
 Inicialmente será utilzada a seguinte fórmula : 
 
 
∑
∑
=
=
−−
= n
1t
2
t
n
2t
2
1tt
e
ee
d
)(
 ∴ 9220
255747,50
235875,73 ,==d 
 d = 0,922 ? d < 2 
 n =18 e k = 2, donde di = 1,046 du = 1,535 
iu ddd −<<− 44 ∴ 2,9542,465 <<d 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Autocorrelação 
 
29 
 
 Como d = 0,922 < 2, isso indica autocorrelação positiva e como d não pertence à 
região não conclusiva 2,9542,465 <<d , aceita-se a hipótese de autocorrelação positiva ao 
nível de probabilidade de 5%. 
-3
-2
-1
0
1
2
3
0 200 400 600 800 1000
Qt
R
es
íd
uo
s
 
FIGURA 5 – RESÍDUOS NÃO CORRIGIDOS EM FUNÇÃO DA VARIÁVEL 
RESPOSTA Qt 
 
 b) Corrigir, se necessário, a autocorrelação pelo método interativo de Cochrane – 
Orcutt 
 
 Correção da autocorrelação serial pelo método interativo de Cochrane - Orcutt 
 
 nt
e
eer
t
tt ,,,ˆ L32
1
2
1 == ∑
∑
−
− ∴ 0,493
255747,50
126079,50 ==rˆ 
 As primeiras observações serão corrigidas por : 
 
 211 1 rQW ˆ−= 268,849301309 21 =−= ,W 
 211 1 rPZ ˆ−= 115,249301132,4 21 =−= ,Z 
 211 1 rYS ˆ−= 42,94930149,3 21 =−= ,S 
 
 As demais observações serão corrigidas através das seguintes expressões : 
 
 14930 −−= ttt QQW , 14930 −−= ttt PPZ , 14930 −−= ttt YYS , 
 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Autocorrelação 
 
30 
 
 Equação corrigida 
 
(-1,47)(-1,24)(1,75)
5,7760,5531,4036Y-1,6215P-466,8508 2 === FRQ 
 
 c) Estimar a equação de demanda de automóveis, utilizando Qt-1 como variável 
explicativa e usar o teste adequado para verificar a presença ou não da 
autocorrelação serial 
 
 Teste de autocorrelação : 
 
 Utilizando-se a variável defasada Qt-1 como variável explicativa, foram obtidos os 
seguintes resultados : 
 
2,070d(-1,446)(-1,224)(2,375)(1,682)
.17930.4233,7385Y-5,6104P-0,5654Q1190,0868 21-t
=
==+= FRQ 
NOTA : Segundo MATOS (1997, p. 146), quando a variável resposta defasada é 
utilizada como variável explicativa, o teste convencional de DURBIN – 
WATSON, não é recomendável. Deve ser utilizado outro teste, como por 
exemplo o teste alternativo proposto pelo próprio DURBIN. 
0.23803337 
 Considerando que d = 2,070 e a variância do coeficiente estimado da variável Qt-1 é 
igual a 0,0354, ter-se-á : 
 
 =×−⎟⎠
⎞⎜⎝
⎛ −= ),/(, 0567018118
2
07021h 
 
 Para 95 % de probabilidade Z = 2, logo Zc = 2- P(Z>-0,169) = 2 – 0,0675 = 1,93 
 
 Como h = 0,169 <Zc = 1,93 ao nível de significância de 5%, a hipótese nula de 
autocorrelação serial é rejeitada na equação com a variável defasada Qt-1 
 Hipóteses para o teste : 
 • H0 : r = 0 (ausência de autocorrelação) 
 • H1 : r ≠ 0 (presença de autocorrelação) 
 d = 2,048 ? d > 2 
 n =18 e k = 3, donde di = 0,933 du = 1,696 
iu ddd −<<− 44 ∴ 3,0672,304 <<d 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Autocorrelação 
 
31 
 
 Como d < 4 – du, aceita-se a hipótese nula de ausência de autocorrelação e rejeita-se 
a presença de autocorrelação de primeira ordem. 
 
-3
-2
-1
0
1
2
3
0 50 100 150 200 250 300 350 400 450 500
Qt
R
es
íd
uo
s
 
FIGURA 6 – RESÍDUOSCORRIGIDOS EM FUNÇÃO DA VARIÁVEL RESPOSTA Qt 
 
UNIVERSIDADE FEDERAL DO AMAZONAS 
CURSO DE ENGENHARIA FLORESTAL 
TTTOOOPPPIIICCCOOOSSS DDDEEE EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
 
HETEROCEDASTICIDADE 
 
CONCEITO 
 
 É desejável que a variância dos resíduos eij gerados pela estimação de um modelo, 
seja constante. Se isso ocorre, o pressuposto da homocedasticidade é satisfeito. Nesse caso, 
Var (eij) = σ2, onde σ é uma constante. A Fig. (a), ilustra essa situação, na medida em que a 
dispersão dos resíduos é uniforme ao longo da linha de regressão. A violação desse 
pressuposto é a heterocedasticidadde, que , evidentemente, se refere ao fato de a variância de 
ei não ser constante, isto é, var (ei) = σ2i, ou seja, var (ei) ≠ σ2. 
 A ocorrência da heterocedasticidade é que o método dos mínimos quadrados não 
gera estimativas dos parâmetros eficientes ou de variância mínima, o que implica erros-
padrões viesados e incorreção dos testes de t e F e dos intervalos de confiança. 
 Tal problema é mais frequente em séries não temporais. A relação entre consumo (C) 
e renda disponível (Y), Fig. (b), é um exemplo clássico de dispersão de resíduos diretamente 
correlacionada à variável explicativa. Isso ocorre porque é plausível a hipótese de que os 
valores do consumo (C) e, consequentemente, dos resíduos da equação estimada, aumente 
com o nível da renda disponível. 
 A relação inversamente proporcional entre a dispersão dos resíduos e a variável 
explicativa pode ser ilustrada pela equação de regressão da taxa de rentabilidade (R) sobre o 
tamanho da empresa (T), Fig. (c). Isso ocorre em virtude de a variância da taxa de 
rentabilidade e, também, dos resíduos decrescerem com o aumento do porte da empresa. 
 
 
Fonte : MATOS (1997, p. 148) 
X Y T 
X C R (a) (b) (c) 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade 
 
33 
 
PRESSUPOSTOS SOBRE A NATUREZA DA VARIÂNCIA DOS RESÍDUOS E 
CORREÇÃO DA HETEROCEDASTICIDADE 
 
 Seja o seguinte Modelo Linear 
 
 ttt exy +β+β= 21 (1) 
onde 
yt = despesa mensal com alimentação da t-ésima família 
xt = renda mensal da t-ésima família 
 Admite-se que os et sejam termos estocásticos não correlacionados que satisfazem às 
seguintes propriedades : 
 )()cov()var()( , jieeeeE jiet ≠=σ== 00 2 (2) 
 O parâmetro β2 descreve como a despesa familiar com alimentação varia quando a 
renda familiar aumenta de uma unidade. O parâmetro intercepto β1 mede a despesa com 
alimentação para um nível zero de renda. 
 A equação (1) é adequada para explicar despesas com alimentação para famílias de 
rendas baixas e altas ? As famílias de baixa renda são quase que forçadas a gastar 
exclusivamente com alimentação, determinada parcela de sua renda, sem grandes opções de 
escolha dos tipos de alimentos. Enquanto as famílias de elevado nível de renda podem variar 
sua escolha de alimentos. Assim, a renda é menos importante como variável explicativa para 
despesas com alimentação de uma família de renda alta, por ser mais difícil fazer suposições 
sobre seus gastos com alimentação. 
 Quando as variâncias não são as mesmas para todas as observações, ou seja, 
2
ttt ey σ== )var()var( , diz-se que existe heterocedasticidade, ou que a variável aleatória yt 
e o erro aleatório et são heterocedásticos. Reciprocamente, se se verifica a condição 
2σ== )var()var( tt ey , diz-se que existe a homocedasticidade, e yt e et são homocedásticos. 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade 
 
34 
 
 A existência de diferentes variâncias ou de heterocedasticidade ocorre com 
frequência quando trabalhamos com dados em corte ou seção transversal (cross section). O 
termo dados em corte transversal se refere ao fato de termos dados sobre diversas unidades 
econômicas, tais como famílias ou firmas, em um dado ponto do tempo. Os dados sobre 
renda e despesas com alimentação em uma casa se enquadram nessa categoria. Outros 
exemplos adicionais incluem dados sobre custos, produto, insumo, para diversas firmas, 
dados sobre quantidades adquiridas e preços para determinados artigos em diversos 
varejistas. 
 Os dados em corte transversal invariavelmente envolvem observações sobre 
unidades econômicas de vários tamanhos. Por exemplo, os dados sobre famílias envolvem 
famílias com diferentes números de membros e diferentes níveis de renda. Quanto aos dados 
sobre diversas firmas, podemos medir o tamanho da firma pelo volume de sua produção. 
 A heterocedasticidade não é uma propriedade necessariamente restrita a dados em 
corte transversal. Com dados em séries temporais, em que temos dados ao longo do tempo 
sobre unidade econômica, é possível que a variância do erro se modifique. Isso ocorre 
quando um choque ou variação externa nas circunstâncias criam maior ou menor incerteza 
sobre y. 
 
 De forma geral, seja o modelo linear geral 
 
 ikiki22i110i eXbXbXbbY +++++= L (3) 
 
 Como no caso de Heterocedasticidade var(ei) = σ2i. Isso implica afirmar que 
var(ei)=f(X1i, X2i, ... , Xki) 
 Admitindo-se que Yi é função de apenas uma das variáveis explicativas Xi do 
modelo (o caso mais frequente), então σ2i será de algum modo, relacionada a Xi. Uma forma 
especificativa plausível para a associação entre ei e Xi é a seguinte : 
 
 ci
22
ii Xe ⋅== σσ)var( (4) 
 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade 
 
35 
 
 Tal forma especificativa envolve os parâmetros σ2 e c. O parâmetro c é 
particularmente importante, porque mede a força da Heterocedasticidade. Quanto mais 
próximo de zero o valor de c, menos expressiva será a dispersão dos resíduos ei, de tal forma 
que quando c=0, o problema da heterocedasticidade não existirá. 
 A partir de (1), conclui-se que o desvio-padrão de ei será : 
 
 
2c
i
i2c
iii X
XeS /
/)(
σσσσ =∴⋅== (5) 
 A equação (2) permite inferir que para obter –se variância constante 
(homocedasticidade), basta dividir a equação original por Xc/2. No caso do modelo linear 
simples Y = a+bX+e, a equação transformada após a divisão será : 
 
 
2c2c2c2c X
e
X
bX
X
a
X
Y
//// ++= (6) 
 
 Dessa forma, 
 
 222 11 σ=⋅σ⋅=⋅= cccc XXeXXear )var()/(
/v (7) 
 O resultado obtido pelo uso da equação (4), assegura a homocedasticidade. 
 
 Caso c=2, obtém-se a seguinte equação transformada : 
 
 X
ebX
a
X
Y ++= (8) 
 Fazendo-se X
euXSX
YW === 1 , a equação (5), será expressa por : 
 ubaSW ++= (9) 
 
 Quando c=-2, o fator de ponderação será X-1 = 1/X. Consequentemente, ter-se-á a 
seguinte equação transformada, após sua divisão por 1/X : 
 
 eXbXaXYX ++= 2 (10) 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade 
 
36 
 
 
 Portanto, o resultado da seguinte expressão garante a Heterocedasticidade 
22222 σ=⋅σ⋅=⋅= −XXeXeX )var()var( . 
 Fazendo-se eXsXZYXU === 2 , tem-se : 
 sbZaXU ++= (11) 
 
 Aplicando-se mínimos quadrados às equações (9) e (11), obtém-se estimativas 
eficientes dos parâmetros do modelo original. Evidentemente, tal procedimento pode ser 
também, aplicado ao modelo linear geral. Trata-se do método dos mínimos quadrados 
ponderados. 
 Note-se ainda que na estimação do modelo (9), o termo constante é b. No entanto, 
multiplicando-se a equação (9) estimada por X, restabelecer-se-á a situação inicial. No caso 
de (8), ter-se-á de estimá-la sem o termo constante. 
 
 O coeficientede determinação (R2) e a estatística F, em face da transformação da 
variável dependente Y, perdem significado. Assim, a melhor alternativa é utilizar o R2 e 
estatística F do modelo original ou o quadrado do coeficiente de correlação simples (r2) entre 
os valores observados e estimados de Y a partir da equação corrigida (PINDYCK, 
RUBINFELD, 1986, p. 146). Nesse último caso, poder-se-á calcular a estatística F em 
termos de r2, dado que r2 = R2, nesse caso. Em consequência, k
kn
R
RF 1
1 2
2 −−⋅−= 
 Por fim, deve-se ressaltar que o problema fundamental, visando à estimação de 
parâmetros eficientes, consiste em determinar o padrão da relação entre os resíduos ei e a 
variável X, que lhe é correlacionada. 
 
TESTES E CORREÇÃO DA HETEROCEDASTICIDADE 
 
 Existem diversos testes para detectar a presença ou ausência da Heterocedasticidade. 
Os mais comuns são os propostos por GOLDFELD e QUANDT (1965), PARK (1966), 
GLEJSER (1969) e PASARAN (1987). Abordaremos a seguir, o uso destes quatro tipos de 
testes. 
 
TESTE DE GOLDFELD – QUANDT 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade 
 
37 
 
 
QUANDT E GOLDFELD (1965) propuseram um teste para detectar a Heterocedasticidade, o qual 
consiste nos seguintes passos (apud Koutsoyiannis (1977, p. 185-186) : 
 a. Ordenam-se as observações segundo a magnitude da variável explicativa X, que, 
hipoteticamente está correlacionada aos resíduos; 
 
 b. Seleciona-se arbitrariamente certo número de observações centrais (c), que serão 
omitidas da análise. Em geral, omite-se aproximadamente ¼ das observações centrais. 
Assim, as (n-c) observações restantes são divididas em duas subamostras de tamanhos 
iguais, um incluindo os valores menores de X e outra seus valores mais elevados. 
 
 c. Estimam – se regressões separadas e obtém-se a soma de quadrados dos resíduos 
para cada subamostra : 
 
 c1. SQR1 = soma de quadrado dos resíduos dos valores mais baixos de X, com grau 
de liberdade dado por (n-c)/(2-k-1); 
 c2. SQR2 = soma de quadrado dos resíduos dos valores mais elevados de X, com o 
mesmo número de graus de liberdade (n-c)/(2-k-1); 
 
 d. Com base nessas informações, calcula-se a seguinte estatística com distribuição F 
apresentando [(n-c)/(2-k-1)] graus de liberdade tanto para o numerador como 
para o denominador 
 
 
1
2
1
2
12
12
SQR
SQR
kcnSQR
kcnSQRF =−−−
−−−=
)]/()/[(
)]/()/[(
 (12) 
 
onde 
 
n = número total de observações 
k = número de variáveis explicativas incluídas no modelo 
c = número de observações omitidas 
 
 Note-se que, se as variâncias das duas subamostras forem aproximadamente iguais, 
F tende a 1 e a H0 (ausência de heterocedasticidade) será aceita. 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade 
 
38 
 
 À medida que a diferença entre as duas variâncias se amplia, o problema de 
heterocedasticidade vai se tornando mais sério. Portanto, dado um nível de significância, 
pode-se utilizar a estatística F para verificar a existência ou não do problema da 
Heterocedasticidade. 
 Se Fobservado > Fcrítico para [(n-c)/(2-k-1)], H0 (ausência de heterocedasticidade) será 
rejeitada. 
 IMPORTANTE : A aplicação do teste Quandt – Goldfeld é mais apropriado para 
grandes amostras, de modo que seja possível estimar as duas regressões adequadamente. 
Além disso, sua aplicação requer a normalidade dos resíduos e a ausência de autocorrelação 
serial para que tenha validade. 
 
TESTE DE GLEJSER 
 
 O teste de Glejser consiste em estimar a equação de regressão do valor absoluto dos 
resíduos ei sobre a variável explicativa, que por alguma razão, é relacionada aos resíduos, 
após a escolha da forma especificativa mais adequada. Não obstante a Heterocedasticidade 
se refira à existência de uma relação entre a variância dos resíduos [var(ei)] e uma ou mais 
varáveis explicativas (X), a estimação sugerida por GLEJSER faz sentido, porque a 
magnitude de ei em valores absolutos varia (aumenta ou diminui), quando sua variância não 
for constante. Formalmente ter-se-á : 
 
 21505012 oucvbXae c ;,;,;; −−−=∴++= (13) 
 
 A heterocedasticidade é, então, avaliada em função das estatísticas convencionais de 
análise de regressão (t, F e R2), rejeitando-se H0 (ausência de heterocedasticidade), se os 
parâmetros estimados forem estatisticamente iguais a zero, para dado nível de significância. 
Na prática, é suficiente utilizar a estatística F para a realização do teste. 
 Quando apenas a estimativa do parâmetro b for diferente de zero, tem-se 
heterocedasticidade pura e, desse modo, é plausível admitir que var(ei)=σ2X2c. Portanto, o 
desvio – padrão será proporcional a Xc e, em consequência, poder-se-á utilizar Xc como fator 
de ponderação ou correção da equação original. 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade 
 
39 
 
 Se tanto a estimativa de (a) quanto a de (b) forem diferente de zero, a 
heterocedasticidade será mista e o fator de correção mais apropriado seria o uso da 
estimativa de (a+bXc), o que tornaria a correção muito mais complexa e problemática. 
 NOTA : Pelo procedimento de GLEJSER, o fator de correção (Xc) depende da forma 
especificativa que, mais apropriadamente, ajuste |e| a Xc ou da escolha arbitrária de uma 
delas. 
 
TESTE DE PARK 
 
 Segundo PARK (1966), uma especificação mais adequada seria utilizar a relação e2 
= aXc. Assim, o teste de homocedasticidade consiste em regredir o quadrado dos resíduos, e2, 
sobre o X, usando-se a forma funcional logarítmica. Desse modo, admitindo-se um resíduo 
aditivo u, a equação a ser estimada será : 
 
 uXLncaLneLn +⋅+= )()()( 2 (14) 
 
 Todavia, tal forma especificativa não é aplicável no caso de a variável explicativa a 
priori relacionada a e2, assumir valores negativos ou nulos. Esse é o caso da variável binária. 
 Outra limitação é que o termo u pode, também, ser Heterocedástico, produzindo 
erro-padrão viesado e incorreção no próprio teste (PINDYCK, RUBINFELD, 1986, p. 151). 
 Apesar disso, a especificação adotada por PARK pode ser combinada com o 
procedimento proposto por GLEJSER, com a vantagem de se poder utilizar o valor estimado 
do parâmetro de Ln (X) para a obtenção direta de pesos mais satisfatórios para corrigir a 
Heterocedasticidade. 
 Assim, admitindo-se genericamente que : 
 221222 //)()()var( ci
c
iii
c
iii XXeSXe ⋅σ=⋅σ=σ=∴⋅σ=σ= (15) 
 
 Desse modo, a estimativa do parâmetro c de Ln (X) na equação (8) permite 
determinar diretamente os valores do fator de correção (FC), isto é, FC = Xc/2. Em 
consequência a equação transformada (sem o índice i) será : 
 2222 //// cccc X
e
X
bX
X
a
X
Y ++= (16) 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade 
 
40 
 
 Tal procedimento dispensa, portanto, a tarefa de escolher a melhor forma 
especificativa dos valores de c na equação (7), como requer o procedimento original de 
GLEJSER. 
 
 
TESTE DE PESARAN e PESARAN 
 
 Tal teste consiste em regredir o quadrado dos resíduos (ei) sobre o quadrado dos 
valores estimados da variável dependente (Y), como segue : 
 vYbae ++= 22 ˆ (17) 
 
 O teste da estimativa do parâmetro b pela estatística F revela a significância ou não 
da relação (11) e, consequentemente, a do grau de heterocedasticidade. 
 A grande virtude desse teste é sua simplicidade. Ademais, relacionaos resíduos com 
os valores estimados da variável resposta, o que evita o problema da escolha da variável 
explicativa que é correlacionada com os resíduos, como ocorre nos testes de GLEJSER e de 
PARK, procedimento nem sempre fácil, a menos que exista uma clara racionalização a 
respeito. 
 
 ESTIMADOR DE WHITE 
 
 Halbert White, um econometrista, sugeriu um estimador para as variâncias e 
covariâncias dos estimadores dos coeficientes de mínimos quadrados quando existe 
heterocedasticidade. 
 NOTA : Como os quadrados dos resíduos são usados para aproximar as variâncias, o 
estimador de White é estritamente apropriado somente para grandes amostras. 
 O método consiste em substituir σ2t pelos quadrados dos resíduos, ou seja, atribuir 
e2i = σ2i na seguinte expressão : 
 
 [ ] [ ]22
22
22
22
2 ∑
∑
∑
∑
−
−=
−
σ−=
)(
])[(
)(
])[()var(
xx
exx
xx
xxb
i
ii
i
ii (18) 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade 
 
41 
 
 
 Utilizando o seguinte procedimento do SAS, extrai-se a raiz quadrada da diagonal da 
matriz de covariância para obter-se o erro – padrão estimado sugerido por White, o qual é 
comparado ao erro-padrão obtido pelo Método de mínimos quadrados ordinários, ou seja, 
utiliza-se esse novo erro-padrão para testar a significância dos coeficientes. 
 
data food; * create dataset; 
infile 'table3.1'; * open data file; 
input y x; * input variables; 
 
proc reg; * estimate regression; 
white:model y = x/acov ; * White standard errors are square roots 
 of ACOV diagonal; 
; 
title 'Teste White'; 
 RESULTADO OBTIDO : 
Consistent Covariance of Estimates 
 ACOV INTERCEP X 
 
 INTERCEP 561.88951794 -0.886643258 
 X -0.886643258 0.0014569032 
 
 White MQO 
β1 (constante) 7042389561 ,, = 22,139 
β2 0382000145690 ,, = 0,0305 
 
 
 
E X E R C Í C I O S 
 
1. Considere o seguinte modelo de despesas domésticas : 
 
 ttt exy +β+β= 21 (e.1) 
 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade 
 
42 
 
onde yt é a despesa com alimentação da t-ésima casa e xt é a renda. Determine estimativas 
generalizadas de mínimos quadrados para β1 e β2 sob a hipótese 
 
 a) tt xe 2σ=)var( (e.2) 
 b) tt xe 2σ=)var( (e.3) 
 c) 22 tt xe σ=)var( (e.4) 
 d) )()var( tt xLne 2σ= (e.5) 
 
 Para demonstramos esses fatos, começaremos dividindo ambos os membros da 
equação (e.1) por 4 tx , tx , tx e )( txLN , respectivamente : 
 
 
44
2
4
1
4
1
t
t
t
t
tt
t
x
e
x
x
xx
y +β+β= (e.6) 
 
t
t
t
t
tt
t
x
e
x
x
xx
y +β+β= 21 1 (e.7) 
 
t
t
t
t
tt
t
x
e
x
x
xx
y +β+β= 21 1 (e.8) 
 
)()()()( t
t
t
t
tt
t
xLN
e
xLN
x
xLNxLN
y +β+β= 21 1 (e.9) 
 
 Aplicando-se o seguinte procedimento de cálculo para Mínimos Quadrados 
Generalizados no SAS temos : 
 
 
 
............................................................................................. 
 a) 
Incorreto
White
FRyt
)()(
)()(
,
0,02820,052
0,03320,118
634210,3630,134x36,753 2t ==+=
 (e.10) 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade 
 
43 
 
 b) 
Incorreto
White
FRyt
)()(
),()(
,,,
0,02717,986
029017,325
265274180x141031,924 2t ==+=
 (e.11) 
 c) 
Incorreto
White
FRyt
)()(
),(),(
0,023 14,038
023085612
45,349 0,544 0,1576x 21,2858 2t ==+=
 (e.12) 
 d)
Incorreto
White
FRyt
),(),(
),()(
,,
029046921
036022,488
8001833100,1299x39,5501 2t ==+=
 (e.13) 
............................................................................................. 
TABELA 2 – RESUMO DO TESTE GOLFELD & QUANDT 
Pressupostos de 
Heterocedasticidade 
2
1σ 22σ Q & D Fcrítico P - Valor 
(i) tt xe 2σ=)var( 27,9584 75,8327 2,712 2,217 0,0203 
(ii) tt xe 2σ=)var( 1,15014 2,53161 2,201 2,217 0,0515 
(iii) 22 tt xe σ=)var( 0,00197 0,00287 1,457 2,217 0,2163 
(iv) )()var( tt xLne 2σ= 106,786 335,445 3,141 2,217 0,0098 
 
 Confrontando-se os resultados da tabela 2, observa-se que para os pressupostos (ii) e 
(iii) onde Q & D < Fc aceita-se H0 como ausência de heterocedasticidade, enquanto que para 
os pressupostos (i) e (iv),, onde tem-se Q & D > Fc, rejeita-se H0, donde se pode concluir que 
existe realmente heterocedasticidade e que a variância do erro depende do nível de renda. 
 
 OBS. : Quando o p – Valor de um teste de hipótese é menor do que o nível de 
significância escolhido α, o procedimento do teste conduz à rejeição da hipótese nula. 
Portanto, quando p ≤ α, significa que o valor da estatística F deve estar na região de rejeição. 
Além disso os valores de p e α são distribuídos em p/2 e α/2, para cada lado da região de 
rejeição. 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade 
 
44 
 
 IMPORTANTE : De acordo com HILL et a. (1999, p. 180), ao testar uma hipótese nula 
de igualdade contra uma alternativa do tipo não é igual a, podemos utilizar tanto um teste t 
como um teste F, os resultados serão idênticos. A razão disso é que existe um relacionamento 
exato entre as distribuições t e F. O quadrado de uma variável aleatória t com gl graus de 
liberdade é uma variável aleatória F com distribuição F(1,gl). Por exemplo, quando aplicamos 
um teste t para H0 : β2 = 0 contra H1 : β2 ≠ 0, encontramos t = -2,081, tc = 2,01 e p = 0,0427. 
O valor F que calculamos é F = 4,332 = t2 e Fc = (tc)2. Em razão desse relacionamento exato, 
os p –valores para os dois testes são idênticos, o que significa que sempre chegaremos à 
mesma conclusão, utilizando um desses dois testes estatísticos. Não há equivalência quando 
utilizamos um teste t monocaudal, pois o teste F não é apropriado quando a alternativa é uma 
desigualdade, “>” ou “<”. 
 
 
 
 
 
 Como estamos utilizando um teste bicaudal, se o valor da estatística do teste F recair 
em qualquer uma das caudas da distribuição F, – rejeitamos a hipótese nula H0 : σ21 = σ22 e 
aceitamos a alternativa H1 : σ21 ≠ σ22. Neste caso, a rejeição da hipótese nula leva à 
conclusão de que se σ21 > σ22 , então essa alternativa descarta completamente a possibilidade 
de σ21 < σ22 e vice-versa. O que difere os testes monocaudais dos bicaudais são a escolha da 
região de rejeição e o cálculo do valor de p. Os testes monocaudais são usados para testar H0 
: σ21 = σ22 contra H1 : σ21 > σ22 ou H1 : σ21 < σ22 , ou seja, a regra de decisão para esse tipo 
de teste consiste em rejeitar H0 : σ21 = σ22 e aceitar uma das alternativas H1 : σ21 > σ22 ou H1 
: σ21 > σ22 , conforme estabelecido a priori. 
OBS.: Ao testar uma hipótese com uma única igualdade, é perfeitamente 
correto utilizar tanto um teste t como o teste F, pois, como vimos, são 
processos equivalentes. Na prática, é costume testar hipótestes únicas, ou 
isoladas, utilizando um teste t. O teste F é reservado em geral para hipóteses 
conjuntas. 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade45 
 
 Faça um comentário sobre a sensibilidade das estimativas e de seus desvios – padrão 
à especificação de heterocedasticidade. Em cada caso, utilize o teste de GOLFELD e QUANDT e 
os resíduos dos modelos transformados para testar se a heterocedasticidade foi 
eliminada.Aplique um teste bicaudal1, com nível de 10% de significância. 
 
2. No arquivo pubexp.dat constam dados sobre a despesa pública com educação (EE), 
produto interno bruto (GDP) e população (P) para 34 países no ano de 1980. Esses dados 
foram tirados de Gougherty, C., Introduction to Econometrics, Oxford University Press, 
1992. Admite-se que a despesa per capita com educação esteja relacionada linearmente com 
o produto per capita. Isto é, 
 
 ttt exy +β+β= 21 (e.14) 
onde ⎟⎟⎠
⎞
⎜⎜⎝
⎛=⎟⎟⎠
⎞
⎜⎜⎝
⎛=
t
t
t
t
t
t P
GDPxP
EEy 
 Suspeita-se que et possa ser heterocedástico, com uma variância relacionada com xt. 
 a) Por que razão a suspeita quanto à heterocedasticidade pode ser razoável ? 
 Porque à medida que a renda xt cresce os erros não – observáveis tendem a crescer 
em termos absolutos, ou seja, espera-se que os gastos com educação cresçam à medida que a 
renda xt cresça, o que evidencia que a variância não é constante. É, portanto, desejável 
modelar uma variância σ2 que aumente com o crescimento de xt. Além disso, o fenômeno da 
heterocedasticidade ocorre com frequência quando trabalhamos com dados em corte ou 
seção transversal (cross section). Isto significa que esses dados refletem o comportamento de 
diversas unidades econômicas, tais como firmas ou famílias, em um dado ponto no tempo. 
Portanto, os dados sobre despesa com educação enquadra-se nessa categoria, daí ser razoável 
que possamos a priori indagar as consequências da herocedasticidade sobre o modelo em 
questão. 
__________ 
1 O teste bicaudal é recomendado quando se pressupõe que as duas partições da amostra possam ter variâncias 
diferentes, mas não podemos predizer qual variância é potencialmente maior, o que se faz mediante a hipótese 
alternativa onde H1 : β21 ≠ β22. Para o teste bicaudal com o nível de 10% de significância, atribuímos a maior 
estimativa de variância ao numerador do F calculado e tomamos um valor crítico Fc tal que P[F > Fc] = 0,05. 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade 
 
46 
 
 b) Estime a equação (e.14) utilizando mínimos quadrados; trace num gráfico a 
função mínimos quadrados e os resíduos. Há evidência de heterocedasticidade ? 
 
Incorreto
White
FRyt
)()(
),(),(
0,00520,0486
0060003920
199,588 0,862 0,0732x -0,1246 2t ==+=
 (e.15) 
-3
-2
-1
0
1
2
3
0 250 500 750 1000 1250 1500
Despesa por 1000 Habitantes
R
es
íd
uo
s
 
FIGURA 1 – RESÍDUOS NÃO CORRIGIDOS EM FUNÇÃO DA VARIÁVEL RESPOSTA DESPESA 
POR 1000 HABITANTES 
 
 Sim, há evidência de heterocedasticidade conforme é possível observar na figura 1 
onde temos a distribuição dos resíduos. É possível perceber que existe discrepância no 
comportamento dos resíduos, os quais apresentam um padrão de dispersão irregular em torno 
da linha central, com maior evidência para países com população superior a um milhão de 
habitantes. 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade 
 
47 
 
-3
-2
-1
0
1
2
3
0 250 500 750 1000 1250 1500
Despesa por 1000 Habitantes
R
es
íd
uo
s
1 
FIGURA 2 – RESÍDUOS CORRIGIDOS EM FUNÇÃO DA VARIÁVEL RESPOSTA DESPESA POR 
1000 HABITANTES 
 
 c) Teste a existência de heterocedasticidade utilizando o teste de GOLDFELD e 
QUANDT. 
 
Pressupostos de 
Heterocedasticidade 
2
1σ 22σ Q & D Fcrítico P - Valor 
tt xe 2σ=)var( 0,0016 0,0021 1,3105 2,403 0,3035 
 
 Como Q & D = 1,31 < Fc = 2,4, aceita-se H0 , ou seja, a heterocedasticdade não está 
presente 
 
 d) Use a fórmula de White para estimativas de variâncias de mínimos quadrados, 
para achar alguns desvios – padrão alternativos para as estimativas de mínimos 
quadrados obtidas na parte (b). Use esses desvios padrão e os obtidos na parte (b) 
para construir dois intervalos alternativos de 95% de confiança para β2. Que 
podemos dizer de um intervalo de confiança que ignora a heterocedasticidade ? 
 )ˆ(ˆ 11 β×±β dptc = ],;,[,, 058301909003920*1,690912460 −−=±− (e.16) 
 )ˆ(ˆ 22 β×±β dptc = ];[,, 0,08330,063100600*1,690907320 =± (e.17) 
UNIVERSIDADE FEDERAL DO PARANÁ 
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA FLORESTAL 
EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
Heterocedasticidade 
 
48 
 
 Quando se ignora a heterocedasticidade e utiliza-se desvios padrão incorretos, 
tendemos a subestimar a precisão das estimativas; tendemos a obter intervalos de confiança 
menores do que deveriam ser. Ademais, em reconhecendo a heterocedasticidade, estamos 
reconhecendo que nossa informação é menos precisa. 
 Desse modo, o estimador de White para desvios padrão ajuda a superar o problema 
de extração de inferências incorretas das estimativas de mínimos quadrados em presença da 
heterocedasticidade. Todavia, atenção ! , como os quadrados dos resíduos são usados para 
aproximar as variâncias, o estimador de White é estritamente apropriado somente para 
grandes amostras. 
 
 e) Reestime a equação (e.14) sob a hipótese de que var (et) = σ2xt 
 
 Modelo Transformado 
 
Incorreto
White
FRyt
)()(
)()(
0,00440,0289
0,00430,0222
246,900 0,885 0,0693x -0,0929 2t ==+=
 (e.18) 
Relate os resultados. 
 
 Os resultados mostram que o problema foi corrigido e que a transformação permitiu 
inclusive melhorar a precisão das estimativas, pois foi possível obter uma pequena elevação 
no valor de R2 , em virtude da redução do erro aleatório. 
 
Construa um intervalo de 95% de confiança para β2. 
 
 )ˆˆ(ˆˆ 22 β±β dptc = ],;,[,, 076600620000430*1,690906930 =± (e.19) 
 
Faça um comentário sobre sua amplitude em relação à dos intervalos de confiança 
achados em (d) 
 
 Os desvios padrão são suficientemente pequenos e a amplitude neste caso resultou 
em um valor menor do que o obtido no item (d), o que sugere que quando consideramos a 
heterocedasticidade, teremos inevitavelmente estimativas mais precisas pois, melhoramos o 
poder de predição dos estimadores. 
UNIVERSIDADE FEDERAL DO AMAZONAS 
CURSO DE ENGENHARIA FLORESTAL 
TTTOOOPPPIIICCCOOOSSS DDDEEE EEECCCOOONNNOOOMMMEEETTTRRRIIIAAA 
 
64 
 
EQUAÇÕES SIMULTÂNEAS 
 
 
1. EXEMPLO DE ESTIMAÇÃO DE MÍNIMOS QUADRADOS DE DOIS ESTÁGIOS TSLS 
 
 
As trufas são um tipo de cogumelo subterrâneo, são uma delícia gastronômica. Na França são 
localizadas por pessoas que utilizam porcos para farejá-las e indicá-las. Na verdade os porcos farejam 
freneticamente as trufas porque – assim como os franceses – têm um apetite insaciável por elas. 
Consideremos um modelo de oferta e demanda de trufas: 
 
Demanda: dttttt erdpspq ++++= 4321 αααα (1) 
Oferta: stttt epfpq +++= 321 βββ (2) 
 
TABELA 1 – EQUAÇÃO REDUZIDA PARA O PREÇO DE TRUFAS (p) 
LS // Variável dependente p 
Variável Estimativa Desvio 
Padrão 
Valor t Valor p 
const -10,837 2,661 -4,072 0,0004 
ps 0,569 0,117 4,868 0,0000 
rd 0,253 0,057 4,409 0,0002 
pf 0,451 0,100 4,536 0,0001 
 
141312111 ttpftrdtpstp νππππ ++++= 
 
tpftrdtpstp 0,4510,2530,569-10,837ˆ +++= 
 
R2 0,889 p 20,908 Epadrão 2,199 
R2 Adj. 0,876 ps 6,241 F 69,18
9 
 
TABELA 2 – EQUAÇÃO REDUZIDA PARA A QUANTIDADE DE TRUFAS (q) 
LS // Variável dependente q 
Variável Estimativa Desvio 
Padrão 
Valor t Valor p 
const 7,895 3,243 2,434 0,0221 
ps 0,656 0,143 4,605 0,0001 
rd 0,217 0,070 3,094 0,0047

Continue navegando