Buscar

Análise de Regressão com Heterocedasticidade e Autocorrelação


Continue navegando


Prévia do material em texto

FGV – EPGE 
MPFEE - 2006 
Prof. Eduardo Pontual Ribeiro 
Prova II – Respostas sintéticas 
 
 
1) V( β̂ |X)=E[(X´X)-1X´εε´X(X´X)-1|X]= (X´X)-1X´ E[εε´|X] X(X´X)-1. Com 
heterocedasticidade, E[εε´|X]≠σ2In, sendo na verdade E[εε´|X] =Ω, com elementos ωii=σi2 e 
ωij=0, i≠j (forma exata nas notas de aula). Com isto V( β̂ |X)= (X´X)-1X´ΩX(X´X)-1. 
 
2) No modelo de regressão abaixo, 
a) H0: não há heterocedasticidade; Ha: há heterocedasticidade. Teste calculado como 
nR2 da regressão artificial ei2 (resíduo da regressão (A))em função de x e x2 (e 
produtos cruzados). Rejeitamos H0 pelo pequeno p-valor, concluindo que há evidência 
de heterocedasticidade. 
b) H0: não há autocorrelação de ordem 1 ; Ha: há autocorrelação de ordem 1. Teste 
calculado como nR2 da regressão artificial et (resíduo da regressão (A)) em função de 
et-1, e x. Não rejeitamos H0 pelo p-valor maior que 5% ou 10%, concluindo que não há 
evidência de autocorrelação nos erros de 1ª ordem. 
c) As regressões (D) e (E)diferem da regressão (A) em seus desvios padrões. A regressão 
(D) traz uma correção da matriz de var/covar dos coeficientes para 
heterocedasticidade. A regressão (E) traz uma correção da matriz de var/covar dos 
coeficientes para autocorrelação. Os coeficientes estimados são os mesmos. A 
regressão (D) deve ser estudada se rejeitarmos o teste de heterocedasticidade, como é 
o caso. A regressão (E) deve ser estudada se rejeitarmos o teste de autocorrelação, 
como não é o caso aqui. 
3) 
a) Seja um modelo y*=xβ+u, em que y* é uma variável latente referente a “interesse em se 
sindicalizar”. O modelo estudado considera que SINDICALIZADO=1, se y*>c, ou seja, se o 
interesse for grande o bastante, e SINDICALIZADO=1, se y*≤c. Substituindo, temos 
P(SINDICALIZADO)=P(y*>c) = P(xβ+u>c)= P(u>c –xβ) = F(a+xβ), em que a é uma 
constante. Supondo uma distribuição para u, como logística temos o modelo logit. 
b) Pede-se ∂P(sindicalizado|X)/∂esc. No modelo Logit, temos P(sindicalizado|X)=F(z), onde 
z=xβ. Assim, ∂P(sindicalizado|X)/∂esc= (∂F(z)/∂z) (∂z/∂esc)=f(z)βesc. Usando as informações 
do enunciado: ∂P(trabalhar|X)/∂exp= 0,195*0,146321 =0.0285. 
c) Uma medida seria a procentagem de acertos na previsão, em relação às observações: 
(1755+114)/2656=0,7037% 
 
4) 
A explicação é a alta correlação entre as variáveis IDADE e IDADE2 (multicolinearidade). A 
alta correlação cria dificuldades do modelo identificar o efeito ceteris paribus de uma 
variável. Assim, a estatística t não permite rejeitar a hipótese nula de insignificância de cada 
coeficiente das variáveis em questão. Mas conjuntamente as variáveis são significativas.