Prévia do material em texto
FGV – EPGE MPFEE - 2006 Prof. Eduardo Pontual Ribeiro Prova II – Respostas sintéticas 1) V( β̂ |X)=E[(X´X)-1X´εε´X(X´X)-1|X]= (X´X)-1X´ E[εε´|X] X(X´X)-1. Com heterocedasticidade, E[εε´|X]≠σ2In, sendo na verdade E[εε´|X] =Ω, com elementos ωii=σi2 e ωij=0, i≠j (forma exata nas notas de aula). Com isto V( β̂ |X)= (X´X)-1X´ΩX(X´X)-1. 2) No modelo de regressão abaixo, a) H0: não há heterocedasticidade; Ha: há heterocedasticidade. Teste calculado como nR2 da regressão artificial ei2 (resíduo da regressão (A))em função de x e x2 (e produtos cruzados). Rejeitamos H0 pelo pequeno p-valor, concluindo que há evidência de heterocedasticidade. b) H0: não há autocorrelação de ordem 1 ; Ha: há autocorrelação de ordem 1. Teste calculado como nR2 da regressão artificial et (resíduo da regressão (A)) em função de et-1, e x. Não rejeitamos H0 pelo p-valor maior que 5% ou 10%, concluindo que não há evidência de autocorrelação nos erros de 1ª ordem. c) As regressões (D) e (E)diferem da regressão (A) em seus desvios padrões. A regressão (D) traz uma correção da matriz de var/covar dos coeficientes para heterocedasticidade. A regressão (E) traz uma correção da matriz de var/covar dos coeficientes para autocorrelação. Os coeficientes estimados são os mesmos. A regressão (D) deve ser estudada se rejeitarmos o teste de heterocedasticidade, como é o caso. A regressão (E) deve ser estudada se rejeitarmos o teste de autocorrelação, como não é o caso aqui. 3) a) Seja um modelo y*=xβ+u, em que y* é uma variável latente referente a “interesse em se sindicalizar”. O modelo estudado considera que SINDICALIZADO=1, se y*>c, ou seja, se o interesse for grande o bastante, e SINDICALIZADO=1, se y*≤c. Substituindo, temos P(SINDICALIZADO)=P(y*>c) = P(xβ+u>c)= P(u>c –xβ) = F(a+xβ), em que a é uma constante. Supondo uma distribuição para u, como logística temos o modelo logit. b) Pede-se ∂P(sindicalizado|X)/∂esc. No modelo Logit, temos P(sindicalizado|X)=F(z), onde z=xβ. Assim, ∂P(sindicalizado|X)/∂esc= (∂F(z)/∂z) (∂z/∂esc)=f(z)βesc. Usando as informações do enunciado: ∂P(trabalhar|X)/∂exp= 0,195*0,146321 =0.0285. c) Uma medida seria a procentagem de acertos na previsão, em relação às observações: (1755+114)/2656=0,7037% 4) A explicação é a alta correlação entre as variáveis IDADE e IDADE2 (multicolinearidade). A alta correlação cria dificuldades do modelo identificar o efeito ceteris paribus de uma variável. Assim, a estatística t não permite rejeitar a hipótese nula de insignificância de cada coeficiente das variáveis em questão. Mas conjuntamente as variáveis são significativas.