Buscar

prova 3 RESOLUÇÕES

Prévia do material em texto

IEUFU41041- INTORUDÇÃO À ESTATÍSTICA ECONÔMICA -PROVA 3 – 25/07/2017 
 
QUESTÃO 1 - Para verificar se existe discriminação no mercado de empréstimos hipotecários nos Estados 
Unidos, um modelo de probabilidade linear pode ser usado: 
𝑎𝑝𝑟𝑜𝑣𝑎𝑑𝑜 = 𝛽0 + 𝛽1𝑏𝑟𝑎𝑛𝑐𝑜 + 𝑜𝑢𝑡𝑟𝑜𝑠 𝑓𝑎𝑡𝑜𝑟𝑒𝑠 (1) 
A variável binária a ser explicada é aprovado, que será igual a um se um empréstimo hipotecário a um 
indivíduo foi aprovado. A variável explicativa importante é branco, uma variável dummy igual a um se o 
pretendente for branco. Os outros pretendentes no conjunto de dados são negros e hispânicos. 
(i) Se houver discriminação contra as minorias, e os fatores apropriados tiverem sido controlados, 
qual será o sinal de 𝛽1? 
Se houver discriminação contra minorias o fato de ser branco deve aumentar a probabilidade de 
aprovação de crédito, tudo o mais constate. Assim, b1>0. 
Utilizando-se os dados contidos no arquivo LOANAPP, foi estimada a regressão simples (1) e os resultados 
são reportados abaixo: 
 
(ii) (1 ponto) Interprete o coeficiente de branco. Ele é estatisticamente significante? É grande, do 
ponto de vista prático? 
O coeficiente 0,20 associado à variável branco significa que o fato da pessoa ser branca aumenta 
em média 20% a chance de ter um crédito hipotecário aprovado, vis a vis a uma pessoa não 
branca. Esta diferença é bastante importante do ponto de vista prático, além de se mostrar muito 
significante estatisticamente (razão t muito elevada e em torno de 10: rejeita-se a hipótese nula 
de não significância da variável a menos de 1% de nível de significância). 
Como controles, foram incluídas as variáveis: renda (renda do solicitante em U$ 1.000), outras (outras 
obrigações do solicitante como % da renda total), montante (montante de empréstimo em U$ 1.000), 
anos (anos de trabalho no emprego atual), masculino (dummy =1 se pessoa do sexo masculino), casado 
(dummy=1 se pessoa casada), dep (número de dependentes), avaliação (valor avaliado do imóvel) , 
meses (tempo de em meses do empréstimo), créditos (número de registros de créditos), atraso0 
(nenhum mês sem pagar hipoteca), atraso1ou2 (1 u 2 meses sem pagar hipoteca), astraso3mais (3 ou 
mais meses sem pagar hipoteca) e um termo de interação entre “outras” e “branco” (outrasbr) . Os 
resultados da estimação deste modelo mais completo são logo mais abaixo. Responda: 
(iii) (1 ponto) No modelo de regressão múltipla, o que acontece com o coeficiente de branco? Ainda 
existe evidência de discriminação contra os não-brancos? Comente. 
 
Quando são adicionadas as outras variáveis explicativas como controles, obtém-se uma 
estimativa para B1≈-0,163. Ou seja, há uma inversão de sinal deste parâmetro, mas ele não mede 
mais sozinho o efeito da raça. Esta mudança se deve ao fato de que agora se está controlando a 
regressão por outros fatores que devem afetar as taxas de aprovação de empréstimos, e alguns 
deles claramente se diferenciam por raça (Em média, pessoas brancas possuem características 
financeiras – tais como rendas mais altas e históricos de crédito mais fortes – que as tornam 
pessoas com menores riscos de empréstimos), além de ter sido incluída uma interação de 
 
 _cons .7077922 .0182393 38.81 0.000 .6720221 .7435623
 branco .2005957 .01984 10.11 0.000 .1616864 .239505
 
 aprovado Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 214.067371 1988 .107679764 Root MSE = .3201
 Adj R-squared = 0.0485
 Residual 203.59303 1987 .102462521 R-squared = 0.0489
 Model 10.4743407 1 10.4743407 Prob > F = 0.0000
 F( 1, 1987) = 102.23
 Source SS df MS Number of obs = 1989
. reg aprovado branco
brancos*outras. O B1 perde um pouco da significância estatística neste caso, mas ainda é 
estatisticamente significante a 5.1% de nível de significância num teste bilateral (estatística t ≈ -
1,95 com P-valor=0,051). Contudo o efeito raça no modelo de regressão múltipla não é mais 
captado apenas por B1, pois agora existe também a interação entre outras*branco. O B1 mede o 
impacto da raça quando a proporção de outras obrigações como % da renda é zero (e na amostra 
há apenas 1 indivíduo com zero de obrigações como % da renda). Portanto, B1 neste modelo 
deixa de ter uma interpretação econômica relevante. O efeito marginal da raça agora irá 
depender também do percentual de outras obrigações como percentual da renda: 
∆𝑎𝑝𝑟𝑜𝑣𝑎𝑑𝑜
∆𝑏𝑟𝑎𝑛𝑐𝑜
= −0.1629 + 0.01 ∗ 𝑜𝑢𝑡𝑟𝑎𝑠 
Tomando-se o valor médio de “outras” na amostra = 32.38%, o fato de ser branco tem um efeito 
sobre a chance de ter crédito aprovado da ordem de −0.1629 + 0.01 ∗ 32.38 = 0.1638 =
16.38%. Ou seja, ainda se observa um efeito discriminação importante contra os não-brancos da 
ordem de 16%. 
 
(iv) (2 pontos) O termo de interação é estatisticamente significante? Qual o efeito marginal da 
variável “outras”? Interprete o significado da interação outrasbr. 
A interação outrasbr é significante (t=4.20 e P-valor < 0,1%). O efeito marginal da variável outras 
é: 
 
∆𝑎𝑝𝑟𝑜𝑣𝑎𝑑𝑜
∆𝑜𝑢𝑡𝑟𝑎𝑠
= −0.015 + 0.01 ∗ 𝑏𝑟𝑎𝑛𝑐𝑜 
Ou seja: Para cada ponto percentual a mais de obrigações que o indivíduo tiver como percentual 
(%) da renda total, diminui em 1.5% as chances de se ter um crédito aprovado, tudo o mais 
constante, se a pessoa não for branca. Porém, este custo é reduzido para (-0.015+0.01) = 0.005= 
- 0.5% caso a pessoa seja branca. Ou seja, o custo marginal de se estar endividado em termos de 
chances de ter um crédito aprovado é menor para brancos do que para não brancos. 
 
 
(v) (2 pontos) Foi rodado novamente o modelo de regressão múltipla, mas agora sem as variáveis 
montante, anos, masculino, dep e créditos. O R-quadrado deste novo modelo com as restrições 
foi 0.1065. Com base num teste F de restrição de exclusão a 5% de significância, responda: essas 
variáveis podem ser excluídas do modelo proposto em (iii)? Considere que o F-crítico de 
referência neste caso é 2,21. 
Hipótese nula para o teste de restrição de exclusão: 
H0: b4=0, b5=0, b6=0, b8=0, b11=0. 
Cálculo da estatística F-teste: F=[(0.1093-0.1065)/5]/[(1-0.1093)/1947] ≈ 1,224. 
Como F-teste < F-crítico (1,224 < 2,21), não se pode rejeitar a hipótese nula a 5% de nível de 
significância. Portanto, as variáveis não são conjuntamente significantes e podem ser excluídas 
do modelo. 
 
 _cons 1.267766 .0821513 15.43 0.000 1.106652 1.42888
 outrasbr .00999 .0023793 4.20 0.000 .0053238 .0146562
 atraso3mais -.1830533 .0699234 -2.62 0.009 -.3201859 -.0459206
 atraso1ou2 -.1321721 .0524978 -2.52 0.012 -.2351298 -.0292144
 atraso0 -.0461941 .0159091 -2.90 0.004 -.0773949 -.0149934
 créditos .0021636 .0072018 0.30 0.764 -.0119604 .0162877
 meses -6.37e-07 1.57e-07 -4.05 0.000 -9.45e-07 -3.29e-07
 avaliação .0001528 .0000641 2.38 0.017 .000027 .0002786
 dep -.0101484 .0069708 -1.46 0.146 -.0238194 .0035226
 casado .04213 .0170059 2.48 0.013 .0087783 .0754818
 masculino -.0170399 .0194538 -0.88 0.381 -.0551923 .0211126
 anos -.0059294 .0064324 -0.92 0.357-.0185445 .0066858
 montante -.000067 .0001297 -0.52 0.606 -.0003214 .0001875
 outras -.0150549 .0021966 -6.85 0.000 -.0193629 -.010747
 renda -.0003536 .0000934 -3.78 0.000 -.0005369 -.0001704
 branco -.1628421 .083519 -1.95 0.051 -.3266381 .000954
 
 aprovado Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 213.670912 1962 .108904644 Root MSE = .31264
 Adj R-squared = 0.1025
 Residual 190.308482 1947 .097744469 R-squared = 0.1093
 Model 23.3624302 15 1.55749535 Prob > F = 0.0000
 F( 15, 1947) = 15.93
 Source SS df MS Number of obs = 1963
> atraso1ou2 atraso3mais outrasbr
. reg aprovado branco renda outras montante anos masculino casado dep avaliação meses créditos atraso0 
Para testar se o modelo de regressão múltipla proposto é homocedástico, a versão modificada do teste de 
White foi executada: foram obtidos os resíduos 𝑢�̂�e os valores preditos 𝑦�̂� da regressão mais completa 
reportada acima e rodou-se a seguinte equação: 𝑢�̂�
2 = 𝛼0 + 𝛼1𝑦�̂� + 𝛼2𝑦�̂�
2 + 𝑒𝑟𝑟𝑜. Os resultados desta 
estimação foram os seguintes: 
 
(vi) (2 pontos) Com base nestes resultados, o que se pode concluir sobre a validade da hipótese 
RLM.5 de homocedasticidade? Justifique sua resposta! 
Uma forma de se testar se o modelo é homocedástico é realizar o teste F de significância geral da 
regressão dos resíduos quadrados pelos valores preditos e o quadrado dos valores preditos 
reportada acima (teste de White). A hipótese nula neste caso é: 
H0: 𝛼1 = 0, 𝛼2 = 0 (O modelo é homocedástico, pois a variância do erro não depende dos valores 
das variáveis explicativas e nem do quadrado e do produto cruzado delas) 
H1: H0 é falsa (modelo heterocedástico). 
O valor da estatística F reportada neste caso é 50.48, com P-valor associado=0.0000. Portanto, 
rejeita-se a hipótese nula e conclui-se que o modelo apresenta HETEROCEDASTICIDADE. 
QUESTÃO 2 (2 pontos) - Assinale verdadeiro ou falso para as afirmativas abaixo e Justifique em qualquer 
um dos casos: 
1 – Sob heterocedasticidade os estimadores de MQO deixam de ser não viesados. Falsa. Para 
serem não viesados só são necessárias as 4 primeiras hipóteses de MQO. 
2 - Sob heterocedasticidade os teste T e F continuam válidos, desde que em grandes amostras. 
Falsa. Neste caso é preciso calcular erros padrão robustos à heterocedasticidade para se fazer testes de hipóteses sobre os verdadeiros parâmetros do modelo. 
3 – É possível se estimar erros padrão dos estimadores MQO robustos à heterocedasticidade, 
desde que em grande amostras. Verdadeira. Os erros padrão robustos permitem que se façasm 
testes T e intervalos de confiança confiáveis mesmo sob heterocedasticidade. 
4 – Em grandes amostras MQO é consistente e com distribuição aproximadamente normal desde 
que as hipóteses RLM1-RLM5 se observem. Verdadeira. Neste caso, a hipótese 6 de normalidade 
dos erros pode ser relaxada em grandes amostras. 
 
Fórmula Teste F restrições de exclusão: 
 
 
 _cons .4352412 .1108166 3.93 0.000 .2179104 .6525719
 yhat2 -.0906152 .1760158 -0.51 0.607 -.435813 .2545827
 yhat -.3057285 .2784274 -1.10 0.272 -.8517733 .2403163
 
 resid2 Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 95.6433357 1962 .048747878 Root MSE = .21542
 Adj R-squared = 0.0480
 Residual 90.9584563 1960 .046407376 R-squared = 0.0490
 Model 4.68487931 2 2.34243966 Prob > F = 0.0000
 F( 2, 1960) = 50.48
 Source SS df MS Number of obs = 1963
. reg resid2 yhat yhat2
 
  )1/(1
/
2
22



knR
qRR
F
irir
rir

Continue navegando