Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Econometria I (IS 211) Modelo de Regressão Múltipla: Problemas Adicionais Lucas Siqueira de Castro lucascastro@ufrrj.br Referência WOOLDRIDGE, J. Introdução à econometria: uma abordagem moderna. São Paulo: Cengage Learning, 6a edição, 2017, capítulo 6. Mudança de Escala Mudança de escala da variável y Provoca mudança na escala de todos os coeficientes estimados Exemplo Se a variável dependente é multiplicada por um número c, todos os coeficientes e os seu erros-padrão são multiplicados também por c As estatísticas t e F ficam inalteradas 2 Exemplo Exemplo Mudança de Escala Mudança de escala de uma variável explicativa x Se xj for multiplicado por um número c, seus coeficientes e os respectivos erros-padrão são divididos por c. As estatísticas t e F não se alteram 3 Exemplo Quiz 1 Na equação original sobre pesos dos recém-nascidos, suponha que faminc seja medida em dólares em vez de milhares de dólares. Desse modo, defina a variável fincdol=1000*faminc Como mudam os resultados MQO quando fincdol substitui faminc? Mudança de Escala e Logaritmo 4 Mudança de Escala e Logaritmo Forma Funcional MQO Uso de relações não-lineares entre y e x por adotar funções não lineares de y e x Mas permanece a linearidade dos parâmetros Exemplos de funções não lineares de y e x log(y) ou log(x) Formas quadráticas de x Interações de variáveis x Interpretação de Modelos com Log Modelo log-log ln(y) = b0 + b1ln(x) + u Interpretação b1 é a elasticidade constante de y com respeito a x Um aumento de Dx% em x provoca um aumento de b1Dx% em y 5 Interpretação de Modelos com Log Modelo log-nível ln(y) = b0 + b1x + u Interpretação b1 é a mudança percentual em y dada uma mudança de 1 unidade em x b1 é chamado de semielasticidade Um aumento de Dx provoca um aumento aproximado de (100.b1)Dx em y Um aumento de Dx provoca um aumento exato de 100[exp(b1Dx)-1] em y Exemplo Elasticidade constante Semielasticidade Exemplo Interpretação Um aumento de 1% em oxn faz cair o preço em 0,718% Elasticidade constante Quando comods aumenta em 1, o preço aumenta em aproximadamente 100*(0,306)=30,6% ou exatamente 100*[exp(0,306*1)-1]=35,8% Neste exemplo, Dx=Dcomods=1 O ajuste não é tão crucial para pequenas mudanças percentuais Semielasticidade do preço em relação a comods 6 Por Que Usar Modelos com Logs? Modelos em log são invariantes à escala das variáveis uma vez que medem variações percentuais Para y>0: Distribuição condicional de y heterocedástica ou com cauda Distribuição condicional de log(y) Menos heterocedástica Menos cauda Às vezes, elimina a heterocedasticidade e a cauda ao mesmo tempo Por Que Usar Modelos com Logs? Uso de log estreita a amplitude dos valores das variáveis Estimativas menos sensíveis a observações extremas (outliers) na variável dependente e nas variáveis independentes Indução de normalidade do termo de erro Que Variáveis são Transformadas em Log? Quando a variável é um valor monetário positivo, costuma-se transformar em log Salários, vendas no comércio, valor de mercado das empresas Mas isso não é regra! Variáveis com valores muito grandes População Número de empregados 7 Que Variáveis Costumam Não Ser Transformadas em Log? Variáveis com especificação em nível Variáveis medidas em anos Escolaridade Experiência Idade Variáveis que são proporção ou porcentagem Taxa de desemprego Taxa de estudantes aprovados Que Variáveis São Transformadas em Log? Pode ser variáveis que são proporção ou porcentagem Mas cuidado com a interpretação! Variação em pontos percentuais versus Variação percentual desemp é variável de taxa de desemprego Quando desemp passa de 8 para 9, aumentou 1 pp Equivalente a 12,5% sobre o nível de desemprego original (1/8) Quando se usa log(desemp), se quer saber a variação percentual na taxa de desemprego: log(9) – log(8) ≈ 0,118 ou 11,8% Problema de se Aplicar Log Não existe log de valores negativos ou zero Quando a variável y assume alguns valores nulos, o que fazer? Solução Aplicar log(1 + y) Interpretação ainda de elasticidade constante 8 Modelos Quadráticos Modelo y = b0 + b1x + b2x2 + u b1 não pode ser interpretado como a única medida da influência de x sobre y b2 também mede uma parte da influência de x sobre y Modelos Quadráticos Efeito sobre y Ou xxy DD 21 ˆ2ˆˆ bb x x y 21 ˆ2ˆ ˆ bb D D Modelos Quadráticos Suponha que o coeficiente de x (b1>0) seja positivo e o coeficiente de x2 seja negativo (b2<0) y cresce primeiro chega a um máximo e depois decresce em relação a x O ponto de máximo é: 21* ˆ2ˆ bbx 9 Modelos Quadráticos Suponha que o coeficiente de x (b1<0) seja negativo e o coeficiente de x2 seja positivo (b2>0) y decresce primeiro chega a um mínimo e depois cresce em relação a x O ponto de mínimo é: Note que o ponto de mínimo e o ponto de máximo são os mesmos x* 21* ˆ2ˆ bbx Exemplo Exemplo Interpretação exper tem efeito de redução sobre salárioh O primeiro ano de experiência vale: US$0,298 por hora O segundo ano vale menos: US$0,298 – 2(0,0061)(1)~0,286 Aumentando de 10 para 11: US$0,298 - 2(0,0061)(10)~0,176 10 Exemplo Termos de Interação Modelo y = b0 + b1x1 + b2x2 + b3x1x2 + u Medição do efeito de x1 sobre y papel de b1 papel de b3 Fórmula: Qual x2? x2 médio: 231 1 x x y bb D D 2x 11 Modelo Hedônico Exemplo Exemplo 12 Ainda o R-quadrado Indicador de quanto da variação de y é explicada por x1, x2,..., xj Não é importante para se considerar se o estimador é justo (não-viesado) Superestimação de sua importância Ainda o R-quadrado R2 alto s2u baixo O estimador pode ser viesado ou não Isso depende da hipótese de média condicional zero R2 baixo s2u alto Vários fatores não foram levados em conta no lado direito da regressão R-Quadrado Ajustado R2 sempre aumenta à medida que se inserem variáveis no lado direito do modelo de regressão R2 ajustado leva em conta o número de variáveis no modelo Ou 1 112 nSQT knSQRR 1 ˆ 1 2 2 nSQT R s 13 R-Quadrado Ajustado R2 ajustado como medida de ajuste da regressão Imposição de uma penalidade à inclusão de variáveis independentes adicionais Comparação entre dois modelos que tenham a mesma var. dependente Não se usa para comparar modelos com variáveis dependentes diferentes Exemplo: um modelo com y e o outro com log(y) R-Quadrado Ajustado R2 ajustado em função do R2: Exemplo R2=0,30; n=51 e k=10 )1( )1)(1(1 2 2 kn nRR 125,0 40 )50(70,012 R R-Quadrado Ajustado R-quadrado ajustado pode ser negativo!!! Exemplo R2=0,10, n=51, k=10 R-quadrado ajustado negativo indica ajuste ruim da regressão aos dados 125,0 40 )50(90,012 R 14 Ajuste da Regressão Não se deve supervalorizar o R2 ou R2 ajustado Olhar a teoria e o bom senso A não inclusão de uma variável que influencie y no modelo não invalida o efeito ceteris paribus dos coeficiente das outras variáveis A não ser que haja omissão de variável relevante Adição de Regressores na Regressão 1º caso: Inclusão de regressores que afetam y e estão correlacionados comoutros regressores Redução da variância do erro Multicolinearidade Efeito sobre o erro-padrão indefinido 𝑒𝑝 𝛽መ = 𝜎ො 𝑆𝑄𝑇 1 − 𝑅ଶ Adição de Regressores na Regressão 2º caso: Inclusão de regressores que afetam y e não estão correlacionados com outros regressores Redução da variância do erro Menor erro-padrão das estimativas Maior eficiência Maior precisão 15 Intervalos de Confiança de Previsões Considere a equação estimada 𝑦ො = 𝛽መ +𝛽መଵ𝑥ଵ + 𝛽መଶ𝑥ଶ + ⋯+ 𝛽መ𝑥 Quando se inserem valores específicos das variáveis explicativas nesta equação, obtém-se uma previsão para a variável dependente y Intervalos de Confiança de Previsões Sejam c1, c2,..., ck valores particulares de cada uma das variáveis explicativas 𝐸 𝑦 𝑥ଵ = 𝑐ଵ, 𝑥ଶ = 𝑐ଶ, … , 𝑥 = 𝑐 Em outros termos: 𝜃 = 𝛽መ +𝛽መଵ𝑐ଵ + 𝛽መଶ𝑐ଶ + ⋯+ 𝛽መ𝑐 𝜃: valor previsto de y Intervalos de Confiança de Previsões Como construir um intervalo de confiança de 𝜃? Ou seja, construir um indicador de incerteza nesse valor previsto de y Para construir um IC de 95% de confiança para 𝜃, é preciso um erro-padrão de 𝜃: 𝜃 ± 2 ȉ 𝑒𝑝 𝜃 Note que esse IC é aproximado! Válido para tamanho de amostra (n) grande 16 Intervalos de Confiança de Previsões Vamos usar um truque para obter o desconhecido 𝑒𝑝 𝜃 Escreva: 𝛽 = 𝜃 − 𝛽ଵ𝑐ଵ − 𝛽ଶ𝑐ଶ − ⋯− 𝛽𝑐 E junte isso à equação: 𝑦 = 𝛽 + 𝛽ଵ𝑥ଵ + 𝛽ଶ𝑥ଶ + ⋯+ 𝛽𝑥 + 𝑢 Obtendo: 𝑦 = 𝜃 + 𝛽ଵ 𝑥ଵ − 𝑐ଵ + 𝛽ଶ 𝑥ଶ − 𝑐ଶ + ⋯+ 𝛽 𝑥 − 𝑐 + 𝑢 Intervalos de Confiança de Previsões De modo prático, subtrai-se o valor cj de cada observação de xj, e depois computa-se a seguinte regressão: Rodar yi contra uma constante, (xi1- c1),..., (xik - ck) para i=1,2,...,n O valor previsto de y e seu erro-padrão são obtidos da constante desta regressão Análise de Resíduos Resíduos: Informação útil pode ser obtida, observando-se os resíduos Exemplo: modelo de preços hedônicos Regressão dos preços das residências contra um conjunto de características dessas residências Resíduos negativos indicam boas oportunidades de compra Resíduos positivos indicam maus negócios iii yyu ˆˆ 17 Quiz 2 Como você usaria a análise de resíduo para determinar quais jogadores de futebol estão sendo pagos demais ou estão sendo mal pagos com relação aos seus desempenhos? Resíduo de Solow Seja o modelo de Solow: 𝑦 = 𝐴𝐾ఉభ𝐿ఉమ𝑒௨ Linearizando (aplicando ln): 𝑙𝑛𝑦 = 𝑙𝑛𝐴 +𝛽ଵ 𝐾 +𝛽ଶ 𝐿 + 𝑢 𝑢ො: “resíduo de Solow” Medida de produtividade total de fatores (PTF) Erro de Medida Infantil…
Compartilhar