Baixe o app para aproveitar ainda mais
Prévia do material em texto
ECONOMETRIA Prof. Patricia Maria Bortolon, D. Sc. Cap. 6 – Extensões do Modelo de Regressão Linear de Duas Variáveis Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição. Rio de Janeiro. Elsevier- Campus, 2006 A regressão que passa pela origem 𝑌𝑖 = 𝛽2𝑋𝑖 + 𝑢𝑖 • Exemplo: modelo de formação de preços de ativos da moderna teoria de portfólio (CAPM), na sua forma de prêmio de risco 𝐸𝑅𝑖 − 𝑟𝑓 = 𝛽𝑖(𝐸𝑅𝑚 − 𝑟𝑓) • Para fins empíricos é muitas vezes expressa como: 𝑅𝑖 − 𝑟𝑓 = 𝛽𝑖(𝑅𝑚 − 𝑟𝑓) + 𝑢𝑖 • ou 𝑅𝑖 − 𝑟𝑓 = 𝛼𝑖 − 𝛽𝑖(𝑅𝑚 − 𝑟𝑓) + 𝑢𝑖 Variável dependente Variável independente A regressão que passa pela origem • 𝛽𝑖 é estimado a partir da linha característica: 𝑅𝑖𝑡 = 𝛼𝑖 + 𝛽𝑖𝑟𝑚𝑡 + 𝑢𝑖 Então a teoria explicita que no modelo: 𝑅𝑖 − 𝑟𝑓 = 𝛼𝑖 − 𝛽𝑖(𝑅𝑚 − 𝑟𝑓) + 𝑢𝑖 𝛼𝑖 seja igual a zero. A regressão que passa pela origem • Aplicando MQO à FRA: 𝑌𝑖 = 𝛽2𝑋𝑖 + 𝑢𝑖 • Encontramos: 𝛽2 = 𝑋𝑖𝑌𝑖 𝑋𝑖 2 𝑣𝑎𝑟 𝛽2 = 𝜎2 𝑋𝑖 2 𝜎2 = 𝑢𝑖 2 𝑛 − 1 A regressão que passa pela origem • ... que comparadas às obtidas com o termo de intercepto: 𝛽2 = 𝑥𝑖𝑦𝑖 𝑥𝑖 2 𝑣𝑎𝑟 𝛽2 = 𝜎2 𝑥𝑖 2 𝜎 2 = 𝑢𝑖 2 𝑛 − 2 • Observamos as seguintes diferenças: – Lidamos com variáveis brutas e não as ajustadas à média – Graus de liberdade para cálculo de 𝜎2 = n − 1 – 𝑢𝑖 ≠ 0, consequentemente, a média das previsões será diferente da média das observações 𝑌𝑖 = 𝑌𝑖 + 𝑢𝑖 𝑌 = 𝑌 + 𝑢 𝑌 ≠ 𝑌 A regressão que passa pela origem • Observamos as seguintes diferenças: – O r2 pode ser negativo. O r2 convencional pode não ser adequado a esses modelos. Pode-se calcular, entretanto, o r2 bruto que também atende a relação 0 < r2 < 1, mas não deve ser comparado ao r2 convencional. 𝑟𝑏𝑟𝑢𝑡𝑜 2 = 𝑋𝑖𝑌𝑖 2 𝑋𝑖 2 𝑌𝑖 2 – Regressões pela origem só devem ser usadas se houver indicação teórica forte “a priori” – Melhor estimar com intercepto, e se ele for não significativo estimar sem ele – Além disso, omiti-lo desnecessariamente seria um “erro de especificação” violando a Premissa 9 do MLRC Escalas e unidades de medida • FRA: 𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖 • Seja: 𝑌𝑖 ∗ = 𝑤1𝑌𝑖 𝑋𝑖 ∗ = 𝑤2𝑋𝑖 𝑌𝑖 ∗ = 𝛽1 ∗ + 𝛽2 ∗𝑋𝑖 ∗ + 𝑢𝑖 ∗ • As relações entre as estimativas são: 𝛽2 ∗ = 𝑤1 𝑤2 𝛽2 𝑣𝑎𝑟 𝛽2 ∗ = 𝑤1 𝑤2 2 𝑣𝑎𝑟 𝛽2 𝛽1 ∗ = 𝑤1 𝛽1 𝑣𝑎𝑟 𝛽1 ∗ = 𝑤1 2𝑣𝑎𝑟 𝛽1 𝜎∗ 2 = 𝑤1 2 𝜎2 𝑟𝑥𝑦 2 = 𝑟𝑥∗𝑦∗ 2 Ver exemplos numéricos pag.139 e observação no topo da pag. 140 Regressão com variáveis padronizadas • 𝑌𝑖 ∗ = 𝑌𝑖− 𝑌 𝑆𝑌 𝑋𝑖 ∗ = 𝑋𝑖− 𝑋 𝑆𝑋 • Média de 𝑋𝑖 ∗ e 𝑌𝑖 ∗ é sempre 0 e desvio padrão sempre 1 • Uma regressão com variáveis dependentes e independentes padronizadas terá sempre intercepto igual a zero 𝑌𝑖 ∗ = 𝛽1 ∗ + 𝛽2 ∗𝑋𝑖 ∗ + 𝑢𝑖 ∗ = 𝛽2 ∗𝑋𝑖 ∗ + 𝑢𝑖 ∗ Pois 𝛽1 ∗ = 𝑌 − 𝛽2 ∗ 𝑋 Regressão com variáveis padronizadas • Interpretação de β: – Para cada aumento de 1 desvio padrão da variável independente a variável dependente aumenta 𝛽2 ∗ desvios padrão. • Qual a vantagem? – Em modelos com mais do que um regressor podemos avaliar seus efeitos em uma mesma base. Os coeficientes passam a medir a força relativa dos vários regressores. – Se um coeficiente padronizado for maior do que o outro regressor no mesmo modelo, então ele contribui mais para a explicação do regressando do que o segundo. Modelos log-log (ou log-linear) • Imagine o seguinte modelo de regressão exponencial: 𝑌𝑖 = 𝛽1𝑋𝑖 𝛽2 + 𝑒𝑢𝑖 • Que também pode ser expresso como: 𝑙𝑛𝑌𝑖 = 𝑙𝑛𝛽1 + 𝛽2𝑙𝑛𝑋𝑖 + 𝑢𝑖 • Estimando por MQO o modelo: 𝑌𝑖 ∗ = 𝛼 + 𝛽2 𝑋𝑖 ∗ + 𝑢𝑖 • Teremos: – 𝛽2 mede a elasticidade de Y em relação a X – 𝛽2 mede a variação percentual em Y para dada variação percentual (pequena) em X – Uma dica para verificar se esse é um bom caminho é fazer o diagrama de dispersão lnY x lnX, e ver se há sinais de relação linear Modelos log-log (ou log-linear) Porque mede a elasticidade: 𝑙𝑛𝑌 = 𝛼 + 𝛽𝑙𝑛𝑋 Derivando em relação a X cada um dos lados: 𝑑(𝑙𝑛𝑌) 𝑑𝑥 = 1 𝑌 𝑑𝑦 𝑑𝑥 𝑑(𝛼 + 𝛽𝑙𝑛𝑋) 𝑑𝑥 = 𝛽 1 𝑋 Igualando: 1 𝑌 𝑑𝑦 𝑑𝑥 = 𝛽 1 𝑋 𝛽 = 𝑋 𝑌 𝑑𝑦 𝑑𝑥 = 𝑑𝑦 𝑌 𝑑𝑥 𝑋 Modelos Semilogarítmicos Modelos log-lin • Ex: se quisermos avaliar a taxa de crescimento de uma variável 𝑌𝑡 = 𝑌0 1 + 𝑟 𝑡 onde r = taxa de crescimento composta ou geométrica 𝑙𝑛𝑌𝑡 = 𝑙𝑛𝑌0 + 𝑡. 𝑙𝑛(1 + 𝑟) 𝑙𝑛𝑌𝑡 = 𝛽1 + 𝛽2𝑡 é o modelo de taxa de crescimento 𝛽1 𝛽2 t é a variável X: 1, 2, 3, ... Modelos Semilogarítmicos Modelos log-lin 𝛽2 = ln 1 + 𝑟 ln 1 + 𝑟 = 𝛽2 • 𝛽2 dá a taxa de crescimento instantânea (em um ponto no tempo) • Para obter a taxa composta (ao longo de um período) 1 + 𝑟 = 𝑒𝛽2 𝑟 = 𝑒𝛽2 − 1 Modelos Semilogarítmicos • Se ao invés de log Y, faz-se a regressão com Y temos um modelo de tendência linear 𝑌𝑡 = 𝛽1 + 𝛽2𝑡 + 𝑢𝑡 • Expressará uma variação absoluta e não relativa (no período) Modelos Semilogarítmicos Modelos log-lin 𝑙𝑛𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖 𝑑𝑦 𝑑𝑥 𝑙𝑛𝑌𝑖 = 𝑑𝑦 𝑑𝑥 𝛽1 + 𝑑𝑦 𝑑𝑥 𝛽2𝑋𝑖 + 𝑑𝑦 𝑑𝑥 𝑢𝑖 𝑑𝑦 𝑑𝑥 1 𝑌 = 𝛽2 𝛽2 = 𝑑𝑦 𝑌 𝑑𝑥 𝛽2 = ∆𝑌 𝑌 ∆𝑋 = 𝑣𝑎𝑟𝑖𝑎çã𝑜 % 𝑒𝑚 𝑌 𝑣𝑎𝑟𝑖𝑎çã𝑜 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑒𝑚 𝑋 • Taxa de crescimento de Y • Semi-elasticidade de Y Modelos Semilogarítmicos Modelos lin-log Para conhecer a variação absoluta de Y dada uma variação percentual de X 𝑌𝑖 = 𝛽1 + 𝛽2𝑙𝑛𝑋𝑖 + 𝑢𝑖 𝑑𝑦 𝑑𝑥 𝑌𝑖 = 𝑑𝑦 𝑑𝑥 𝛽1 + 𝑑𝑦 𝑑𝑥 𝛽2𝑙𝑛𝑋𝑖 + 𝑑𝑦 𝑑𝑥 𝑢𝑖 𝑑𝑦 𝑑𝑥 = 𝛽2 1 𝑋 𝛽2 = 𝑋𝑑𝑦 𝑑𝑥 = 𝑑𝑦 𝑑𝑥 𝑋 𝛽2 = ∆𝑌 ∆𝑋 𝑋 = 𝑣𝑎𝑟𝑖𝑎çã𝑜 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑒𝑚 𝑌 𝑣𝑎𝑟𝑖𝑎çã𝑜 % 𝑒𝑚 𝑋 ∆𝑌 = 𝛽2 ∆𝑋 𝑋 Modelos Semilogarítmicos Modelos lin-log ∆𝑌 = 𝛽2 ∆𝑋 𝑋 • Assim, para interpretar o efeito de X em Y num modelo lin- log, é preciso multiplicar 𝛽2 pela variação relativa de X, em geral = 1% ou 0,01, ou divide-se 𝛽2 por 100. Por que usar logaritmos? • log são invariantes à escala de variáveis, pois medem variações percentuais • Fornecem estimativa direta da elasticidade • Em modelos com Y>0, a distribuição condicional é geralmente heterocedástica e assimétrica => ln (Y) atenua essas características • A distribuição de ln (Y) reduz os efeitos dos outliers
Compartilhar