Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Aula 6 - ECONOMETRIA Profa. Dra. Margarida Garcia de Figueiredo margaridagf@ufmt.br mgfiguei@gmail.com 05/06/2014 2 DIFERENTES FORMAS FUNCIONAIS DOS MODELOS DE REGRESSÃO 3 FORMAS FUNCIONAIS DOS MODELOS DE REGRESSÃO • Para que possamos utilizar o método dos MQO para estimativa dos parâmetros da regressão, o modelo deve ser necessariamente linear nos parâmetros. • Porém, não necessariamente linear nas variáveis. • Trataremos agora de alguns modelos de regressão bastante utilizados nas análises econômicas, que podem não ser lineares nas variáveis, mas o são nos parâmetros, ou que podem ser tornados lineares por meio de transformações das variáveis. 4 FORMAS FUNCIONAIS DOS MODELOS DE REGRESSÃO Alguns modelos comumente utilizados nas análises econômicas: 1) Modelo log-linear ou log-log 2) Modelos semilogarítmicos 3) Modelos recíprocos 5 FORMAS FUNCIONAIS DOS MODELOS DE REGRESSÃO Alguns modelos comumente utilizados nas análises econômicas: 1) Modelo log-linear ou log-log 2) Modelos semilogarítmicos 3) Modelos recíprocos 6 1. MODELO LOG-LOG, DUPLO-LOG OU LOG-LINEAR eXY iii 21 iii XY lnlnln 21 iii XY lnln 2 1 ln 7 1. MODELO LOG-LOG, DUPLO-LOG OU LOG-LINEAR Representação Gráfica Y X eXY iii 21 0 2 Se 8 1. MODELO LOG-LOG, DUPLO-LOG OU LOG-LINEAR Representação Gráfica Y X eXY iii 21 0 2 Se 9 1. MODELO LOG-LOG, DUPLO-LOG OU LOG-LINEAR Um aspecto atraente do modelo log-log, que o tornou muito difundido nos trabalhos aplicados, é que o coeficiente angular mede a elasticidade de Y em relação a X, isto é, a variação percentual de Y, dada uma variação percentual unitária de X 10 1. MODELO LOG-LOG, DUPLO-LOG OU LOG-LINEAR Exemplo Ilustrativo: lnQcerv = 18,2 – 1,61lnPcerv + 1,86lnR + Erro Qcerv = quantidade demandada de cerveja em litros Pcerv = preço da cerveja em R$ R = renda média da população em R$ Coeficientes representam a elasticidade-preço e a elasticidade-renda da demanda por cerveja 11 FORMAS FUNCIONAIS DOS MODELOS DE REGRESSÃO Alguns modelos comumente utilizados nas análises econômicas: 1) Modelo log-linear ou log-log 2) Modelos semilogarítmicos 3) Modelos recíprocos 12 2. MODELOS SEMILOGARÍTMICOS: LOG-LIN • Modelo log-lin: É amplamente utilizado para medir taxas de crescimento de algumas variáveis econômicas, a exemplo de taxas de crescimento da população, do PNB, do PIB, da oferta de moeda, do emprego, da produtividade, do déficit comercial, etc. Exemplo: desejamos conhecer a taxa média de crescimento anual do consumo das famílias no Brasil 13 2. MODELOS SEMILOGARÍTMICOS: LOG-LIN Ano Consumo em R$ milhões de 2007 1994 1.317 1995 117.251 1996 333.725 1997 680.233 1998 2.235.648 1999 451.762 2000 735.882 2001 630.628 2002 432.866 2003 662.936 2004 900.154 2005 1.349.587 2006 2.657.460 2007 2.060.853 Tabela 01. Consumo das famílias no Brasil, em R$ milhões de 2007 (valores deflacionados de acordo com o IPC-A) Fonte: IBGE 14 2. MODELOS SEMILOGARÍTMICOS: LOG-LIN Exemplo: Consumo das famílias no Brasil • Denotemos por Yt, o consumo das famílias no período t e por Y0 o consumo destas famílias no período inicial da análise. )1(0 rYY t t onde r é a taxa de crescimento composta ou geométrica de Y 15 2. MODELOS SEMILOGARÍTMICOS: LOG-LIN Exemplo: Consumo das famílias no Brasil )1(lnlnln 0 rtYY t 1 2 tY t 21ln tt tY 21ln Incluindo o termo de erro aleatório 16 2. MODELOS SEMILOGARÍTMICOS: LOG-LIN tt tY 21ln Este modelo se assemelha a qualquer outro modelo de regressão linear, já que os parâmetros são lineares. A única diferença é que o regressando é o log de Y e o regressor é o tempo, que assumirá valores 1, 2, 3,..., n. Modelos como este são chamados de semilogarítimicos, porque apenas uma das variáveis está em forma logarítmica Um modelo em que apenas o regressando aparece na forma logarítmica é chamado de modelo log-lin 17 2. MODELOS SEMILOGARÍTMICOS: LOG-LIN tt tY 21ln Estimar os parâmetros da função de regressão linear simples, de ln(consumo) em função de t Y X Ano ln consumo t 1994 7,18 1 1995 11,67 2 1996 12,72 3 1997 13,43 4 1998 14,62 5 1999 13,02 6 2000 13,51 7 2001 13,35 8 2002 12,98 9 2003 13,40 10 2004 13,71 11 2005 14,12 12 2006 14,79 13 2007 14,54 14 18 2. MODELOS SEMILOGARÍTMICOS: LOG-LIN Sabendo-se que: para encontrar o valor de r, devemos tomar o anti-logaritmo 𝛽2 = 𝑙𝑛 1 + 𝑟 → 0,3035 = 𝑙𝑛 1 + 𝑟 𝑒𝑥𝑝 0,3035 = 1 + 𝑟 𝑒𝑥𝑝 0,3035 − 1 = 𝑟 𝑟 = 1,3546 − 1 = 0,3546 𝑙𝑛𝑌 = 10,8 + 0,3035𝑡 + 𝜀 𝑙𝑛𝑌 = 𝛽1 + 𝛽2𝑡 + 𝜀 𝒓 = 𝟑𝟓, 𝟒𝟔% 20 2. MODELOS SEMILOGARÍTMICOS: LOG-LIN O produto de 𝜷𝟐 por 100 é conhecido na literatura como a semi-elasticidade de Y em relação a X 𝒍𝒏𝒀 = 𝜷𝟏 + 𝜷𝟐𝒕 + 𝜺 Para encontrar a variação exata: ∆𝒀% = 𝒆𝒙𝒑 𝜷𝟐 − 𝟏 × 𝟏𝟎𝟎 21 2. MODELOS SEMILOGARÍTMICOS: LIN-LOG • Modelo lin-log: (Conhecer a variação absoluta de Y dada uma variação percentual de X) tit XY ln21 XX Y 2 )( 2 XXY Assim, se varia 1% (ou 0,01 unidade), a variação absoluta de Y será: XX )01,0( 2 Y Para interpretar corretamente o significado do parâmetro Beta 2, é necessário dividi-lo por 100 22 2. MODELOS SEMILOGARÍTMICOS: LIN-LOG Representação Gráfica 23 2. MODELOS SEMILOGARÍTMICOS: LIN-LOG Aplicação prática “modelos de despesas de Engel” “o total das despesas com alimentação tende a aumentar em progressão aritmética enquanto as despesas totais aumentam em progressão geométrica” Exemplo: modelo de regressão para as despesas com alimentação na Índia, em função das despesas totais: DespAlim = -1.283,9 + 257,27lnDespTotal + Erro um aumento de 1% nas despesas totais dos indianos, corresponde a um aumento de 2,57 rupias nas despesas com alimentação 24 FORMAS FUNCIONAIS DOS MODELOS DE REGRESSÃO Alguns modelos comumente utilizados nas análises econômicas: 1) Modelo log-linear ou log-log 2) Modelos semilogarítmicos 3) Modelos recíprocos 25 3. MODELOS RECÍPROCOS t i t X Y 1 21 quando X aumenta indefinidamente o termo se aproxima de zero e Y se aproxima do valor limite ou assintótico )/1( 2 X 1 Portanto, modelos recíprocos trazem embutido um valor assíntota ou limite, o qual a variável dependente assumirá, quando a variável independente X aumentar indefinidamente. 26 3. MODELOS RECÍPROCOS Formas Prováveis 27 3. MODELOS RECÍPROCOS • Exemplo: mortalidade infantil em função do PNB per capita PNBpc MI 1 17,273.2779,81 Verifica-se que, na medida em que o PNB per capita aumenta indefinidamente, a mortalidade infantil se aproxima do seu valor assintótico de cerca de 82 óbitos por mil 28 Variáveis binárias ou Dummy Incorporando fatores qualitativos nos modelos de regressão 29 Variáveis binárias ou Dummy • Até o presente momento: todas as variáveis tinham significado quantitativo • Análises empíricas: incorporar fatores qualitativos nos modelos de regressão • Exemplos: o sexo ou a raça de um indivíduo, o ramo de atividade de umaempresa (fabricante, varejista, etc.), a região onde uma cidade está localizada (norte, sul, leste e oeste), etc. • A incorporação de atributos qualitativos nos modelos de regressão poderá ser feita utilizando-se algumas variáveis binárias ou variáveis do tipo zero-um (variáveis dummy) 30 Variáveis binárias ou Dummy • Criamos variáveis dummy para representar diferentes categorias qualitativas em um modelo de regressão. • A variável dummy assume valor 1 na presença da categoria e valor zero na ausência da categoria. • Exemplos: 1. Sexo feminino ou masculino; 2. Alguém possui ou não um computador pessoal; 3. Uma empresa oferece ou não certo tipo de benefício aos funcionários; 4. As quatro estações do ano, etc. 31 Variáveis binárias ou Dummy • Exemplo: para representar o sexo no modelo • Definir a binária feminino, a qual assumirá valor 1 quando a pessoa for mulher e valor 0 quando for homem • Neste caso, o nome indica o evento cujo valor seja 1 • Poderíamos fazer ao contrário: binária masculino, assumindo valor 1 para homem e 0 para mulher • Variável sexo: não é interessante 32 Variáveis binárias ou Dummy • Exemplo: para representar o sexo no modelo Obs Média Renda Horas de estudo Feminino 1 7,5 2.000 2 0 2 9,0 3.500 4 1 ... ... ... ... ... 99 6,0 2.800 1,5 1 100 5,5 1.900 1 0 Amostra com 100 alunos da UFMT para avaliar o desempenho escolar em função da renda familiar, das horas diárias de estudo e do sexo 33 Variáveis binárias ou Dummy educinofeSalárioh 100 min Exemplo: Estudar o salário por hora em função do nível educacional e do sexo. Amostra aleatória com 526 observações. Obs Salário Educ Feminino 1 3,1 11 1 2 3,24 12 1 3 3,0 11 0 ... ... ... ... 526 3,5 14 1 35 Variáveis binárias ou Dummy educinofeSalárioh 51,0min27,262,3 Exemplo: Estudar o salário por hora em função do nível educacional e do sexo 0,51educ: para cada ano adicional de estudo, uma pessoa ganha US$0.51 a mais por hora de trabalho -2,27feminino: considerando o mesmo nível educacional, uma mulher ganha em média US$ 2.27 a menos por hora de trabalho, do que um homem 36 Variáveis binárias ou Dummy 𝑯𝒐𝒎𝒆𝒏𝒔: 𝑌 = 𝜷𝟎 + 𝛽1𝐸𝑑𝑢𝑐 + 𝜀 𝑴𝒖𝒍𝒉𝒆𝒓𝒆𝒔: 𝑌 = 𝜷𝟎 + 𝜹𝟎 + 𝛽1𝐸𝑑𝑢𝑐 + 𝜀 𝑆𝑎𝑙𝑎𝑟𝑖𝑜 𝐸𝑑𝑢𝑐 𝜷𝟎 𝜷𝟎 + 𝜹𝟎(𝟑, 𝟔𝟐) (𝟑, 𝟔𝟐 − 𝟐, 𝟐𝟕) Homem: grupo base ou referência 37 Variáveis binárias ou Dummy • Como existem apenas dois grupos, precisamos de apenas dois interceptos diferentes, então utilizamos apenas 1 binária • Inclusão de duas binárias, uma para cada sexo: multicolinearidade perfeita – armadilha da variável dummy • Alguns pesquisadores: omissão do intercepto • Não existe maneira consensual de se estimar o R2 em modelos sem intercepto 38 Variáveis binárias ou Dummy Obs Cte Educ Feminino Masculino 1 1 11 1 0 2 1 12 1 0 3 1 11 0 1 ... ... ... ... 526 1 14 1 0 “Armadilha da variável Dummy” Matriz X de variáveis explicativas (526 x 5) 39 Variáveis binárias ou Dummy • Nada muda na mecânica do MQO quando incluímos variáveis binárias nos modelos • Estimamos os parâmetros, relizamos o teste-t para verificar significância estatística, inclusive dos parâmetros das variáveis dummy, etc. • Diferença: interpretação dos coeficientes das variáveis dummy • Testar se realmente existe discriminação salarial? 0: 00 H 0: 0 H A 40 Variáveis binárias ou Dummy • Exemplo: suponha que estejamos interessados em estudar os salários em função do nível educacional, da experiência no mercado, do sexo e do estado civil. Pessoa Salário/h Educ Exper Feminino Casado 1 3,1 11 2 1 0 2 3,24 12 22 1 1 3 3 11 2 0 0 4 6 8 44 0 1 5 5,3 12 7 0 1 … … … … … … 525 11,56 16 5 0 1 526 3,5 14 5 1 0 Amostra com 526 observações 41 Variáveis binárias ou Dummy Preparar a planilha no Excel para exportar para o Eviews e estimar o modelo normalmente 42 Variáveis binárias ou Dummy De acordo com os resultados para o teste t, todas as variáveis foram estatisticamente significativas a 1% de probabilidade De acordo com o resultado do teste F, o modelo foi estatisticamente significativo de maneira global a 1% de probabilidade 43 Variáveis binárias ou Dummy Logaritmo Para cada ano adicional de estudo, o salário aumenta em média 8,7% Para cada ano adicional de experiência, o salário aumenta em média 0,76% Para um mesmo nível educacional e a mesma experiência no mercado de trabalho, uma pessoa casada ganha em média 13,8% a mais do que uma pessoa não casada Para um mesmo nível educacional e a mesma experiência no mercado de trabalho, uma mulher ganha em média 32,5% a menos do que um homem 44 Variáveis binárias ou Dummy Modelo Log-lin casadoinofeSaláriohLn educ 000 min21)( exp casadoinofeeducSaláriohLn 138,0min3251,0exp0076,0087,0469,0)( Para os mesmos níveis educacionais e de experiência no mercado, as mulheres ganham em média 32,5% a menos do que os homens De forma geral, se 𝜹𝟎 for o coeficiente de uma variável dummy, quando ln(Y) é a variável dependente, a diferença percentual exata entre o grupo que apresenta determinada característica ou não, pode ser calculada: DIFERENÇA EXATA 100 × 𝑒𝑥𝑝 𝛿0 − 1 45 Uso de variáveis Dummy para categorias múltiplas Objetivamos estudar a diferença salarial entre 4 grupos distintos de pessoas: 1. Mulheres casadas 2. Mulheres solteiras 3. Homens casados 4. Homens solteiros Quantas variáveis dummy devemos incluir no modelo? Eleger um grupo base (referência) e criar três variáveis dummy Referência 46 Uso de variáveis Dummy para categorias múltiplas Exemplo da equação de salários/hora para 4 grupos de pessoas Pessoa Salário/h Educ Exper Mcasada Msolteira Hcasado 1 3,10 11 2 0 1 0 2 3,24 12 22 0 0 1 3 3,00 11 2 1 0 0 4 6,00 8 44 0 0 1 5 5,30 12 7 0 0 1 . . . . . . . . . . . . . . . . . . 525 11,56 16 5 1 0 0 526 3,50 14 5 0 1 0 0 47 Uso de variáveis Dummy para categorias múltiplas exp027,0079,0110,0198,0213,032,0)( educmsoltmcashcasSaláriohLn Grupo base (referência) = homens solteiros Todas as categorias deverão ser comparadas em relação ao grupo dos homens solteiros. Exemplo: os homens casados ganham em média 23,7% a mais do que os homens solteiros, mantendo-se as demais característcas constantes. É importante realizar o teste t, para verificar se de fato existe diferença salarial entre as categorias de pessoas. Exemplo da equação de salários/hora para 4 grupos de pessoas 48 Uso de variáveis Dummy para categorias múltiplas Embora o grupo base escolhido seja o de homens solteiros, podemos realizar comparações entre os demais grupos? Sim, porém, não temos como calcular o valor da estatística t, para verificar se a diferença é estatísticamente significativa. Exemplo: diferença salarial entre mulheres solteiras e mulheres casadas = – 0,110 – (– 0,198) = 0,088 , ou seja, as mulheres solteiras ganham em média 8,8% a mais do que as mulheres casadas Para a realização do teste-t, devemos reestimar o modelo considerando uma destas variáveis como o grupo base (referência) Exemplo da equação de salários/hora para 4 grupos de pessoas 49 Variáveis binárias ou Dummy EXEMPLO: Preço do imóvel em função do tamanho do terreno, da área construída, da quantidade de dormitórios e de uma dummy colonial Obs Preço (R$ 1000) Tamterr (m2)Arquad (m2) Qtdorm (núm.) Colonial 1 320 480 200 3 0 2 180 360 160 2 1 ... ... ... ... ... ... 200 550 520 450 4 1 Amostra com 200 observações 50 Variáveis binárias ou Dummy Preços de imóveis: Interpretando os parâmetros… ln(preço) = 5,56 + 0,168ln(tamterr) + 0,707ln(arquad) + 0,027qtdorm + 0,054colonial Colonial é uma variável binária, referente ao imóvel ter estilo colonial (ou não) O coeficiente 0,054 para colonial significa que, considerando-se os demais fatores fixos, um imóvel no estilo colonial custa em média 5,55% a mais do que imóveis de outros estilos 51 Incorporação de informações ordinais com o uso de variáveis Dummy Suponha que queiramos verificar qual a diferença entre o salário inicial de pessoas formadas em diferentes faculdades de economia, as quais foram rankeadas quanto à qualidade do ensino Mais de 50 faculdades de economia foram rankeadas Analisaremos as diferenças entre 6 grupos: Top5 = as 5 melhores R6_10 = posições entre 6 e 10 R11_15 = posições entre 11 e 15 R16_20 = posições entre 16 e 20 R21_25 = posições entre 21 e 25 R25+ = posições acima de 25 Exemplo: efeito da classificação das faculdades de economia sobre o salário inicial 52 Incorporação de informações ordinais com o uso de variáveis Dummy Pessoa Salário Top5 R6_10 R11_15 R16_20 R21_25 Outros 1 3,10 0 0 0 1 0 12 2 3,24 0 0 0 0 1 3 3 3,00 1 0 0 0 0 18 4 6,00 0 1 0 0 0 5 5 5,30 0 0 0 0 1 6 . . . . . . . . . . . . . . . . . . . . . . . . 525 11,56 0 0 1 0 0 21 526 3,50 0 0 0 1 0 14 Exemplo: efeito da classificação das faculdades de economia sobre o salário inicial 53 Incorporação de informações ordinais com o uso de variáveis Dummy Grupo base (referência) = alunos que estudaram em universidades classificadas numa posição acima de 25 no rank Não criamos uma variável dummy para este grupo Os coeficientes associados a cada uma das categorias, serão todos comparados com este grupo Exemplo: efeito da classificação das faculdades de economia sobre o salário inicial 54 Incorporação de informações ordinais com o uso de variáveis Dummy 15_11375,010_6594,057,017,9)( RRtopSalárioLn outrosRR 25_21132,020_16263,0 O salário inicial de um profissional formado em uma escola que ocupa uma posição entre 21 e 25 no rank das universidades é, em média, 14,11% maior do que o salário inicial de um profissional formado em uma escola que ocupa uma posição acima de 25 no rank (exp(0,7)-1).100 = 101,4% Diferença salarial entre um profissional formado entre as Top5 e em escolas acima de 25 Exemplo: efeito da classificação das faculdades de economia sobre o salário inicial 55 Interações envolvendo variáveis Dummy Queremos saber se existe diferença salarial entre 4 grupos distintos de pessoas: 1) Usam computador apenas em casa 2) Usam computador apenas no trabalho 3) Usam computador tanto em casa quanto no trabalho 4) Não usam computador Podemos criar apenas duas variáveis dummy e trabalhar com a interação entre elas Exemplo: efeito do uso de computador em casa e no trabalho sobre o salário 56 Interações envolvendo variáveis Dummy Pessoa Salário/h Ccasa Ctrab Ccasa.Ctrab outras 1 3,10 0 0 0 12 2 3,24 0 1 0 1 3 3,00 1 1 1 14 4 6,00 1 0 0 5 5 5,30 1 1 1 3 . . . . . . . . . . . . . . . . . . 525 11,56 0 1 0 6 526 3,50 1 0 0 17 Grupo base: pessoas que não utilizam computador Exemplo: efeito do uso de computador em casa e no trabalho sobre o salário 57 Interações envolvendo variáveis Dummy CcasaCtrabSalárioLog 07,0177,017,9)( outrosCcasaCtrab.017,0 Uma pessoa que usa computador apenas no trabalho ganha em média 19,36% a mais do que uma pessoa que não usa computador Uma pessoa que usa computador apenas em casa ganha em média 7,25% a mais do que uma pessoa que não usa computador Uma pessoa que usa computador tanto no trabalho quanto em casa ganha em média 1,71% a mais do que uma pessoa que não usa computador Exemplo: efeito do uso de computador em casa e no trabalho sobre o salário
Compartilhar