Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Econometria I (IS 211) Variáveis Dummy Lucas Siqueira de Castro lucascastro@ufrrj.br Referência WOOLDRIDGE, J. Introdução à econometria: uma abordagem moderna. São Paulo: Cengage Learning, 6a edição, 2017, capítulo 7. Variáveis Dummy Variável dummy ou binária Fatores qualitativos Assume apenas dois valores 0 quando um evento não ocorre 1 quando um evento ocorre Exemplos Sexo (feminino = 1; masculino = 0) Status marital (casado = 1; solteiro = 0) Aplicação Casados ganham mais? 2 Variável Dummy Modelo com uma variável quantitativa (x) e uma variável dummy y = b0 + d0d + b1x + u Interpretação Deslocamento de intercepto Se d=0, então y = b0 + b1x + u Se d=1, então y = (b0 + d0) + b1x + u 5 Exemplo de d0 > 0 x y {d0 } b0 y = (b0 + d0) + b1x y = b0 + b1x intercepto = b0 d = 0 d = 1 intercepto = b0+ d0 Equação de Salários Modelo com uma variável quantitativa (educ) e uma variável dummy (feminino) salárioh = b0 + d0feminino + b1educ + u Interpretação d0 é a diferença no salário-hora entre homens e mulheres O coeficiente d0 determina se existe discriminação contra mulheres 3 7 Exemplo de d0 < 0 educ {d0 } b0 salárioh = b0 + b1educ salárioh =(b0 + d0)+ b1educ inclinação = b1 feminino = 1 feminino = 0 Quiz Você deveria incluir junto de feminino a seguinte variável dummy também na equação de salários: homem=1, se for homem; homem=0, se for mulher? Resposta: não, porque senão as variáveis dummy provocariam colinearidade perfeita “Armadilha da variável dummy” Variável Dummy Grupo-base ou grupo de referência É o grupo contra o qual são feitas as comparações O valor do grupo de referência é representado pelo intercepto global (a constante) da regressão Na equação de salários com feminino como variável dummy Homens são grupo-base ou grupo de referência 4 Testando a Discriminação de Sexo Testando a discriminação salarial por sexo Hipótese nula de não existência de diferença entre homens e mulheres H0: d0=0 Hipótese alternativa de que existe discriminação contra as mulheres H1: d0<0 Exemplo Interpretação quando y é log(y) 5 Interpretação quando y é log(y) Interpretação do coeficiente da dummy quando y é log(y) Interpretação de variação percentual Por ex., coeficiente de feminino é - 0,297 Cálculo aproximado Controlando para outros fatores, as mulheres ganham 100*(0,297)=29,7% a menos que os homens Interpretação quando y é log(y) Cálculo exato da variação percentual do coeficiente da dummy Coeficiente de feminino é -0,297 Controlando para outros fatores, as mulheres ganham 100*(0,297)=29,7% a menos que os homens 297,0loglog HM saláriohsalárioh Interpretação quando y é log(y) Mas a estimativa mais exata leva em conta a diferença proporcional nos salários entre mulheres e homens, mantendo fixos os outros fatores: O salário da mulher é 25,7% menor do que dos homens 257,01297,0exp H HM salárioh saláriohsalárioh 6 Dummy para Categorias Múltiplas Categorias múltiplas Num modelo de preços residenciais hedônicos Localização geográfica Centro, N, S, L e O Inserir 4 variáveis dummy N=1; caso contrário, 0 S=1; caso contrário, 0 L=1; caso contrário, 0 O=1; caso contrário, 0 Centro é a grupo-base Representado pela constante Dummy para Categorias Múltiplas O grupo-base é representado pela constante Comparação do valor da dummy com a constante do grupo-base Exemplo: se constante=81.000,00 (esse é o valor para a região Centro) e se dSUL=15.000,00 e dNORTE=-7.000,00 Uma casa na zona Sul vale, em média, 15 mil a mais do que no Centro Uma casa na zona Norte vale, em média, 7 mil a menos do que no Centro Se houver m categorias, inserir m-1 variáveis dummy Dummy para Informações Ordinais Efeito do risco de crédito Varia de 0 (pior) a 4 (melhor) Variável ordinal (CR) Regressão: txdebenture= b0 + b1CR + outros fatores Problema Interpretação de b1 O que significa um aumento de 0 para 1 em CR? E de 3 para 4? Sem sentido 7 Dummy para Informações Ordinais Abordagem melhor Definir variáveis dummy para cada valor de CR CR1=1 se CR=1; e zero, caso contrário CR2=1 se CR=2; e zero, caso contrário etc Regressão txdebenture = b0 + d1CR1 + d2CR2 + d3CR3 + d4CR4 + outros fatores + u Note que CR0 é o grupo-base Dummy para Informações Ordinais Interpretação d1 é a diferença em txdebenture entre uma empresa com um risco de crédito 1 e uma empresa com um risco de crédito zero. Interpretação análoga para d2, d3 e d4 Dificuldade se houver muitas categorias Ranking de faculdades Não é possível pôr uma variável dummy para cada posição Atratividade Física e Salários Indicadores de boa aparência física em uma equação de salários Cada pessoa da amostra foi classificada por um entrevistador quanto à aparência física (feia, comum, média, bonita e muito bonita) Mas foram usados só 3 grupos Média, abaixo da média, acima da média 8 Atratividade Física e Salários Equação estimada para homens: 𝑙𝑜𝑔ො 𝑠𝑎𝑙á𝑟𝑖𝑜 = 𝛽መ − 0,164𝑎𝑏𝑎𝑖𝑥𝑜𝑚𝑒𝑑 + 0,046 0,016𝑎𝑐𝑖𝑚𝑎𝑚𝑒𝑑 + 𝑜𝑢𝑡𝑟𝑜𝑠𝑓𝑎𝑡𝑜𝑟𝑒𝑠 0,033 n=700, 𝑅തଶ = 0,403 Grupo-base é a média Outros fatores: educ, perm, exper, estado civil e raça Atratividade Física e Salários Equação estimada para as mulheres 𝑙𝑜𝑔ො 𝑠𝑎𝑙á𝑟𝑖𝑜 = 𝛽መ − 0,124 𝑎𝑏𝑎𝑖𝑥𝑜𝑚𝑒𝑑 + 0,066 0,035 𝑎𝑐𝑖𝑚𝑎𝑚𝑒𝑑 + 𝑜𝑢𝑡𝑟𝑜𝑠𝑓𝑎𝑡𝑜𝑟𝑒𝑠 0,049 n=409, 𝑅തଶ = 0,330 Interações entre Variáveis Dummy Modelo log(salárioh)=b0 + d1 feminino + d2 casado + d3 feminino.casado + outros fatores + u Diferencial de salários entre os 4 grupos Se feminino=0 e casado=0 Grupo de homens solteiros (b0) Se feminino=0 e casado=1 Grupo dos homens casados (b0 + d2) Etc 9 Exemplo Interação de Dummy com Variável Quantitativa Interação de uma dummy com uma variável quantitativa contínua y = b0 + d0d + b1x + d1d*x + u d=0 y = b0 + b1x + u d=1 y = (b0 + d0) + (b1+ d1) x + u Mudança de inclinação 27 y x y = b0 + b1x y = (b0 + d0) + (b1 + d1) x Exemplo de d0 > 0 e d1 < 0 d = 1 d = 0 10 Interação de Dummy com Variável Quantitativa Exemplo log(salarioh) = (b0 + d0 feminino) + (b1 + d1 feminino).educ + u Se feminino=0 Intercepto de homens é b0 b1 inclinação de educ para homens Se feminino=1 Intercepto para mulheres é (b0 + d0) d1 mede a diferença no retorno da educação entre mulheres e homens Interação de Dummy com Variável Quantitativa Exemplo (cont.) Testar se o retorno à educação é o mesmo entre homens e mulheres: 𝐻: 𝛿ଵ = 0 O que significa que a inclinação de log(salárioh) em relação a educ é a mesma entre homens e mulheres Modelo de Probabilidade Linear Variável dependente dummy P(y = 1|x) = E(y|x) P(y = 1|x) = b0 + b1x1 + … + bkxk Interpretação de bj Mudança na probabilidade de sucesso quando xj varia y estimado é a probabilidade prevista de sucesso 11 Modelo de Probabilidade Linear Problemas Previsões de y fora do intervalo [0,1] Violação da homocedasticidade Cuidado com a inferência (testes t e F) Bom início na análise quando y binário Apesar dos problemas Exemplo Modelo de participação da mulher na força de trabalho naft = b0 + b1nesprend + b2educ + b3exper + b4exper2 + b5idade+ b6crianmed6 + b7crianma6 + u Cuidado com a Interpretação! Na estimação do modelo anterior, b6=-0,262. Interpretação: Então, se a mulher tiver uma criança pequena, ela tem uma redução na probabilidade de estar na força de trabalho de 26,2%. Mas, como o modelo é linear, se ela tiver 4 filhos: -0,262*(4)= -1,048 Sem sentido!!! 12
Compartilhar