Baixe o app para aproveitar ainda mais
Prévia do material em texto
2021-1 Econometria Prof. MSc. Jader de Amorim Email: jader.amorim@anhembi.br Curso de Economia mailto:mauricio.penteado@anhembi.br Econometria Aula 11 Variáveis binárias Objetivos de Aprendizagem da Aula Para a aula de hoje: Objetivo: “Testar hipóteses sobre os parâmetros do modelo da regressão populacional como ferramentas de análise de cenários e para a tomada de decisões”. Metodologia ensino: Aula expositiva e uso da metodologia ativa “Atividade em aula”. Objetivos de Aprendizagem da Aula Competências a serem fortalecidas: ✓ ANALISAR E RESOLVER PROBLEMAS ✓ ATINGIR OBJETIVOS ✓ RACIOCÍNIO LÓGICO-MATEMÁTICO – Usar raciocínio lógico-matemático na resolução de problemas. ✓ ANÁLISE DE PROCESSOS ECONÔMICOS – Analisar os fenômenos socioeconômicos a partir dos fundamentos da teoria econômica e instrumental quantitativo a fim de resolver problemas econômicos numa realidade diversificada, global e em constante transformação. (Ciências Econômicas) ✓ PLANEJAMENTO ECONÔMICO – Analisar e mensurar o impacto do cenário econômico e político global no processo de tomada de decisões de caráter econômico em organizações. (Ciências Econômicas) Agenda 1. Introdução 2. A descrição das informações qualitativas 3. Uma única variável dummy independente 4. Equação dos salários por hora 5. Variáveis Dummy 6. Variável dependente como log(y) 7. Variável dependente binária: modelo de probabilidade linear 8. Resumo 9. Revisão do aprendizado Introdução Vimos que as variáveis dependentes e independentes em nossos modelos de regressão múltipla tinham significado quantitativo. No trabalho empírico também devemos incorporar fatores qualitativos nos modelos de regressão. O sexo ou a etnia de um indivíduo, o ramo de atividade de uma empresa e a região onde uma cidade está localizada são todos considerados fatores qualitativos. A descrição das informações qualitativas Fatores qualitativos frequentemente aparecem na forma de informação binária: uma pessoa é do sexo feminino ou masculino; alguém possui ou não um computador pessoal; uma firma oferece ou não certo tipo de plano de pensão a seus empregados; um Estado adota ou não pena de morte (nos Estados Unidos). Em econometria, as variáveis binárias são em geral chamadas de variáveis dummy. Ao definirmos uma variável dummy, precisamos decidir a qual evento será atribuído o valor um e a qual será atribuído o valor zero. A descrição das informações qualitativas A maneira pela qual denominamos nossas variáveis não tem importância para obter os resultados da regressão, mas sempre nos ajuda a escolher nomes que deixam claras as equações e as explicações. Uma única variável dummy independente Considere o seguinte modelo simples de determinação de salários por hora: 𝑤𝑎𝑔𝑒= 𝜷𝟎 + 𝛿𝑓𝑒𝑚𝑎𝑙𝑒+ 𝜷𝟏𝑒𝑑𝑢𝑐+ 𝑢 Como female = 1 quando a pessoa é mulher e female = 0 quando é homem, temos a seguinte intepretação: 𝛿 é a diferença no salário por hora entre mulheres e homens, dado o mesmo grau de educação (e o mesmo termo de erro u). Se 𝛿<0, então, para o mesmo nível dos outros fatores, as mulheres ganham menos que os homens em média. Uma única variável dummy independente Você pode estar se perguntando porque não incluímos, também, uma variável dummy, male, que seria um para homem e zero para mulheres. A razão é que seria redundante. O uso de duas variáveis dummy introduziria colinearidade perfeita, porque female + male = 1, o que significa que male é uma função linear perfeita de female. Escolhemos homens para ser o grupo base ou grupo de referência, isto é, grupo contra o qual as comparações são feitas. Esta é a razão pela qual 𝛽0 é o intercepto para os homens e 𝛿 é a diferença dos interceptos entre mulheres e homens. Uma única variável dummy independente Gráfico de 𝑤𝑎𝑔𝑒= 𝛽0 + 𝛿𝑓𝑒𝑚𝑎𝑙𝑒+ 𝛽1𝑒𝑑𝑢𝑐 + 𝑢 para 𝛿<0 Portanto, Homens: female = 0 𝑤𝑎𝑔𝑒 = 𝛽0 + 𝛽1𝑒𝑑𝑢𝑐 + 𝑢 Mulheres: female = 1 𝑤𝑎𝑔𝑒 = (𝛽0 + 𝛿) + 𝛽1𝑒𝑑𝑢𝑐 + 𝑢 Gráfico: wage = f(educ) para homens e para mulheres Metodologia Ativa Atividade em sala de aula Nada mais muda muito quando mais variáveis explicativas estão envolvidas. Considerando os homens como o grupo-base, monte um modelo que controla a experiência e a permanência além da educação. No aplicativo Gretl, acesse o arquivo de exemplos do Wooldridge. Selecione o banco de dados “wage1” (Wagws, education, experience, etc.) a) Ache o modelo que explica a variável y = wage (salário por hora) e as variáveis x𝜹 = female (sexo feminino = 1; sexo masculino =0), x1 = educ (anos de educação formal), x2 = exper (anos de experiência no mercado de trabalho) e x3 = tenure (anos com empregador atual) Modelo: 𝑤𝑎𝑔𝑒= 𝛽0 + 𝛿𝑓𝑒𝑚𝑎𝑙𝑒+ 𝛽1𝑒𝑑𝑢𝑐 + 𝛽2𝑒𝑥𝑝𝑒𝑟 + 𝛽3𝑡𝑒𝑛𝑢𝑟𝑒+ 𝑢 Uma única variável dummy independente Solução 𝑤𝑎𝑔𝑒= 𝛽0 + 𝛿𝑓𝑒𝑚𝑎𝑙𝑒+ 𝛽1𝑒𝑑𝑢𝑐+ 𝛽2𝑒𝑥𝑝𝑒𝑟+ 𝛽3𝑡𝑒𝑛𝑢𝑟𝑒+ 𝑢 Como podemos efetivamente testar a discriminação salarial? Usamos a estatística t. A única diferença em relação ao que vínhamos fazendo até agora é a interpretação do coeficiente da variável dummy. Equação dos salários por hora Equação dos salários por hora 𝑤𝑎𝑔𝑒 = −1,57 −1,81𝑓𝑒𝑚𝑎𝑙𝑒 + 0,572𝑒𝑑𝑢𝑐 + 0,25𝑒𝑥𝑝𝑒𝑟 + 0,141𝑡𝑒𝑛𝑢𝑟𝑒 (0,72) (0,26) (0,049) (0,012) (0,021) n = 526, R² = 0,364 O intercepto negativo não é muito significativo já que ninguém na amostra tem zero anos de educ, exper, tenure. O coeficiente de female registra a diferença média no salário por hora entre mulher e homem, dados os mesmos níveis de educ, exper e tenure. Se compararmos uma mulher e um homem com os mesmos níveis de educação, experiência e permanência, a mulher ganha em média US$ 1,81 por hora a menos que o homem. Metodologia Ativa Atividade em sala de aula Considerando os homens como o grupo-base, monte um modelo que NÂO controla a experiência e a permanência além da educação. No aplicativo Gretl, acesse o arquivo de exemplos do Wooldridge. Selecione o banco de dados “wage1” (Wagws, education, experience, etc.) a) Ache o modelo que explica a variável y = wage (salário por hora) e as variáveis x𝜹 = female (sexo feminino = 1; sexo masculino =0) Modelo: 𝑤𝑎𝑔𝑒= 𝛽0 + 𝛿𝑓𝑒𝑚𝑎𝑙𝑒 Equação dos salários por hora 𝑤𝑎𝑔𝑒 = 7,10 − 2,51𝑓𝑒𝑚𝑎𝑙𝑒 (0,21) (0,30) n = 526, R² = 0,116 O intercepto é o salário médio dos homens na amostra, de modo que os homens ganham, em média, US$ 7,10 por hora. O coeficiente de female é a diferença do salário entre homens e mulheres. Assim, o salário médio das mulheres é US$ 4,59 por hora. O diferencial salarial estimado entre homens e mulheres é maior na segunda equação porque não controla as diferenças em educação, experiência e permanência, e esses fatores são mais baixos, em média, para as mulheres do que para os homens nessa amostra. Variáveis Dummy Um caso especial de análise de política é a avaliação de programas, na qual gostaríamos de saber o efeito de programas econômicos ou sociais sobre indivíduos, empresas, vizinhança, cidades, etc. No caso mais simples existem dois grupos de objeto de estudo. O grupo de controle não participa do programa. O grupo de tratamento faz parte do programa. Metodologia Ativa Atividade em sala de aula No aplicativo Gretl, acesse o arquivo de exemplos do Wooldridge. Selecione o banco de dados “hprice1” (House prices and characteristics) a) Ache o modelo que explica a variável y = log(price) (preço da casa em mil USD), x1 = log(lotsize) (tamanho do lote em pés quadrados), x2 = log(sqrft) (tamanho da casa em pés quadrados), x3 = bdrms (número de quartos) e x𝜹 = colonial (estilo colonial = 1, caso contrário = 0) Modelo : log(𝑝𝑟𝑖𝑐𝑒) = 𝜷𝟎 + 𝜷𝟏 log(𝑙𝑜𝑡𝑠𝑖𝑧𝑒) + 𝜷𝟐 log(𝑠𝑞𝑟𝑓𝑡) + 𝜷𝟑 𝑏𝑑𝑟𝑚𝑠+ 𝜹𝑐𝑜𝑙𝑜𝑛𝑖𝑎𝑙 (modelo log-nível para bdrms e colonial; e modelo log-log para lotsize e sqrft) Variável dependente comolog(y) Variável dependente como log(y) Log(𝑝𝑟𝑖𝑐𝑒) = − 1,35 + 0,168log(𝑙𝑜𝑡𝑠𝑖𝑧𝑒) + 0,707log(𝑠𝑞𝑟𝑓𝑡) + 0,027𝑏𝑑𝑟𝑚𝑠 + 0,054𝑐𝑜𝑙𝑜𝑛𝑖𝑎𝑙 Todas as variáveis são autoexplicativas, exceto colonial que é uma variável binária igual a um se o imóvel tiver estilo colonial. Isso significa que prever que um imóvel de estilo colonial seja vendido por cerca de 5,4% a mais, mantendo-se todos os outros fatores fixos. Metodologia Ativa Atividade em sala de aula Considerando os homens como o grupo-base, monte um modelo que controla a experiência e a permanência além da educação. No aplicativo Gretl, acesse o arquivo de exemplos do Wooldridge. Selecione o banco de dados “wage1” (Wagws, education, experience, etc.) a) Ache o modelo que explica a variável y = wage (salário por hora) e as variáveis x𝜹 = female (sexo feminino = 1; sexo masculino =0), x1 = educ (anos de educação formal), x2 = exper (anos de experiência no mercado de trabalho), x3 = exper2 (quadrado de exper) e x4 = tenure (anos com empregador atual) x5 = tenure2 (quadrado de tenure) Modelo: log(w𝑎𝑔𝑒) = 𝛽0 + 𝛿𝑓𝑒𝑚𝑎𝑙𝑒+ 𝛽1𝑒𝑑𝑢𝑐+ 𝛽2𝑒𝑥𝑝𝑒𝑟+ 𝛽3𝑒𝑥𝑝𝑒𝑟2 + 𝛽4𝑡𝑒𝑛𝑢𝑟𝑒+ 𝛽5𝑡𝑒𝑛𝑢𝑟𝑒2 + 𝑢 Variável dependente como log(y) Variável dependente como log(y) log(𝑤𝑎𝑔𝑒) = 0,417 − 0,297𝑓𝑒𝑚𝑎𝑙𝑒 + 0,080𝑒𝑑𝑢𝑐 + 0,029𝑒𝑥𝑝𝑒𝑟 − 0,00058𝑒𝑥𝑝𝑒𝑟2 + 0,032𝑡𝑒𝑛𝑢𝑟𝑒 - 0,000585𝑡𝑒𝑛𝑢𝑟𝑒2 O coeficiente de female implica, para os mesmos níveis de educ, exper e tenure, que as mulheres ganham cerca de 29,7% a menos que os homens. Variável dependente binária: modelo de probabilidade linear Em todos os modelos vistos até agora, a variável dependente y teve um significado quantitativo. O que acontece se quisermos usar regressão múltipla para explicar um evento qualitativo? Y pode ser definido para indicar se um adulto concluiu o ensino médio; y pode indicar se um aluno do curso superior usou drogas ilegais durante determinado ano escolar ou y pode indicar se uma empresa foi absorvida por outra durante determinado ano. Y SOMENTE MUDA DE ZERO PARA UM OU DE UM PARA ZERO OU NÃO MUDA. Variável dependente binária: modelo de probabilidade linear O modelo de regressão linear múltipla com uma variável dependente binária é chamado de modelo de probabilidade linear. Exemplo: inlf = 1 se a mulher informar ter trabalhado com remuneração fora de casa em algum período do ano; e inlf = 0, caso contrário. Metodologia Ativa Atividade em sala de aula Presumimos que a participação na força de trabalho depende de outras fontes de renda, anos de estudo, experiência anterior no mercado de trabalho, número de filhos menores que 6 anos e número de filhos entre 6 e 18. No aplicativo Gretl, acesse o arquivo de exemplos do Wooldridge. Selecione o banco de dados “mroz” (Married women’s hours of work) a) Ache o modelo que explica a variável y=infl (=1, se na força de trabalho em 1975), x1=nwifeinc (renda), x2=educ (anos de escolaridade), x3=exper (experiência anterior no mercado de trabalho), x4=exper2 (quadrado de exper), x5=age (idade da mulher, em anos), x6=kidslt6 (número de filhos menores que 6 anos) e x7=kidsge6 (número de filhos entre 6 e 18 anos) Modelo: Inlf = 𝛽0 - 𝛽1 nwifeinc + 𝛽2 educ + 𝛽3 exper – 𝛽4exper² - 𝛽5 age - 𝛽6 kidslt6 + 𝛽7 kidsge6 Variável dependente binária: modelo de probabilidade linear Variável dependente binária: modelo de probabilidade linear Inlf = 0,586 - 0,0034nwifeinc + 0,038educ + 0,039exper – 0,0006exper² - 0,016age - 0,0262kidslt6 + 0,013kidsge6 O coeficiente de educ significa que, tudo o mais mantido fixo, mais um ano de educação aumenta a probabilidade de participação na força de trabalho em 0,038. Resumo Vimos como usar informações qualitativas na análise de regressão. Uma variável dummy é definida para fazer distinção entre dois grupos e o coeficiente estimado da variável estima a diferença ceteris paribus entre os dois grupos. Revisão do aprendizado 1. Introdução 2. A descrição das informações qualitativas 3. Uma única variável dummy independente 4. Equação dos salários por hora 5. Variáveis Dummy 6. Variável dependente como log(y) 7. Variável dependente binária: modelo de probabilidade linear 8. Resumo •Obrigado !
Compartilhar