Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

17/05/2024
1
AT 11.2 - Análise de regressão IX 
(regressão múltipla)
Prof. Gustavo Moreira
LES0773 - Estatística Aplicada III (Análise 
Multivariada)
gustavocmoreira@usp.br
DEPARTAMENTO DE
Economia, Administração e Sociologia
Regressão simples vs. Regressão múltipla
• Quando há somente uma variável 
explicativa (independente), temos um 
modelo de regressão simples.
ෝ𝑦𝑖 = 𝛼 + 𝛽𝑥𝑖
• Se estimarmos um modelo com mais de 
uma variável explicativa, temos um modelo 
de regressão múltipla:
ෝ𝑦𝑖 = 𝛼 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + ⋯ + 𝛽𝑘𝑥𝑘𝑖
1
2
17/05/2024
2
Regressão múltipla
• Tudo o que nós vimos até o momento se mantém válido em uma 
análise de regressão múltipla. Teste t, teste F, intervalo de confiança, 
𝑅2, 𝑅2 ajustado, formas funcionais, etc.
• A técnica de estimação continua sendo a de Mínimos Quadrados 
Ordinários.
• A vantagem é que agora podemos nos aproximar mais da realidade e 
criar modelos de regressão que sejam mais adequados para explicar 
determinados fenômenos sociais e econômicos que são dependentes 
de múltiplas variáveis. Isso também permitirá mais flexibilização das 
formas funcionais.
Regressões polinomiais
3
4
17/05/2024
3
Regressões polinomiais
• Essa classe de modelos permite modelar a relação entre a variável 
dependente 𝑦 em função da variável independente (𝑥) a partir de uma 
função polinomial de grau 𝑛.
𝑦 = 𝛽0 + 𝛽1𝑥 + 𝛽2𝑥2 + ⋯ 𝛽𝑛𝑥𝑛 + 𝜀
• As funções polinomiais são úteis quando a relação entre a variável 
dependente e independente é não linear e pode ser aproximada pela 
função polinomial. 
Regressões polinomiais
• A estimativa de uma regressão polinomial ajuda a melhorar o ajuste do 
modelo. No entanto, a intepretação dos coeficientes polinomiais pode 
se tornar difícil. 
• A inclusão de um elemento polinomial na análise de regressão é uma 
decisão teórico-empírica. 
5
6
17/05/2024
4
Regressões polinomiais
Qual “reta” ajusta melhor a esses dados?
Regressões polinomiais
• Alguns casos típicos da literatura dizem respeito 
à relação não linear entre idade e salários. 
• A literatura aponta uma relação de “U invertido”. 
As pessoas ganham menos quando mais novas, 
esse salário aumenta ao longo do tempo, atinge 
um pico e terminam a carreira ganhando menos.
• Para captar isso, precisamos estimar:
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 𝛼 + 𝛽1𝑖𝑑𝑎𝑑𝑒 + 𝛽2𝑖𝑑𝑎𝑑𝑒2
7
8
17/05/2024
5
Regressões polinomiais
• Para esses casos, as estimativas geralmente se parecem com isso 
(considere que ambos os elementos são estatisticamente significativos):
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 61,22 + 1,56𝑖𝑑𝑎𝑑𝑒 − 0,02𝑖𝑑𝑎𝑑𝑒2
• Como interpretar? À medida que a idade aumenta em 1 ano, a renda 
aumenta em R$1,56 (salário-hora). 
• Como interpretar o termo quadrático? Interpretamos inicialmente o sinal 
desse elemento. O sinal negativo indica que a curva tem formato de “U 
invertido”.
Regressões polinomiais
• Outro exercício interessante, é: qual é a idade média em que as 
pessoas atingem o maior salário?
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 61,22 + 1,56𝑖𝑑𝑎𝑑𝑒 − 0,02𝑖𝑑𝑎𝑑𝑒2
• Para encontrar o ponto de ótimo, deriva e iguala a zero:
𝝏𝒔𝒂𝒍á𝒓𝒊𝒐𝒔
𝝏𝒊𝒅𝒂𝒅𝒆
= 𝟏, 𝟓𝟔 − 𝟎, 𝟎𝟒 𝒊𝒅𝒂𝒅𝒆 = 𝟎 → 𝒊𝒅𝒂𝒅𝒆 = 𝟑𝟗 𝒂𝒏𝒐𝒔
9
10
17/05/2024
6
Regressões polinomiais
• Para esses casos, as estimativas geralmente se parecem com isso:
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 61,22 + 1,56𝑖𝑑𝑎𝑑𝑒 − 0,02𝑖𝑑𝑎𝑑𝑒2
• Mas o coeficiente -0,02 é algo esquisito de interpretar e, muitas 
vezes, ausente de significado. Um aumento em 1 ano na idade ao 
quadrado diminui os salários em 0,02.
Regressões polinomiais
• Para esses casos, as estimativas geralmente se parecem com isso:
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 61,22 + 1,56𝑖𝑑𝑎𝑑𝑒 − 0,02𝑖𝑑𝑎𝑑𝑒2
• E se o coeficiente 𝑖𝑑𝑎𝑑𝑒2 for não estatisticamente significativo? 
Significa que não podemos rejeitar a hipótese nula de que ele seja 
zero. Logo, é uma evidência que não existe a relação em forma de U 
invertido entre idade e salários.
11
12
17/05/2024
7
Regressões polinomiais
• Mais um caso: curva de Kuznets Ambiental. 
Pode ser aplicada para mostrar a relação entre 
desmatamento e PIB.
• A literatura aponta uma relação de “U invertido”. 
Países de renda baixa desmatam pouco. À 
medida que a renda aumenta, o desmatamento 
aumenta. A partir de determinado nível de renda, 
o desmatamento decresce.
• Para captar isso, precisamos estimar:
෣𝑑𝑒𝑠𝑚𝑎𝑡𝑎𝑚𝑒𝑛𝑡𝑜 = 𝛼 + 𝛽1𝑃𝐼𝐵 + 𝛽2𝑃𝐼𝐵2
As possibilidades de 
interpretação são similares 
ao caso dos salários.
Regressões polinomiais
• Mais um caso: relação entre renda e vitimização 
de roubo.
• A literatura aponta uma relação de “U invertido”. 
Pessoas pobres são pouco roubadas. À medida 
que a renda aumenta, o risco de vitimização 
aumenta até certo ponto. Depois disso, pessoas 
de renda mais elevadas conseguem se proteger 
melhor, frequentam locais “melhores” e reduzem 
o risco de vitimização.
• Para captar isso, precisamos estimar:
෣𝑟𝑜𝑢𝑏𝑜 = 𝛼 + 𝛽1𝑟𝑒𝑛𝑑𝑎 + 𝛽2𝑟𝑒𝑛𝑑𝑎2
As possibilidades de 
interpretação são similares 
ao caso dos salários.
13
14
17/05/2024
8
Regressões polinomiais
Qual “reta” ajusta melhor a esses dados?
Regressões polinomiais
• Você pode também estimar uma regressão 
cúbica:
ො𝑦 = 𝛼 + 𝛽1𝑥 + 𝛽2𝑥2 + 𝛽3𝑥3
• Interpretar os coeficientes quadráticos e 
cúbicos tornam-se ausentes de significado. 
Mas a significância estatística desses 
elementos servem para confirmar a relação 
não linear de interesse.
15
16
17/05/2024
9
Regressões polinomiais
• Essa relação cúbica é difícil de ser 
observada nas ciências sociais aplicadas, 
mas pode acontecer. Uma relação conhecida 
é entre produção e custos (CT):
෣𝑝𝑟𝑜𝑑𝑢çã𝑜 = 𝛼 + 𝛽1𝐶𝑇 + 𝛽2𝐶𝑇2 + 𝛽3𝐶𝑇3
• Relembre a teoria dos custos da 
microeconomia.
Regressões polinomiais
• Estimar equações polinomiais de ordem superior podem ser 
redundantes se comparadas às estimativas de segundo e terceiro grau. 
Isso porque essas funções são muito parecidas:
• Devemos ser parcimoniosos na quantidade de regressores (variáveis 
independentes) em uma regressão múltipla.
17
18
17/05/2024
10
Regressores qualitativos 
categóricos
Regressões com variáveis categóricas
• Enquanto estávamos no mundo da regressão simples, adicionamos ao 
nosso modelo para interpretação uma variável qualitativa binária. 
• Vamos relembrar:
19
20
17/05/2024
11
Interpretação dos coeficientes
• Exemplo 1: Considere que estimamos o seguinte modelo para avaliar o 
efeito de um treinamento sobre os salários (em R$). Parta do pressuposto 
que todos os coeficientes são estatisticamente significantes.
• A variável treinamento é binária: 1 se recebeu o treinamento e 0 se não 
recebeu.
• Como interpretar? O fato de ter feito o treinamento (=1) indica que, em 
média, o salário se elevou em R$1.021,3, em comparação com quem não 
recebeu o treinamento (=0).
෣𝒔𝒂𝒍á𝒓𝒊𝒐𝒔 = 𝟐𝟐𝟑𝟐, 𝟏 + 𝟏𝟎𝟐𝟏, 𝟑 ∗ 𝒕𝒓𝒆𝒊𝒏𝒂𝒎𝒆𝒏𝒕𝒐
Interpretação dos coeficientes
• Sempre interpretamos o resultado do modelo para o valor igual a 1, em 
relação ao valor de quem é 0 (denominada de categoria base). Isso 
porque:
• Salário estimado de quem recebeu o treinamento (=1)
• Salário estimado de quem não recebeu o treinamento (=0)
෣𝒔𝒂𝒍á𝒓𝒊𝒐𝒔 = 𝟐𝟐𝟑𝟐, 𝟏 + 𝟏𝟎𝟐𝟏, 𝟑 ∗ 𝟏 = 𝑹$𝟑. 𝟐𝟓𝟑, 𝟒𝟎
෣𝒔𝒂𝒍á𝒓𝒊𝒐𝒔 = 𝟐𝟐𝟑𝟐, 𝟏 + 𝟏𝟎𝟐𝟏, 𝟑 ∗ 𝟎 = 𝑹$𝟐. 𝟐𝟑𝟐, 𝟏𝟎
21
22
17/05/2024
12
Interpretação dos coeficientes
• Sempre interpretamos o resultado do modelo para o valor igual a 1, em 
relação ao valor de quem é 0 (denominada de categoria base). Isso 
porque:
• Salário estimado de quem recebeu o treinamento (=1)
• Salário estimado de quem não recebeu o treinamento (=0)
෣𝒔𝒂𝒍á𝒓𝒊𝒐𝒔 = 𝟐𝟐𝟑𝟐, 𝟏 + 𝟏𝟎𝟐𝟏, 𝟑 ∗ 𝟏 = 𝑹$𝟑. 𝟐𝟓𝟑, 𝟒𝟎
෣𝒔𝒂𝒍á𝒓𝒊𝒐𝒔 = 𝟐𝟐𝟑𝟐, 𝟏 + 𝟏𝟎𝟐𝟏, 𝟑 ∗ 𝟎 = 𝑹$𝟐. 𝟐𝟑𝟐, 𝟏𝟎
∆ = 1021,30
Regressões com variáveis categóricas
• Mas nada impede de incluir no nosso modelo variáveis independentescategóricas que não sejam somente binárias.
• Por exemplo:
• Explicar o valor do aluguel em função de 3 regiões (vl. Indep.; nova 
piracicaba; campestre).
• Explicar o gasto com cartão de crédito em função do estado civil (1 = 
solteiro; 2 = casado; 3 = viúvo).
• Explicar os salários em função do setor de atividade (1 = const. civil; 2 = 
indústria; 3 = comércio; 4 = agricultura; etc).
23
24
17/05/2024
13
Regressões com variáveis categóricas
• Se desejarmos explicar uma variável dependente em função de uma 
variável categórica com 𝑘 categorias, devemos adicionar 𝑘 − 1 variáveis 
binárias em nosso modelo.
• Para realizar a interpretação, a análise será feita com relação à 
categoria em que todas as variáveis binárias assumem valor 0 
simultaneamente. Essa é chamada de categoria base (ou de 
referência). Se refere à categoria omitida da regressão.
Regressões com variáveis categóricas
• Passo 1: transformar variáveis categóricas em variáveis binárias (o 
software fará isso automaticamente).
• Exemplo:
Nome_cliente Salário Estado_civil
Ana 3723 1
Pedro 2320 2
Mariana 4131 3
Lucas 2029 1
Júlia 2499 1
Rafael 3517 2
Carolina 3282 3
Estado civil:
1 – solteiro; 2 – casado; 3 – divorciado.
25
26
17/05/2024
14
Regressões com variáveis categóricas
• Passo 1: transformar variáveis categóricas em variáveis binárias (o 
software fará isso automaticamente).
• Exemplo:
Nome_cliente Salário Estado_civil
Ana 3723 1
Pedro 2320 2
Mariana 4131 3
Lucas 2029 1
Júlia 2499 1
Rafael 3517 2
Carolina 3282 3
Estado civil:
1 – solteiro; 2 – casado; 3 – divorciado.
Nome_cliente Salário Estado_civil 𝐷1 𝐷2 𝐷3
Ana 3723 1
Pedro 2320 2
Mariana 4131 3
Lucas 2029 1
Júlia 2499 1
Rafael 3517 2
Carolina 3282 3
Criação de binárias
𝐷1 = ቊ
1 𝑠𝑒 𝑠𝑜𝑙𝑡𝑒𝑖𝑟𝑜
0 𝑠𝑒 𝑛ã𝑜
𝐷2 = ቊ
1 𝑠𝑒 𝑐𝑎𝑠𝑎𝑑𝑜
0 𝑠𝑒 𝑛ã𝑜
𝐷3 = ቊ
1 𝑠𝑒 𝑑𝑖𝑣𝑜𝑟𝑐𝑖𝑎𝑑𝑜
0 𝑠𝑒 𝑛ã𝑜
Regressões com variáveis categóricas
• Passo 1: transformar variáveis categóricas em variáveis binárias (o 
software fará isso automaticamente).
• Exemplo:
Nome_cliente Salário Estado_civil
Ana 3723 1
Pedro 2320 2
Mariana 4131 3
Lucas 2029 1
Júlia 2499 1
Rafael 3517 2
Carolina 3282 3
Estado civil:
1 – solteiro; 2 – casado; 3 – divorciado.
Nome_cliente Salário Estado_civil 𝐷1 𝐷2 𝐷3
Ana 3723 1 1 0 0
Pedro 2320 2 0 1 0
Mariana 4131 3 0 0 1
Lucas 2029 1 1 0 0
Júlia 2499 1 1 0 0
Rafael 3517 2 0 1 0
Carolina 3282 3 0 0 1
𝐷1 = ቊ
1 𝑠𝑒 𝑠𝑜𝑙𝑡𝑒𝑖𝑟𝑜
0 𝑠𝑒 𝑛ã𝑜
𝐷2 = ቊ
1 𝑠𝑒 𝑐𝑎𝑠𝑎𝑑𝑜
0 𝑠𝑒 𝑛ã𝑜
𝐷3 = ቊ
1 𝑠𝑒 𝑑𝑖𝑣𝑜𝑟𝑐𝑖𝑎𝑑𝑜
0 𝑠𝑒 𝑛ã𝑜
Criação de binárias
27
28
17/05/2024
15
Regressões com variáveis categóricas
• Passo 2: estimar o modelo incluindo 𝑘 − 1 categorias como variáveis 
explicativas. A categoria a ser retirada (de referência) fica a critério do 
analista. Mas, tenha em mente que os resultados das outras binárias 
serão interpretados em relação à categoria de referência.
ෝ𝑦𝑖 = 𝛼 + 𝛽1𝐷1 + 𝛽2𝐷2
ෝ𝑦𝑖 = 𝛼 + 𝛽1𝐷2 + 𝛽2𝐷3
ෝ𝑦𝑖 = 𝛼 + 𝛽1𝐷1 + 𝛽2𝐷3
𝐷3 (divorciado) será a categoria omitida (de referência)
𝐷1 (solteiro) será a categoria omitida (de referência)
𝐷2 (casado) será a categoria omitida (de referência)
Regressões com variáveis categóricas
• Passo 3: interpretar as 
estimativas. Vamos supor que o 
seguinte modelo foi estimado, com 
a variável solteiro omitida e todos 
os coeficiente estatisticamente 
significantes. Salário está em mil 
reais.
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3𝐷2 − 0,8𝐷3
29
30
17/05/2024
16
Regressões com variáveis categóricas
• Passo 3: interpretar as 
estimativas. Vamos supor que o 
seguinte modelo foi estimado, com 
a variável solteiro omitida e todos 
os coeficiente estatisticamente 
significantes. Salário está em mil 
reais.
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3𝐷2 − 0,8𝐷3
Qual é o salário esperado para a categoria solteiro 
(𝐷1)?
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3 ∗ 0 − 0,8 ∗ 0 = 1,5
Qual é o salário esperado para a categoria casado 
(𝐷2)?
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3 ∗ 1 − 0,8 ∗ 0 = 2,8
Qual é o salário esperado para a categoria 
divorciado (𝐷3)?
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3 ∗ 0 − 0,8 ∗ 1 = 0,7
Regressões com variáveis categóricas
• Passo 3: interpretar as 
estimativas. Vamos supor que o 
seguinte modelo foi estimado, com 
a variável solteiro omitida e todos 
os coeficiente estatisticamente 
significantes. Salário está em mil 
reais.
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3𝐷2 − 0,8𝐷3
Qual é o salário esperado para a categoria solteiro 
(𝐷1)?
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3 ∗ 0 − 0,8 ∗ 0 = 1,5
Qual é o salário esperado para a categoria casado 
(𝐷2)?
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3 ∗ 1 − 0,8 ∗ 0 = 2,8
Qual é o salário esperado para a categoria 
divorciado (𝐷3)?
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3 ∗ 0 − 0,8 ∗ 1 = 0,7
31
32
17/05/2024
17
Regressões com variáveis categóricas
• Passo 3: interpretar as 
estimativas. Vamos supor que o 
seguinte modelo foi estimado, com 
a variável solteiro omitida e todos 
os coeficiente estatisticamente 
significantes. Salário está em mil 
reais.
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3𝐷2 − 0,8𝐷3
Qual é o salário esperado para a categoria solteiro 
(𝐷1)?
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3 ∗ 0 − 0,8 ∗ 0 = 1,5
Qual é o salário esperado para a categoria casado 
(𝐷2)?
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3 ∗ 1 − 0,8 ∗ 0 = 2,8
Qual é o salário esperado para a categoria 
divorciado (𝐷3)?
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3 ∗ 0 − 0,8 ∗ 1 = 0,7
Regressões com variáveis categóricas
• O modelo estimado foi:
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3𝐷2 − 0,8𝐷3
• E vimos que:
Estado_civil Salário Esperado
Solteiro 1,5
Casado 2,8
Divorciado 0,7
33
34
17/05/2024
18
Regressões com variáveis categóricas
• O modelo estimado foi:
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3𝐷2 − 0,8𝐷3
• E vimos que:
Estado_civil Salário Esperado
Solteiro 1,5
Casado 2,8
Divorciado 0,7
Casados ganham 1,3 mil reais (2,8-1,5) a 
mais que a categoria de referência 
(solteiros)
Regressões com variáveis categóricas
• O modelo estimado foi:
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3𝐷2 − 0,8𝐷3
• E vimos que:
Estado_civil Salário Esperado
Solteiro 1,5
Casado 2,8
Divorciado 0,7
Divorciados ganham 0,8 mil reais a menos 
(0,7-1,5) do que a categoria de referência 
(solteiros)
35
36
17/05/2024
19
Regressões com variáveis categóricas
• De maneira mais prática, a interpretação pode ser realizada de 
maneira direta:
෣𝑠𝑎𝑙á𝑟𝑖𝑜𝑠 = 1,5 + 1,3𝐷2 − 0,8𝐷3
• Indivíduos casados (𝐷2 = 1) ganham 1,3 mil reais a mais do que a 
categoria de referência (solteiros).
• Indivíduos divorciados (𝐷3 = 1) ganham 0,8 mil reais a menos do que a 
categoria de referência (solteiros).
Regressões com variáveis categóricas
• E se o coeficiente estimado não for estatisticamente significativo? Isso 
significa que não há diferenças estatisticamente significantes entre a 
categoria analisada e a categoria de referência.
• Mais uma vez: a definição da categoria de referência (omitida), fica a 
critério do pesquisador). Faça da maneira mais conveniente. Isso não 
alterará os seus resultados, somente a interpretação.
• É preciso informar o software que você está incluindo uma variável 
categórica no modelo. Caso contrário o software a tratará como variável 
contínua.
37
38
17/05/2024
20
Regressões com variáveis categóricas
• Curiosidade: porque precisamos retirar uma categoria da análise? 
Para evitar a “armadilha” das variáveis binárias. O método de MQO 
exige que as variáveis explicativas não possuam relações lineares 
exatas. Em outras palavras, uma variável não pode ser combinação 
linear da outra.
Nome_cliente Salário Estado_civil 𝐷1 𝐷2 𝐷3
Ana 3723 1 1 0 0
Pedro 2320 2 0 1 0
Mariana 4131 3 0 0 1
Lucas 2029 1 1 0 0
Júlia 2499 1 1 0 0
Rafael 3517 2 0 1 0
Carolina 3282 3 0 0 1
Para qualquer caso, temos que:
𝐷1 + 𝐷2 + 𝐷3 = 1
Isso indica que há uma relação 
de colinearidade perfeita entre 
elas. Se uma variável tem valor 
1, as outras devem ser iguais a 0.
Regressões com variáveis categóricas
• E se eu “rodar”o meu modelo com todas as categorias? O modelo 
automaticamente excluirá uma categoria para a obtenção das 
estimativas.
• Sem isso, não é possível obter os parâmetros / estimativas.
39
40
17/05/2024
21
Variável de interação: 
produto entre variável 
contínua e binária
Variável de interação:
• Podemos ter um modelo de regressão múltipla explicando 𝑦 em função 
de uma variável contínua 𝑥 e de uma variável binária 𝐷
ො𝑦 = 𝛼 + 𝛽1𝑥 + 𝛽2𝐷
• Podemos, ainda, adicionar uma variável de interação entre a variável 
binária 𝐷 e a variável contínua 𝑥, que será o produto entre elas:
ො𝑦 = 𝛼 + 𝛽1𝑥 + 𝛽2𝐷 + 𝛽3𝐷 ∗ 𝑥
41
42
17/05/2024
22
Variável de interação:
• Considere o seguinte modelo de salários:
ො𝑦 = 𝛼 + 𝛽1𝑒𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑𝑒 + 𝛽2𝑚𝑢𝑙ℎ𝑒𝑟 + 𝛽3𝑚𝑢𝑙ℎ𝑒𝑟 ∗ 𝑒𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑𝑒
• Em que mulher é uma variável binária com valor 1 para mulher e 0 
para homem.
ො𝑦 = 𝛼 + 𝛽1𝑒𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑𝑒 + 𝛽2𝑚𝑢𝑙ℎ𝑒𝑟 + 𝛽3𝑚𝑢𝑙ℎ𝑒𝑟 ∗ 𝑒𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑𝑒
Retorno da escolaridade 
nos salários
Salário das mulheres em 
relação ao salário dos homens
Retorno da escolaridade para as 
mulheres em relação ao retorno da 
escolaridade para os homens
Variável de interação:
• Na base de dados ficaria algo como:
Salario Escolaridade Mulher Escolaridade*mulher
1000 0 0 0
2300 2 1 2
3000 6 0 0
2000 4 1 4
1800 0 1 0
900 12 1 12
43
44
17/05/2024
23
Variável de interação:
• Suponha que estimamos o seguinte modelo, com coeficientes estatisticamente significativos:
ො𝑦 = 200 + 20 ∗ 𝑒𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑𝑒 − 100 ∗ 𝑚𝑢𝑙ℎ𝑒𝑟 − 12 ∗ (𝑚𝑢𝑙ℎ𝑒𝑟 ∗ 𝑒𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑𝑒)
• Se homem:
ො𝑦 = 200 + 20 ∗ 𝑒𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑𝑒 − 100 ∗ 0 − 12 ∗ 0 ∗ 𝑒𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑𝑒 = 200 + 20 ∗ 𝑒𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑𝑒
• Se mulher:
ො𝑦 = 200 + 20 ∗ 𝑒𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑𝑒 − 100 ∗ 1 − 12 ∗ 1 ∗ 𝑒𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑𝑒 = 100 + 8 ∗ 𝑒𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑𝑒
• Conclusão: o retorno da escolaridade das mulheres é R$12 inferior ao retorno da 
escolaridade dos homens.
45
46
	Slide 1
	Slide 2
	Slide 3
	Slide 4
	Slide 5
	Slide 6
	Slide 7
	Slide 8
	Slide 9
	Slide 10
	Slide 11
	Slide 12
	Slide 13
	Slide 14
	Slide 15
	Slide 16
	Slide 17
	Slide 18
	Slide 19
	Slide 20
	Slide 21
	Slide 22
	Slide 23
	Slide 24
	Slide 25
	Slide 26
	Slide 27
	Slide 28
	Slide 29
	Slide 30
	Slide 31
	Slide 32
	Slide 33
	Slide 34
	Slide 35
	Slide 36
	Slide 37
	Slide 38
	Slide 39
	Slide 40
	Slide 41
	Slide 42
	Slide 43
	Slide 44
	Slide 45
	Slide 46

Mais conteúdos dessa disciplina