Baixe o app para aproveitar ainda mais
Prévia do material em texto
Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Econometria I Modelos de reposta binários Frederico Uchôa FCE/UFBA 22 de fevereiro de 2021 ECOA93 Frederico Uchôa 1 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Caracterização • Trataremos aqui de modelos de regressão cuja variável dependente pertence a m categorias mutuamente exclusivas. • �ando m = 2 temos uma variável dependente binária • Os dois resultados possíveis são geralmente denotados por 0 e 1. • Esse tipo de variável é também chamada de variável dummy ou dicotômicas. • Por exemplo, considere uma pessoa que vota no segundo turno de uma eleição: • 1 se a pessoa vota em certo candidato; 0 caso contrário. • Obviamente, os valores 1 e 0 são arbitrários. ECOA93 Frederico Uchôa 2 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Caracterização • O valor esperado de uma variável dicotômica yi ∈ [0, 1] é a probabilidade de assumir o valor 1. • Considere, E (yi) = 0.P (yi = 0) + 1.P (yi = 1) = P (yi = 1) • Então, o modelo de regressão linear yi = x ′i β + ui é chamado de modelo linear de probabilidade. ECOA93 Frederico Uchôa 3 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Caracterização • Esse modelo não é um modelo estatístico adequado para o valor esperado E (yi|xi) = x ′i β. • O lado esquerdo da equação assume valores entre 0 e 1, mas o lado direito pode assumir qualquer valor real. • Observe que os valores de ŷi podem não respeitar o intervalo [0, 1]. • Mas os valores esperados são probabilidades condicionais. • Se o intervalo não é respeitado, podemos ter probabilidades negativas ou maiores que 1. • Além disso, o termo de erro é heterocedástico. ECOA93 Frederico Uchôa 4 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Caracterização • ui é certamente não normal pois ui = 1− x ′ i β se yi = 1 −x ′i β se yi = 10 • E a variância de ui é dada por Var (ui) = x ′i β (1− x ′i β) ECOA93 Frederico Uchôa 5 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Caracterização Figura 1: Valores ajustados de modelo de regressão de um linear de probabilidade. 10 15 20 25 30 0. 0 0. 2 0. 4 0. 6 0. 8 1. 0 x y ECOA93 Frederico Uchôa 6 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Modelos Probit e Logit • Os modelos Logit e Probit partem da suposição de que a variável dependente (dicotômica) é apenas a manifestação observável de uma variável não observável (dita variável latente) (Wooldridge, 2002). • A diferença entre os modelos é a suposição sobre a distribuição do erro: • Se o erro tem distribuição normal, o modelo adequado é o Probit; ou • Se o erro tem distribuição logística, o modelo adequado é o Logit. • A probabilidade condicional de escolher a alternativa A dado X é dada por P (yi = 1|xi) = F (zi) = F (x ′i β) ECOA93 Frederico Uchôa 7 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Modelos Probit e Logit • A função F mapeia zi em [0, 1] e satisfaz as condições F (−∞) = 0, F (∞) = 2 e ∂F (z) ∂z > 0 • Por exemplo, no modelo linear de probabilidade a função F (·) é a identidade, ou seja, F (x ′i β) = x ′ i β • Os modelos Logit e Probit especificam F (·) como uma função de distribuição cumulativa (cdf) para garantir que as probabilidades respeitem o intervalo [0, 1]. ECOA93 Frederico Uchôa 8 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Modelos Probit e Logit • O modelo Probit assume que a função F é a função de distribuição cumulativa (cdf) da distribuição normal padrão. • Nesse caso, as probabilidades da variável resposta são P (yi = 1|xi) = Φ (x ′i β) = ∫ x′i β −∞ φ (z) dz em que φ (z) = 1√ 2π e − 1 2 z2 é a pdf e Φ (·) a cdf da distribuição normal padrão. ECOA93 Frederico Uchôa 9 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Modelos Probit e Logit • Já modelo Logit assume que a função F é a função logística. • Nesse caso, as probabilidades da variável resposta são P (yi = 1|xi) =Λ (x ′i β) = ex ′ i β 1 + ex′i β = 1 1 + e−x′i β ECOA93 Frederico Uchôa 10 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Modelos Probit e Logit • Os modelos Logit e Probit são quase idênticos e a decisão de qual dos dois modelos usar é arbitrária. • No entanto, os parâmetros β dos dois modelos são de escalas de diferentes. • Se multiplicarmos os β no modelo Probit por 1, 6 o valor será o mesmo que os do modelo Logit. • A Figura a seguir mostra como a transformação se comporta em ambos os modelos • Observe que os valores de P (yi = 1|zi) agora respeitam o intervalo [0, 1]. ECOA93 Frederico Uchôa 11 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Modelos Probit e Logit Figura 2: Mapeamento de zi pelos modelos Probit e Logit. 10 15 20 25 30 0. 0 0. 2 0. 4 0. 6 0. 8 1. 0 zi F (z i) Probit Logit ECOA93 Frederico Uchôa 12 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação • Assumimos que a amostra tem n observações independentes: {yi, xi}ni=1. • Como o modelo é binomial, a suposição de independência entre as observações nos garante que a distribuição da variável dependente é a Bernoulli. • A variável dependente assume os valores 0 ou 1, o que nos permite escrever a função de probabilidade do seguinte modo: F (x ′i β) y (1− F (x ′i β)) 1−y = F (x ′ i β) se y = 1 1− F (x ′i β) se y = 0 . ECOA93 Frederico Uchôa 13 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação • Ambos os modelos, Probit e Logit, são estimados por Máxima Verossimilhança (ML). • Se as observações são independentes entre si temos que L = ∏ i|yi=0 P (yi = 0|xi) ∏ i|yi=1 P (yi = 1|xi) = n∏ i=1 [1− F (zi)]1−yi F (zi)yi ECOA93 Frederico Uchôa 14 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação • O log da função verossimilhança é logL = n∑ i=1 {yi log F (zi) + (1− yi) log [1− F (zi)]} • O Estimador de MV (EMV) é obtido a partir da condição de primeira ordem da maximização: ∂ logL ∂β = n∑ i=1 [ yi F (zi) f (zi)− 1− yi 1− F (zi) + f (zi) ] xi ECOA93 Frederico Uchôa 15 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação ∂ logL ∂β = n∑ i=1 yi F ( x ′i β̂ ) f (x ′i β̂) xi − 1− yi 1− F ( x ′i β̂ ) + f (x ′i β̂) xi = n∑ i=1 yi − F ( x ′i β̂ ) F ( x ′i β̂ ) [ 1− F ( x ′i β̂ )] f (x ′i β̂) xi em que f (·) = ∂F (zi) ∂zi . ECOA93 Frederico Uchôa 16 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação • No caso do modelo Probit temos ∂ logL ∂β = ∑ i|yi=0 −φ (zi) 1− Φ (zi) xi + ∑ i|yi=1 φ (zi) Φ (zi) xi = 0 • No caso do modelo Logit temos ∂ logL ∂βk = n∑ i=0 ( yi − ezi 1 + ezi ) xik = 0 ECOA93 Frederico Uchôa 17 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação • Não há solução fechada as condições de primeira ordem e rotinas de otimização numérica devem ser usadas. • O log da função de verossimilhança é côncavo em ambos os modelos e as rotinas numéricas convergem bem para o máximo global único. • O EMV de β é consistente e normalmente distribuído assintoticamente.• Com base nos partir dos resultados EMV sabemos que β̂ ∼ N (β,Avar (β)) • A variância de β é obtida a partir da matriz de informação. ECOA93 Frederico Uchôa 18 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação • Primeiro notamos a igualdade −E ( ∂2L ∂β∂β′ ) = E [( ∂2L ∂β )( ∂2L ∂β′ )] • Depois escrevemos as derivadas da segunda parte da igualdade acima ∂2L ∂β = yi − F ( x ′i β̂ ) F ( x ′i β̂ ) [ 1− F ( x ′i β̂ )] f (x ′i β̂) xi e ECOA93 Frederico Uchôa 19 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação ∂2L ∂β′ = yi − F ( x ′i β̂ ) F ( x ′i β̂ ) [ 1− F ( x ′i β̂ )] f (x ′i β̂) x ′i • Então −E ( ∂2L ∂β∂β′ ) = E yi − F ( x ′i β̂ ) F ( x ′i β̂ ) [ 1− F ( x ′i β̂ )] f (x ′i β̂) xi yi − F ( x ′i β̂ ) F ( x ′i β̂ ) [ 1− F ( x ′i β̂ )] f (x ′i β̂) x ′i ECOA93 Frederico Uchôa 20 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação −E ( ∂2L ∂β∂β′ ) = E yi − F ( x ′i β̂ ) F ( x ′i β̂ ) [ 1− F ( x ′i β̂ )] 2 f (x ′i β̂)2 xix ′i • Usando a Lei das Expectativas Iteradas E [E (Y |X)] = E (Y) temos −E ( ∂2L ∂β∂β′ ) = E E yi − F ( x ′i β̂ ) F ( x ′i β̂ ) [ 1− F ( x ′i β̂ )] 2 f (x ′i β̂)2 xix ′i | xi ECOA93 Frederico Uchôa 21 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação −E ( ∂2L ∂β∂β′ ) = E E {[ yi − F ( x ′i β̂ )]2 | xi }2 F ( x ′i β̂ )2 [ 1− F ( x ′i β̂ )]2 f (x ′i β̂)2 xix ′i • Observe que usando a fórmula da variância, Var (X) = E (X 2)− [E (X)]2, temos E {[ yi − F ( x ′i β̂ )]2 | xi } = Var {[ yi − F ( x ′i β̂ )]2 | xi } + E [ yi − F ( x ′i β̂ ) | xi ]2 ECOA93 Frederico Uchôa 22 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação • Ademais, E {[ yi − F ( x ′i β̂ )] | xi } = E (yi|xi)− F ( x ′i β̂ ) = F ( x ′i β̂ ) − F ( x ′i β̂ ) = 0 e Var {[ yi − F ( x ′i β̂ )]2 | xi } = F ( x ′i β̂ ) [ 1− F ( x ′i β̂ )] ECOA93 Frederico Uchôa 23 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação • Logo, chegamos a −E ( ∂2L ∂β∂β′ ) = E F ( x ′i β̂ ) [ 1− F ( x ′i β̂ )] F ( x ′i β̂ )2 [ 1− F ( x ′i β̂ )]2 f (x ′i β̂)2 xix ′i = E f ( x ′i β̂ )2 F ( x ′i β̂ )2 [ 1− F ( x ′i β̂ )] xix ′i ECOA93 Frederico Uchôa 24 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação • Então, o estimador do valor esperado da matriz de informação (Hessiana) é I = −E ( ∂2L ∂β∂β′ ) = 1 n n∑ i=1 f ( x ′i β̂ )2 F ( x ′i β̂ )2 [ 1− F ( x ′i β̂ )]xix ′i ECOA93 Frederico Uchôa 25 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação • Na verdade, três estimadores podem ser usados. • Esses estimadore são assintoticamente equivalentes, mas seu desempenho varia em amostras infinitas. • A inversa do negativo da matriz de Hessiana. • A inversa da matriz de informação. • A inversa do produto externo das derivadas de primeira ordem (BHHH). • No geral, a matriz Hessiana e a matriz de informação têm resultados quase idênticos e levam a estimativas mais precisas da matriz de covariâncias do que o estimador baseado nas derivadas de primeira ordem. ECOA93 Frederico Uchôa 26 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação • Observação importante! • O EMV dos modelos Probit e Logit baseia-se na suposição (forte) de homoscedasticidade e normalidade na distribuição dos erros. • O EMV é inconsistente sob heterocedasticidade • E o problema não é resolvido mesmo que estimadores robustos de covariância sejam usados. • Há solução passa por estratégias de estimação semiparamétricas que relaxam essas suposições. ECOA93 Frederico Uchôa 27 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação • Em geral, os parâmetros não são diretamente interpretáveis. • Estamos interessados no efeito marginal de uma mudança em xik sobre o valor esperado de yi . • O parametrização do modelo Logit é muito conveniente por que simplifica sobremaneira a álgebra. • Uma propriedade interessante é ∂Λ (zi) ∂zi = ezi (1 + ezi )2 e 1− Λ (zi) = 1 (1 + ezi ) ECOA93 Frederico Uchôa 28 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação e, então, ∂Λ (zi) ∂zi = Λ (zi) [1− Λ (zi)] • A condição de primeira ordem EMV é n∑ i=1 [ yi − Λ ( x ′i β̂ )] xi = 0 ECOA93 Frederico Uchôa 29 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação • A expressão da variância assintótica é simplificada para Ω = E { Λ ( x ′i β̂ ) [ 1− Λ ( x ′i β̂ )] xix ′i }−1 • Os efeitos marginais são dados por ∂P (yi = 1|xi) ∂xik = Λ (x ′i β) [1− Λ (x ′i β)]βk ECOA93 Frederico Uchôa 30 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação • No caso do modelo Probit as probabilidades condicionais são dadas pela cdf normal padrão e a condição de primeira ordem para a maximização do EMV é n∑ i=1 yi − Φ ( x ′i β̂ ) Φ ( x ′i β̂ ) [ 1− Φ ( x ′i β̂ )]φ(x ′i β̂) xi = 0 • Os efeitos marginais são dados por ∂P (yi = 1|xi) ∂xik = φ (x ′i β)βk ECOA93 Frederico Uchôa 31 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Estimação • E a expressão da variância assintótica é Ω = E φ ( x ′i β̂ )2 Φ ( x ′i β̂ ) [ 1− Φ ( x ′i β̂ )]xx ′ −1 ECOA93 Frederico Uchôa 32 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Efeitos marginais • Lembrete: o parâmetro de inclinação do modelo de regressão linear mede o efeito marginal da variável explicativa sobre a variável dependente. • Logo, o efeito marginal depende do valor da variável explicativa. • E, portanto, existe um efeito marginal individual para cada observação da amostra. • Dois tipos diferentes de efeitos marginais podem ser calculados: ECOA93 Frederico Uchôa 33 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Efeitos marginais • Efeito marginal médio: • Calculamos a derivada de uma variável mantendo as demais constantes. • Usamos uma variação infinitesimal no valor da variável explicativa para calcular o efeito médio nas observações. • Efeito marginal na média: • Mantemos constantes a maioria das variáveis explicativas enquanto analisa-se para uma das variáveis da equação. • Esta abordagem é mais fácil de entender, mas pode resultar em cenários altamente irrealistas se as variáveis explicativas forem altamente correlacionadas (por exemplo, em manter a idade constante enquanto varia o status de aposentado para não aposentado) . ECOA93 Frederico Uchôa 34 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Efeitos marginais • Se a variável explicativa analisada é contínua temos ∂P (yi = 1) ∂xik = φ ( x ′β̂ ) β̂ • Logo, para uma variável explicativa contínua o efeito marginal na probabilidade é proporcional ao efeito no índice ( x ′β̂ ) . • Se a variável explicativa analisada é dicotômica temos que: • O efeito marginal na probabilidade é igual ao valor de Φ ( x ′β̂ ) quando xik = 1 menos o valor de Φ ( x ′β̂ ) quando xik = 0, tudo o mais constante. ECOA93 Frederico Uchôa 35 / 59 Caracterização ModelosProbit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Efeitos marginais • Observe que o efeito marginal depende de xi e, portanto, podemos • Usar valores de xi teoricamente mais relevantes. • Usar os valores médios de x.i , o que produzirá Efeitos Marginais na Média. • Calcular os efeitos marginais para todos os valores de xi e obter a média, o que produzirá os Efeitos Marginais Médios (AME). ECOA93 Frederico Uchôa 36 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Efeitos marginais • No caso do Efeitos Marginais Médio teremos • Variáveis contínuas 1 n n∑ i=1 φ ( x ′i β̂ ) β̂ • Variáveis dicotômicas 1 n n∑ i=1 [ φ ( x ′i β̂|xik = 1 ) − φ ( x ′i β̂|xik = 0 )] ECOA93 Frederico Uchôa 37 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Efeitos marginais • Já vimos que o modelo de regressão linear não ajusta corretamente aos dados quando y assume os valores no intervalo [0, 1]. • No entanto, podemos modelar a probabilidade de y = 1 • Para simplificar vamos chamar π = P (yi = 1) e, então, log ( π 1− π ) = x ′i β̂ π 1− π = e x′i β̂ π = ex ′ i β̂ 1 + ex ′ i β̂ ECOA93 Frederico Uchôa 38 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Efeitos marginais • No modelo Logit o log da razão de probabilidades (log odds ratio), log ( π 1− π ) , é linear nos regressores. • Os coeficientes na regressão Logit são interpretados em termos de odds ratio. • Esta expressão é interessante porque nos permite interpretar β como uma semi-elasticidade. • Além disso, o Logit é facilmente convertido de volta nas probabilidades. • Para simplificar, considere um modelo que tem apenas uma variável explicativa e vamos chamar a razão de probabilidades de OR. ECOA93 Frederico Uchôa 39 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Efeitos marginais • Se considerarmos o impacto do aumento de uma unidade em, digamos, x a equação de regressão logística será OR∗ = π∗ 1− π∗ = β0 + β1 (x1 + 1) • Podemos isolar a inclinação calculando a diferença entre essas as equações, isto é, OR∗ OR = eβ0+β1(x1+1) eβ0+β1x1 =eβ1 ECOA93 Frederico Uchôa 40 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Efeitos marginais • E, então, log ( OR∗ OR ) = β1 • Com mais de uma variável explicativa a intuição é a mesma: uma mudança de uma unidade em das variáveis explicativas altera a razão de chances (multiplicativa) pelo fator de eβk . • Também podemos interpretar da seguinte maneira: uma mudança de uma unidade em xk aumenta o log da rasão de probabilidades em βk . ECOA93 Frederico Uchôa 41 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Modelos multinomiais • Os modelos que vimos até aqui podem ser generalizados para o caso em que os indivíduos escolhem m > 2 alternativas mutuamente excludentes. • A maior diferença é que agora temos que distinguir entre o caso em que as alternativas disponíveis são ordenadas ou não. • É conveniente pensarmos em m variáveis binárias yj , j = 1, . . . ,m, cada uma delas assumindo o valor 1 se a categoria j é selecionada ou, caso contrário, 0. • Como resultado podemos escrever 1 n n∑ i=1 yij =P (y = j) ECOA93 Frederico Uchôa 42 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Modelos multinomiais • O fato de as alternativas serem mutuamente exclusivas implica que somente um dos yi1, . . . , yim assume o valor 1 enquanto os demais permanecem com valor 0. • Um modelo multinomial, no qual a probabilidade condicional de escolher a alternativa j dado X é dado por P (y = j|X) = Fj (Xβ) em que m∑ j=1 pj = 1. • A especificação de F (·) determina o modelo empregado. ECOA93 Frederico Uchôa 43 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Modelos multinomiais • Essa notação geral é útil por que os resultados permite obter resultados gerais. • Observe que o modelo binário é um caso especial nesta notação. • Assim como antes, assumimos uma amostra de n observações independentes, mas y dado X segue uma distribuição multinomial, que pode ser escrita de uma forma muito compacta como m∏ j=1 pyjj = p1 se y = 1 p2 se y = 2 ... pm se y = m ECOA93 Frederico Uchôa 44 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Modelos multinomiais • A função de verossimilhança é L = n∑ i=1 m∑ j=1 yij log Fj (x ′i β) • O EMV de β é dado por ∂L ∂β = yij Fj (x ′i β) fj ( x ′i β̂ ) xi = 0 em que fj (z) ≡ ∂Fj (z) ∂z . ECOA93 Frederico Uchôa 45 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Modelos multinomiais • A variância de β é obtida a partir da matriz de informação Ω = −E ( ∂2L ∂β∂β′ ) = E m∑ j=1 ( yj p2j ∂pj ∂β ∂pj ∂β′ − yj pj ∂pj ∂β∂β′ ) ECOA93 Frederico Uchôa 46 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Modelos multinomiais • Os efeitos marginais são calculados do mesmo modo que no caso binomial. • No entanto, o sinal do coeficiente não é necessariamente o mesmo que o sinal do efeito marginal correspondente. • Depende se estamos analisando uma variável varia ou não entre as alternativas. • No primeiro caso, o efeito marginal indica, tudo o mais constante, quanto as probabilidades mudam quando a variável explicativa muda de alternativa. • No segundo, a condição coeteris paribus não tem sentido por que variação de um dos regressores se dá em todas as alternativas. ECOA93 Frederico Uchôa 47 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Ilustração no R • Vamos usar como exemplo uma base de dados sobre a eleição de 2018. • Digamos que nosso interesse seja avaliar como a desigualdade se relaciona com a probabilidade de vitória do candidato Jair Bolsonaro. • No R podemos ajustar modelos com variáveis dependentes dicotômicas com a função glm. • Primeiro vamos ajustar um modelo Linear, depois um Probit e, finalmente, o modelo Logit. • Como veremos em ambos os modelos, há uma relação negativa entre a probabilidade de vitória (y = 1) e a variável explicativa. • Conforme a desigualdade em 2010 aumenta, a probabilidade de vitória diminui. ECOA93 Frederico Uchôa 48 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Ilustração no R ### data <- read.csv('dados-bolsonaro-2018.csv', sep = ',') ### linear <- glm(DumBol2018 ~ gini2010, data = data, family = gaussian) ### #summary(linear) ECOA93 Frederico Uchôa 49 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Ilustração no R ## ## Call: ## glm(formula = DumBol2018 ~ gini2010, family = gaussian, data = data) ## ## Deviance Residuals: ## Min 1Q Median 3Q Max ## -0.92472 -0.45356 -0.00808 0.44083 1.19315 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 1.75242 0.04914 35.66 <2e-16 *** ## gini2010 -2.57471 0.09980 -25.80 <2e-16 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## (Dispersion parameter for gaussian family taken to be 0.2233462) ## ## Null deviance: 1391.1 on 5564 degrees of freedom ## Residual deviance: 1242.5 on 5563 degrees of freedom ## (31 observations deleted due to missingness) ## AIC: 7454.7 ## ## Number of Fisher Scoring iterations: 2 ECOA93 Frederico Uchôa 50 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R ReferênciasIlustração no R Figura 3: Modelo Linear da probabilidade vitória, dada a desigualdade em 2010. 0.3 0.4 0.5 0.6 0.7 0.8 − 0. 2 0. 0 0. 2 0. 4 0. 6 0. 8 1. 0 1. 2 Desigualdade V itó ria ( y= 1) ECOA93 Frederico Uchôa 51 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Ilustração no R ### probit <- glm(DumBol2018 ~ gini2010, data = data, family = binomial(link = 'probit')) ### #summary(probit) ECOA93 Frederico Uchôa 52 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Ilustração no R ## ## Call: ## glm(formula = DumBol2018 ~ gini2010, family = binomial(link = "probit"), ## data = data) ## ## Deviance Residuals: ## Min 1Q Median 3Q Max ## -2.0660 -1.0926 -0.4197 1.0666 2.6866 ## ## Coefficients: ## Estimate Std. Error z value Pr(>|z|) ## (Intercept) 3.4852 0.1480 23.55 <2e-16 *** ## gini2010 -7.1604 0.3018 -23.72 <2e-16 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## (Dispersion parameter for binomial family taken to be 1) ## ## Null deviance: 7714.2 on 5564 degrees of freedom ## Residual deviance: 7080.6 on 5563 degrees of freedom ## (31 observations deleted due to missingness) ## AIC: 7084.6 ## ## Number of Fisher Scoring iterations: 4 ECOA93 Frederico Uchôa 53 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Ilustração no R Figura 4: Modelo Probit da probabilidade vitória, dada a desigualdade em 2010. 0.3 0.4 0.5 0.6 0.7 0.8 − 0. 2 0. 0 0. 2 0. 4 0. 6 0. 8 1. 0 1. 2 Desigualdade V itó ria ( y= 1) ECOA93 Frederico Uchôa 54 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Ilustração no R ### logit <- glm(DumBol2018 ~ gini2010, data = data, family = binomial(link = 'logit')) ### #summary(logit) ECOA93 Frederico Uchôa 55 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Ilustração no R ## ## Call: ## glm(formula = DumBol2018 ~ gini2010, family = binomial(link = "logit"), ## data = data) ## ## Deviance Residuals: ## Min 1Q Median 3Q Max ## -2.0433 -1.0847 -0.4375 1.0667 2.5495 ## ## Coefficients: ## Estimate Std. Error z value Pr(>|z|) ## (Intercept) 5.7800 0.2526 22.88 <2e-16 *** ## gini2010 -11.8976 0.5160 -23.06 <2e-16 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## (Dispersion parameter for binomial family taken to be 1) ## ## Null deviance: 7714.2 on 5564 degrees of freedom ## Residual deviance: 7074.4 on 5563 degrees of freedom ## (31 observations deleted due to missingness) ## AIC: 7078.4 ## ## Number of Fisher Scoring iterations: 4 ECOA93 Frederico Uchôa 56 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Ilustração no R Figura 5: Modelo Logit da probabilidade vitória, dada a desigualdade em 2010. 0.3 0.4 0.5 0.6 0.7 0.8 − 0. 2 0. 0 0. 2 0. 4 0. 6 0. 8 1. 0 1. 2 Desigualdade V itó ria ( y= 1) ECOA93 Frederico Uchôa 57 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Ilustração no R • Agora, vamos calcular a odd ratio. • Vamos precisar do pacote oddsratio. ### or_glm(data = data, model = logit, incr = list(gini2010 = 0.1)) ## predictor oddsratio ci_low (2.5) ci_high (97.5) increment ## 1 gini2010 0.304 0.275 0.336 0.1 ECOA93 Frederico Uchôa 58 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelos multinomiais Ilustração no R Referências Bibliografia Wooldridge, J. M. (2002), Econometric analysis of cross section and panel data, 1 ed., The MIT Press. ECOA93 Frederico Uchôa 59 / 59 Caracterização Modelos Probit e Logit Efeitos marginais Modelo Probit Modelo Logit Modelos multinomiais Ilustração no R Referências
Compartilhar