Baixe o app para aproveitar ainda mais
Prévia do material em texto
Variáveis Dummies Cap. 9 INTRODUÇÃO: Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino Dummy; variável artificial para quantificar atributo. 𝐷𝑢𝑚𝑚𝑦 1, 𝑝𝑟𝑒𝑠𝑒𝑛ç𝑎 𝑑𝑜 𝑎𝑡𝑟𝑖𝑏𝑢𝑡𝑜 0, 𝑎𝑢𝑠ê𝑛𝑐𝑖𝑎 𝑑𝑜 𝑎𝑡𝑟𝑖𝑏𝑢𝑡𝑜 1) Modelos de Análise da Variância (ANOVA) 𝑖) 𝑌𝑖 = 𝛽1 + 𝛽2𝐷2𝑖+ ∈𝑖 𝑖𝑖) 𝑌𝑖 = 𝛽1 + 𝛽2𝐷2𝑖 + 𝛽3𝐷3𝑖+ ∈𝑖 𝑖𝑖. 1) 𝐸(𝑌𝑖|𝐷2𝑖 = 1, 𝐷3𝑖 = 0) = 𝛽1 + 𝛽2 𝑖𝑖. 2) 𝐸(𝑌𝑖|𝐷2𝑖 = 0, 𝐷3𝑖 = 1) = 𝛽1 + 𝛽3 𝑖𝑖. 3) 𝐸(𝑌𝑖|𝐷2𝑖 = 0,𝐷3𝑖 = 0) = 𝛽1 𝑖. 1) 𝐸(𝑌𝑖|𝐷2𝑖 = 1) = 𝛽1 + 𝛽2 𝑖. 2) 𝐸(𝑌𝑖|𝐷2𝑖 = 0) = 𝛽1 Variáveis Dummies 2 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino Salário inicial (Y) Milhares de dólares Sexo D=1: masculino D=0: feminino 22,0 1 19,0 0 18,0 0 21,7 1 18,5 0 21,0 1 20,5 1 17,0 0 17,5 0 21,2 1 𝐸𝑥𝑒𝑚𝑝𝑙𝑜𝑠 1 − 𝐸𝑠𝑡𝑖𝑚𝑎𝑟 𝑚𝑎𝑛𝑢𝑎𝑙𝑚𝑒𝑛𝑡𝑒 𝑜 𝑚𝑜𝑑𝑒𝑙𝑜 𝑑𝑒 𝑠𝑎𝑙á𝑟𝑖𝑜 𝑑𝑜 𝑝𝑟𝑜𝑓𝑒𝑠𝑠𝑜𝑟 𝑢𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑡á𝑟𝑖𝑜: 𝑖. 1) 𝐸(𝑌𝑖 𝐷2𝑖 = ? 𝑖. 2) 𝐸(𝑌𝑖 𝐷2𝑖 = 1 = ? 𝑖. 3) 𝐸(𝑌𝑖 𝐷2𝑖 = 0 = ? 𝑖) 𝑌𝑖= 𝛽1 + 𝛽2𝐷2𝑖+ ∈𝑖 Variáveis Dummies 3 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino 𝑖𝑖) 𝑌𝑖 = 𝛽1 + 𝛽2𝐷2𝑖 + 𝛽3𝐷3𝑖+ ∈𝑖 em que 𝐷2𝑖 𝑁𝑜𝑟𝑑𝑒𝑠𝑡𝑒 𝑒 𝐶𝑒𝑛𝑡𝑟𝑜 − 𝑂𝑒𝑠𝑡𝑒 ; 𝑒 𝐷3𝑖 (Sul) 𝐸𝑥𝑒𝑚𝑝𝑙𝑜𝑠 2: Salário dos professores da escola pública, por região (tabela 9.1) – Oeste, Nordeste, Centro-Oeste e Sul 𝑖𝑖. 1) 𝐸(𝑌𝑖 𝐷2𝑖 = 1,𝐷3𝑖 = 0 = 24.424,14 𝑖𝑖. 2) 𝐸(𝑌𝑖|𝐷2𝑖 = 0, 𝐷3𝑖 = 1) = 22.894,00 𝑖𝑖. 3) 𝐸(𝑌𝑖|𝐷2𝑖 = 0, 𝐷3𝑖 = 0) = 26.158,62 𝑖𝑖) 𝐸(𝑌𝑖 𝐷2𝑖 , 𝐷3𝑖 = 26.158,62 − 1.734,473𝐷2𝑖 − 3.264,615𝐷3𝑖 Variáveis Dummies 4 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino 𝑨𝒓𝒎𝒂𝒅𝒊𝒍𝒉𝒂 𝒅𝒂𝒔 𝑽𝒂𝒓𝒊á𝒗𝒆𝒊𝒔 𝑩𝒊𝒏á𝒓𝒊𝒂𝒔 𝐷𝑒𝑡(𝑋’𝑋)−1= 0 𝑚𝑎𝑡𝑟𝑖𝑧 𝑠𝑖𝑛𝑔𝑢𝑙𝑎𝑟 Obs: Teste o exercí𝑐𝑖𝑜 𝑑𝑜 𝑒𝑥𝑒𝑚𝑝𝑙𝑜 1 Modelo 1: MQO, usando as observações 1960-1969 (T = 10) Variável dependente: Sal Omitido devido a colinearidade exata: D2 Coeficiente Erro Padrão razão-t p-valor const 18 0,311769 57,7350 <0,0001 *** D1 3,28 0,440908 7,4392 <0,0001 *** Média var. dependente 19,64000 D.P. var. dependente 1,849444 Soma resíd. quadrados 3,888000 E.P. da regressão 0,697137 R-quadrado 0,873701 R-quadrado ajustado 0,857913 F(1, 8) 55,34156 P-valor(F) 0,000073 Log da verossimilhança −9,465934 Critério de Akaike 22,93187 Critério de Schwarz 23,53704 Critério Hannan-Quinn 22,26800 rô 0,599856 Durbin-Watson 0,667284 Variáveis Dummies 5 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino 𝑨𝒓𝒎𝒂𝒅𝒊𝒍𝒉𝒂 𝒅𝒂𝒔 𝑽𝒂𝒓𝒊á𝒗𝒆𝒊𝒔 𝑩𝒊𝒏á𝒓𝒊𝒂𝒔 𝐷𝑒𝑡(𝑋’𝑋)−1= 0 𝑚𝑎𝑡𝑟𝑖𝑧 𝑠𝑖𝑛𝑔𝑢𝑙𝑎𝑟 𝑺𝒐𝒍𝒖çã𝒐 𝟏:Estimação do modelo sem intercepto Os estimadores fornecerão diretamente os valores médios das diversas categorias Obs: Teste o exercí𝑐𝑖𝑜 𝑑𝑜 𝑒𝑥𝑒𝑚𝑝𝑙𝑜 1 Modelo 3: MQO, usando as observações 1960-1969 (T = 10) Variável dependente: Sal Coeficiente Erro Padrão razão-t p-valor D1 21,28 0,311769 68,2556 <0,0001 *** D2 18 0,311769 57,7350 <0,0001 *** Média var. dependente 19,64000 D.P. var. dependente 1,849444 Soma resíd. quadrados 3,888000 E.P. da regressão 0,697137 R-quadrado 0,873701 R-quadrado ajustado 0,857913 F(1, 8) 55,34156 P-valor(F) 0,000073 Log da verossimilhança −9,465934 Critério de Akaike 22,93187 Critério de Schwarz 23,53704 Critério Hannan-Quinn 22,26800 rô 0,599856 Durbin-Watson 0,667284 Variáveis Dummies 6 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino 𝑨𝒓𝒎𝒂𝒅𝒊𝒍𝒉𝒂 𝒅𝒂𝒔 𝑽𝒂𝒓𝒊á𝒗𝒆𝒊𝒔 𝑩𝒊𝒏á𝒓𝒊𝒂𝒔 𝐷𝑒𝑡(𝑋’𝑋)−1= 0 𝑚𝑎𝑡𝑟𝑖𝑧 𝑠𝑖𝑛𝑔𝑢𝑙𝑎𝑟 𝑺𝒐𝒍𝒖çã𝒐 𝟐:Se uma variável qualitativa tem “m” categorias, introduz−se apenas “m−1” variáveis binárias Obs: Teste o exercí𝑐𝑖𝑜 𝑑𝑜 𝑒𝑥𝑒𝑚𝑝𝑙𝑜 1 Variáveis Dummies 7 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino 2) Modelos de Análise da Variância-covariância (ANCOVA) 2.1) Regressões Paralelas: 𝑌𝑖 = 𝛽1 + 𝛽2𝐷2𝑖 + 𝛽3𝐷3𝑖 + 𝛽4𝑋𝑖+ ∈𝑖 ∴ 𝑋 é a covariável Testar exercício 2 (Tabela 9.1 – Gujarati): salários = f(𝐷2, 𝐷3, gastos) 𝑖) 𝐸(𝑌𝑖 𝐷2, 𝐷3, gastos = 13.269,11 − 1.673,614𝐷2𝑖 − 1.144,157𝐷3𝑖 + 3,2889𝑋𝑖 𝑖𝑖) 𝐸(𝑌𝑖 𝐷2𝑖 = 1, 𝐷3𝑖 = 1 = 𝛽1 + 𝛽2 + 𝛽3 + 𝛽4𝑋𝑖 𝑖𝑣) 𝐸(𝑌𝑖|𝐷2𝑖 = 0, 𝐷3𝑖 = 1) = 𝛽1 + 𝛽3 + 𝛽4𝑋𝑖 𝑖𝑖𝑖) 𝐸(𝑌𝑖|𝐷2𝑖 = 1, 𝐷3𝑖 = 0) = 𝛽1 + 𝛽2 +𝛽4𝑋𝑖 𝑣𝑖) 𝐸(𝑌𝑖|𝐷2𝑖 = 0, 𝐷3𝑖 = 0) = 𝛽1 +𝛽4𝑋𝑖 Variáveis Dummies 8 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino 2) Modelos de Análise da Variância-covariância (ANCOVA) 2.1) Regressões Concorrentes: 𝑌𝑡 =∝1 + 𝛽1𝑋𝑡 + 𝛽2𝐷𝑡𝑋𝑡+ ∈𝑖 Exercício 3 - Teste de Chow (Tabela 8.9 – Gujarati): poupança = f[renda, 𝐷𝑡= 0 (1970-1981); 𝐷𝑡= 1 (1982-1995)] 𝑖) 𝐸(𝑌𝑖 𝑟𝑒𝑛𝑑𝑎, 𝐷t = ? 𝑖𝑖) 𝐸(𝑌𝑖 𝑟𝑒𝑛𝑑𝑎, 𝐷t = 0 = ? 𝑖𝑖𝑖) 𝐸(𝑌𝑖 𝑟𝑒𝑛𝑑𝑎, 𝐷t = 1 =? Variáveis Dummies 9 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino 2) Modelos de Análise da Variância-covariância (ANCOVA) 2.1) Regressões Dessemelhantes: 𝑌𝑡 =∝1 + ∝2 𝐷𝑡 + 𝛽1𝑋𝑡 + 𝛽2𝐷𝑡𝑋𝑡+ ∈𝑖 Exercício 3 - Teste de Chow (Tabela 8.9 – Gujarati): poupança = f[renda, 𝐷𝑡= 0 (1970-1981); 𝐷𝑡= 1 (1982-1995)] 𝑖) 𝐸(𝑌𝑖 𝑟𝑒𝑛𝑑𝑎, 𝐷t = 1,0161 + 152,4786𝐷𝑡 + 0,0803𝑋𝑖 − 0,0655𝐷𝑡𝑋𝑡 𝑖𝑖) 𝐸(𝑌𝑖 𝑟𝑒𝑛𝑑𝑎, 𝐷t = 0 = ? 𝑖𝑖𝑖) 𝐸(𝑌𝑖 𝑟𝑒𝑛𝑑𝑎, 𝐷t = 1 =? 10 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO DE PROBABILIDADE LINEAR – MPL (1) Considere o modelo: 𝐼 𝑌𝑖 = 𝛽1 + 𝛽2𝑋2𝑖+ ∈𝑖 𝑒𝑚 𝑞𝑢𝑒: 𝑌𝑖 = ቈ 1 0 Logo: 𝐸(𝑌𝑖 𝑋2𝑖 = 𝛽1 + 𝛽2𝑋2𝑖 é 𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒 𝑐𝑜𝑛𝑑𝑖𝑐𝑖𝑜𝑛𝑎𝑙 𝑞𝑢𝑒 𝑜 𝑒𝑣𝑒𝑛𝑡𝑜 𝑌𝑖 𝑜𝑐𝑜𝑟𝑟𝑒𝑟á, 𝑑𝑎𝑑𝑜 𝑎 𝑜𝑐𝑜𝑟𝑟ê𝑛𝑐𝑖𝑎 𝑑𝑒 𝑋2𝑖 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑠𝑢𝑐𝑒𝑠𝑠𝑜 𝑑𝑒 𝑢𝑚 𝑒𝑣𝑒𝑛𝑡𝑜 (𝑃𝑟) 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑖𝑛𝑠𝑢𝑐𝑒𝑠𝑠𝑜 𝑑𝑒 𝑢𝑚 𝑒𝑣𝑒𝑛𝑡𝑜 (1 − 𝑃𝑟) Assim: Atributos 𝒀𝒊 ∈𝒊 Pr insucesso 0 −𝛽1 − 𝛽2𝑋2𝑖 = ∈𝑖 1-Pr sucesso 1 1 − 𝛽1 − 𝛽2𝑋2𝑖 = ∈𝑖 Pr 𝐸 |𝑌𝑖 𝑋2𝑖 = 𝑖=1 𝑛 𝑌𝑖𝑃𝑟𝑖 = 𝑌𝑖 1 − 𝑃𝑟 + 𝑌𝑖 𝑃𝑟 = 𝑃𝑟𝑖 𝑉𝑎𝑟 ∈𝑖 = 𝐸 ∈𝑖 2 = 𝑖=1 𝑛 ∈𝑖 2𝑃𝑟 = P r( 1 − 𝑃𝑟) ֜ ℎ𝑒𝑡𝑒𝑟𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑖𝑑𝑎𝑑𝑒 11 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO DE PROBABILIDADE LINEAR – MPL 2) Resolvendo a Heterocedasticidade: Mínimos Quadrados Ponderados (ii) 𝑃 𝑟 1 − 𝑃𝑟 = 𝐸 |𝑌𝑖 𝑋𝑖 [1 − (𝐸 |𝑌𝑖 𝑋𝑖 ] ֜ መ𝜃𝑖 = ൧𝑌𝑖[1 − 𝑌𝑖 ∴ መ𝜃𝑖 é 𝑜 𝑝𝑒𝑠𝑜 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜 (iii) Regride: 𝑌𝑖 𝜃𝑖 = 𝛽1 𝜃𝑖 + 𝛽2 𝑋2𝑖 𝜃𝑖 + ∈𝑖 𝜃𝑖 ֜ 𝑌𝑖 ∗ = መ𝛽1 ∗ + መ𝛽2𝑋𝑖 ∗ + Ƹ𝜖𝑖 ∗ 3) Problemas do Método: (i) 𝐸 |𝑌𝑖 𝑋𝑖 pode estar fora dos limites [0,1]; (ii) A hipótese de normalidade de ∈𝑖 não se sustenta; (iii) Devido da presença da heterocedasticidade da 𝑣𝑎𝑟 ∈𝑖 , as estimativas መ𝛽𝑖 ∗ de MQO são não eficientes, embora sejam não-viesados; (iv) O R2 não serve como medida de ajuste. (i) 𝑅𝑒𝑔𝑟𝑖𝑑𝑒 𝐼 𝑝𝑜𝑟 𝑀𝑄𝑂 𝑝𝑎𝑟𝑎 𝑜𝑏𝑡𝑒𝑟 𝑌 12 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO DE PROBABILIDADE LINEAR – MPL 4) Exercício (Tabela 15,4 – Gujarati – Cap.15): Verificar os valores ajustados de Y 𝑌𝑖 = 𝛽1 + 𝛽2𝑋2𝑖+ ∈𝑖 𝑒𝑚 𝑞𝑢𝑒: 𝑌𝑖 = 𝑋2𝑖 = 𝑅𝑒𝑛𝑑𝑎 1, se a família é proprietária da casa 0, caso contrário Fam. Y X Fam. Y X Fam. Y X Fam. Y X 1 0 8 11 1 17 21 1 22 31 117 2 1 16 12 1 18 22 1 16 32 0 13 3 1 18 13 0 14 23 0 12 33 1 21 4 0 11 14 1 20 24 0 11 34 1 20 5 0 12 15 0 6 25 1 16 35 0 11 6 1 19 16 1 19 26 0 11 36 0 8 7 1 20 17 1 16 27 1 20 37 1 17 8 0 13 18 0 10 28 1 18 38 1 16 9 0 9 19 0 8 29 0 11 39 0 7 10 0 10 20 1 18 30 0 10 40 1 17 13 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO LOGIT 1) Considere o modelo alternativo: 𝑌𝑖 ∗ = 𝛽1 + 𝛽2𝑋2𝑖+ ∈𝑖 𝑒𝑚 𝑞𝑢𝑒 𝑌 ∗ é 𝑢𝑚𝑎 𝑣𝑎𝑟𝑖á𝑣𝑒𝑙 𝑙𝑎𝑡𝑒𝑛𝑡𝑒 1, se 𝑌∗ > 0 𝑌 0, caso contrário (2) O Método: Considera a FDA Logística: 𝑓 𝑍 = 1 1 + 𝑒−𝑍 ∴ 𝑒 = 𝑏𝑎𝑠𝑒 𝑑𝑜𝑠 𝑙𝑜𝑔𝑎𝑟í𝑡𝑚𝑜𝑠 𝑛𝑎𝑡𝑢𝑟𝑎𝑖𝑠; função de densidade logística acumulada𝑓 𝑍 = Z = 𝑙𝑜𝑔𝑖𝑡 14 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO LOGIT (2) O Método: Efetua-se uma transformação logística em Y: 𝑓 𝑍 = 1 1 + 𝑒−𝑍 Assumindo: 𝑓 𝑍 = 𝑃𝑟 = 𝐸 |𝑌𝑖 𝑋𝑖 Convertendo a variável dependente em uma razão de chance e aplicando o logaritmo neperiano, obtém-se a equação logística: 𝑙𝑛 𝑃𝑟 1 − 𝑃𝑟 = 𝑙𝑛 𝑒𝑍𝑖 = 𝑍𝑖 𝑒𝑚 𝑞𝑢𝑒 𝑍𝑖 = 𝛽1 + 𝛽2𝑋2𝑖 15 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO LOGIT (3) Estimação do Modelo: 3.1) Dados não agrupados: Método de estimação não linear - Máxima Verossimilhança (pacote estatístico) Testar Tabela 15.7, Gujarati para dados não agrupados ou individuais. Fazer leitura do item 15.8, cap. 15. GPA (média das notas no período letivo); TUCE(nota de uma prova feita no início do curso para verificar o conhecimento de aluno sobre macroeconomia antes do início das aulas); PSI (1, se for utilizado o novo método de ensino); GRADE (Nota. 1 se nota A; 0 se nota B e C) Modelo 1: Logit, usando as observações 1-32 Variável dependente: GRADE Erros padrão baseados na Hessiana Coeficiente Erro Padrão z Inclinação* const −13,0213 4,93132 −2,6405 GPA 2,82611 1,26294 2,2377 0,533859 TUCE 0,0951577 0,141554 0,6722 0,0179755 PSI 2,37869 1,06456 2,2344 0,456498 Média var. dependente 0,343750 D.P. var. dependente 0,482559 R-quadrado de McFadden 0,374038 R-quadrado ajustado 0,179786 Log da verossimilhança −12,88963 Critério de Akaike 33,77927 Critério de Schwarz 39,64221 Critério Hannan-Quinn 35,72267 16 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO LOGIT (3) Estimação do Modelo: 3.2) Dados Agrupados ou replicados (GLOGIT): Transformação do modelo para aplicação de MQO (i) Estima 𝑃𝑟 = 𝑛𝑖 𝑁𝑖 ֜ 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑒𝑚 𝑞𝑢𝑒: 𝑛𝑖 é 𝑜 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑐𝑜𝑟𝑟ê𝑛𝑐𝑖𝑎 𝑑𝑜 𝑒𝑣𝑒𝑛𝑡𝑜 𝑁𝑖 é 𝑜 𝑛𝑢𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠 𝑒𝑠𝑡𝑢𝑑𝑎𝑑𝑎𝑠 (ii) Como ∈𝑖 ~𝑁 0, 1 𝑁𝑖 𝑃𝑟 1−𝑃𝑟 ֜ 𝐻𝑒𝑡𝑒𝑟𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑖𝑑𝑎𝑑𝑒 Logo: 𝑒𝑝(∈𝑖) = 𝜃 = 𝑁𝑖 𝑃𝑟 1 − 𝑃𝑟 𝑒𝑚 𝑞𝑢𝑒 𝜃 = 𝑝𝑒𝑠𝑜 Aplicando Mínimos Quadrados Ponderados em 𝐿𝑖 = 𝑙𝑛 𝑃𝑟 1−𝑃𝑟 = 𝑍𝑖 , tem-se: 𝜃𝐿 = 𝛽1 𝜃 + 𝛽2 𝜃𝑋2𝑖 + 𝜃 ∈𝑖 ֜ 𝐿 ∗ = 𝛽1 ∗ + 𝛽2𝑋2𝑖 ∗ + 𝜖𝑖 ∗ (iii) Executa teste de hipótese usual. Contudo, os resultados só serão válidos para grandes amostras. Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO LOGIT (3) Estimação do Modelo: 3.2) Dados Agrupados ou replicados (GLOGIT): Transformação do modelo para aplicação de MQO Testar Tabela 15.5, Gujarati: Número de famílias proprietárias de um imóvel residencial. Obs. X Ni Ni em US$ mil Nº de famílias com renda Xi nº de famílias proprietária de um imóvel residêncial 1 6 40 8 2 8 50 12 3 10 60 18 4 13 80 28 5 15 100 45 6 20 70 36 7 25 65 39 8 30 50 33 9 35 40 30 10 40 25 20 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO LOGIT (4) Interpretação do Modelo: 4.1) Dados não agrupados: Método de estimação não linear - Máxima Verossimilhança (pacote estatístico) 𝑓 𝑍 = 1 1 + 𝑒−𝑍 𝑒𝑚 𝑞𝑢𝑒 𝑍𝑖 = 𝛽1 + 𝛽2𝑋2𝑖𝐶𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎𝑛𝑑𝑜 𝑞𝑢𝑒: i) Logit መ𝛽𝑖 𝑎𝑛𝑔𝑢𝑙𝑎𝑟: 𝑡𝑢𝑑𝑜 𝑚𝑎𝑖𝑠 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒, 𝑎 𝑣𝑎𝑟𝑖𝑎çã𝑜 𝑢𝑛𝑖𝑡á𝑟𝑖𝑎 𝑒𝑚 𝑋𝑖 implica a variação, em média, do logit estimado. ii) Chances Para um dado 𝑋𝑖 , o sucesso tem 𝑀 vezes chances de ocorrer. 𝑃𝑟 1 − 𝑃𝑟 = 𝑒𝑍𝑖 ∴ 𝑒 = 2,7182 e fazendo: 𝑒𝑍𝑖 = 𝑀 iii) Probabilidades: 𝑃𝑟 = 1 1 + 𝑒−𝑍𝑖 Para um dado (−𝑍𝑖), o evento pode ocorrer com 𝑃𝑟 probabilidade. e 𝑙𝑛 𝑃𝑟 1−𝑃𝑟 = 𝑙𝑛 𝑒𝑍𝑖 = 𝑍𝑖 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO LOGIT (4) Interpretação do Modelo: 𝐶𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎𝑛𝑑𝑜 𝑞𝑢𝑒: i) Logit መ𝛽𝑖 𝑎𝑛𝑔𝑢𝑙𝑎𝑟: 𝑡𝑢𝑑𝑜 𝑚𝑎𝑖𝑠 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒, 𝑎 𝑣𝑎𝑟𝑖𝑎çã𝑜 𝑢𝑛𝑖𝑡á𝑟𝑖𝑎 𝑒𝑚 𝑋𝑖 implica a variação, em média, do logit ponderado estimado. ii) Chances 𝑃𝑟 1 − 𝑃𝑟 = 𝑒𝑍𝑖/ 𝜃 = 𝑒 𝛽1+𝛽2𝑋2𝑖/ 𝜃 iii) Probabilidades: 4.2) Dados Agrupados ou replicados (GLOGIT): Transformação do modelo para aplicação de MQO 𝜃 = 𝑁𝑖 𝑃𝑟 1 − 𝑃𝑟𝑒𝑚 𝑞𝑢𝑒: 𝜃 𝑍𝑖 = 𝛽1 + 𝛽2𝑋2𝑖 ,𝑙𝑛 𝑃𝑟 1−𝑃𝑟 𝜃 = 𝑙𝑛 𝑒𝑍𝑖 𝜃 = 𝑍𝑖 𝜃 Ou [𝑒𝑍𝑖/ 𝜃−1] x 100 𝑇𝑢𝑑𝑜 𝑚𝑎𝑖𝑠 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒, 𝑎 𝑣𝑎𝑟𝑖𝑎çã𝑜 𝑢𝑛𝑖𝑡á𝑟𝑖𝑎 𝑒𝑚 𝑋𝑖 implica a variação ( መ𝛽2) nas chances de ocorrência do evento, ou cerca de [𝑒𝑍𝑖/ 𝜃−1] x 100 por cento. 𝑃𝑟 1 − 𝑃𝑟 = 𝑒𝑍𝑖/ 𝜃 𝑃𝑟 = 𝑒𝑍𝑖/ 𝜃 1 + 𝑒𝑍𝑖/ 𝜃 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO LOGIT (4) Interpretação do Modelo: 𝐶𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎𝑛𝑑𝑜 𝑞𝑢𝑒: iv) Variação das Probabilidades: 4.2) Dados Agrupados ou replicados (GLOGIT): Transformação do modelo para aplicação de MQO 𝑒𝑚 𝑞𝑢𝑒: 𝑍𝑖 = 𝛽1 + 𝛽2𝑋2𝑖 𝜕Pr 𝜕𝑋 = መ𝛽2 𝑃𝑟 1 − 𝑃𝑟 𝑇𝑢𝑑𝑜 𝑚𝑎𝑖𝑠 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒, 𝑎 𝑣𝑎𝑟𝑖𝑎çã𝑜 𝑢𝑛𝑖𝑡á𝑟𝑖𝑎 𝑒𝑚 𝑋𝑖 implica uma variação de [ መ𝛽2 𝑃𝑟 1 − 𝑃𝑟 ] em 𝑃𝑟. 𝑃𝑟 = 𝑒𝑍𝑖 1 + 𝑒𝑍𝑖 𝜕Pr 𝜕𝑋 = 𝜕Pr 𝜕(𝑒𝑍𝑖) X 𝜕(𝑒𝑍𝑖) 𝜕𝑋 𝑂𝑛𝑑𝑒: 21 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO PROBIT 1) Modelo: 𝑌𝑖 ∗ = 𝛽1 + 𝛽2𝑋2𝑖+ ∈𝑖 𝑒𝑚 𝑞𝑢𝑒 𝑌 ∗ é 𝑢𝑚𝑎 𝑣𝑎𝑟𝑖á𝑣𝑒𝑙 𝑙𝑎𝑡𝑒𝑛𝑡𝑒 1, se 𝑌∗ > 0 𝑌 0, caso contrário (2) O Método: FDA Normal Censurada (Se os erros ∈𝑖 seguem distribuição normal): 𝑃𝑟𝑖 = 𝐹 𝑍 = න −∞ 𝑧 1 2𝜋 𝑒𝑥𝑝 − 𝑡2 2 𝑑𝑡 Onde: Pr = 𝐹 𝑍𝑖 é 𝑜 𝑛𝑜𝑟𝑚𝑖𝑡 Z Z F(Z) 0 1 -∞ lim F(Z) = 0 Z - ∞ Z é uma variável aleatória padronizada: Z ~ (0,1) -∞ < Z < ∞ mas F Z é sempre positiva Logo F(Z) é uma FDA normal padrão 22 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO PROBIT Fazendo: Pr 𝑌 = 1 𝑋𝑖 Z Z Pr = F(Z) 0 1 -∞= Pr 𝑌∗ > 0 )= P r( ∈𝑖> −𝑍 Pr Área total = 1 Área F(Z) = 1 – F(Z) Pela propriedade da simetria (para um Z positivo): 𝐹 −𝑍 = 1 − 𝐹 −𝑍 𝐹 𝑍 = 1 − 𝐹 𝑍 Como 𝑜 𝑛𝑜𝑟𝑚𝑖𝑡 é Pr = 𝐹 𝑍𝑖 Então: Z𝑖 = 𝐹 −1 𝑃𝑟 = 𝛽1 + 𝛽2𝑋2𝑖 𝑂𝐵𝑆. : መ𝑍𝑖 = 𝐹 −1 𝑃𝑟 no Excel: inserir uma categoria/ estatística/INV. NORMP.N/ok/probabilidade/ok. 23 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO PROBIT 3) Estimação do modelo: 3.1) Para dados não agrupados: Método da Máxima Verossimilhança (Tabela 15.7: Dados relativos aos efeitos do Sistema de Instrução Personalizado (PSI) sobre as notas do curso. Obs GPA TUCE PSI NOTA CONCEITO Obs GPA TUCE PSI NOTA CONCEITO 1 2,66 20 0 0 C17 2,75 25 0 0 C 2 2,89 22 0 0 B 18 2,83 19 0 0 C 3 3,28 24 0 0 B 19 3,12 23 1 0 B 4 2,92 12 0 0 B 20 3,16 25 1 1 A 5 4,00 21 0 1 A 21 2,06 22 1 0 C 6 2,86 17 0 0 B 22 3,62 28 1 1 A 7 2,76 17 0 0 B 23 2,89 14 1 0 C 8 2,87 21 0 0 B 24 3,51 26 1 0 B 9 3,03 25 0 0 C 25 3,54 24 1 1 A 10 3,92 29 0 1 A 26 2,83 27 1 1 A 11 2,63 20 0 0 C 27 3,39 17 1 1 A 12 3,32 23 0 0 B 28 2,67 24 1 0 B 13 3,57 23 0 0 B 29 3,65 21 1 1 A 14 3,26 25 0 1 A 30 4,00 23 1 1 A 15 3,53 26 0 0 B 31 3,10 21 1 0 C 16 2,74 19 0 0 B 32 2,39 19 1 1 A Y=1, se a nota final for A. Y=0, caso contrário. TUCE = nota de uma prova feita no início do curso para verificar os conhecimentos do aluno sobre Macroeconomia antes de frequentar as aulas. PSI=1, se for utilizado o novo método de ensino. PSI=0, caso contrário. GPA = média das notas no início do período letivo. 24 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO PROBIT 3) Estimação do modelo: 3.1) Para dados não agrupados: Método da Máxima Verossimilhança (Tabela 15.7: Dados relativos aos efeitos do Sistema de Instrução Personalizado (PSI) sobre as notas do curso. MODELO: 𝑮𝒓𝒂𝒅𝒆 𝒏𝒐𝒕𝒂 = 𝛽1 + 𝛽2𝐺𝑃𝐴 + 𝛽3𝑇𝑈𝐶𝐸 + 𝛽4𝑃𝑆𝐼+ ∈𝑖 Logit (binário): 𝑮𝒓𝒂𝒅𝒆 𝒏𝒐𝒕𝒂 = −13,0213 + 2,8261𝐺𝑃𝐴 + 0,091𝑇𝑈𝐶𝐸 + 2,3686𝑃𝑆𝐼 Probit (binário): 𝑮𝒓𝒂𝒅𝒆 𝒏𝒐𝒕𝒂 = −7,4526 + 1,6258𝐺𝑃𝐴 + 0,0517𝑇𝑈𝐶𝐸 + 1,4263𝑃𝑆𝐼 Fazendo መ𝛽𝑖(𝑃𝑟𝑜𝑏𝑖𝑡). 𝜋2 3 ≅ መ𝛽𝑖(𝐿𝑜𝑔𝑖𝑡) Z Pr = F(Z) 0 1 i) Distribuição logística padrão (base do logit): Z ~ (0, 𝜋2 3 ) Probit Logit var[ መ𝛽𝑖(𝐿𝑜𝑔𝑖𝑡)] = 𝜋2 3 ep [ መ𝛽𝑖(𝐿𝑜𝑔𝑖𝑡)] =. 𝜋2 3 ii) Distribuição normal padrão (base do normit): Z ~ (0, 1) 25 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO PROBIT 3) Estimação do modelo: 3.2) Para Dados Agrupados: GPROBIT i) Obtêm-se 𝑃𝑟 por 𝑃𝑟 = 𝑛𝑖 𝑁𝑖 ii) Substitui 𝑍𝑖 𝑝𝑜𝑟 𝑃𝑟 na FDA normal e calcula 𝐹 −1 para obter 𝑍𝑖. Com መ𝑍𝑖 estima 𝑍𝑖 = መ𝛽1 + መ𝛽2𝑋2𝑖 iii) Considera [ መ𝑍𝑖 + 0,5] o valor do normit estimado iv) Para obtenção da variação de probabilidade: ∂𝑃𝑟 ∂𝑋𝑖 . 100 ֜ 𝐹𝑡𝑎𝑏( መ𝑍𝑖) መ𝛽2 . 100 ֜ 𝐹𝑡𝑎𝑏( መ𝛽1 + መ𝛽2𝑋2𝑖) መ𝛽2 . 100 26 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO TOBIT 1) Introdução: Modelo de Regressão Censurada Grupo 1: Consumidores que adquiriram a casa própria Grupo 2: Consumidores que não adquiriram a casa própria X = Renda (extrato de renda) X = Renda Y = Montante de renda gasta com a compra Y = ∄ 2) Modelo de Regressão Normal Censurada 𝑌𝑖 ∗ = 𝛽1 + 𝛽2𝑋2𝑖 + ∈𝑖 , se 𝑌 ∗ > 0 𝑌 0, se 𝑌∗ ≤ 0 )∴ ∈𝑖~𝐼𝑁(0, 𝜎 2 N Yi Xi 𝒀∗ > 𝟎 n1 1 1 X1 X2 𝒀∗ ≤ 𝟎 n2 0 0 X3 X4 27 Universidade Federal de Sergipe UFS/DEE Econometria Profa. Heliana Quintino MODELO TOBIT 3) Método de Estimação: Método de Máxima Verossimilhança Grupo 1: 𝑌∗ > 0 ∈𝑖 > 𝑌𝑖 − 𝛽𝑋𝑖 Grupo 2: 𝑌∗ ≤ 0 ∈𝑖 ≤ −𝛽𝑋𝑖 𝑓 𝑌𝑖 − 𝛽𝑋𝑖 𝜎 ֜𝑓(𝑡) 𝐹 −(𝛽𝑋𝑖) 𝜎 ֜𝐹(𝑧) 𝑌𝑖 ∗ = 𝛽1 + 𝛽2𝑋2𝑖 + ∈𝑖 , se 𝑌 ∗ > 0 𝑌 0, se 𝑌∗ ≤ 0 Como ∈𝑖 𝑡𝑒 𝑢𝑚𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑛𝑜𝑟𝑚𝑎𝑙 𝑡𝑟𝑢𝑛𝑐𝑎𝑑𝑎 𝑐𝑜𝑚 𝜇 ≠ 0 (pois depende de 𝛽, 𝜎 𝑒 𝑋𝑖 ) , podemos escrever a função de verossimilhança: 𝐿 = ෑ 𝑌∗>0 1 𝜎 𝑓 𝑌𝑖 − 𝛽𝑋𝑖 𝜎 ෑ 𝑌∗≤0 𝐹 )−(𝛽𝑋𝑖 𝜎
Compartilhar