Prévia do material em texto
Regressão Logística UNIVERSIDADE DE SÃO PAULO FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E CONTABILIDADE DE RIBEIRÃO PRETO DEPARTAMENTO DE CONTABILIDADE Prof. Fabiano Guasti Lima fabianoguastilima@gmail.com Pós-Graduação – 2023 mailto:fabianoguastilima@gmail.com FERRAMENTAS ESTATÍSTICAS MULTIVARIADAS Técnicas Multivariadas Técnicas de dependência Técnicas de Interdependência Uma Variável Dependente Mais que uma Variável Dependente Cross-tabulation Análise de Variância e Covariância Regressão Múltipla Análise Discriminante Regressão Logística Análise Conjunta Análise de Variância e Covariância Multiv. Correlação Canônica Variáveis Interdepend. Similaridades entre Variáveis Análise Fatorial Escalonam. Multidimens. 3 Técnicas de Dependência Técnica Estatística Variável Dependente Variáveis Independentes Regressão Múltipla Métrica Métricas Análise Discriminante Categórica Métricas Regressão Logística Categórica Métricas/Categóricas Conceitos Probabilidade Chande (odds) de ocorrência de um evento Logito Probabilidade Estimar a Probabilidade de ocorrência de determinado evento ou de que um indivíduo venha a se enquadrar nessa ou naquela categoria. Chance (ODDS) Chance de ocorrência do evento: Exemplo: Se p=0,50, chance = 1 (1 para 1) Se p=0,75, chance = 3 (3 para 1) Se p=0,25, chance = 1/3 (1 para 3) Logito LOGITO: logaritmo natural da chance de ocorrência de uma resposta do tipo “sim”. E, a partir do logito, define-se a probabilidade de ocorrência do evento em estudo, em função das variáveis explicativas. Curva Logística Probabilística Curva S ou Sigmóide 0 0,2 0,4 0,6 0,8 1 1,2 -6 -4 -2 0 2 4 6 p Função Logística Z 1 f(Z) 1 e 1 1 2 2 n n p Z ln X X X 1 p logit Odds (chance) Função Logística • se p = 0,5 – chance é de 1 para 1 • se p = 0,75 – chance é de 3 para 1 • p = odds/(1+odds) i iX 1 f(Z) 1 e Função Logística • EXEMPLO: A probabilidade de um cliente adquirir a assinatura de uma revista por mala direta: • X1=sexo(1 mulher; 0 homem) • X2=idade (anos) • X3=estado civil (1 solteiro; 0 casado) Função Logística • EXEMPLO: mulher, casada com 35 anos • EXEMPLO: homem, casado com 35 anos Valor esperado dos resíduos é igual a zero Ausência de autocorrelação Ausência de correlação entre resíduos e variáveis explicativas Ausência de multicolinearidade NÃO pressupõe normalidade dos resíduos NÃO pressupõe homogeneidade da variância Pressupostos da Regressão Logística Medidas de Ajustes da Regressão Logística TÉCNICA – Estimação Parâmetros MÉTODO Regressão Múltipla MMQ – minimiza os desvios quadráticos Regressão Logística Máxima Verossimilhança – busca maximizar a probabilidade (verossimilhança) que um evento ocorra Medidas de Ajustes da Regressão Logística - Máxima Verossimilhança 1 1 .ln 1 .ln 1 1 Zn Z Z i e LL Y Y máx e e Medidas de Ajustes da Regressão Logística Curva ROC = Receiver Operating Characteristic Curve Quanto MAIOR a área abaixo da Curva ROC, maior a capacidade do modelo discriminar os grupos sinistrados dos não sinistrados. Área abaixo da Curva ROC menor ou igual a 0,5: Não Há discriminação. Área entre 0,7 e 0,8 = Discriminação Aceitável Maior que 0,8 = Discriminação Excelente Regressão Logística Multinomial Regressão Logística Multinomial Esta série documental retrata a tragédia com o ônibus espacial Challenger, dos preparativos para o lançamento até a explosão em 28 de janeiro de 1986. Passado o frenesi do programa lunar, nos anos 1980 a NASA sentia a necessidade de realizar algum feito que devolvesse os olhares populares à sua direção. A decisão, então, foi usar o novo programa dos ônibus espaciais nessa jogada, e essa jogada foi promover o envio de uma pessoa comum à órbita da Terra — no caso, a professora Christa McAuliffe, escolhida após um processo seletivo como aquela que reunia todas as características que essa pessoa precisaria ter para mexer a fundo com o coração da nação. Challenger: voo Final Prêmio Nobel de Física em 1965.