Prévia do material em texto
Análise Discriminante UNIVERSIDADE DE SÃO PAULO FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E CONTABILIDADE DE RIBEIRÃO PRETO DEPARTAMENTO DE CONTABILIDADE Prof. Fabiano Guasti Lima fabianoguastilima@gmail.com Pós-Graduação – 2023 mailto:fabianoguastilima@gmail.com Relação entre as variáveis MÉTODOS DE DEPENDÊNCIA: UMA OU MAIS VARIÁVEIS EXPRESSAS COMO DEPENDENTES DE UM CONJUNTO DE VARIÁVEIS INDEPENDENTES. EX: COM BASE NA RENDA, IDADE E ESTADO CIVIL, DETERMINADA PESSOA É OU NÃO É UM BOM RISCO DE CRÉDITO? MÉTODOS DE INTERDEPENDÊNCIA: NENHUMA VARIÁVEL É EXPRESSA COMO DEPENDENTE DE OUTRAS. EX: IDENTIFICAÇÃO E CLASSIFICAÇÃO DE CIDADES PELA SIMILARIDADE DO TAMANHO DE SUA POPULAÇÃO, DA DISTRIBUIÇÃO DE RENDA, DAS RAÇAS E DO CONSUMO DE PRODUTOS INDUSTRIALIZADOS. FERRAMENTAS ESTATÍSTICAS MULTIVARIADAS Técnicas Multivariadas Técnicas de dependência Técnicas de Interdependência Uma Variável Dependente Mais que uma Variável Dependente Cross-tabulation Análise de Variância e Covariância Regressão Múltipla Análise Discriminante Regressão Logística Análise Conjunta Análise de Variância e Covariância Multiv. Correlação Canônica Variáveis Interdepend. Similaridades entre Variáveis Análise Fatorial Escalonam. Multidimens. Técnicas de Dependência Técnica Estatística Variável Dependente Variáveis Independentes Regressão Múltipla Métrica Métricas Análise Discriminante Categórica Métricas Exemplo: dois grupos Grupo 1 – margem de contribuição satisfatória Grupo 2 – margem de contribuição não satisfatória Observação Grupo Renda Dependentes 1 1 3400 3 2 1 2400 2 3 1 2700 2 4 1 2300 2 5 1 3100 1 6 1 2200 2 7 1 4900 5 8 1 2700 3 9 1 3400 4 10 1 4200 5 11 2 3800 5 12 2 3400 5 13 2 2000 3 14 2 1100 3 15 2 1800 3 16 2 1100 2 17 2 1000 2 18 2 2600 4 19 2 600 2 20 2 1000 5 Média 1 3130 2,9 Média 2 1840 3,4 Exemplo: Diagrama de dispersão Grupos 1 e 2 0 1 2 3 4 5 6 0 1000 2000 3000 4000 5000 6000 Renda D e p e n d e n te s Grupo 1 Grupo 2 Série3 Série4 C2 C1 Solução do problema 2211 XbXbaZ No Excel RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,79107278 R-Quadrado 0,625796144 R-quadrado ajustado 0,581772161 Erro padrão 0,331752856 Observações 20 ANOVA gl SQ MQ F F de significação Regressão 2 3,128980719 1,564490359 14,21489152 0,000235191 Resíduo 17 1,871019281 0,110059958 Total 19 5 Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção 1,672058423 0,213251584 7,840778436 4,79387E-07 1,222136913 2,121979934 Variável X 1 -0,000387728 7,50573E-05 -5,165768841 7,75778E-05 -0,000546085 -0,000229371 Variável X 2 0,251252931 0,067243373 3,736471259 0,001642472 0,109381816 0,393124046 21 251253,0000355,0672058,1 XXZ Predição dos Valores Observação Grupo Renda Dependentes Escore Discr Grupo Predito 1 1 3400 3 1,11 1 2 1 2400 2 1,24 1 3 1 2700 2 1,13 1 4 1 2300 2 1,28 1 5 1 3100 1 0,72 1 6 1 2200 2 1,32 1 7 1 4900 5 1,03 1 8 1 2700 3 1,38 1 9 1 3400 4 1,36 1 10 1 4200 5 1,30 1 11 2 3800 5 1,45 1 12 2 3400 5 1,61 2 13 2 2000 3 1,65 2 14 2 1100 3 2,00 2 15 2 1800 3 1,73 2 16 2 1100 2 1,75 2 17 2 1000 2 1,79 2 18 2 2600 4 1,67 2 19 2 600 2 1,94 2 20 2 1000 5 2,54 2 Média 1 3130 2,9 1,19 Média 2 1840 3,4 1,81 Média 1,50 Avaliação do poder discriminatório da função Grupos Originais Grupos preditos 1 2 TOTAIS 1 10 0 10 2 1 9 10 TOTAIS 11 9 20 Eficiência de 95% - 19 em 20 Análise Discriminante Múltipla Grupo 1 Margem de contribuição satisfatória Grupo 2 Margem de contribuição aceitável Grupo 3 Margem de contribuição não satisfatória Observação Grupo Renda Dependentes 1 1 3400 3 2 1 2400 2 3 1 2700 2 4 1 2300 2 5 1 3100 1 6 2 2200 2 7 2 4900 5 8 2 2700 3 9 2 3400 4 10 2 4200 5 11 2 3800 5 12 2 3400 5 13 2 2000 3 14 3 1100 3 15 3 1800 3 16 3 1100 2 17 3 1000 2 18 3 2600 4 19 3 600 2 20 3 1000 5 Análise Discriminante Múltipla Medida da Distância de Mahalanobis D = distância da observação ao centróide X = valor assumido pela variável independente S2 = variância da variável independente dentro do grupo Cálculos Observação Grupo Renda Dependentes 1 1 3400 3 2 1 2400 2 3 1 2700 2 4 1 2300 2 5 1 3100 1 6 1 2200 2 7 2 4900 5 8 2 2800 3 9 2 3400 4 10 2 4200 5 11 2 3800 5 12 2 3400 5 13 2 2000 3 14 3 1100 3 15 3 1800 3 16 3 1100 2 17 3 1000 2 18 3 2600 4 19 3 600 2 20 3 1000 5 Média 1 2683,33 2,00 Média 2 3500,00 4,29 Média 3 1314,29 3,00 Variância 1 229666,7 0,40 Variância 2 883333,3 0,90 Variância 3 448095,2 1,33 Distância da observação 1 ao centróide 1 Distância da observação 1 ao centróide 2 Distância da observação 1 ao centróide 3 Observação Grupo Renda Dependentes 1 2 3 Mínimo Grupo Predito 1 1 3400 3 2,18 1,36 3,12 1,36 2 2 1 2400 2 0,59 2,67 1,84 0,59 1 3 1 2700 2 0,03 2,55 2,24 0,03 1 4 1 2300 2 0,80 2,72 1,71 0,80 1 5 1 3100 1 1,80 3,48 3,18 1,80 1 6 1 2200 2 1,01 2,77 1,58 1,01 1 7 2 4900 5 6,63 1,67 5,63 1,67 2 8 2 2800 3 1,60 1,54 2,22 1,54 2 9 2 3400 4 3,50 0,32 3,23 0,32 2 10 2 4200 5 5,70 1,06 4,65 1,06 2 11 2 3800 5 5,28 0,82 4,10 0,82 2 12 2 3400 5 4,97 0,76 3,56 0,76 2 13 2 2000 3 2,13 2,09 1,02 1,02 3 14 3 1100 3 3,66 2,89 0,32 0,32 3 15 3 1800 3 2,43 2,26 0,73 0,73 3 16 3 1100 2 3,30 3,51 0,92 0,92 3 17 3 1000 2 3,51 3,58 0,99 0,99 3 18 3 2600 4 3,17 1,00 2,11 1,00 2 19 3 600 2 4,35 3,91 1,37 1,37 3 20 3 1000 5 5,90 2,76 1,79 1,79 3 Renda Dependentes Renda Depend Média 1 2683,33 2,00 Variância 1 229666,7 0,40 Média 2 3500,00 4,29 Variância 2 883333,3 0,90 Média 3 1314,29 3,00 Variância 3 448095,2 1,33 Distância de Mahalanobis Cálculos Avaliação do poder discriminatório da função Grupos Origin ais Grupos preditos 1 2 3 TOTAIS 1 5 1 0 6 2 0 6 1 7 3 0 1 6 7 TOTAIS 5 8 7 20 Eficiência de 85% - 17 em 20