Buscar

Aula 4 - Análise Discriminante 2023

Prévia do material em texto

Análise Discriminante
UNIVERSIDADE DE SÃO PAULO
FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E
CONTABILIDADE DE RIBEIRÃO PRETO
DEPARTAMENTO DE CONTABILIDADE
Prof. Fabiano Guasti Lima
fabianoguastilima@gmail.com
Pós-Graduação – 2023
mailto:fabianoguastilima@gmail.com
Relação entre as variáveis
 MÉTODOS DE DEPENDÊNCIA: UMA OU MAIS 
VARIÁVEIS EXPRESSAS COMO DEPENDENTES DE 
UM CONJUNTO DE VARIÁVEIS INDEPENDENTES.
 EX: COM BASE NA RENDA, IDADE E ESTADO CIVIL, 
DETERMINADA PESSOA É OU NÃO É UM BOM RISCO DE 
CRÉDITO?
 MÉTODOS DE INTERDEPENDÊNCIA: NENHUMA 
VARIÁVEL É EXPRESSA COMO DEPENDENTE DE 
OUTRAS.
 EX: IDENTIFICAÇÃO E CLASSIFICAÇÃO DE CIDADES PELA 
SIMILARIDADE DO TAMANHO DE SUA POPULAÇÃO, DA 
DISTRIBUIÇÃO DE RENDA, DAS RAÇAS E DO CONSUMO 
DE PRODUTOS INDUSTRIALIZADOS.
FERRAMENTAS ESTATÍSTICAS 
MULTIVARIADAS
Técnicas Multivariadas
Técnicas de dependência Técnicas de Interdependência
Uma Variável 
Dependente
Mais que 
uma 
Variável 
Dependente
Cross-tabulation
Análise de Variância e 
Covariância
Regressão Múltipla
Análise Discriminante
Regressão Logística
Análise Conjunta
Análise de Variância 
e Covariância Multiv.
Correlação Canônica
Variáveis 
Interdepend.
Similaridades 
entre Variáveis
Análise 
Fatorial
Escalonam. 
Multidimens.
Técnicas de Dependência
Técnica Estatística
Variável 
Dependente
Variáveis 
Independentes
Regressão Múltipla Métrica Métricas
Análise Discriminante Categórica Métricas
Exemplo: dois grupos
 Grupo 1 – margem de contribuição satisfatória
 Grupo 2 – margem de contribuição não satisfatória
Observação Grupo Renda Dependentes
1 1 3400 3
2 1 2400 2
3 1 2700 2
4 1 2300 2
5 1 3100 1
6 1 2200 2
7 1 4900 5
8 1 2700 3
9 1 3400 4
10 1 4200 5
11 2 3800 5
12 2 3400 5
13 2 2000 3
14 2 1100 3
15 2 1800 3
16 2 1100 2
17 2 1000 2
18 2 2600 4
19 2 600 2
20 2 1000 5
Média 1 3130 2,9
Média 2 1840 3,4
Exemplo:
Diagrama de dispersão Grupos 1 e 2
0
1
2
3
4
5
6
0 1000 2000 3000 4000 5000 6000
Renda
D
e
p
e
n
d
e
n
te
s
Grupo 1 Grupo 2 Série3 Série4
C2
C1
Solução do problema
2211 XbXbaZ 
No Excel
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo 0,79107278
R-Quadrado 0,625796144
R-quadrado ajustado 0,581772161
Erro padrão 0,331752856
Observações 20
ANOVA
gl SQ MQ F F de significação
Regressão 2 3,128980719 1,564490359 14,21489152 0,000235191
Resíduo 17 1,871019281 0,110059958
Total 19 5
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores
Interseção 1,672058423 0,213251584 7,840778436 4,79387E-07 1,222136913 2,121979934
Variável X 1 -0,000387728 7,50573E-05 -5,165768841 7,75778E-05 -0,000546085 -0,000229371
Variável X 2 0,251252931 0,067243373 3,736471259 0,001642472 0,109381816 0,393124046
21 251253,0000355,0672058,1 XXZ 
Predição dos Valores
Observação Grupo Renda Dependentes Escore Discr Grupo Predito
1 1 3400 3 1,11 1
2 1 2400 2 1,24 1
3 1 2700 2 1,13 1
4 1 2300 2 1,28 1
5 1 3100 1 0,72 1
6 1 2200 2 1,32 1
7 1 4900 5 1,03 1
8 1 2700 3 1,38 1
9 1 3400 4 1,36 1
10 1 4200 5 1,30 1
11 2 3800 5 1,45 1
12 2 3400 5 1,61 2
13 2 2000 3 1,65 2
14 2 1100 3 2,00 2
15 2 1800 3 1,73 2
16 2 1100 2 1,75 2
17 2 1000 2 1,79 2
18 2 2600 4 1,67 2
19 2 600 2 1,94 2
20 2 1000 5 2,54 2
Média 1 3130 2,9 1,19
Média 2 1840 3,4 1,81
Média 1,50
Avaliação do poder discriminatório da 
função
Grupos
Originais
Grupos preditos
1 2 TOTAIS
1 10 0 10
2 1 9 10
TOTAIS 11 9 20
Eficiência de 95% - 19 em 20 
Análise Discriminante Múltipla
Grupo 1 Margem de contribuição satisfatória
Grupo 2 Margem de contribuição aceitável
Grupo 3 Margem de contribuição não satisfatória
Observação Grupo Renda Dependentes
1 1 3400 3
2 1 2400 2
3 1 2700 2
4 1 2300 2
5 1 3100 1
6 2 2200 2
7 2 4900 5
8 2 2700 3
9 2 3400 4
10 2 4200 5
11 2 3800 5
12 2 3400 5
13 2 2000 3
14 3 1100 3
15 3 1800 3
16 3 1100 2
17 3 1000 2
18 3 2600 4
19 3 600 2
20 3 1000 5
Análise Discriminante Múltipla
Medida da Distância de Mahalanobis
D = distância da observação ao centróide
X = valor assumido pela variável independente
S2 = variância da variável independente dentro do grupo
Cálculos 
Observação Grupo Renda Dependentes
1 1 3400 3
2 1 2400 2
3 1 2700 2
4 1 2300 2
5 1 3100 1
6 1 2200 2
7 2 4900 5
8 2 2800 3
9 2 3400 4
10 2 4200 5
11 2 3800 5
12 2 3400 5
13 2 2000 3
14 3 1100 3
15 3 1800 3
16 3 1100 2
17 3 1000 2
18 3 2600 4
19 3 600 2
20 3 1000 5
Média 1 2683,33 2,00
Média 2 3500,00 4,29
Média 3 1314,29 3,00
Variância 1 229666,7 0,40
Variância 2 883333,3 0,90
Variância 3 448095,2 1,33
Distância da observação 1 ao 
centróide 1
Distância da observação 1 ao 
centróide 2
Distância da observação 1 ao 
centróide 3
Observação Grupo Renda Dependentes 1 2 3 Mínimo Grupo Predito
1 1 3400 3 2,18 1,36 3,12 1,36 2
2 1 2400 2 0,59 2,67 1,84 0,59 1
3 1 2700 2 0,03 2,55 2,24 0,03 1
4 1 2300 2 0,80 2,72 1,71 0,80 1
5 1 3100 1 1,80 3,48 3,18 1,80 1
6 1 2200 2 1,01 2,77 1,58 1,01 1
7 2 4900 5 6,63 1,67 5,63 1,67 2
8 2 2800 3 1,60 1,54 2,22 1,54 2
9 2 3400 4 3,50 0,32 3,23 0,32 2
10 2 4200 5 5,70 1,06 4,65 1,06 2
11 2 3800 5 5,28 0,82 4,10 0,82 2
12 2 3400 5 4,97 0,76 3,56 0,76 2
13 2 2000 3 2,13 2,09 1,02 1,02 3
14 3 1100 3 3,66 2,89 0,32 0,32 3
15 3 1800 3 2,43 2,26 0,73 0,73 3
16 3 1100 2 3,30 3,51 0,92 0,92 3
17 3 1000 2 3,51 3,58 0,99 0,99 3
18 3 2600 4 3,17 1,00 2,11 1,00 2
19 3 600 2 4,35 3,91 1,37 1,37 3
20 3 1000 5 5,90 2,76 1,79 1,79 3
Renda Dependentes Renda Depend
Média 1 2683,33 2,00 Variância 1 229666,7 0,40
Média 2 3500,00 4,29 Variância 2 883333,3 0,90
Média 3 1314,29 3,00 Variância 3 448095,2 1,33
Distância de Mahalanobis
Cálculos 
Avaliação do poder discriminatório da 
função
Grupos
Origin
ais
Grupos preditos
1 2 3 TOTAIS
1 5 1 0 6
2 0 6 1 7
3 0 1 6 7
TOTAIS 5 8 7 20
Eficiência de 85% - 17 em 20

Mais conteúdos dessa disciplina