Baixe o app para aproveitar ainda mais
Prévia do material em texto
Perguntas Importantes Quantos clusters? Hierarchichal Quem está em cada? Hierarchichal Quais variáveis foram significativas para analise K-Means Tem q usar o número de Clusters do Hierarchichal Options - ANOVA (Analise de variância - Teste f - Compara médias entre grupos) Table F crítico (o q está dentro dele é estatisticamente zero) If lim n->oo, a curva tende a uma normal nível de confiança padrão 95% (5% nível de significância) Quanto maior a diferença de médias, melhor a variável é para discriminar os grupos F 0 95% confiança 5% Significância F calculado = invf(5%;clusters-1;n-k) excel = 3,44 As 4 variávies foram significativas, ao nível de confiança de 95%, para que fossem formados 3 clusters (F calculado > F crítico). Ou SigF<0,05 Sig. = Área => Se área for maior que 5%, não é significante. No excel, sig = distf(F;clusters-1;n-k) Caso alguma variável não for significante, tirar ela da amostra e rodar de novo Exercício aula 3) 1. do 27 para 28 -> salto de proporção e magnitude superior aos demais, o que pode ser confirmado pelo dengrograma 2) 3)
Compartilhar