Baixe o app para aproveitar ainda mais
Prévia do material em texto
EXERCÍCIOS - Aula 7 Considere o arquivo Cervejas, com as variáveis: índice de caloria, índice de sódio, índice de álcool, custo de fabricação e país de origem do fabricante. qual a escala das variáveis? quais poderão ser usadas para obter os conglomerados? quais poderão ser usados para analisar os perfis dos conglomerados obtidos? aplique a técnica de análise de conglomerados hierárquicos, utilizando padronização pelo método Z-scores, a distância quadrática euclidiana e o método furthest neighbor descreva os 14 primeiros estágios do esquema de aglomeração quantas duplas foram mantidas até o estágio 16? em qual estágio foi formado o primeiro conglomerado sem ser dupla? quantos conglomerados existem no estágio 15? determine duas soluções para o número ideal de conglomerados considere a solução de 4 conglomerados; acrescente no banco de dados as variáveis padronizadas e aplique a técnica K - Médias (K- Means), com as opções running means e iterate and classify; salve o cluster membership no banco de dados com base na ANOVA (Análise de Variância), qual é a variável que mais discriminou os 4 grupos de cervejas? E qual a que menos diferenciou os grupos? analise o perfil dos conglomerados obtidos em função das médias (ou centróides) das variáveis caloria, sódio, álcool e custo qual é o perfil dos conglomerados em função dos países fabricantes de cervejas? Banco de dados: Dados de emprego do SPSS, considerando as seguintes variáveis: Current Salary (salary) Beginning Salary (salbegin) Months since Hire (jobtime) Previous Experience (months) (prevexp) aplique a técnica de análise de conglomerados hierárquicos para estas quatro variáveis, utilizando a distância quadrática euclidiana, o método between-groups e a padronização Z-scores identifique duas soluções para o número adequado de conglomerados padronize as 4 variáveis e aplique a técnica K- Médias (K- Means), com as opções running means e iterate and classify com a solução de 4 grupos; salve o cluster membership no banco de dados analise a distribuição dos elementos nos 4 grupos; o que essa distribuição está indicando? localizar os 2 outliers e usar o comando de filtro para excluí-los Data / Select cases / If condition is satisfied / If id ~= 29 & id ~= 343 Continue / OK processar novamente K-Médias com 3 grupos analisar ANOVA e eliminar variáveis se for o caso qual é a variável que mais discriminou os grupos de funcionários? analise o perfil dos conglomerados obtidos em função das médias (ou centróides) das variáveis mantidas depois da análise da ANOVA analise o perfil dos conglomerados obtidos em função da variável jobcat
Compartilhar