EAD0351 Aula7 Exercícios

•

USP-SP

0

Eduardo Nerd

15.03.2018

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Técnicas Estatísticas de Agrupamento

82 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

EXERCÍCIOS - Aula 7
Considere o arquivo Cervejas, com as variáveis: índice de caloria, índice de sódio, índice de álcool, custo de fabricação e país de origem do fabricante.
qual a escala das variáveis? quais poderão ser usadas para obter os conglomerados? quais poderão ser usados para analisar os perfis dos conglomerados obtidos?
aplique a técnica de análise de conglomerados hierárquicos, utilizando padronização pelo método Z-scores, a distância quadrática euclidiana e o método furthest neighbor
descreva os 14 primeiros estágios do esquema de aglomeração
quantas duplas foram mantidas até o estágio 16?
em qual estágio foi formado o primeiro conglomerado sem ser dupla?
quantos conglomerados existem no estágio 15?
determine duas soluções para o número ideal de conglomerados
considere a solução de 4 conglomerados; acrescente no banco de dados as variáveis padronizadas e aplique a técnica K - Médias (K- Means), com as opções running means e iterate and classify; salve o cluster membership no banco de dados
com base na ANOVA (Análise de Variância), qual é a variável que mais discriminou os 4 grupos de cervejas? E qual a que menos diferenciou os grupos?
analise o perfil dos conglomerados obtidos em função das médias (ou centróides) das variáveis caloria, sódio, álcool e custo
qual é o perfil dos conglomerados em função dos países fabricantes de cervejas?
Banco de dados: Dados de emprego do SPSS, considerando as seguintes variáveis:
Current Salary (salary)
Beginning Salary (salbegin)
Months since Hire (jobtime)
Previous Experience (months) (prevexp)
aplique a técnica de análise de conglomerados hierárquicos para estas quatro variáveis, utilizando a distância quadrática euclidiana, o método between-groups e a padronização Z-scores
identifique duas soluções para o número adequado de conglomerados
padronize as 4 variáveis e aplique a técnica K- Médias (K- Means), com as opções running means e iterate and classify com a solução de 4 grupos; salve o cluster membership no banco de dados
analise a distribuição dos elementos nos 4 grupos; o que essa distribuição está indicando?
localizar os 2 outliers e usar o comando de filtro para excluí-los
Data / Select cases / If condition is satisfied / If id ~= 29 & id ~= 343
Continue / OK
processar novamente K-Médias com 3 grupos
analisar ANOVA e eliminar variáveis se for o caso
qual é a variável que mais discriminou os grupos de funcionários?
analise o perfil dos conglomerados obtidos em função das médias (ou centróides) das variáveis mantidas depois da análise da ANOVA
analise o perfil dos conglomerados obtidos em função da variável jobcat