Buscar

ATIVIDADE 3 A3 - ANÁLISE MULTIVARIADA DE DADOS - DIFERENTES TÉCNICAS DISPONÍVEIS PARA ANÁLISE DE CONGLOMERADOS

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UNP - UNIVERSIDADE POTIGUAR 
BACHARELADO EM ESTATÍSTICA 
DISCIPLINA: ANÁLISE MULTIVARIADA DE DADOS 
UNIDADE 3 – DIFERENTES TÉCNICAS DISPONÍVEIS PARA ANÁLISE DE 
CONGLOMERADOS 
Me. FRANCISCO JOSE DA SILVA JUNIOR 
ALESSANDRO FEREIRA 
 
 
 
 
 
 
 
 
 
 
Atividade 3 A3, apresentada ao curso bacharelado 
em Estatística, ofertado pela Universidade Potiguar, 
como requisito avaliativo complementar da terceira 
avaliação da disciplina: Análise Multivariada de 
Dados. 
 
 
 
 
 
 
 
 
 
 
 
 
ALUNO: EBERSON COSTA – MATRÍCULA 2020201380 
BENEVIDES – PARÁ 
2023 
UNP – UNIVERSIDADE POTIGUAR 
BACHARELADO EM ESTATÍSTICA 
ANÁLISE MULTIVARIADA DE DADOS – DIFERENTES TÉCNICAS DISPONÍVEIS 
PARA ANÁLISE DE CONGLOMERADOS 
 
 
ATIVIDADE 3 – A3 
 
Existem vários tipos de métodos de agrupamento: hierárquicos, baseados em 
centroides, baseados em distribuição, baseados em densidade e outros. No 
agrupamento baseado em centroides, os agrupamentos são representados por um 
vetor central, que pode não ser, necessariamente, um membro do conjunto de dados. 
 
Os algoritmos de agrupamento são usados para divisão do espaço de entrada em 
vários subespaços. É um procedimento iterativo de particionamento de dados que 
atribui n observações a exatamente um dos k aglomerados. 
 
O método do centroide pode ajudar as empresas a identificarem a localização das 
instalações usadas para fabricação e outros aspectos relacionados à produção do 
negócio. O objetivo final desse método é usar formulações matemáticas para obter 
custos de envio mais baixos, menor tempo de envio ou ambos em relação aos lucros. 
 
Com base no exposto, desenvolva o método de ligação do centroide como técnica de 
análise de dados, exemplificando-o com um problema real de análise de dados em 
que esse método pode ser aplicado como solução. 
 
Com o método ligação centróide, a distância entre dois agrupamentos é a distância 
entre os centróides ou médias dos agrupamentos. A distância é calculada com a 
seguinte matriz de distância: 
 
 
 
 
 
 
Notação 
 
Termo Descrição 
dmj Distância entre os agrupamentos m e j 
m Agrupamento mesclado que consiste nos agrupamentos k e l, com m = (k,i) 
dkj Distância entre os agrupamentos k e j 
dlj Distância entre os agrupamentos l e j 
Nk Número de observações no agrupamento k 
Nl Número de observações no agrupamento l 
Nm Número de observações no agrupamento m 
 
Pode-se, ainda, considerar que no método do centroide, a distância entre dois 
aglomerados A e B é definida como a distância euclidiana entre os vetores médios 
(geralmente chamados de centroides) dos dois aglomerados: 
 
 
 
Em que são os vetores médios para os vetores de observação em A e 
 
Os vetores de observação em B, respectivamente. De maneira usual 
 
são definidos da seguinte forma: 
 
 
Os dois aglomerados com a menor distância entre os centroides são mesclados em 
cada etapa. Após a junção de dois clusters A e B, o centroide do novo aglomerado AB 
é dado pela média ponderada a seguir: 
 
 
 
 
Assim como nos armazéns, é preciso estudar a localização das unidades fabris. A 
centralização ou descentralização dessas unidades também dependem de alguns 
fatores analisados para os armazéns, como: economia de escala, riscos e transportes. 
O que muda entre eles são as características a serem observadas. 
Nesse contexto, pode-se afirmar que: 
I - Geralmente, os custos fixos de produção são menores quando centralizada num 
único local; e vice-versa. 
II - Se a fábrica é centralizada, os custos com insumos são menores e os custos com 
distribuição maiores. 
III - Qualquer eventualidade impactará a totalidade de uma unidade fabril centralizada. 
 
 
 
Referências 
 
FÁVERO, L. P .; BELFIORI, P . Análise de dados: técnicas multivariadas exploratórias 
com SPSS e STATA. Rio de Janeiro: Elsevier, 2015. 
 
FÁVERO, L. P .; BELFIORI, P . Manual de análise de dados: estatística e modelagem 
multivariada com Excel®, SPSS® e Stata®. Rio de Janeiro: Elsevier, 2017. 
 
HAIR, J. F. et al. Análise multivariada de dados. 5. ed. Bookman: Porto Alegre, 2009. 
 
https://support.minitab.com/pt-br/minitab/21/help-and-how-to/statistical-
modeling/multivariate/how-to/cluster-observations/methods-and-formulas/linkage-
methods/Acesso em 26 set. 2023. 
 
LANDIM, P . M. B. Análise estatística de dados geológicos multivariados. São Paulo: 
Ocina de Textos, 2011. 
 
SILVA JR, F. J. R. FERREIRA, A. ANÁLISE MULTIVARIADA DE DADOS: Diferentes 
Técnicas Disponíveis para Análise de Conglomerados. Universidade 
Potiguar.https://student.ulife.com.br//ContentPlayer/Index?Ic+5g8qUwH796Ts6u7zR
ee... Acesso em: 25 set. 2023. 
 
 
https://support.minitab.com/pt-br/minitab/21/help-and-how-to/statistical-modeling/multivariate/how-to/cluster-observations/methods-and-formulas/linkage-methods/Acesso
https://support.minitab.com/pt-br/minitab/21/help-and-how-to/statistical-modeling/multivariate/how-to/cluster-observations/methods-and-formulas/linkage-methods/Acesso
https://support.minitab.com/pt-br/minitab/21/help-and-how-to/statistical-modeling/multivariate/how-to/cluster-observations/methods-and-formulas/linkage-methods/Acesso
https://student.ulife.com.br/ContentPlayer/Index?Ic+5g8qUwH796Ts6u7zRee
https://student.ulife.com.br/ContentPlayer/Index?Ic+5g8qUwH796Ts6u7zRee

Continue navegando