Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNP - UNIVERSIDADE POTIGUAR BACHARELADO EM ESTATÍSTICA DISCIPLINA: ANÁLISE MULTIVARIADA DE DADOS UNIDADE 3 – DIFERENTES TÉCNICAS DISPONÍVEIS PARA ANÁLISE DE CONGLOMERADOS Me. FRANCISCO JOSE DA SILVA JUNIOR ALESSANDRO FEREIRA Atividade 3 A3, apresentada ao curso bacharelado em Estatística, ofertado pela Universidade Potiguar, como requisito avaliativo complementar da terceira avaliação da disciplina: Análise Multivariada de Dados. ALUNO: EBERSON COSTA – MATRÍCULA 2020201380 BENEVIDES – PARÁ 2023 UNP – UNIVERSIDADE POTIGUAR BACHARELADO EM ESTATÍSTICA ANÁLISE MULTIVARIADA DE DADOS – DIFERENTES TÉCNICAS DISPONÍVEIS PARA ANÁLISE DE CONGLOMERADOS ATIVIDADE 3 – A3 Existem vários tipos de métodos de agrupamento: hierárquicos, baseados em centroides, baseados em distribuição, baseados em densidade e outros. No agrupamento baseado em centroides, os agrupamentos são representados por um vetor central, que pode não ser, necessariamente, um membro do conjunto de dados. Os algoritmos de agrupamento são usados para divisão do espaço de entrada em vários subespaços. É um procedimento iterativo de particionamento de dados que atribui n observações a exatamente um dos k aglomerados. O método do centroide pode ajudar as empresas a identificarem a localização das instalações usadas para fabricação e outros aspectos relacionados à produção do negócio. O objetivo final desse método é usar formulações matemáticas para obter custos de envio mais baixos, menor tempo de envio ou ambos em relação aos lucros. Com base no exposto, desenvolva o método de ligação do centroide como técnica de análise de dados, exemplificando-o com um problema real de análise de dados em que esse método pode ser aplicado como solução. Com o método ligação centróide, a distância entre dois agrupamentos é a distância entre os centróides ou médias dos agrupamentos. A distância é calculada com a seguinte matriz de distância: Notação Termo Descrição dmj Distância entre os agrupamentos m e j m Agrupamento mesclado que consiste nos agrupamentos k e l, com m = (k,i) dkj Distância entre os agrupamentos k e j dlj Distância entre os agrupamentos l e j Nk Número de observações no agrupamento k Nl Número de observações no agrupamento l Nm Número de observações no agrupamento m Pode-se, ainda, considerar que no método do centroide, a distância entre dois aglomerados A e B é definida como a distância euclidiana entre os vetores médios (geralmente chamados de centroides) dos dois aglomerados: Em que são os vetores médios para os vetores de observação em A e Os vetores de observação em B, respectivamente. De maneira usual são definidos da seguinte forma: Os dois aglomerados com a menor distância entre os centroides são mesclados em cada etapa. Após a junção de dois clusters A e B, o centroide do novo aglomerado AB é dado pela média ponderada a seguir: Assim como nos armazéns, é preciso estudar a localização das unidades fabris. A centralização ou descentralização dessas unidades também dependem de alguns fatores analisados para os armazéns, como: economia de escala, riscos e transportes. O que muda entre eles são as características a serem observadas. Nesse contexto, pode-se afirmar que: I - Geralmente, os custos fixos de produção são menores quando centralizada num único local; e vice-versa. II - Se a fábrica é centralizada, os custos com insumos são menores e os custos com distribuição maiores. III - Qualquer eventualidade impactará a totalidade de uma unidade fabril centralizada. Referências FÁVERO, L. P .; BELFIORI, P . Análise de dados: técnicas multivariadas exploratórias com SPSS e STATA. Rio de Janeiro: Elsevier, 2015. FÁVERO, L. P .; BELFIORI, P . Manual de análise de dados: estatística e modelagem multivariada com Excel®, SPSS® e Stata®. Rio de Janeiro: Elsevier, 2017. HAIR, J. F. et al. Análise multivariada de dados. 5. ed. Bookman: Porto Alegre, 2009. https://support.minitab.com/pt-br/minitab/21/help-and-how-to/statistical- modeling/multivariate/how-to/cluster-observations/methods-and-formulas/linkage- methods/Acesso em 26 set. 2023. LANDIM, P . M. B. Análise estatística de dados geológicos multivariados. São Paulo: Ocina de Textos, 2011. SILVA JR, F. J. R. FERREIRA, A. ANÁLISE MULTIVARIADA DE DADOS: Diferentes Técnicas Disponíveis para Análise de Conglomerados. Universidade Potiguar.https://student.ulife.com.br//ContentPlayer/Index?Ic+5g8qUwH796Ts6u7zR ee... Acesso em: 25 set. 2023. https://support.minitab.com/pt-br/minitab/21/help-and-how-to/statistical-modeling/multivariate/how-to/cluster-observations/methods-and-formulas/linkage-methods/Acesso https://support.minitab.com/pt-br/minitab/21/help-and-how-to/statistical-modeling/multivariate/how-to/cluster-observations/methods-and-formulas/linkage-methods/Acesso https://support.minitab.com/pt-br/minitab/21/help-and-how-to/statistical-modeling/multivariate/how-to/cluster-observations/methods-and-formulas/linkage-methods/Acesso https://student.ulife.com.br/ContentPlayer/Index?Ic+5g8qUwH796Ts6u7zRee https://student.ulife.com.br/ContentPlayer/Index?Ic+5g8qUwH796Ts6u7zRee
Compartilhar