Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNP - UNIVERSIDADE POTIGUAR BACHARELADO EM ESTATÍSTICA DISCIPLINA: MINERAÇÃO DE DADOS UNIDADE 4 - ALGORITMOS DE AGRUPAMENTO E DE ASSOCIAÇÃO AUTOR: ESP. WESLEY SOARES DE SOUZA REVISOR: BRUNO ROBERTO NEPOMUCENO MATHEUS Atividade 4 (PRATIQUE E COMPARTILHE) apresentada ao curso bacharelado em Estatística, ofertado pela Universidade Potiguar, como requisito complementar para a quarta avaliação da disciplina Mineração de Dados – Unidade 4 - Algoritmos de Agrupamento e de Associação. Autor: Esp. Wesley Soares de Souza Revisor: Bruno Roberto Nepomuceno Matheus ALUNO: EBERSON COSTA – MATRÍCULA 2020201380 BENEVIDES – PARÁ 2021 MINERAÇÃO DE DADOS UNIDADE 4 ALGORITMOS DE AGRUPAMENTO E DE ASSOCIAÇÃO PRATIQUE E COMPARTILHE PLANEJAMENTO DE AMOSTRAGENS, VÍCIOS DE AMOSTRAGENS, BIG DATA Vamos Praticar Levando em consideração o estudo citado, observa-se que alguns métodos são coincidentes no sentido de trazerem resultados semelhantes, explique o fato e como podemos evitar tal situação quando desenvolvemos um projeto. Ao final disponibilize seu trabalho no fórum da seção. Conforme se viu os algoritmos utilizados foram os Métodos, da Ligação Simples, da Ligação Completa, da Centróide, da Mediana, das Médias das Distâncias e de Ward. Logo, os resultados obtidos na utilização dos métodos, se assemelharam ao nível de significância, sendo relativamente alto, concluindo-se que qualquer algoritmo de agrupamento estudado, se encontrou estabilizado e de fato os indivíduos existentes se equipararam conforme o demonstrado. Observou-se também que com exceção dos métodos centróide e Ward e os métodos do centróide e mediana, os outros foram coincidentes comparados com Ward, levando-se em consideração a matriz de Mahalanobis, com dados originais e ‘bootstrap’. Esse fato se evidencia porque a análise associativa consiste em mostrar em quais condições ocorrem frequentemente juntas os determinados conjuntos de dados. Sua premissa básica é encontrar elementos que implicam na presença de outros (elementos) em uma mesma transação, pois o agrupamento é a forma de segmentar as populações heterogêneas em subgrupos homogêneos. Deduz-se, que para se evitar tal situação, a saída é a utilização da classificação e predição, que analisam objetos com classes rotuladas, onde o agrupamento ou clustering analisa objetos cujos rótulos de classes são desconhecidas. REFERÊNCIAS ALBUQUERQUE, M.A.; FERREIRA, R.L.C.; SILVA, J.A.A.; SANTOS, E.S.;STOSIC, B.;SOUZA, A.L.; Estabilidade em Análise de Agrupamento: Estudo de Caso em Ciência Florestal. Sociedade de Investigações Florestais, UFRPE:Viçosa. 2006.Disponíveloem:o<http://www.scielo.br/scielo.php?pid=S0100o67622006000200 013&script=sci_abstract&tlng=pt> Acesso em: 31 Dez. 2019. JOHNSON, R. A.; WICHERN, D. W. Applied multivariate statistical analysis. 3.ed. New Jersey: Prantice Hall, 1992. 642p. MARDIA, A.K.V.; KENT, J.T.; BIBBY, J.M. Multivariate analysis. London:Academic.Press, 1997. 518p. PETERMANN, R.J.; Modelo de Mineração de Dados para Classificação de Clientes em Telecomunicações. Tese de Mestrado. PPGE-UFRS:Porto Alegre.2006. VASCONCELOS, L.M.R.; CARVALHO, C.L.; Aplicação de Regras de Associação para Mineração de Dados na Web. Relatório Técnico. UFG:Goiás. 2004.
Compartilhar