Prévia do material em texto
06/09/22, 18:54 Atividade Objetiva de Revisão - Análise de agrupamento: 09 - Machine Learning (2020) https://pucminas.instructure.com/courses/24704/quizzes/48163?module_item_id=372006 1/5 Atividade Objetiva de Revisão - Análise de agrupamento Entrega Sem prazo Pontos 4 Perguntas 4 Limite de tempo Nenhum Tentativas permitidas Sem limite Histórico de tentativas Tentativa Tempo Pontuação MAIS RECENTE Tentativa 1 2 minutos 2 de 4 As respostas corretas estão ocultas. Pontuação desta tentativa: 2 de 4 Enviado 26 mai em 20:41 Esta tentativa levou 2 minutos. Fazer o teste novamente 1 / 1 ptsPergunta 1 A tarefa de análise de agrupamento, ou clustering, consiste em uma técnica de aprendizado: supervisionado. semi-supervisionado. não supervisionado. fracamente-supervisionado. https://pucminas.instructure.com/courses/24704/quizzes/48163/history?version=1 https://pucminas.instructure.com/courses/24704/quizzes/48163/take?user_id=83556 06/09/22, 18:54 Atividade Objetiva de Revisão - Análise de agrupamento: 09 - Machine Learning (2020) https://pucminas.instructure.com/courses/24704/quizzes/48163?module_item_id=372006 2/5 As análises de agrupamento, ou clustering, consistem em técnicas de aprendizado não supervisionado. Nessa técnicas, o número de grupos não é predeterminado, e não existe um atributo alvo que deve ser previsto. 0 / 1 ptsPergunta 2IncorretaIncorreta Considere as afirmativas a seguir sobre métodos de agrupamento. 1. A escolha da métrica apropriada pode influenciar o formato do cluster. 2. Os algoritmos, em geral, utilizam uma abordagem gulosa (greedy) para as operações de particionamento ou fusão. 3. Os algoritmos de hierárquicos podem não convergir para uma solução. Está correto o que se afirma em: 2 e 3, apenas. 1 e 3, apenas. 1 e 2, apenas. 1, 2 e 3. Errado. 06/09/22, 18:54 Atividade Objetiva de Revisão - Análise de agrupamento: 09 - Machine Learning (2020) https://pucminas.instructure.com/courses/24704/quizzes/48163?module_item_id=372006 3/5 Alguns elementos podem estar perto em algumas métricas, mas distantes em outra métrica. Compare a distância Euclidiana com a Distância de Chebishev, que são dois exemplos de métricas simples e muito utilizadas que produzem resultados diferentes. Os algoritmos utilizam abordagem gulosa, que sempre escolhem a menor distância para realizar as fusões ou a maior distância para realizar os particionamentos. Os algoritmo hierárquicos sempre produzirão um dendograma. Os algoritmos de particionamento como a K-means é que podem não convergir, devido a natureza aleatória da escolha dos clusteres iniciais e pela sua característica iterativa que só para quando não houverem mais realocações. 1 / 1 ptsPergunta 3 A matriz de distâncias a seguir foi construída a partir da preferência de consumidores sobre 4 estilos diferentes de Cerveja: Estilo Ale Pilsen Lager IPA Ale 0 7 10 13 Pilsen 0 3 12 Lager 0 15 IPA 0 Usando o processo de agrupamento hierãrquico com Single Linkage, podemos agrupar os dados nos clústeres: {Pilsen, Lager} e {Ale, IPA} {Lager} e {IPA, Ale, Pilsen} {IPA} e {Ale, Pilsen, Lager} 06/09/22, 18:54 Atividade Objetiva de Revisão - Análise de agrupamento: 09 - Machine Learning (2020) https://pucminas.instructure.com/courses/24704/quizzes/48163?module_item_id=372006 4/5 Correto. {Ale, Pilsen} e {Lager, IPA} O dendograma resultante do algoritmo de Single Linkage é: Pelo dendograma podemos observar que, se desejarmos dividir do dataset em dois clusters, os grupos resultantes seriam {IPA} e {Ale, Pilsen, Lager}. 0 / 1 ptsPergunta 4IncorretaIncorreta Sobre os algoritmos de aprendizado para análise de agrupamento, é correto afirmar que: Ao contrário do agrupamento hierárquico baseado em dendograma, o aprendizado pela K-means exige que o número de clústeres seja predeterminado. 06/09/22, 18:54 Atividade Objetiva de Revisão - Análise de agrupamento: 09 - Machine Learning (2020) https://pucminas.instructure.com/courses/24704/quizzes/48163?module_item_id=372006 5/5 Tanto a K-means quanto os algoritmos hierárquicos encontram a solução ótima global da partição em relação à distância quadrática médica entre os exemplos e o centroide mais próximo. O algoritmo K-means particiona o espaço de características em hiper- esferas, enquando os algoritmos baseados em dendogramas não possuem uma estrutura fixa. O algoritmo da K-means atribui uma probabilidade de que um determinado exemplo pertença a um cluster específico. O aprendizado pela K-means tem como hiper-parâmetro o número de clústeres em que se deseja agrupar os dados. Os algoritmos baseados em dendograma, por outro lado são uma classe de algoritmos baseados em grafos que nos permitem gerar uma estrutura que pode ser posteriormente particionada em quantos clústeres forem necessários, sem a necessidade de novo aprendizado. É incorreto afirmar que o algoritmo K-means divide o espaço em hiper-esferas, pois isso só é verdade no caso de se utilizar a distância euclidiana no espaço de características. O algoritmo K-means não atribui probabilidades, mas trabalha com conjuntos crisp, ou seja, o exemplo pertence ou não pertence a um cluster específico. O algoritmo K-means é um algoritmo guloso e não garante que irá encontrar um ótimo global. Por isso é necessário se executar o algoritmo múltiplas vezes e escolher a melhor solução. Pontuação do teste: 2 de 4