Baixe o app para aproveitar ainda mais
Prévia do material em texto
D509.EAD - Mineração de Dad… Ques�onários A�vidade 4 Conta Painel de controle Cursos Grupos Calendário Caixa de entrada Histórico Ajuda A�vidade 4 Iniciado: 26 nov em 0:10 Instruções do teste Salvando... Graduação Semestral | 2023.2 Página inicial Avisos Fóruns Módulos Tarefas Programa Zoom Importante: Caso você esteja realizando a a�vidade através do aplica�vo "Canvas Student", é necessário que você clique em "FAZER O QUESTIONÁRIO", no final da página. 0,2 ptsPergunta 1 Leia o texto a seguir: “A avaliação do resultado ob�do na análise de agrupamento é comumente chamada de validação. Na validação do modelo de grupos resultante de um algoritmo, tem-se o obje�vo de avaliar se esse modelo de fato representa a organização dos exemplares no conjunto de dados sob análise.” Fonte: DA SILVA, L. A.; PERES, S. M.; BOSCARIOLI, C. Introdução à Mineração de Dados Com aplicações em R. Rio de Janeiro: Elsevier, 2016. p. 179. Avalie as seguintes asserções e a relação proposta entre elas. I. A avaliação dos resultados ob�dos a par�r de algoritmos de agrupamento pode ser feita considerando critérios de o�mização. Nesse caso, se busca encontrar grupos que minimizam ou maximizam um critério específico. PORQUE II. As relações Within-Cluster e Between-Cluster medem a compactação (densidade) nos grupos e entre os grupos, o ideal é um alto within nos grupos e um baixo between entre os grupos. A respeito dessas asserções, assinale a opção correta As asserções I e II são proposições verdadeiras, mas a II não é uma jus�fica�va da I. A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. As asserções I e II são ambas proposições falsas. As asserções I e II são proposições verdadeiras, e a II é uma jus�fica�va da I. A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. 0,2 ptsPergunta 2 Leia o texto a seguir: “Árvore de decisão é uma das técnicas mais populares de mineração de dados. Mais comumente usada para resolver a tarefa de classificação de dados, a árvore de decisão consiste em uma coleção de nós internos e nós folhas, organizados em um modelo hierárquico (da mesma forma que se organizam as estruturas de dados do �po árvore). ” Fonte: DA SILVA, L. A.; PERES, S. M.; BOSCARIOLI, C. Introdução à Mineração de Dados Com aplicações em R. Rio de Janeiro: Elsevier, 2016. p. 101. Considerando as afirmações apresentadas, assinale a opção correta. A escolha do atributo predi�vo, que dividirá o conjunto de dados, deve ser feita considerando aquele que melhor par�ciona o conjunto, diferentes atributos resultam em diferentes par�ções. A opção deve considerar o atributo mais discrimina�vo, de modo a obter melhores par�ções. Boas par�ções são aquelas que apresentam um maior grau de pureza. Assim, subconjuntos que contem registros de muitas classes são o obje�vo, visto que, nesses casos, podemos dividir o subconjunto de modo que haja poucos registros em cada folha da árvore. Existem diferentes formas de medir o grau de pureza (ou impureza) nos subconjuntos ob�dos a par�r da divisão. Dependendo do atributo escolhido teremos diferentes subconjuntos e as medidas de impureza avaliam cada combinação. Uma destas medidas é denominada Hunt. Enquanto os objetos que estão em um determinado subconjunto, ou vér�ce na árvore, têm a mesma classe o subconjunto deve ser dividido. A divisão se encerra quando os objetos do subconjunto têm valores iguais para os atributos de entrada (predi�vos), porém têm classes diferentes. As divisões na árvore de decisão devem ser binárias. Atributos categóricos que apresentam duas categorias resultarão em divisões binárias. Por outro lado, atributos com mais de duas categorias, ou atributos numéricos, devem ser agrupados para possibilitar uma divisão binária. 0,2 ptsPergunta 3 Leia o texto a seguir: “Informalmente, um algoritmo é qualquer procedimento computacional bem definido que toma algum valor ou conjunto de valores como entrada e produz algum valor ou conjunto de valores como saída. Portanto, um algoritmo é uma sequência de etapas computacionais que transforma a entrada na saída.” Fonte: CORMEN, T. H.; LEISERSON, C. E.; RIVEST, R. L.; STEIN, C. Algoritmos: Teoria e Prá�ca. Rio de Janeiro: Elsevier, 2012. p. 03. Qual alterna�va indica corretamente exemplos de algoritmos de agrupamento? Árvores de regressão, redes neurais, máquinas de vetores de suporte. Regressão linear, regressão polinomial, rede neural Adaline. k-médias, k-medoides, Single-Link. Árvores de decisão, k-NN, regras de classificação. Apriori, FP-Growth, algoritmo de Hunt. 0,2 ptsPergunta 4 Leia o texto a seguir: “Uma vez construída a árvore, ela pode ser usada para classificar um objeto de classe desconhecida. Para isso, basta testar os valores dos atributos na árvore e percorrê-la até se a�ngir um nó folha, que corresponde à classe predita para aquele objeto. As árvores de decisão possuem as vantagens [...] esse �po de modelo [...] é chamado de caixa branca. ” Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 170. Considerando as vantagens e desvantagens apresentadas pela árvore de decisão, avalie as afirmações e selecione a alterna�va correta. I. As árvores de decisão apresentam alto custo computacional na indução do modelo predi�vo e na dedução de uma classe. II. Dependendo do conjunto de dados, a árvore de decisão tem uma precisão comparável com classificadores mais sofis�cados. III. Dependendo das suas dimensões, a árvore de decisão possibilita explicar facilmente a hipótese induzida para um novo objeto. IV. Para problemas que apresentam muitas classes e poucos objetos o desempenho (asser�vidade) da árvore de decisão é alto. É correto o se afirma apenas em: II e IV, apenas. I e III, apenas. III e IV, apenas. I e II, apenas. II e III, apenas. 0,2 ptsPergunta 5 Leia o texto a seguir: “Os algoritmos par�cionais mais usados são o k-médias, o k-medoides e variações de ambos. A maioria dos algoritmos hierárquicos são variações dos métodos mais populares dessa categoria: single-link e complete-link. Também são descritos algoritmos baseados em densidade (DBSCAN), em grafos (MST) e em par�cionamento não exclusivo (fuzzy k-médias).” Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 116. Considere as seguintes descrições a respeito do funcionamento do algoritmo K-Means (K-Médias). I. O algoritmo K-Means (K-Médias) consiste na definição aleatória de K centroides que representam a quan�dade de grupos que se pretende obter. II. Cada objeto no conjunto de dados é associado ao centroide mais próximo, aqui se considera uma medida de distância entre os centroides e os objetos. III. A par�r da iden�ficação inicial dos grupos, os centroides são fixados para cada um deles, de modo que representem o centro de gravidade de cada grupo. IV. O processo se encerra, com a verificação das distâncias entre os centros de gravidade de cada grupo a par�r do estabelecimento arbitrário de uma distância obje�vo. É correto o que se afirma apenas em: II e IV, apenas. II e III, apenas. III e IV, apenas. I e III, apenas. I e II, apenas. Enviar teste Perguntas Pergunta 1 Pergunta 2 Pergunta 3 Pergunta 4 Pergunta 5 Tempo transcorrido: Prazo da tenta�va encerrado: 26 nov em 23:59 5 Minutos, 9 Segundos Ocultar hora A+ A A- https://famonline.instructure.com/courses/31415 https://famonline.instructure.com/courses/31415/quizzes https://famonline.instructure.com/courses/31415/quizzes/156289 https://famonline.instructure.com/ https://famonline.instructure.com/profile/settings https://famonline.instructure.com/ https://famonline.instructure.com/courses https://famonline.instructure.com/groups https://famonline.instructure.com/calendar https://famonline.instructure.com/conversations http://help.instructure.com/https://famonline.instructure.com/courses/31415 https://famonline.instructure.com/courses/31415/announcements https://famonline.instructure.com/courses/31415/discussion_topics https://famonline.instructure.com/courses/31415/modules https://famonline.instructure.com/courses/31415/assignments https://famonline.instructure.com/courses/31415/assignments/syllabus https://famonline.instructure.com/courses/31415/external_tools/34272
Compartilhar