Prévia do material em texto
<p>27/08/2021 Atividade Objetiva 2: Mineração de Dados Atividade Objetiva 2 Entrega 16 abr em 23:59 Pontos 1 Perguntas 5 Disponível 10 fev em 0:00 16 abr em 23:59 2 meses Limite de tempo Nenhum Tentativas permitidas 2 Instruções Importante: Caso você esteja realizando a atividade através do aplicativo "Canvas Student", é necessário que você clique em "FAZER o QUESTIONÁRIO", no final da página. Este teste não está mais disponível, pois o curso foi concluído. Histórico de tentativas Tentativa Tempo Pontuação MANTIDO Tentativa 2 4 minutos 1 de 1 MAIS RECENTE Tentativa 2 4 minutos Tentativa 1 6 minutos 0,8 de 1 Pontuação desta tentativa: 1 de 1 Enviado 16 abr em 1:11 Esta tentativa levou 4 minutos. Pergunta 1 0,2/0,2 pts Leia o texto a seguir: Algumas medidas podem ser usadas para resumir a informação contida em uma distribuição de probabilidade de um atributo ou sumarizar a informação contida em uma base de dados. [...] as medidas de dispersão expressam quantitativamente a variabilidade, ou dispersão, dos dados. 1/8</p><p>27/08/2021 Atividade Objetiva 2: Mineração de Dados Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 68-70. A utilização das medidas de posição e de dispersão são importantes para descrever as características dos conjuntos de dados e... Correto! a mediana é um exemplo de medida de posição que descreve a tendência de concentração nos dados. A alternativa está correta, pois a mediana e a média são medidas de posição. desvio padrão, a variância e a amplitude são medidas de dispersão. As medidas de posição descrevem a tendência de concentração nos dados. As medidas de dispersão descrevem o grau de variação nos dados. a variância é um exemplo de medida de dispersão que descreve a tendência de concentração nos a média é um exemplo de medida de dispersão que descreve o grau de variação nos dados. o desvio padrão é um exemplo de medida de posição que descreve o grau de variação nos dados. No answer text provided. Pergunta 2 0,2/0,2 pts Leia o texto a seguir: 2/8</p><p>27/08/2021 Atividade Objetiva 2: Mineração de Dados A análise de grupos, também conhecida como agrupamento de dados, é um termo genérico utilizado para designar um amplo espectro de métodos numéricos de análise de dados multivariados com o objetivo de descobrir grupos homogêneos de objetos. O agrupamento de objetos em diferentes grupos pode simplesmente representar uma forma conveniente de organizar grandes bases de dados [...] Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 88. Considerando a tarefa de agrupamento de dados, avalie as afirmações seguintes: I. agrupamento de dados é utilizado quando não temos um rótulo que possibilite sua classificação. II. agrupamento é uma tarefa que considera medidas de similaridade como as distâncias de Hunt e de Anscombe. III. São métodos considerados para a tarefa de agrupamento o hierárquico, o divisivo e o particional. É correto o que se afirma em: e III, apenas. Correto! e III, apenas. 3/8</p><p>27/08/2021 Atividade Objetiva 2: Mineração de Dados A alternativa está correta, pois apenas as afirmações e III são verdadeiras. A afirmação é verdadeira, pois a tarefa de agrupamento é, de fato, utilizada quando os dados não apresentam rótulo. A afirmação III é verdadeira, pois os métodos hierárquico, divisivo e particional são pertinentes à tarefa de agrupamento. A afirmação é falsa, pois o uso de medidas de similaridade é parte da tarefa de agrupamento, porém, Hunt e Anscombe não são exemplos de medidas de similaridade. II, apenas. I, apenas. III, apenas. Pergunta 3 0,2/0,2 pts Leia o texto abaixo: Há diversos algoritmos de agrupamento na literatura e a escolha de um deles depende da aplicação e dos tipos dos dados. Considere uma base de dados Xn} com n objetos, onde n, corresponde a um vetor de dados com m atributos. Uma partição dos dados é uma coleção C = {C1, Ck} de k subconjuntos. Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 105. Considere as seguintes descrições a respeito dos tipos de algoritmos de agrupamento. 4/8</p><p>27/08/2021 Atividade Objetiva 2: Mineração de Dados I. Hierárquico aglomerativo: consideram uma decomposição dos dados em níveis de hierarquia de modo que, ao final do processo, haja apenas um elemento por grupo; II. Hierárquico divisivo: consideram uma decomposição dos dados em níveis de hierarquia de modo que, ao final do processo, reste apenas um único grande grupo; III. Particionais: objetivam dividir o conjunto original em partições menores, de modo que os elementos em cada partição sejam similares entre si; IV. Politéticos: descreve o uso sequencial ou simultâneo dos atributos no processo de agrupamento, todos os atributos são utilizados para o cálculo das distâncias. É correto o que se afirma apenas em: e II, apenas. e III, apenas. Correto! III e IV, apenas. A alternativa está correta, pois apenas as afirmações III e IV são verdadeiras. A afirmação III é verdadeira, pois os algoritmos particionais buscam dividir o conjunto em partições menores e similares. A afirmativa IV está correta, pois os algoritmos politéticos utilizam todos os atributos para o cálculo das distâncias. A afirmativa IV é verdadeira, pois os algoritmos politéticos utilizam todos os atributos para o cálculo das distâncias. A afirmação é falsa, pois os algoritmos hierárquicos aglomerativos buscam como resultado um único grande grupo. A afirmação A afirmação é falsa, pois os algoritmos hierárquicos divisivos buscam como resultado vários grupos com um único elemento. e III, apenas. e IV, apenas. 5/8</p><p>27/08/2021 Atividade Objetiva 2: Mineração de Dados Pergunta 4 0,2 0,2 pts Leia o texto a seguir: Quarteto de Anscombe é o nome dado a quatro conjuntos de dados que têm estatísticas descritivas quase idênticas [...] Cada conjunto de dados consiste de onze pontos (x,y). Eles foram construídos em 1973 pelo estatístico Francis Anscombe [...] (Fonte: CONTEÚDO aberto. In: Wikipédia: a enciclopédia livre. Disponível em: https://pt.wikipedia.org/wiki/Quarteto_de_Anscombe Acesso em: 13 set 2020. Considerando o conjunto de dados denominado Quarteto de Anscombe, avalie as seguintes afirmações: I. Os conjuntos têm medidas de estatísticas descritivas quase idênticas refletindo a distribuição dos dados. II. Os conjuntos demonstram a importância do uso individual de medidas de estatísticas descritivas para a representação de dados. III. Os conjuntos demonstram que a visualização dos dados é uma importante forma complementar de análise. IV. Os conjuntos representam um exemplo de análise descritiva que reforça a utilização de formas adicionais de análise. É correto o que se afirma apenas em: e IV, apenas. Correto! III e IV, apenas. 6/8</p><p>27/08/2021 Atividade Objetiva 2: Mineração de Dados A alternativa está correta, pois apenas as afirmações III e IV são verdadeiras. A afirmação III é verdadeira, pois os conjuntos de fato demonstram a importância da visualização dos dados como forma complementar. A afirmação IV é verdadeira, pois a análise descritiva deve ser feita com a utilização de diferentes formas adicionais de análise. A afirmação é falsa, pois os conjuntos têm medidas de estatística descritiva quase idênticas e distribuição muito distintas. A afirmação é falsa, pois os conjuntos demonstram a importância do uso de medidas de estatística descritiva em conjunto com outros métodos de representação. e III, apenas. e II, apenas. e III, apenas. Pergunta 5 0,2/0,2 pts Leia o texto a seguir: O agrupamento de dados é uma técnica comum em análise de dados [...] Muitas vezes, há diferentes agrupamentos possíveis para a mesma base de dados e, portanto, a utilidade do agrupamento depende do propósito da análise. O uso de modelos preditivos é muito intenso na automação de processos de tomada de decisão. [...] é possível, em princípio, projetar um modelo preditivo capaz de estimar o valor de novos objetos. Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 88-89, 156. 7/8</p><p>27/08/2021 Atividade Objetiva 2: Mineração de Dados Considerando as descrições apresentadas, assinale a opção correta. Os objetos rotulados são apresentados ao algoritmo de agrupamento para que ele seja treinado e possa aprender um modelo. A tarefa de classificação é uma tarefa descritiva, enquanto a tarefa de agrupamento é uma tarefa preditiva. Correto! Na classificação, a base de dados de entrada do algoritmo é rotulada, ou seja, cada objeto possui sua classe correspondente. A alternativa está correta, pois de fato a classificação considera dados rotulados para o aprendizado do modelo preditivo, ou seja, cada objeto tem sua classe conhecida previamente. A tarefa do algoritmo de classificação é identificar grupos que possam reunir os objetos pela similaridade de seus atributos. Os algoritmos de agrupamento consideram as classes pré-existentes para a composição de grupos de objetos similares. Pontuação do teste: 1 de 1 8/8</p>