Prévia do material em texto
Atividade 2
Entrega 22 out em 23:59 Pontos 1 Perguntas 5
Disponível 14 ago em 0:00 - 22 out em 23:59 Limite de tempo Nenhum
Tentativas permitidas 2
Instruções
Este teste foi travado 22 out em 23:59.
Histórico de tentativas
Tentativa Tempo Pontuação
MAIS RECENTE Tentativa 1 68 minutos 1 de 1
Pontuação desta tentativa: 1 de 1
Enviado 5 out em 22:40
Esta tentativa levou 68 minutos.
Importante:
Caso você esteja realizando a atividade através do aplicativo "Canvas Student", é necessário que você clique em
"FAZER O QUESTIONÁRIO", no final da página.
0,2 / 0,2 ptsPergunta 1
Leia o texto a seguir:
O agrupamento de dados é uma técnica comum em análise de dados [...] Muitas
vezes, há diferentes agrupamentos possíveis para a mesma base de dados e,
portanto, a utilidade do agrupamento depende do propósito da análise.
O uso de modelos preditivos é muito intenso na automação de processos de
tomada de decisão. [...] é possível, em princípio, projetar um modelo preditivo
capaz de estimar o valor de novos objetos.
Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados:
conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 88-
A+
A
A-
https://famonline.instructure.com/courses/31415/quizzes/156260/history?version=1
89, 156.
Considerando as descrições apresentadas, assinale a opção correta.
A tarefa de classificação é uma tarefa descritiva, enquanto a tarefa de agrupamento
é uma tarefa preditiva.
Os objetos rotulados são apresentados ao algoritmo de agrupamento para que ele
seja treinado e possa aprender um modelo.
A tarefa do algoritmo de classificação é identificar grupos que possam reunir os
objetos pela similaridade de seus atributos.
Na classificação, a base de dados de entrada do algoritmo é rotulada, ou seja, cada
objeto possui sua classe correspondente.
Correto!Correto!
A alternativa está correta, pois de fato a classificação considera dados
rotulados para o aprendizado do modelo preditivo, ou seja, cada objeto tem
sua classe conhecida previamente.
Os algoritmos de agrupamento consideram as classes pré-existentes para a
composição de grupos de objetos similares.
0,2 / 0,2 ptsPergunta 2
Leia o texto a seguir:
Algumas medidas podem ser usadas para resumir a informação contida em uma
distribuição de probabilidade de um atributo ou sumarizar a informação contida
A+
A
A-
em uma base de dados. [...] as medidas de dispersão expressam
quantitativamente a variabilidade, ou dispersão, dos dados.
Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados:
conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 68-
70.
A utilização das medidas de posição e de dispersão são importantes para
descrever as características dos conjuntos de dados e...
a mediana é um exemplo de medida de posição que descreve a tendência de
concentração nos dados.
Correto!Correto!
A alternativa está correta, pois a mediana e a média são medidas de posição.
O desvio padrão, a variância e a amplitude são medidas de dispersão. As
medidas de posição descrevem a tendência de concentração nos dados. As
medidas de dispersão descrevem o grau de variação nos dados.
a variância é um exemplo de medida de dispersão que descreve a tendência de
concentração nos dados.
a média é um exemplo de medida de dispersão que descreve o grau de variação
nos dados.
No answer text provided.
o desvio padrão é um exemplo de medida de posição que descreve o grau de
variação nos dados.
0,2 / 0,2 ptsPergunta 3
A+
A
A-
Leia o texto abaixo:
Há diversos algoritmos de agrupamento na literatura e a escolha de um deles
depende da aplicação e dos tipos dos dados. Considere uma base de dados X =
{x , x ,..., x } com n objetos, onde x , j = 1,..., n, corresponde a um vetor de dados
com m atributos. Uma partição dos dados é uma coleção C = {C , C ,..., C } de k
subconjuntos.
Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados:
conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 105.
Considere as seguintes descrições a respeito dos tipos de algoritmos de
agrupamento.
I. Hierárquico aglomerativo: consideram uma decomposição dos dados em
níveis de hierarquia de modo que, ao final do processo, haja apenas um
elemento por grupo;
II. Hierárquico divisivo: consideram uma decomposição dos dados em níveis de
hierarquia de modo que, ao final do processo, reste apenas um único grande
grupo;
III. Particionais: objetivam dividir o conjunto original em partições menores, de
modo que os elementos em cada partição sejam similares entre si;
IV. Politéticos: descreve o uso sequencial ou simultâneo dos atributos no processo
de agrupamento, todos os atributos são utilizados para o cálculo das distâncias.
É correto o que se afirma apenas em:
1 2 n j
1 2 k
I e II, apenas.
II e III, apenas.
I e III, apenas.
II e IV, apenas.
A+
A
A-
III e IV, apenas. Correto!Correto!
A alternativa está correta, pois apenas as afirmações III e IV são verdadeiras.
A afirmação III é verdadeira, pois os algoritmos particionais buscam dividir o
conjunto em partições menores e similares.
A afirmativa IV é verdadeira, pois os algoritmos politéticos utilizam todos os
atributos para o cálculo das distâncias.
A afirmação I é falsa, pois os algoritmos hierárquicos aglomerativos buscam
como resultado um único grande grupo.
A afirmação II é falsa, pois os algoritmos hierárquicos divisivos buscam como
resultado vários grupos com um único elemento.
0,2 / 0,2 ptsPergunta 4
Leia o texto a seguir:
A análise de grupos, também conhecida como agrupamento de dados, é um
termo genérico utilizado para designar um amplo espectro de métodos numéricos
de análise de dados multivariados com o objetivo de descobrir grupos
homogêneos de objetos. O agrupamento de objetos em diferentes grupos pode
simplesmente representar uma forma conveniente de organizar grandes bases de
dados [...]
Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados:
conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 88.
Considerando a tarefa de agrupamento de dados, avalie as afirmações seguintes:
I. O agrupamento de dados é utilizado quando não temos um rótulo que
possibilite sua classificação.
II. O agrupamento é uma tarefa que considera medidas de similaridade como as
distâncias de Hunt e de Anscombe.
III. São métodos considerados para a tarefa de agrupamento o hierárquico, o
divisivo e o particional.
A+
A
A-
É correto o que se afirma em:
III, apenas.
II, apenas.
I e III, apenas. Correto!Correto!
A alternativa está correta, pois apenas as afirmações I e III são verdadeiras.
A afirmação I é verdadeira, pois a tarefa de agrupamento é, de fato, utilizada
quando os dados não apresentam rótulo.
A afirmação III é verdadeira, pois os métodos hierárquico, divisivo e particional
são pertinentes à tarefa de agrupamento.
A afirmação II é falsa, pois o uso de medidas de similaridade é parte da tarefa
de agrupamento, porém, Hunt e Anscombe não são exemplos de medidas de
similaridade.
II e III, apenas.
I, apenas.
0,2 / 0,2 ptsPergunta 5
Leia o texto a seguir:
Quarteto de Anscombe é o nome dado a quatro conjuntos de dados que têm
estatísticas descritivas quase idênticas [...] Cada conjunto de dados consiste de
onze pontos (x,y). Eles foram construídos em 1973 pelo estatístico Francis
Anscombe [...]
(Fonte: CONTEÚDO aberto. In: Wikipédia: a enciclopédia livre. Disponível em:
https://pt.wikipedia.org/wiki/Quarteto_de_Anscombe Acesso em: 13 set 2020.
A+
A
A-
Considerando o conjunto de dados denominado Quarteto de Anscombe, avalie as
seguintes afirmações:
I. Os conjuntos têm medidas de estatísticas descritivas quase idênticas
refletindo a distribuição dos dados.
II. Os conjuntos demonstram a importância do uso individual de medidas de
estatísticas descritivas para a representação de dados.
III. Os conjuntos demonstram que a visualizaçãodos dados é uma importante
forma complementar de análise.
IV. Os conjuntos representam um exemplo de análise descritiva que reforça a
utilização de formas adicionais de análise.
É correto o que se afirma apenas em:
II e III, apenas.
II e IV, apenas.
III e IV, apenas. Correto!Correto!
A alternativa está correta, pois apenas as afirmações III e IV são verdadeiras.
A afirmação III é verdadeira, pois os conjuntos de fato demonstram a
importância da visualização dos dados como forma complementar.
A afirmação IV é verdadeira, pois a análise descritiva deve ser feita com a
utilização de diferentes formas adicionais de análise.
A afirmação I é falsa, pois os conjuntos têm medidas de estatística descritiva
quase idênticas e distribuição muito distintas.
A afirmação II é falsa, pois os conjuntos demonstram a importância do uso de
medidas de estatística descritiva em conjunto com outros métodos de
representação.
I e II, apenas.
I e III, apenas.
Pontuação do teste: 1 de 1
A+
A
A-