Mineração de Dados - FAM - AO2 - 5 4pts

•

FAM

Ranieri Franco

12/06/2023

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

09/06/23, 17:54 Teste: AO2
https://famonline.instructure.com/courses/27321/quizzes/142890/take 1/12
AO2
Iniciado: 9 jun em 17:14
Instruções do teste
Importante:
Caso você esteja realizando a atividade através do aplicativo "Canvas Student", é necessário que
você clique em "FAZER O QUESTIONÁRIO", no final da página.
0,6 ptsPergunta 1
Leia o texto a seguir:
 
“Essas funções são baseadas em critérios que avaliam o quão bom cada atributo
é no papel de dividir o conjunto de dados, considerando a distribuição de classes
presentes no conjunto. [...] O índice Gini usa um critério baseado em impureza
para analisar as diferenças entre as distribuições de probabilidade dos valores
dos atributos de classe.”
 
Fonte: DA SILVA, L. A.; PERES, S. M.; BOSCARIOLI, C. Introdução à
Mineração de Dados Com aplicações em R. Rio de Janeiro: Elsevier, 2016. p.
104.
 
Avalie as seguintes asserções e a relação proposta entre elas.
 
I. A escolha de um atributo para dividir um conjunto de dados pode ser feita com a
utilização do índice Gini, quanto menor for o valor calculado mais puras serão as
partições;
 
PORQUE
 
II. O índice Gini calcula a proporção de classes diferentes em uma partição e
quanto maior for a heterogeneidade da partição, tanto maior será o valor do
índice.
A+
A
A-
09/06/23, 17:54 Teste: AO2
https://famonline.instructure.com/courses/27321/quizzes/142890/take 2/12
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I.
As asserções I e II são ambas proposições falsas.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa da I.
A asserção I é uma proposição verdadeira, e a II é uma proposição falsa.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
 
A respeito dessas asserções, assinale a opção correta:
0,6 ptsPergunta 2
Leia o texto a seguir:
 
“O algoritmo k-médias toma como entrada o parâmetro k, correspondente ao
número de grupos desejados, e particiona o conjunto de n objetos em k grupos,
de forma que a similaridade intragrupo seja alta e a similaridade intergrupo seja
baixa. A similaridade intragrupo é avaliada considerando o valor médio dos
objetos em um grupo, que pode ser visto como o seu centro de gravidade ou
centroide.”
 
Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados:
conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 116.
 
Considere as seguintes descrições a respeito da tarefa de agrupamento, mais
especificamente ao algoritmo k-médias.
 
I. A detecção de agrupamentos é uma tarefa de aprendizado preditiva também
conhecida como clustering. Nesse caso, as técnicas utilizadas são,
comumente, relativas ao aprendizado supervisionado, ou seja, o conjunto de
dados não possui rótulos e o aprendizado usa apenas os atributos preditivos;
II. Os algoritmos para tarefas preditivas produzem modelos a partir de um
processo de treinamento que utiliza todo o conjunto de dados disponível. O
A+
A
A-
09/06/23, 17:54 Teste: AO2
https://famonline.instructure.com/courses/27321/quizzes/142890/take 3/12
I e II, apenas.
II e III, apenas.
I e IV, apenas.
I e III, apenas.
III e IV, apenas.
objetivo é organizar os dados rotulados em grupos de acordo com uma
medida de similaridade ou correlação;
III. Um grupo é um conjunto de objetos similares (homogêneos) e os objetos que
pertencem a grupos diferentes são não similares (heterogêneos). O principal
objetivo do agrupamento é maximizar a homogeneidade interna nos grupos e a
heterogeneidade entre os grupos.
IV. Dependendo do atributo selecionado, poderemos ter diferentes grupos. Nesse
contexto, a detecção de agrupamentos poderá resultar em diferentes quantidades
de grupos e em composições, também diferentes, para cada grupo obtido.
 
É correto apenas o que se afirma em: 
0,6 ptsPergunta 3
Avalie o diagrama a seguir:
 
A+
A
A-
09/06/23, 17:54 Teste: AO2
https://famonline.instructure.com/courses/27321/quizzes/142890/take 4/12
Superfitting é o nome que se dá quando há muito ajuste dos dados pela curva da
função aprendida.
Underfitting é o nome que se dá quando há pouco ajuste dos dados pela curva da
função aprendida.
Interfitting é o nome que se dá quando há uma correlação forte entre os valores das
variáveis independentes e as dependentes.
Subfitting é o nome que se dá quando há poucas variáveis independentes no
conjunto de dados.
Overfitting é o nome que se dá quando há muitas variáveis independentes no
conjunto de dados.
 
Fonte: JANOS, M. 3 Dimensões Inteligência Artificial nas Empresas, 2020.
Disponível em: https://www.3dimensoes.com.br/post/overfitting-e-underfitting.
Acesso em: 07 out. 2020.
 
Sobre a tarefa de regressão linear, o diagrama descreve exemplos de funções
aprendidas a partir da análise de dados. Nesse contexto, selecione a alternativa
correta, dentre as disponíveis abaixo, sobre o ajustamento de funções lineares
aos dados. 
A+
A
A-
09/06/23, 17:54 Teste: AO2
https://famonline.instructure.com/courses/27321/quizzes/142890/take 5/12
0,6 ptsPergunta 4
A asserção I é uma proposição verdadeira, e a II é uma proposição falsa.
As asserções I e II são ambas proposições falsas.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa da I.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I.
Leia o texto a seguir:
 
“A análise de grupos pode ser aplicada em diversas áreas do conhecimento, por
exemplo, na medicina, para a identificação de categorias de diagnósticos,
pacientes e remédios; na biologia, para propor uma taxonomia de animais e
plantas; na agricultura, para categorizar plantas, solos e frutos em diferentes
tipos; [...] e muitas outras.”
 
Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados:
conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 89.
Avalie as seguintes asserções e a relação proposta entre elas.
 
I. Na classificação, os objetos considerados são identificados, previamente, com
seus respectivos rótulos que definem sua pertinência à classe.
 
PORQUE
 
II. No agrupamento, o problema consiste em segmentar uma base de dados não
rotulada em grupos que tenham algum significado ou utilidade prática.
 
A respeito dessas asserções, assinale a opção correta:
 
A+
A
A-
09/06/23, 17:54 Teste: AO2
https://famonline.instructure.com/courses/27321/quizzes/142890/take 6/12
0,6 ptsPergunta 5
O algoritmo que induz uma árvore de decisão produzirá o mesmo resultado a partir
do mesmo conjunto de dados.
A escolha do atributo que dividirá o conjunto de dados é feita a partir de medidas de
pureza.
O objetivo principal para cada divisão feita na árvore de decisão é a obtenção
partições heterogêneas.
A divisão das partições na árvore de decisão deve ser realizada até que haja nós
folha unitários.
Uma árvore de decisão particionará um conjunto em duas partições por nível,
produzindo uma árvore binária.
Leia o texto a seguir:
 
“Uma árvore de decisão é uma estrutura em forma de árvore na qual cada nó
interno corresponde a um teste de um atributo, cada ramo representa um
resultado do teste e os nós folhas representam classes ou distribuições de
classes. O nó mais elevado da árvore é conhecido como nó raiz, e cada caminho
da raiz até um nó folha corresponde a uma regra de classificação.”
 
Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados:
conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 170.
 
Qual alternativa descreve, corretamente, uma característica da árvore de decisão.
0,6 ptsPergunta 6
Leia o texto a seguir:
 
A+
A
A-
09/06/23, 17:54 Teste: AO2
https://famonline.instructure.com/courses/27321/quizzes/142890/take 7/12
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa da I.
As asserções I e II são ambas proposiçõesfalsas.
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I.
A asserção I é uma proposição verdadeira, e a II é uma proposição falsa.
“O valor de um atributo de um dado objeto é uma medida da quantidade daquele
atributo, a qual pode ser numérica ou categórica. Os atributos numéricos podem
assumir quaisquer valores numéricos [...] ao passo que as quantidades
categóricas assumem valores correspondentes a símbolos distintos.”
 
Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados:
conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 30.
 
Avalie as seguintes asserções e a relação proposta entre elas.
 
I. Os atributos numéricos discretos têm seus valores obtidos a partir de processos
de medição e os atributos contínuos têm seus valores obtidos a partir de
processos de contagem.
 
PORQUE
 
II. Os valores numéricos discretos pertencem ao conjunto dos números naturais e
os valores numéricos contínuos pertencem ao conjunto dos números reais.
 
A respeito dessas asserções, assinale a opção correta:
0,6 ptsPergunta 7
Leia o texto abaixo:
 
A+
A
A-
09/06/23, 17:54 Teste: AO2
https://famonline.instructure.com/courses/27321/quizzes/142890/take 8/12
a transformação, a mineração e a avaliação dos dados.
a análise descritiva, a associação e a detecção de anomalias nos dados.
a limpeza, a integração, a seleção ou redução e a transformação dos dados.
o agrupamento e a associação dos dados.
a análise descritiva, o agrupamento e a predição dos dados.
A mineração de dados é parte integrante de um processo mais amplo, conhecido
como descoberta de conhecimento em bases de dados (knowledge discovery in
databases, ou KDD) [...] A preparação ou pré-processamento de dados é uma
das partes principais do KKD, e correspondem as etapas anteriores à mineração
que visam preparar os dados para uma análise eficiente e eficaz.
 
(Fonte: DE CASTRO, L. N. Introdução à mineração de dados: conceitos básicos,
algoritmos e aplicações. São Paulo: Saraiva, 2016.)
 
A preparação ou pré-processamento de dados inclui
0,6 ptsPergunta 8
Leia o texto a seguir:
 
“O pré-processamento, também conhecido como preparação da base de dados,
manipula e transforma os dados brutos de maneira que o conhecimento neles
contido possa ser mais fácil e corretamente obtido. A melhor maneira de se pré-
processar os dados depende de três fatores centrais: os problemas existentes na
base, quais respostas pretende-se obter e como funcionam as técnicas de
mineração.”
 
Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados:
 conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 34.
 
A+
A
A-
09/06/23, 17:54 Teste: AO2
https://famonline.instructure.com/courses/27321/quizzes/142890/take 9/12
A limpeza cuida de permitir que métodos que trabalham apenas com atributos
nominais possam ser empregados. A integração cuida da união de múltiplas fontes
de dados. A redução cuida da diminuição da base de dados. A transformação cuida
da padronização do formato dos dados. A discretização cuida da atribuição de
valores ausentes, da remoção de ruídos e de corrigir inconsistências.
A limpeza cuida da diminuição da base de dados. A integração cuida da
padronização do formato dos dados. A redução cuida da união de múltiplas fontes de
dados. A transformação cuida de permitir que métodos que trabalham apenas com
atributos nominais possam ser empregados. A discretização cuida da atribuição de
valores ausentes, da remoção de ruídos e de corrigir inconsistências.
A limpeza cuida de permitir que métodos que trabalham apenas com atributos
nominais possam ser empregados. A integração cuida da diminuição da base de
dados. A redução cuida da união de múltiplas fontes de dados. A transformação cuida
da padronização do formato dos dados. A discretização cuida da atribuição de
valores ausentes, da remoção de ruídos e de corrigir inconsistências.
A limpeza cuida da atribuição de valores ausentes, da remoção de ruídos e de
corrigir inconsistências. A integração cuida da união de múltiplas fontes de dados. A
redução cuida da diminuição da base de dados. A transformação cuida da
padronização do formato dos dados. A discretização cuida de permitir que métodos
que trabalham apenas com atributos nominais possam ser empregados.
A limpeza cuida da padronização do formato dos dados. A integração cuida da
diminuição da base de dados. A redução cuida da união de múltiplas fontes de
dados. A transformação cuida de permitir que métodos que trabalham apenas com
atributos nominais possam ser empregados. A discretização cuida da atribuição de
valores ausentes, da remoção de ruídos e de corrigir inconsistências.
Qual alternativa descreve corretamente as principais tarefas de pré-
processamento?
0,6 ptsPergunta 9
Leia o texto abaixo:
 
Árvore de decisão é uma das técnicas mais populares de mineração de dados.
Mais comumente usada para resolver a tarefa de classificação de dados, a árvore
de decisão consiste em uma coleção de nós internos e nós folhas, organizados
em um modelo hierárquico (da mesma forma que se organizam as estruturas de
dados do tipo árvore). No contexto da resolução da tarefa de classificação, uma
árvore de decisão representa o modelo capaz de guiar a tomada de decisão
sobre a determinação da classe à qual um exemplar pertence.
A+
A
A-
09/06/23, 17:54 Teste: AO2
https://famonline.instructure.com/courses/27321/quizzes/142890/take 10/12
Os nós internos da árvore (tipo de prato) dizem respeito a atributos prescritivos de
uma ocasião em que alguém está no restaurante para realizar uma refeição.
Cada nó folha (temperatura) representa uma decisão sugerida pelo modelo
classificador para a ocasião, sugestão esta, presente no atributo rótulo do conjunto
de dados usado para induzir o modelo.
Segundo o modelo representado pela árvore, se a ocasião se refere à temperatura
alta e à hora do jantar, deve-se optar por um prato frio.
A construção da árvore é realizada por meio de um algoritmo que não precisa
analisar os atributos descritivos do conjunto de dados previamente rotulado,
consistindo apenas no processo de aprendizado do modelo classificador.
A árvore de decisão está classificando as ocasiões em: apropriadas para consumo
de pratos no jantar ou inapropriadas para consumo de pratos no jantar.
A figura abaixo traz um exemplo de um modelo classificador hipotético, na forma
de uma árvore de decisão, para escolha de pratos em um restaurante.
 
 
Fonte: SILVA, L. A. Introdução à mineração de dados: com aplicações em R. Rio
de Janeiro: Elsevier, 2016.
 
Considerando as informações apresentadas, assinale a opção correta.
 
A+
A
A-
09/06/23, 17:54 Teste: AO2
https://famonline.instructure.com/courses/27321/quizzes/142890/take 11/12
Salvo em 17:54 
0,6 ptsPergunta 10
O termo mineração de dados é uma alusão ao processo de extração de minerais,
uma vez que se explora um conhecimento(mina) usando algoritmos (minerais
preciosos) adequados para obter base de dados (ferramentas).
O termo mineração de dados é uma alusão ao processo de extração de minerais,
uma vez que se explora uma base de dados (mina) usando algoritmos (ferramentas)
adequados para obter conhecimento (minerais preciosos).
O termo mineração de dados é uma alusão ao processo de extração de minerais,
uma vez que se explora uma base de dados (mina) usando algoritmos (minerais
preciosos) adequados para obter conhecimento (ferramentas).
O termo mineração de dados é uma alusão ao processo de extração de minerais,
uma vez que se explora um algoritmo (mina) usando banco de dados (ferramentas)
adequados para obter conhecimento (minerais preciosos).
O termo mineração de dados é uma alusão ao processo de extração de minerais,
uma vez que se explora o conhecimento (mina) usando banco de dados
(ferramentas) adequados para obter ferramentas (minerais preciosos).
Leia o texto abaixo:
 
O processo de mineração corresponde à extração de minerais valiosos, como
ouro e pedraspreciosas, a partir de uma mina. Uma característica importante
desses materiais é que, embora não possam ser cultivados ou produzidos
artificialmente, existem de maneira implícita e muitas vezes desconhecida em
alguma fonte, podendo ser extraídos. Esse processo requer acesso à mina, o uso
de ferramentas adequadas de mineração, a extração dos minérios propriamente
dita e o seu posterior preparo para comercialização.
 
Fonte: DE CASTRO, L. N. Introdução à mineração de dados: conceitos básicos,
algoritmos e aplicações. São Paulo: Saraiva, 2016.
 
Considerando as informações apresentadas, assinale a opção correta.
Enviar teste
A+
A
A-
09/06/23, 17:54 Teste: AO2
https://famonline.instructure.com/courses/27321/quizzes/142890/take 12/12
A+
A
A-