AO2 - MINERACAO DE DADOS - NOTA5,4

•

FAM

4

1

4

1

0

Jacquelinne Dias

11/06/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Administração de Banco de Dados

3.068 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

AO2
Iniciado: 9 jun em 4:43
Instruções do teste
Importante:
Caso você esteja realizando a atividade através do aplicativo "Canvas Student", é necessário que
você clique em "FAZER O QUESTIONÁRIO", no final da página.
0,6 ptsPergunta 1
A quarta etapa do KDD é a mineração dos dados cujo objetivo é a classificação
dos dados em partições homogêneas de modo a possibilitar a extração de regras
Avalie a representação a seguir sobre o processo KDD:
Fonte: SABRI, I. A. A. et al. Web Data Extraction Approach for Deep Web
using WEIDJ.
Procedia Computer Science, v. 163, p. 417-426, 2019.
Sobre as etapas do processo KDD, selecione a alternativa correta dentre as
disponíveis a seguir.
A+
A
A-
e padrões úteis para a obtenção de conhecimento.
A terceira etapa do KDD se refere à transformação dos dados e a busca pelos
atributos que serão importantes para o objetivo, podendo reduzir o número de
variáveis que serão consideradas no processo.
A segunda etapa do KDD realiza a seleção dos dados que serão analisados, a
partir de diferentes fontes de dados, essa etapa resulta em um conjunto de dados
que delimita o contexto a ser analisado.
A primeira etapa do KDD realiza operações para a diminuição de ruído nos dados
e, também, são definidas as estratégias a respeito de como tratar a ausência de
determinados valores.
A quinta etapa é a interpretação dos padrões minerados, dependendo dos
resultados observados, é possível realizar alguma outra tarefa sobre esses
resultados, de modo que haja uma melhora do modelo.
0,6 ptsPergunta 2
Uma árvore de decisão particionará um conjunto em duas partições por nível,
produzindo uma árvore binária.
A escolha do atributo que dividirá o conjunto de dados é feita a partir de medidas
Leia o texto a seguir:
“Uma árvore de decisão é uma estrutura em forma de árvore na qual cada nó
interno corresponde a um teste de um atributo, cada ramo representa um
resultado do teste e os nós folhas representam classes ou distribuições de
classes. O nó mais elevado da árvore é conhecido como nó raiz, e cada
caminho da raiz até um nó folha corresponde a uma regra de classificação.”
Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados:
conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p.
170.
Qual alternativa descreve, corretamente, uma característica da árvore de
decisão.
A+
A
A-
de pureza.
O objetivo principal para cada divisão feita na árvore de decisão é a obtenção
partições heterogêneas.
A divisão das partições na árvore de decisão deve ser realizada até que haja nós
folha unitários.
O algoritmo que induz uma árvore de decisão produzirá o mesmo resultado a
partir do mesmo conjunto de dados.
0,6 ptsPergunta 3
Leia o texto abaixo:
Muitos problemas práticos possuem registros históricos relacionando situações
específicas com determinados resultados. Por exemplo, administradoras de
cartões de crédito possuem registros de transações passadas e a informação
de se foram fraudulentas ou não; financeiras possuem cadastros de clientes
que pediram empréstimo associados às formas e condições de pagamento (e
até inadimplências); empresas possuem registros de funcionários com seu
perfil e desempenho no trabalho; entre muitos outros exemplos. Quando cada
registro possui um rótulo de classe ou um valor de saída associado que
representa o resultado histórico de registros passados, o objetivo da análise é,
quase invariavelmente, construir um modelo que possa ser usado para
predizer qual seria essa saída para novos registros, ou seja, registros cuja
classe ou valor de saída são desconhecidos. Para os mesmos exemplos
citados anteriormente, a operadora de cartões de crédito precisa de um modelo
que seja capaz de identificar se uma transação corrente é fraudulenta ou não;
as financeiras querem saber se devem ou não conceder um empréstimo
solicitado e qual o valor do empréstimo a ser concedido; e as empresas
desejam saber de antemão o desempenho de um funcionário que será
contratado, de acordo com seu perfil.
Fonte: DE CASTRO, L. N. Introdução à mineração de dados: conceitos
básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016.
Qual das técnicas a seguir deve ser utilizada se uma operadora de cartões de
A+
A
A-
Classificação.
Detecção de desvio.
Agrupamento.
Estimativa.
Associação.
crédito precisa identificar se uma transação corrente é fraudulenta ou não?
0,6 ptsPergunta 4
Leia o texto a seguir:
“O algoritmo k-médias toma como entrada o parâmetro k, correspondente ao
número de grupos desejados, e particiona o conjunto de n objetos em k
grupos, de forma que a similaridade intragrupo seja alta e a similaridade
intergrupo seja baixa. A similaridade intragrupo é avaliada considerando o valor
médio dos objetos em um grupo, que pode ser visto como o seu centro de
gravidade ou centroide.”
Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados:
conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p.
116.
Considere as seguintes descrições a respeito da tarefa de agrupamento, mais
especificamente ao algoritmo k-médias.
I. A detecção de agrupamentos é uma tarefa de aprendizado preditiva
também conhecida como clustering. Nesse caso, as técnicas utilizadas são,
comumente, relativas ao aprendizado supervisionado, ou seja, o conjunto
de dados não possui rótulos e o aprendizado usa apenas os atributos
preditivos;
II. Os algoritmos para tarefas preditivas produzem modelos a partir de um
A+
A
A-
I e IV, apenas.
I e II, apenas.
II e III, apenas.
III e IV, apenas.
I e III, apenas.
processo de treinamento que utiliza todo o conjunto de dados disponível. O
objetivo é organizar os dados rotulados em grupos de acordo com uma
medida de similaridade ou correlação;
III. Um grupo é um conjunto de objetos similares (homogêneos) e os objetos
que pertencem a grupos diferentes são não similares (heterogêneos). O
principal objetivo do agrupamento é maximizar a homogeneidade interna nos
grupos e a heterogeneidade entre os grupos.
IV. Dependendo do atributo selecionado, poderemos ter diferentes grupos.
Nesse contexto, a detecção de agrupamentos poderá resultar em diferentes
quantidades de grupos e em composições, também diferentes, para cada
grupo obtido.
É correto apenas o que se afirma em:
0,6 ptsPergunta 5
Considere a seguinte distribuição conjunta de probabilidade:
Fonte: LORENA, A. C., FARIA, F. A. Representação do Conhecimento –
A+
A
A-
II e IV, apenas.
III e IV, apenas.
II e III, apenas.
I e III, apenas.
I e II, apenas.
Lidando com incerteza. Notas de aula. UNIFESP (São Paulo), 2015.
Avalie as seguintes afirmações a respeito da distribuição de probabilidade
anterior.
I. P(cárie) = 0,25;
II. P(cárie ˅ dor de dente) = 0,28;
III. P(cárie | dor de dente) = 0,60;
IV. P(extração) = 0,4.
É correto o que se afirma apenas em:
0,6 ptsPergunta 6
Leia o texto a seguir:
“O pré-processamento, também conhecido como preparação da base de
dados, manipula e transforma os dados brutos de maneira que o conhecimento
neles contido possa ser mais fácil e corretamente obtido. A melhor maneira de
se pré-processar os dados depende de três fatores centrais: os problemas
existentes na base, quais respostas pretende-se obter e como funcionam as
técnicas de mineração.”
Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados:
A+
A
A-
A limpeza cuida da diminuição da base de dados. A integração cuida da
padronização do formato dos dados. A redução cuida da união de múltiplas fontes
de dados. A transformação cuida de permitir que métodos que trabalham apenas
com atributos nominais possam ser empregados. A discretização cuida da
atribuição de valores ausentes, da remoção de ruídos e de corrigir inconsistências.
A limpeza cuida de permitir que métodos que trabalham apenas com atributos
nominais possam ser empregados. A integração cuida da união de múltiplas
fontes de dados. A redução cuida da diminuição da base de dados. A
transformaçãocuida da padronização do formato dos dados. A discretização cuida
da atribuição de valores ausentes, da remoção de ruídos e de corrigir
inconsistências.
A limpeza cuida da padronização do formato dos dados. A integração cuida da
diminuição da base de dados. A redução cuida da união de múltiplas fontes de
dados. A transformação cuida de permitir que métodos que trabalham apenas com
atributos nominais possam ser empregados. A discretização cuida da atribuição de
valores ausentes, da remoção de ruídos e de corrigir inconsistências.
A limpeza cuida de permitir que métodos que trabalham apenas com atributos
nominais possam ser empregados. A integração cuida da diminuição da base de
dados. A redução cuida da união de múltiplas fontes de dados. A transformação
cuida da padronização do formato dos dados. A discretização cuida da atribuição
de valores ausentes, da remoção de ruídos e de corrigir inconsistências.
A limpeza cuida da atribuição de valores ausentes, da remoção de ruídos e de
corrigir inconsistências. A integração cuida da união de múltiplas fontes de dados.
A redução cuida da diminuição da base de dados. A transformação cuida da
padronização do formato dos dados. A discretização cuida de permitir que
métodos que trabalham apenas com atributos nominais possam ser empregados.
conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p.
34.
Qual alternativa descreve corretamente as principais tarefas de pré-
processamento?
0,6 ptsPergunta 7
Leia o texto abaixo:
A+
A
A-
A construção da árvore é realizada por meio de um algoritmo que não precisa
analisar os atributos descritivos do conjunto de dados previamente rotulado,
consistindo apenas no processo de aprendizado do modelo classificador.
Cada nó folha (temperatura) representa uma decisão sugerida pelo modelo
classificador para a ocasião, sugestão esta, presente no atributo rótulo do conjunto
Árvore de decisão é uma das técnicas mais populares de mineração de dados.
Mais comumente usada para resolver a tarefa de classificação de dados, a
árvore de decisão consiste em uma coleção de nós internos e nós folhas,
organizados em um modelo hierárquico (da mesma forma que se organizam as
estruturas de dados do tipo árvore). No contexto da resolução da tarefa de
classificação, uma árvore de decisão representa o modelo capaz de guiar a
tomada de decisão sobre a determinação da classe à qual um exemplar
pertence.
A figura abaixo traz um exemplo de um modelo classificador hipotético, na
forma de uma árvore de decisão, para escolha de pratos em um restaurante.
Fonte: SILVA, L. A. Introdução à mineração de dados: com aplicações em R.
Rio de Janeiro: Elsevier, 2016.
Considerando as informações apresentadas, assinale a opção correta.
A+
A
A-
de dados usado para induzir o modelo.
A árvore de decisão está classificando as ocasiões em: apropriadas para consumo
de pratos no jantar ou inapropriadas para consumo de pratos no jantar.
Os nós internos da árvore (tipo de prato) dizem respeito a atributos prescritivos de
uma ocasião em que alguém está no restaurante para realizar uma refeição.
Segundo o modelo representado pela árvore, se a ocasião se refere à temperatura
alta e à hora do jantar, deve-se optar por um prato frio.
0,6 ptsPergunta 8
O termo mineração de dados é uma alusão ao processo de extração de minerais,
uma vez que se explora o conhecimento (mina) usando banco de dados
(ferramentas) adequados para obter ferramentas (minerais preciosos).
O termo mineração de dados é uma alusão ao processo de extração de minerais,
uma vez que se explora uma base de dados (mina) usando algoritmos (minerais
preciosos) adequados para obter conhecimento (ferramentas).
O termo mineração de dados é uma alusão ao processo de extração de minerais,
uma vez que se explora uma base de dados (mina) usando algoritmos
(ferramentas) adequados para obter conhecimento (minerais preciosos).
Leia o texto abaixo:
O processo de mineração corresponde à extração de minerais valiosos, como
ouro e pedras preciosas, a partir de uma mina. Uma característica importante
desses materiais é que, embora não possam ser cultivados ou produzidos
artificialmente, existem de maneira implícita e muitas vezes desconhecida em
alguma fonte, podendo ser extraídos. Esse processo requer acesso à mina, o
uso de ferramentas adequadas de mineração, a extração dos minérios
propriamente dita e o seu posterior preparo para comercialização.
Fonte: DE CASTRO, L. N. Introdução à mineração de dados: conceitos
básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016.
Considerando as informações apresentadas, assinale a opção correta.
A+
A
A-
O termo mineração de dados é uma alusão ao processo de extração de minerais,
uma vez que se explora um conhecimento(mina) usando algoritmos (minerais
preciosos) adequados para obter base de dados (ferramentas).
O termo mineração de dados é uma alusão ao processo de extração de minerais,
uma vez que se explora um algoritmo (mina) usando banco de dados
(ferramentas) adequados para obter conhecimento (minerais preciosos).
0,6 ptsPergunta 9
Leia o texto a seguir:
“O valor de um atributo de um dado objeto é uma medida da quantidade
daquele atributo, a qual pode ser numérica ou categórica. Os atributos
numéricos podem assumir quaisquer valores numéricos [...] ao passo que as
quantidades categóricas assumem valores correspondentes a símbolos
distintos.”
Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados:
conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p.
30.
Avalie as seguintes asserções e a relação proposta entre elas.
I. Os atributos numéricos discretos têm seus valores obtidos a partir de
processos de medição e os atributos contínuos têm seus valores obtidos a
partir de processos de contagem.
PORQUE
II. Os valores numéricos discretos pertencem ao conjunto dos números
naturais e os valores numéricos contínuos pertencem ao conjunto dos números
reais.
A+
A
A-
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa
da I.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
As asserções I e II são ambas proposições falsas.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa da I.
A asserção I é uma proposição verdadeira, e a II é uma proposição falsa.
A respeito dessas asserções, assinale a opção correta:
0,6 ptsPergunta 10
a limpeza, a integração, a seleção ou redução e a transformação dos dados.
a análise descritiva, a associação e a detecção de anomalias nos dados.
a análise descritiva, o agrupamento e a predição dos dados.
Leia o texto abaixo:
A mineração de dados é parte integrante de um processo mais amplo,
conhecido como descoberta de conhecimento em bases de dados (knowledge
discovery in databases, ou KDD) [...] A preparação ou pré-processamento de
dados é uma das partes principais do KKD, e correspondem as etapas
anteriores à mineração que visam preparar os dados para uma análise
eficiente e eficaz.
(Fonte: DE CASTRO, L. N. Introdução à mineração de dados: conceitos
básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016.)
A preparação ou pré-processamento de dados inclui
A+
A
A-
Salvo em 4:12
a transformação, a mineração e a avaliação dos dados.
o agrupamento e a associação dos dados.
Enviar teste
A+
A
A-