Uniasslevi - Machine Learning II - Associacao e Agrupamento - Avaliacao Final

•

UNIASSELVI

8

0

8

0

1

Damiao Oliveira

24/04/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 9 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Machine Learning

1.264 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1 
O processo de KDD requer ferramentas especializadas, que permitam a análise 
sistemática de grandes bases de dados. Muitas dessas análises, por sua vez, 
utilizam algoritmos clássicos, propostos ainda no início do desenvolvimento da 
comunicação. 
 
 
Sobre as etapas do CRISP-DM, assinale a alternativa CORRETA: 
 
A 
Compreensão dos negócios, Entendimento dos dados, enriquecimento semântico, 
Modelagem, Análise dos resultados e Divulgação dos resultados. 
B 
Compreensão dos negócios, Entendimento dos dados, Preparação dos dados, 
Modelagem, Análise dos resultados e Divulgação dos resultados. 
C 
Compreensão dos negócios, Entendimento dos dados, Preparação dos dados, 
Modelagem, Análise dos resultados e Data Warehousing. 
D 
Compreensão dos negócios, Entendimento dos dados, Preparação dos dados, Data 
Mining, Análise dos resultados e Divulgação dos resultados. 
2 
A área de Knowledge Discovery in Databases (KDD) é uma dinâmica e evolutiva 
que envolve outras áreas do conhecimento – Estatística, Inteligência Artificial e 
Banco de Dados. Este conjunto se constitui em uma tecnologia capaz de 
automatizar processos de busca por padrões úteis, bem como a mineração de 
dados. Sobre mineração de dados, associe os itens, utilizando o código a seguir: 
 
I- Previsão. 
 
II- Risco e probabilidade. 
 
III- Recomendações. 
 
IV- Localizando sequências. 
 
V- Agrupamento. 
 
( ) Separando clientes ou eventos em cluster de itens relacionados, analisando e 
prevendo afinidades. 
 
( ) Analisando seleções de clientes em um carrinho de compras, prevendo os 
próximos eventos prováveis. 
 
( ) Determinando quais produtos são mais prováveis de serem vendidos juntos, 
gerando recomendações. 
 
( ) Escolhendo os melhores clientes para malas diretas, determinando o ponto 
equilibrado provável para cenários de risco, atribuindo probabilidades a 
diagnósticos ou outros resultados. 
 
( ) Estimando vendas, prevendo cargas de servidor ou tempo de inatividade de 
servidor. 
Assinale a alternativa que apresenta a sequência CORRETA: 
 
FONTE: HORA, Gleidison Santos et al. Avaliação de ferramentas de mineração de 
dados: uma abordagem com o modelo tam. Interfaces Científicas-Exatas e 
Tecnológicas, v. 2, n. 3, p. 109-121, 2018. 
A 
I - II - III - IV - V. 
B 
I - II - IV - III - V. 
C 
V - IV - III - II - I. 
D 
IV - V - I - III - II. 
3 
De modo simplificado, o CRISP-DM é uma metodologia abrangente de mineração 
de dados e um modelo de processo que fornece para qualquer usuário de data 
mining, seja ele iniciante ou especialista, um modelo completo para realização de 
um projeto de mineração de dados. Sobre as etapas do CRISP-DM, associe os itens, 
utilizando o código a seguir: 
 
I- Compreensão dos negócios. 
 
II- Entendimento dos dados. 
 
III- Preparação dos dados. 
 
IV- Modelagem. 
 
( ) Nessa etapa, são aplicados algoritmos para a construção de modelos 
confirmatórios. Análises exploratórias dos dados podem ser úteis nesta etapa. 
( ) Tratamento dos dados prévios ao processo de mineração com o objetivo de 
remover problemas e inconsistências nos dados. 
( ) Compreensão e descrição dos dados, seus atributos e variáveis. 
( ) Fundamental para compreender o objetivo da mineração. 
Assinale a alternativa que apresenta a sequência CORRETA: 
 
FONTE: RAMOS, Jorge Luis Cavalcanti et al. CRISP-EDM: uma proposta de 
adaptação do Modelo CRISP-DM para mineração de dados educacionais. In: Anais 
do XXXI Simpósio Brasileiro de Informática na Educação. SBC, 2020. p. 1092-1101. 
A 
IV - I - II - III. 
B 
I - II - III - IV. 
C 
I - IV - II - III. 
D 
IV - III - II - I. 
4 
Pode-se dizer que a mineração de dados é uma etapa do processo KDD, usada para 
auxiliar os especialistas em uma determinada área a atualizar suas bases de 
conhecimento na busca de alguma vantagem competitiva em seu negócio. Dentre 
as tarefas de mineração de dados, podemos destacar a sumarização. Considerando 
a sumarização, classifique V para as sentenças verdadeiras e F para as falsas: 
 
( ) A sumarização de textos é empregada para organizar de maneira lógica 
informações de diferentes coleções de dados, nas quais podem ser realizadas 
pesquisas de maneira facilitada por conta de seus resumos. 
( ) Embora seja considerada uma tarefa de mineração de dados, a sumarização é 
parte da classificação automática de textos. 
( ) Os objetivos da sumarização se classificam principalmente em dois pontos de 
vista: o do leitor, portanto o usuário do sumário; e do produtor, o escritor. 
( ) A SAT refere-se ao uso de um sistema com o objetivo de produzir uma 
representação condensada de determinado conteúdo de entrada. 
Assinale a alternativa que apresenta a sequência CORRETA: 
A 
F - F - V - V. 
B 
V - F - V - V. 
C 
V - V - V - V. 
D 
V - V - F - F. 
5 
Machine Learning é uma forma de IA muito utilizada atualmente, que permite o 
aprendizado pelo sistema a partir de dados imputados, que servirão como base de 
treinamento para que o sistema gere modelos ou saídas que possam servir para 
análises preditivas. Considerando as técnicas de agrupamento, classifique V para 
as sentenças verdadeiras e F para as falsas: 
 
( ) O agrupamento (clusterização) enquadra-se no aprendizado supervisionado. 
( ) O agrupamento consiste na divisão dos dados em grupos (clusters). 
( ) Os clusters compartilham valores próximos entre os atributos de entrada. 
( ) Os clusters são gerados automaticamente sem precisar informar um número 
pré-determinado. 
Assinale a alternativa que apresenta a sequência CORRETA: 
A 
V - V - V - F. 
B 
F - V - V - V. 
C 
F - V - F - V. 
D 
V - V - F - V. 
6 
A mineração de regras de associação em um banco de dados de transações de 
vendas é uma tarefa extremamente cara em termos de tempo de processamento. 
Dependendo do ramo de atividade, pode ser construído um grande volume de 
dados, bem como de regras. Sobre as regras de associação, classifique V para as 
sentenças verdadeiras e F para as falsas: 
 
( ) O suporte é caracterizado como o número de transações incluindo todos os 
elementos na posição antecedente e consequente da regra. 
( ) A regra de associação é formada por dois conjuntos de elementos, um 
antecedente e um consequente, representados na forma Antecedente (Y) → 
Consequente (W). 
( ) A confiança de uma regra é a probabilidade condicional de que uma transação 
contenha Y, dado que contém W. 
( ) Por sua vez, o Lift, outro índice estatístico utilizado para definir o grau de 
suporte somado ao de confiança de uma regra. 
Assinale a alternativa que apresenta a sequência CORRETA: 
A 
V - V - V - F. 
B 
V - F - V - V. 
C 
F - V - V - V. 
D 
V - F - V - F. 
7 
 Na era do Big Data, deixaremos de viver como as 10000 gerações que nos 
antecederam. Para alguns pesquisadores, o Big Data é tão revolucionário na vida 
humana quanto a descoberta do fogo ou o início da agricultura. Dentre os campos 
que se aproveitam de tais dados, a mineração de dados destaca-se por obter 
conhecimento de tais dados. Sobre etapas da mineração de dados, associe os itens, 
utilizando o código a seguir: 
 
I- Limpeza de dados. 
 
II- Integração de dados. 
 
III- Seleção de dados. 
 
IV- Transformação de dados. 
 
( ) Em que os dados relevantes para a tarefa de análise são recuperados da base 
de dados. 
 
( ) Em que os dados são transformados e consolidados em formulários 
apropriados para mineração, realizando operações de resumo ou agregação. 
 
( ) Em que são removidos ruídos e dados inconsistentes. 
 
( ) Em que várias fontes de dados podem ser combinadas. 
Assinale a alternativa que apresenta a sequência CORRETA: 
A 
IV - III - II - I. 
B 
I - II - III - IV. 
C 
III - IV - I - II. 
D 
I - IV - III - II. 
8 
A biblioteca scikit-learn dá suporte ao desenvolvimento de algoritmos de machine 
learning, dentre eles tambémo algoritmo de agrupamento k-means. Dentre as 
maneiras de ser implementado, o trecho a seguir é uma maneira de instanciar o 
algoritmo: KMeans(n_clusters=5, random_state=40). 
Sobre o random_state, assinale a alternativa CORRETA: 
A 
É o número de clusters. 
B 
É o número de dados de entrada. 
C 
É o número aleatório de dados de saída. 
D 
É o valor de base para geração de pontos aleatórios. 
9 
O KDD (knowledge discovery in databases) é baseado em técnicas conhecidas 
como aprendizagem de máquina, reconhecimento de padrões e estatística clássica 
para descobrir padrões nas análises. 
Sobre as etapas do KDD, assinale a alternativa CORRETA: 
 
 
A 
Coleta, Pré-Processamento, Transformação, Data Mining e Interpretação. 
B 
Seleção, Pré-Processamento, Transformação, Data Mining e Interpretação. 
C 
Seleção, Data Warehousing e Interpretação. 
D 
Coleta, Data Warehousing, Pré-Processamento, Transformação e Data Mining. 
10 
Ferramenta de mineração de dados, desenvolvida na Universidade de Waikato, na 
Nova Zelândia, é um software de aprendizado de máquina de código aberto testado 
e aprovado escrito em Java e está disponível da web e pode ser acessada por meio 
de uma interface gráfica do usuário, de aplicativos de terminal padrão ou de uma 
API Java. 
Sobre a ferramenta descrita, assinale a alternativa CORRETA: 
A 
Google Collab. 
B 
RapidMiner. 
C 
Orange. 
D 
WEKA.