Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 O processo de KDD requer ferramentas especializadas, que permitam a análise sistemática de grandes bases de dados. Muitas dessas análises, por sua vez, utilizam algoritmos clássicos, propostos ainda no início do desenvolvimento da comunicação. Sobre as etapas do CRISP-DM, assinale a alternativa CORRETA: A Compreensão dos negócios, Entendimento dos dados, enriquecimento semântico, Modelagem, Análise dos resultados e Divulgação dos resultados. B Compreensão dos negócios, Entendimento dos dados, Preparação dos dados, Modelagem, Análise dos resultados e Divulgação dos resultados. C Compreensão dos negócios, Entendimento dos dados, Preparação dos dados, Modelagem, Análise dos resultados e Data Warehousing. D Compreensão dos negócios, Entendimento dos dados, Preparação dos dados, Data Mining, Análise dos resultados e Divulgação dos resultados. 2 A área de Knowledge Discovery in Databases (KDD) é uma dinâmica e evolutiva que envolve outras áreas do conhecimento – Estatística, Inteligência Artificial e Banco de Dados. Este conjunto se constitui em uma tecnologia capaz de automatizar processos de busca por padrões úteis, bem como a mineração de dados. Sobre mineração de dados, associe os itens, utilizando o código a seguir: I- Previsão. II- Risco e probabilidade. III- Recomendações. IV- Localizando sequências. V- Agrupamento. ( ) Separando clientes ou eventos em cluster de itens relacionados, analisando e prevendo afinidades. ( ) Analisando seleções de clientes em um carrinho de compras, prevendo os próximos eventos prováveis. ( ) Determinando quais produtos são mais prováveis de serem vendidos juntos, gerando recomendações. ( ) Escolhendo os melhores clientes para malas diretas, determinando o ponto equilibrado provável para cenários de risco, atribuindo probabilidades a diagnósticos ou outros resultados. ( ) Estimando vendas, prevendo cargas de servidor ou tempo de inatividade de servidor. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: HORA, Gleidison Santos et al. Avaliação de ferramentas de mineração de dados: uma abordagem com o modelo tam. Interfaces Científicas-Exatas e Tecnológicas, v. 2, n. 3, p. 109-121, 2018. A I - II - III - IV - V. B I - II - IV - III - V. C V - IV - III - II - I. D IV - V - I - III - II. 3 De modo simplificado, o CRISP-DM é uma metodologia abrangente de mineração de dados e um modelo de processo que fornece para qualquer usuário de data mining, seja ele iniciante ou especialista, um modelo completo para realização de um projeto de mineração de dados. Sobre as etapas do CRISP-DM, associe os itens, utilizando o código a seguir: I- Compreensão dos negócios. II- Entendimento dos dados. III- Preparação dos dados. IV- Modelagem. ( ) Nessa etapa, são aplicados algoritmos para a construção de modelos confirmatórios. Análises exploratórias dos dados podem ser úteis nesta etapa. ( ) Tratamento dos dados prévios ao processo de mineração com o objetivo de remover problemas e inconsistências nos dados. ( ) Compreensão e descrição dos dados, seus atributos e variáveis. ( ) Fundamental para compreender o objetivo da mineração. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: RAMOS, Jorge Luis Cavalcanti et al. CRISP-EDM: uma proposta de adaptação do Modelo CRISP-DM para mineração de dados educacionais. In: Anais do XXXI Simpósio Brasileiro de Informática na Educação. SBC, 2020. p. 1092-1101. A IV - I - II - III. B I - II - III - IV. C I - IV - II - III. D IV - III - II - I. 4 Pode-se dizer que a mineração de dados é uma etapa do processo KDD, usada para auxiliar os especialistas em uma determinada área a atualizar suas bases de conhecimento na busca de alguma vantagem competitiva em seu negócio. Dentre as tarefas de mineração de dados, podemos destacar a sumarização. Considerando a sumarização, classifique V para as sentenças verdadeiras e F para as falsas: ( ) A sumarização de textos é empregada para organizar de maneira lógica informações de diferentes coleções de dados, nas quais podem ser realizadas pesquisas de maneira facilitada por conta de seus resumos. ( ) Embora seja considerada uma tarefa de mineração de dados, a sumarização é parte da classificação automática de textos. ( ) Os objetivos da sumarização se classificam principalmente em dois pontos de vista: o do leitor, portanto o usuário do sumário; e do produtor, o escritor. ( ) A SAT refere-se ao uso de um sistema com o objetivo de produzir uma representação condensada de determinado conteúdo de entrada. Assinale a alternativa que apresenta a sequência CORRETA: A F - F - V - V. B V - F - V - V. C V - V - V - V. D V - V - F - F. 5 Machine Learning é uma forma de IA muito utilizada atualmente, que permite o aprendizado pelo sistema a partir de dados imputados, que servirão como base de treinamento para que o sistema gere modelos ou saídas que possam servir para análises preditivas. Considerando as técnicas de agrupamento, classifique V para as sentenças verdadeiras e F para as falsas: ( ) O agrupamento (clusterização) enquadra-se no aprendizado supervisionado. ( ) O agrupamento consiste na divisão dos dados em grupos (clusters). ( ) Os clusters compartilham valores próximos entre os atributos de entrada. ( ) Os clusters são gerados automaticamente sem precisar informar um número pré-determinado. Assinale a alternativa que apresenta a sequência CORRETA: A V - V - V - F. B F - V - V - V. C F - V - F - V. D V - V - F - V. 6 A mineração de regras de associação em um banco de dados de transações de vendas é uma tarefa extremamente cara em termos de tempo de processamento. Dependendo do ramo de atividade, pode ser construído um grande volume de dados, bem como de regras. Sobre as regras de associação, classifique V para as sentenças verdadeiras e F para as falsas: ( ) O suporte é caracterizado como o número de transações incluindo todos os elementos na posição antecedente e consequente da regra. ( ) A regra de associação é formada por dois conjuntos de elementos, um antecedente e um consequente, representados na forma Antecedente (Y) → Consequente (W). ( ) A confiança de uma regra é a probabilidade condicional de que uma transação contenha Y, dado que contém W. ( ) Por sua vez, o Lift, outro índice estatístico utilizado para definir o grau de suporte somado ao de confiança de uma regra. Assinale a alternativa que apresenta a sequência CORRETA: A V - V - V - F. B V - F - V - V. C F - V - V - V. D V - F - V - F. 7 Na era do Big Data, deixaremos de viver como as 10000 gerações que nos antecederam. Para alguns pesquisadores, o Big Data é tão revolucionário na vida humana quanto a descoberta do fogo ou o início da agricultura. Dentre os campos que se aproveitam de tais dados, a mineração de dados destaca-se por obter conhecimento de tais dados. Sobre etapas da mineração de dados, associe os itens, utilizando o código a seguir: I- Limpeza de dados. II- Integração de dados. III- Seleção de dados. IV- Transformação de dados. ( ) Em que os dados relevantes para a tarefa de análise são recuperados da base de dados. ( ) Em que os dados são transformados e consolidados em formulários apropriados para mineração, realizando operações de resumo ou agregação. ( ) Em que são removidos ruídos e dados inconsistentes. ( ) Em que várias fontes de dados podem ser combinadas. Assinale a alternativa que apresenta a sequência CORRETA: A IV - III - II - I. B I - II - III - IV. C III - IV - I - II. D I - IV - III - II. 8 A biblioteca scikit-learn dá suporte ao desenvolvimento de algoritmos de machine learning, dentre eles tambémo algoritmo de agrupamento k-means. Dentre as maneiras de ser implementado, o trecho a seguir é uma maneira de instanciar o algoritmo: KMeans(n_clusters=5, random_state=40). Sobre o random_state, assinale a alternativa CORRETA: A É o número de clusters. B É o número de dados de entrada. C É o número aleatório de dados de saída. D É o valor de base para geração de pontos aleatórios. 9 O KDD (knowledge discovery in databases) é baseado em técnicas conhecidas como aprendizagem de máquina, reconhecimento de padrões e estatística clássica para descobrir padrões nas análises. Sobre as etapas do KDD, assinale a alternativa CORRETA: A Coleta, Pré-Processamento, Transformação, Data Mining e Interpretação. B Seleção, Pré-Processamento, Transformação, Data Mining e Interpretação. C Seleção, Data Warehousing e Interpretação. D Coleta, Data Warehousing, Pré-Processamento, Transformação e Data Mining. 10 Ferramenta de mineração de dados, desenvolvida na Universidade de Waikato, na Nova Zelândia, é um software de aprendizado de máquina de código aberto testado e aprovado escrito em Java e está disponível da web e pode ser acessada por meio de uma interface gráfica do usuário, de aplicativos de terminal padrão ou de uma API Java. Sobre a ferramenta descrita, assinale a alternativa CORRETA: A Google Collab. B RapidMiner. C Orange. D WEKA.
Compartilhar