Prévia do material em texto
PERGUNTAS Qual é o principal objetivo da mineração de dados? Coletar e armazenar grandes volumes de dados. Criar visualizações gráficas complexas dos dados. Identificar padrões e tendências nos dados. Realizar análises estatísticas em dados estruturados. Desenvolver algoritmos de aprendizado de máquina. Resposta Correta: A mineração de dados tem como objetivo principal identificar padrões, tendências, relações e insights valiosos nos conjuntos de dados. Essa análise permite descobrir informações ocultas e úteis para a tomada de decisões. Qual é o processo inicial na mineração de dados? Limpeza e preparação dos dados. Definição dos objetivos do projeto. Implementação de modelos preditivos. Exploração visual dos dados. Implementação de algoritmos de mineração de dados. Resposta Correta: O processo inicial na mineração de dados envolve a definição clara dos objetivos do projeto. Isso envolve entender quais são as questões a serem respondidas, os problemas a serem resolvidos e os resultados desejados. Essa etapa é essencial para orientar todas as fases subsequentes do processo de mineração de dados, são elas: Coleta de dados, Limpeza e pré-processamento dos dados, Exploração dos dados, Transformação dos dados, Escolha dos algoritmos de mineração, Aplicação dos algoritmos de mineração, Avaliação dos resultados, visualização de dados e Implementação e uso dos resultados. Questão 03 Com base no texto fornecido sobre mineração de dados, selecione as opções que descrevem corretamente essa técnica: O que significa o termo mineração de dados? 'Mineração de dados' é um nome impróprio porque o objetivo da mineração de dados não é extrair ou minerar os dados em si. Em vez disso, uma grande quantidade de dados já está presente e a mineração de dados extrai significado ou conhecimento valioso deles. O processo típico de coleta, armazenamento, análise e mineração de dados é descrito abaixo. 1. A coleta de dados está capturando dados de diferentes fontes, como feedback do cliente, pagamentos e pedidos de compra. 2. Data warehousing é o processo de armazenar esses dados em um grande banco de dados ou data warehouse. 3. A análise de dados está processando, armazenando e analisando os dados usando software e algoritmos complexos. 4. A mineração de dados é um ramo da análise de dados ou uma estratégia de análise usada para encontrar padrões ocultos ou anteriormente desconhecidos nos dados. Fonte: AWS. O que é mineração de dados?. Disponível em https://aws.amazon.com/pt/what-is/data-mining/#seo-faq-pairs#what-is-data-mining É uma técnica para coletar dados em larga escala. É um processo de análise de dados não estruturados. É uma abordagem para encontrar relacionamentos ocultos em dados. Envolve o armazenamento e gerenciamento de grandes volumes de dados. Usa técnicas de visualizações de dados para encontrar padrões Resposta Correta: - É uma abordagem para encontrar relacionamentos ocultos em dados. Mineração de dados é uma abordagem utilizada para encontrar relacionamentos ocultos em dados. - Envolve o armazenamento e gerenciamento de grandes volumes de dados. Embora não seja a definição principal da mineração de dados, ela pode envolver o armazenamento e gerenciamento de grandes volumes de dados (Big Data) para análise. - Usa técnicas de visualizações de dados para encontrar padrões As técnicas de visualização de dados são muito usada sna mineração de dados para facilitar a compreensão e a interpretação dos resultados. Questão 04 Considerando o texto apresentado, avalie as afirmações a seguir. Quais são as técnicas de mineração de dados? As técnicas de mineração de dados se baseiam em vários campos de aprendizado que se sobrepõem, incluindo análise estatística, machine learning (ML) e matemática. Alguns exemplos são dados abaixo. · Mineração de regras de associação: A mineração de regras de associação é o processo de encontrar relacionamentos entre dois conjuntos de dados diferentes e aparentemente não relacionados. As instruções if-then demonstram a probabilidade de uma relação entre dois pontos de dados. Os cientistas de dados medem a precisão dos resultados usando critérios de suporte e confiança. O suporte mede a frequência com que os elementos relacionados aparecem no conjunto de dados, enquanto a confiança mostra o número de vezes que uma instrução if-then é precisa.Por exemplo, quando os clientes compram um item, eles também costumam comprar um segundo item relacionado. Os varejistas podem usar a mineração de associação em dados de compras anteriores para identificar o interesse de um novo cliente. Eles usam resultados de mineração de dados para preencher as seções recomendadas de lojas online. · Classificação: A classificação é uma técnica complexa de mineração de dados que treina o algoritmo de ML para classificar dados em categorias distintas. Ela usa métodos estatísticos como árvores de decisão e vizinho mais próximo para identificar a categoria. Em todos esses métodos, o algoritmo é pré-programado com classificações de dados conhecidas para adivinhar o tipo de um novo elemento de dados.Por exemplo, os analistas podem treinar o software de mineração de dados usando imagens rotuladas de maçãs e mangas. Com alguma precisão, o software pode prever se uma nova imagem é uma maçã, manga ou outra fruta. · Agrupamento em clusters: O agrupamento em clusters se trata de agrupar vários pontos de dados com base em suas semelhanças. É diferente da classificação porque não consegue distinguir os dados por categoria específica, mas pode encontrar padrões em suas semelhanças. O resultado da mineração de dados é um conjunto de clusters em que cada coleção é distinta de outros grupos, mas os objetos em cada cluster são semelhantes de alguma forma.Por exemplo, a análise de cluster pode ajudar na pesquisa de mercado ao trabalhar com dados multivariados de pesquisas. Os pesquisadores de mercado usam a análise de cluster para dividir os consumidores em segmentos de mercado e entender melhor as relações entre os diferentes grupos. · Análise de sequência e caminho: O software de mineração de dados também pode procurar padrões nos quais um determinado conjunto de eventos ou valores leva a outros posteriores. Ele pode reconhecer alguma variação nos dados que ocorre em intervalos regulares ou no fluxo e refluxo de pontos de dados ao longo do tempo. Por exemplo, uma empresa pode usar a análise de caminho para descobrir que as vendas de determinados produtos aumentam pouco antes dos feriados ou para perceber que o clima mais quente traz mais pessoas ao site. Falar em Big Data consiste em Ciência dos Dados. O que podemos afirmar já, é que, dado o seu escopo, trata-se de uma das áreas mais promissora da TI. Por enquanto e, como resumo, podemos dizer que uma empresa que adota Big Data tem a capacidade de "injetar" insumos diferenciais aos seus processos de negócio que poderão lhe ajudar a traçar o caminho da inteligência na criação de produtos e serviços mais completos, se adaptando de forma mais rápida à constante mudança dos interesses das pessoas.