Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNP - UNIVERSIDADE POTIGUAR BACHARELADO EM ESTATÍSTICA DISCIPLINA: MINERAÇÃO DE DADOS UNIDADE 1 – MINERAÇÃO DE DADOS, SUAS ABORDAGENS E FASES AUTOR: ESP. WESLEY SOARES DE SOUZA REVISOR: BRUNO ROBERTO NEPUMUCENO MATHEUS Atividade 1 N1, apresentada ao curso bacharelado em Estatística, ofertado pela Universidade Potiguar, como requisito avaliativo complementar da primeira avaliação da disciplina Mineração de Dados – Unidade 1 – Mineração de Dados, Suas Abordagens e Fases. Autor: Esp. Wesley Soares de Souza Revisor: Bruno Roberto Nepomuceno Matheus ALUNO: EBERSON COSTA – MATRÍCULA 2020201380 BENEVIDES – PARÁ 2021 MINERAÇÃO DE DADOS UNIDADE 1 MINERAÇÃO DE DADOS, SUAS ABORDAGENS E FASES A1 N1 Nesta unidade foi dado um esboço sobre a mineração de dados, e os passos a serem seguidos na descoberta de conhecimento da base de dados (KDD). Percebemos a importância do pré-processamento dos dados, centrando os esforços no objetivo principal, que vem a ser definido como regra de negócio pelos especialistas no domínio do problema, para que o modelo de conhecimento atenda a todos os requisitos formulados e permita sua filtragem em modelos semelhantes, formando assim redes de aprendizado de máquina. Com base nos conhecimentos adquiridos, cite como os algoritmos genéticos e as redes neurais vêm a somar à estruturação da mineração de dados e como eles podem minimizar processos com objetivos semelhantes aos modelos de conhecimento já criados, formando uma rede de aprendizagem. Os modos como os algoritmos genéticos e as redes neurais somam-se à estruturação da mineração de dados e como eles podem minimizar processos com objetivos semelhantes aos modelos de conhecimento já criados, formando uma rede de aprendizagem, são determinados em função das características e peculiaridades do problema em questão. Como se sabe, os algoritmos genéticos (AG) são uma família de algoritmos computacionais inspirados na teoria da evolução, que incorporam conceitos semelhantes aos de cromossomo, seleção, reprodução e mutação para resolver, principalmente, os problemas de otimização. A escolha de parâmetros do algoritmo pode influenciar no desempenho e no comportamento do mesmo e devem ser determinados, geralmente por tentativa e erro, em função das características e peculiaridades do problema em questão. Segundo (Jong, 1980) e (Pádua, 2000) os parâmetros mais importantes a serem considerados são os seguintes: Tamanho da população: Pequenas populações comprometem o desempenho do algoritmo por representarem um espaço de busca pequeno. Grandes populações diminuem a chance de ocorrência de mínimos locais, mas devem ser usadas com parcimônia, por demandarem muito esforço computacional. Taxa de cruzamento: Um valor maior acarreta maior variabilidade genética. Entretanto, se for muito alta, aumenta-se a chance de eliminação de bons indivíduos. Se for muito baixa, a população tende a estagnar, diminuindo-se a chance de produção de bons indivíduos. Taxa de mutação: Uma baixa taxa de mutação previne estagnações de determinadas posições. Quando muito alta, introduz-se uma aleatoriedade excessiva no processo de busca. Intervalo de geração: Controla a porcentagem da população a ser substituída na próxima geração. Um valor alto aumenta a chance de perda de bons indivíduos. Um valor muito baixo torna o algoritmo lento, pois pode ser necessário um grande número de gerações até convergir. Segundo (Pádua, 2000), Redes Neurais Artificiais (RNAs) são sistemas paralelos distribuídos, constituídos por unidades (nós) de processamento simples que modelam um neurônio biológico, o neurônio artificial, capazes de aplicar funções matemáticas simples a dados recebidos em sua entrada. Este modelo é denominado MCP, por ter sido proposto por McCulloch e Pitts, em 1943. As redes neurais são sistemas de computação com nós interconectados que funcionam como os neurônios do cérebro humano. Usando algoritmos, as redes neurais podem reconhecer padrões escondidos e correlações em dados brutos, agrupá-los e classificá-los, e com o tempo aprender e melhorar continuamente. As redes neurais também são idealmente desenvolvidas para ajudar as pessoas a resolver problemas complexos em diversas situações da vida real. Elas podem aprender e modelar relações entre entradas e saídas de dados que são não-lineares e complexos; realizar generalizações e inferências; revelar relacionamentos, padrões e predições ocultas e modelar dados altamente voláteis (como dados de séries temporais financeiras) e variâncias necessárias para prever eventos raros (como detecção de fraudes). Como resultado, as redes neurais podem melhorar processos de decisão em diversas áreas, como: Detecção de fraude em cartões de crédito e assistência médica; Otimização de logística para redes de transporte; Reconhecimento de caracteres e de voz, também conhecido como processamento de linguagem natural; Diagnósticos médicos; Marketing direcionado; Predições financeiras de ações de mercado, moeda, opções, futuros, falência e classificação de títulos; Sistemas de controle robóticos; Previsão de carga elétrica e demanda de energia; Controle de qualidade e de processos; Identificação de compostos químicos; Avaliação do ecossistema; Visão computacional para interpretar fotos e vídeos não-tratados (por exemplo, na obtenção de imagens médicas, robótica e reconhecimento facial). REFERÊNCIAS Miranda, Pasteur Ottoni de Junior – DCC PUC MG. Disponível em www.pasteurjr.blogspot.com.Acesso em 31/05/2021. PADUA, A. et al. Redes Neurais Artificiais-Teoria e Aplicações. Rio de Janeiro, LTC, 2000. http://www.pasteurjr.blogspot.com.acesso/
Compartilhar