UNIDADE 1- A1 N1 - MINERAÇÃO DE DADOS

•

UNP

0

Éberson Costa

17/06/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística I

58.671 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

UNP - UNIVERSIDADE POTIGUAR 
BACHARELADO EM ESTATÍSTICA 
DISCIPLINA: MINERAÇÃO DE DADOS 
UNIDADE 1 – MINERAÇÃO DE DADOS, SUAS ABORDAGENS E FASES 
AUTOR: ESP. WESLEY SOARES DE SOUZA 
REVISOR: BRUNO ROBERTO NEPUMUCENO MATHEUS 
 
 
 
 
 
Atividade 1 N1, apresentada ao curso bacharelado 
em Estatística, ofertado pela Universidade Potiguar, 
como requisito avaliativo complementar da primeira 
avaliação da disciplina Mineração de Dados – 
Unidade 1 – Mineração de Dados, Suas Abordagens 
e Fases. 
Autor: Esp. Wesley Soares de Souza 
Revisor: Bruno Roberto Nepomuceno Matheus 
 
 
 
 
 
 
ALUNO: EBERSON COSTA – MATRÍCULA 2020201380 
BENEVIDES – PARÁ 
2021 
MINERAÇÃO DE DADOS 
UNIDADE 1 
MINERAÇÃO DE DADOS, SUAS ABORDAGENS E FASES 
A1 N1 
 
Nesta unidade foi dado um esboço sobre a mineração de dados, e os passos a 
serem seguidos na descoberta de conhecimento da base de dados (KDD). 
Percebemos a importância do pré-processamento dos dados, centrando os esforços 
no objetivo principal, que vem a ser definido como regra de negócio pelos 
especialistas no domínio do problema, para que o modelo de conhecimento atenda a 
todos os requisitos formulados e permita sua filtragem em modelos semelhantes, 
formando assim redes de aprendizado de máquina. 
 
Com base nos conhecimentos adquiridos, cite como os algoritmos genéticos e as 
redes neurais vêm a somar à estruturação da mineração de dados e como eles 
podem minimizar processos com objetivos semelhantes aos modelos de 
conhecimento já criados, formando uma rede de aprendizagem. 
 
Os modos como os algoritmos genéticos e as redes neurais somam-se à 
estruturação da mineração de dados e como eles podem minimizar processos com 
objetivos semelhantes aos modelos de conhecimento já criados, formando uma rede 
de aprendizagem, são determinados em função das características e peculiaridades 
do problema em questão. 
 
Como se sabe, os algoritmos genéticos (AG) são uma família de algoritmos 
computacionais inspirados na teoria da evolução, que incorporam conceitos 
semelhantes aos de cromossomo, seleção, reprodução e mutação para resolver, 
principalmente, os problemas de otimização. 
A escolha de parâmetros do algoritmo pode influenciar no desempenho e no 
comportamento do mesmo e devem ser determinados, geralmente por tentativa e 
erro, em função das características e peculiaridades do problema em questão. 
Segundo (Jong, 1980) e (Pádua, 2000) os parâmetros mais importantes a serem 
considerados são os seguintes: 
 Tamanho da população: Pequenas populações comprometem o desempenho do 
algoritmo por representarem um espaço de busca pequeno. Grandes populações 
diminuem a chance de ocorrência de mínimos locais, mas devem ser usadas com 
parcimônia, por demandarem muito esforço computacional. 
 Taxa de cruzamento: Um valor maior acarreta maior variabilidade genética. 
Entretanto, se for muito alta, aumenta-se a chance de eliminação de bons 
indivíduos. Se for muito baixa, a população tende a estagnar, diminuindo-se a 
chance de produção de bons indivíduos. 
 Taxa de mutação: Uma baixa taxa de mutação previne estagnações de 
determinadas posições. Quando muito alta, introduz-se uma aleatoriedade excessiva 
no processo de busca. 
 Intervalo de geração: Controla a porcentagem da população a ser substituída na 
próxima geração. Um valor alto aumenta a chance de perda de bons indivíduos. Um 
valor muito baixo torna o algoritmo lento, pois pode ser necessário um grande 
número de gerações até convergir. 
Segundo (Pádua, 2000), Redes Neurais Artificiais (RNAs) são sistemas paralelos 
distribuídos, constituídos por unidades (nós) de processamento simples que 
modelam um neurônio biológico, o neurônio artificial, capazes de aplicar funções 
matemáticas simples a dados recebidos em sua entrada. 
Este modelo é denominado MCP, por ter sido proposto por McCulloch e Pitts, em 
1943. 
As redes neurais são sistemas de computação com nós interconectados que 
funcionam como os neurônios do cérebro humano. 
Usando algoritmos, as redes neurais podem reconhecer padrões escondidos e 
correlações em dados brutos, agrupá-los e classificá-los, e com o tempo aprender e 
melhorar continuamente. 
As redes neurais também são idealmente desenvolvidas para ajudar as pessoas a 
resolver problemas complexos em diversas situações da vida real. 
Elas podem aprender e modelar relações entre entradas e saídas de dados que são 
não-lineares e complexos; realizar generalizações e inferências; revelar 
relacionamentos, padrões e predições ocultas e modelar dados altamente voláteis 
(como dados de séries temporais financeiras) e variâncias necessárias para prever 
eventos raros (como detecção de fraudes). 
Como resultado, as redes neurais podem melhorar processos de decisão em 
diversas áreas, como: 
 Detecção de fraude em cartões de crédito e assistência médica; 
 Otimização de logística para redes de transporte; 
 Reconhecimento de caracteres e de voz, também conhecido como 
processamento de linguagem natural; 
 Diagnósticos médicos; 
 Marketing direcionado; 
 Predições financeiras de ações de mercado, moeda, opções, futuros, falência e 
classificação de títulos; 
 Sistemas de controle robóticos; 
 Previsão de carga elétrica e demanda de energia; 
 Controle de qualidade e de processos; 
 Identificação de compostos químicos; 
 Avaliação do ecossistema; 
 Visão computacional para interpretar fotos e vídeos não-tratados (por exemplo, 
na obtenção de imagens médicas, robótica e reconhecimento facial). 
 
REFERÊNCIAS 
 
Miranda, Pasteur Ottoni de Junior – DCC PUC MG. Disponível em 
www.pasteurjr.blogspot.com.Acesso em 31/05/2021. 
 
PADUA, A. et al. Redes Neurais Artificiais-Teoria e Aplicações. Rio de Janeiro, LTC, 
2000. 
 
 
http://www.pasteurjr.blogspot.com.acesso/