Buscar

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Etapas Data Mining
Introdução
Um dos grandes problemas das empresas no tempo atual é a grande quantidade de registros, relacionados ou não, para analise. Mais conhecido como Big Data (REDAÇÃO, 2018).
As informações lidas e processadas podem ser usadas por diversas áreas e formas diferentes, como por exemplo, estudo cientifico de um produto, suas causas, seus comprados e distribuídos. Todas essas informações juntas é um grande insight para qualquer empresa e benefícios a serem colhidos por isso.
Porém para unificadas, é preciso explorar, tratar e unificar todos os registros, isso é feito através do processo de mineração de dados ou Data Mining. Esse conceito serve para buscar as informações importantes escondidas no grande portfólio de dados da empresa.
Definição de um Big Data
O conceito de Big Data (HANSEN, 2019), são dados não estruturados, semi- estruturados ou estruturados, ou seja, pode ser a união de qualquer tipo de dados, seja ele pronto para ser analisado ou não.
A análise, utilizando um Big Data, é possível ser feita através de três formas:
· Velocidade: 
· Tradicionalmente toda a análise é feita sempre do dia anterior, mais conhecida como D-1, porém em ternos atuais, existe uma grande necessidade de analisarmos os dados em tempo real.
· Volume: 
· A grande quantidade de informação absorvida pela empresa diariamente vem crescendo de forma exponencial, ou seja, todo dia a empresa tem uma grande quantidade de registros novos a serem analisados
· Variedade: 
· Não existe um padrão de registro, pode ser qualquer informação relacionada, ou seja, dados de vendas comparado com dados de produção versus hora pessoa trabalhada.
Funcionamento do Data Mining
A mineração de dados é realizada através de um processo de instruções, onde um algoritmo é desenvolvido para agir sobre um conjunto de dados (GUIMARÃES, 2016). 
Onde o usuário relato o problema para qual busca uma solução selecionando os dados a serem analisados.
Informações obtidas com o Data Mining
Aplicando a utilização correta do Data Mining, é possível descobrir vários tipos de informação relacionado a um ou vários assuntos específicos (WIKIPÉDIA, 2020).
São elas:
· Associações: 
· São resultados associados a um evento. Exemplo, quantos chocolates são comprados no dia dos namorados
· Sequencias: 
· São resultados de ações associados a um período. Exemplo, quanto jogos de pratos são comprados por ano.
· Classificação: 
· São resultados de informações baseadas em uma classificação. Exemplo, qual a nota de um certo filme.
· Aglomeração: 
· São resultados de informações baseados em uma não classificação. Exemplo, quantas vezes o filme foi assistido.
· Prognóstico: 
· São resultados de informações baseados em dados futuros. Exemplo, Quantidade de vendas na carteira a serem faturados.
Etapa do Data Mining
	As etapas foram desenvolvidas como uma receita, ou seja, deverá ser seguido todo o passo a passo para a análise dos dados de forma mais pura possível (FIA, 2020)
· Planejamento estratégico: 
· Primeiro passo é entender qual o objetivo da análise dos dados e como ele será utilizado dentro da empresa
· Nessa etapa não existe um limitador, ou seja, quanto mais detalhes o solicitando passar, melhor será o entendimento.
· Seleção de dados: 
· Nesse momento, se faz necessário, conhecer todas as origens dos dados, podem ser mídias sociais, bando de dados, planilhas no formato em Excel ou qualquer base de dados a ser trabalhada.
· Importante nessa etapa, definir quais serão os dados principais a serem trabalhados.
· Limpeza de dados: 
· É a atividade pela qual os ruídos, dados estranhos ou inconsistentes são tratados. Por isso, é muito importante para uma organização, que ela possua em seus processos habituais boas práticas da administração de dados, como o Data Cleansing  (WIKIPÉDIA, 2021)
· Modelagem de dados: 
Nessa fase consiste em criar um modelo de dados a ser trabalhado, aplicando algumas técnicas conhecidas como:
· Estatística: 
· Cálculos aplicados para descobrir padrões e construir modelos preditivos
· Clusterização: 
· É o agrupamento de dados, semelhantes ou não.
· Visualização: 
· Descoberta de padrões ocultos
· Arvore de decisão: 
· Modelo com ramificações para tomada de decisão
· Avaliação de resultados: 
Após a mineração dos dados, efetuados nas etapas anteriores, nesse momento é avaliado os dados obtidos, com foco no objetivo definido.
· Execução: 
Nessa fase consiste na definição das fases de implantação do projeto. Mesmo se a finalidade do modelo for apenas aumentar o conhecimento dos dados, o conhecimento ganho necessitará ser organizado e apresentado em uma maneira que o a empresa possa usar. Dependendo das exigências, a fase de execução pode ser tão simples quanto a geração de um relatório, ou tão complexo quanto executar processos de mineração de dados repetidamente. 
Referências Bibliográficas
1. REDAÇÃO. O que é Big Data? 2018. Disponível em: https://canaltech.com.br/big-data/o-que-e-big-data/#:~:text=Big%20Data%20%C3%A9%20a%20an%C3%A1lise,estruturadas%20a%20uma%20grande%20velocidade.. Acesso em: 01 mar. 2018.
2.  GUIMARÃES, Leandro. O que é Data Mining e como pode ajudar a sua empresa. 2016. Disponível em: https://www.knowsolution.com.br/o-que-e-data-mining-e-como-pode-ajudar-a-sua-empresa/. Acesso em: 8 jun. 2016.
3. WIKIPÉDIA. Mineração de Dados. Disponível em: https://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados. Acesso em: 6 set. 2020.
4. HANSEN, Stevenn. The 3 V’s of Big Data Analytics. Disponível em: https://hackernoon.com/the-3-vs-of-big-data-analytics-1afd59692adb. Acesso em: 1 abr. 2019.
5. FIA. Data Mining: O que é, Para que serve e Tipos de técnicas. Disponível em: https://fia.com.br/blog/data-mining/#:~:text=Data%20mining%20%C3%A9%20um%20processo%20em%20que%20a%20tecnologia%20%C3%A9,e%20oportunidades%20com%20mais%20facilidade.. Acesso em: 8 jan. 2020.
6. WIKIPÉDIA. Data cleansing. Disponível em: https://en.wikipedia.org/wiki/Data_cleansing. Acesso em: 10 fev. 2021.