Prévia do material em texto
Etapas Data Mining Introdução Um dos grandes problemas das empresas no tempo atual é a grande quantidade de registros, relacionados ou não, para analise. Mais conhecido como Big Data (REDAÇÃO, 2018). As informações lidas e processadas podem ser usadas por diversas áreas e formas diferentes, como por exemplo, estudo cientifico de um produto, suas causas, seus comprados e distribuídos. Todas essas informações juntas é um grande insight para qualquer empresa e benefícios a serem colhidos por isso. Porém para unificadas, é preciso explorar, tratar e unificar todos os registros, isso é feito através do processo de mineração de dados ou Data Mining. Esse conceito serve para buscar as informações importantes escondidas no grande portfólio de dados da empresa. Definição de um Big Data O conceito de Big Data (HANSEN, 2019), são dados não estruturados, semi- estruturados ou estruturados, ou seja, pode ser a união de qualquer tipo de dados, seja ele pronto para ser analisado ou não. A análise, utilizando um Big Data, é possível ser feita através de três formas: · Velocidade: · Tradicionalmente toda a análise é feita sempre do dia anterior, mais conhecida como D-1, porém em ternos atuais, existe uma grande necessidade de analisarmos os dados em tempo real. · Volume: · A grande quantidade de informação absorvida pela empresa diariamente vem crescendo de forma exponencial, ou seja, todo dia a empresa tem uma grande quantidade de registros novos a serem analisados · Variedade: · Não existe um padrão de registro, pode ser qualquer informação relacionada, ou seja, dados de vendas comparado com dados de produção versus hora pessoa trabalhada. Funcionamento do Data Mining A mineração de dados é realizada através de um processo de instruções, onde um algoritmo é desenvolvido para agir sobre um conjunto de dados (GUIMARÃES, 2016). Onde o usuário relato o problema para qual busca uma solução selecionando os dados a serem analisados. Informações obtidas com o Data Mining Aplicando a utilização correta do Data Mining, é possível descobrir vários tipos de informação relacionado a um ou vários assuntos específicos (WIKIPÉDIA, 2020). São elas: · Associações: · São resultados associados a um evento. Exemplo, quantos chocolates são comprados no dia dos namorados · Sequencias: · São resultados de ações associados a um período. Exemplo, quanto jogos de pratos são comprados por ano. · Classificação: · São resultados de informações baseadas em uma classificação. Exemplo, qual a nota de um certo filme. · Aglomeração: · São resultados de informações baseados em uma não classificação. Exemplo, quantas vezes o filme foi assistido. · Prognóstico: · São resultados de informações baseados em dados futuros. Exemplo, Quantidade de vendas na carteira a serem faturados. Etapa do Data Mining As etapas foram desenvolvidas como uma receita, ou seja, deverá ser seguido todo o passo a passo para a análise dos dados de forma mais pura possível (FIA, 2020) · Planejamento estratégico: · Primeiro passo é entender qual o objetivo da análise dos dados e como ele será utilizado dentro da empresa · Nessa etapa não existe um limitador, ou seja, quanto mais detalhes o solicitando passar, melhor será o entendimento. · Seleção de dados: · Nesse momento, se faz necessário, conhecer todas as origens dos dados, podem ser mídias sociais, bando de dados, planilhas no formato em Excel ou qualquer base de dados a ser trabalhada. · Importante nessa etapa, definir quais serão os dados principais a serem trabalhados. · Limpeza de dados: · É a atividade pela qual os ruídos, dados estranhos ou inconsistentes são tratados. Por isso, é muito importante para uma organização, que ela possua em seus processos habituais boas práticas da administração de dados, como o Data Cleansing (WIKIPÉDIA, 2021) · Modelagem de dados: Nessa fase consiste em criar um modelo de dados a ser trabalhado, aplicando algumas técnicas conhecidas como: · Estatística: · Cálculos aplicados para descobrir padrões e construir modelos preditivos · Clusterização: · É o agrupamento de dados, semelhantes ou não. · Visualização: · Descoberta de padrões ocultos · Arvore de decisão: · Modelo com ramificações para tomada de decisão · Avaliação de resultados: Após a mineração dos dados, efetuados nas etapas anteriores, nesse momento é avaliado os dados obtidos, com foco no objetivo definido. · Execução: Nessa fase consiste na definição das fases de implantação do projeto. Mesmo se a finalidade do modelo for apenas aumentar o conhecimento dos dados, o conhecimento ganho necessitará ser organizado e apresentado em uma maneira que o a empresa possa usar. Dependendo das exigências, a fase de execução pode ser tão simples quanto a geração de um relatório, ou tão complexo quanto executar processos de mineração de dados repetidamente. Referências Bibliográficas 1. REDAÇÃO. O que é Big Data? 2018. Disponível em: https://canaltech.com.br/big-data/o-que-e-big-data/#:~:text=Big%20Data%20%C3%A9%20a%20an%C3%A1lise,estruturadas%20a%20uma%20grande%20velocidade.. Acesso em: 01 mar. 2018. 2. GUIMARÃES, Leandro. O que é Data Mining e como pode ajudar a sua empresa. 2016. Disponível em: https://www.knowsolution.com.br/o-que-e-data-mining-e-como-pode-ajudar-a-sua-empresa/. Acesso em: 8 jun. 2016. 3. WIKIPÉDIA. Mineração de Dados. Disponível em: https://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados. Acesso em: 6 set. 2020. 4. HANSEN, Stevenn. The 3 V’s of Big Data Analytics. Disponível em: https://hackernoon.com/the-3-vs-of-big-data-analytics-1afd59692adb. Acesso em: 1 abr. 2019. 5. FIA. Data Mining: O que é, Para que serve e Tipos de técnicas. Disponível em: https://fia.com.br/blog/data-mining/#:~:text=Data%20mining%20%C3%A9%20um%20processo%20em%20que%20a%20tecnologia%20%C3%A9,e%20oportunidades%20com%20mais%20facilidade.. Acesso em: 8 jan. 2020. 6. WIKIPÉDIA. Data cleansing. Disponível em: https://en.wikipedia.org/wiki/Data_cleansing. Acesso em: 10 fev. 2021.