Prévia do material em texto
DATA BASE MARKETING AULA 8 – DATA MINING- 05/11/2017 Introdução Nesta aula compreenderemos o processo de mineração de dados e sua importância para as atividades de Database Marketing DATA MINING No mercado competitivo atual as empresas buscam tomar decisões mais rápidas, coerentes e abrangentes. Por outro lado, os profissionais de Marketing se defrontam com uma quantidade cada vez maior de informações disponíveis e necessitam de ferramentas que os auxiliem na busca de informações que realmente são relevantes. A partir do crescimento das bases de dados do Data Warehouse passa a existir uma dificuldade cada vez maior de extração de informações compreensíveis e úteis e em tempo hábil para serem interpretadas pelos tomadores de decisão. Existe uma ineficiência e impossibilidade da análise manual e uma evidente necessidade de novas teorias e ferramentas para auxílio na extração de conhecimento do crescente volume de dados. Um dos grandes problemas dos especialistas em análise de informação é a transformação de dados em informação. Como fazer isso de uma forma automatizada e no menor tempo possível? Uma das respostas para isso é a combinação de estatística convencional e técnicas de inteligência artificial, que resulta em uma técnica muito comentada nos dias de hoje, o Data Mining. Mas o que é Data Mining? O mais importante é entendermos que Data Mining é um processo. Este processo faz uso de uma variedade de instrumentos ou ferramentas estatísticas para trabalhar os dados e encontrar padrões e relações que permitam entender o comportamento e estabelecer projeções válidas acerca do assunto analisado. Algumas Máximas do Marketing e ...... É mais dispendioso conquistar um cliente novo do que reter os existentes. É mais dispendioso reativar um cliente do que do que satisfazê-lo em primeiro lugar. Alguns clientes são mais lucrativos do que outros . Alguns clientes são pouco lucrativos e outros nunca nos darão nenhum lucro. ...... Algumas Respostas Fornecidas pelo Data Mining Que clientes são os mais lucrativos. Que promoções são as mais efetivas. Que clientes respondem melhor a cada tipo de promoções. Que tipo de clientes estão interessados em meus produtos. Que clientes deixarão de fazer negócios com a minha empresa no futuro próximo. Objetivo do Data Mining Encontrar padrões ainda não descobertos nos dados, que possam gerar respostas corretas para novos casos. Este processo de busca e interpretação de padrões é tipicamente interativo e iterativo, envolvendo a aplicação repetitiva de métodos específicos de mineração de dados ou algoritmos e interpretações dos padrões gerados como resultado destes algoritmos. Atividades de Data Mining Os problemas que podem ser resolvidos com Data Mining normalmente são divididos em dois grandes grupos: Predição Dentre as diversas técnicas utilizadas para a Predição, podemos destacar: Classificação: A resposta será apresentada na forma de verdadeiro ou falso. Exemplo: Todo paciente que apresenta o vírus X está com gripe? A resposta será sim ou não. Regressão: A resposta será um valor numérico. Exemplo: Escore para o possível cancelamento da linha de um cliente de uma operadora de telefonia celular. Descoberta de Conhecimento. Dentre as diversas técnicas utilizadas para a Descoberta de Conhecimentos de interesse para a organização, podemos destacar: Detecção de exceções: Identifica mudanças nos padrões anteriormente detectados. A técnica clássica para executar tal detecção é o teste de significância, por exemplo, média, variância, desvio padrão. Exemplo: Clientes residenciais de empresas telefônicas que trabalham em casa Segmentação de bases de dados: O objetivo é dividir um problema em segmentos menores que formam grupos inter-relacionados. Clusterização: Processo semelhante à segmentação de bases de dados, mas parte do pressuposto que não se possui resposta previamente conhecida. Regras de associação: São regras que são formadas com informações existes na base de dados. São relacionamentos que, na grande parte das vezes, não são conhecidos pelo detentor do negócio. Exemplo: 98% das pessoas que compraram fraldas também compram cervejas Todos os Padrões “descobertos” interessam ? Um processo de Data Mining pode gerar milhares de padrões mas nem todos são interessantes para a organização. Um padrão é de interesse se ele é: fácil de ser entendido pelos humanos válido para dados novos ou testados com algum grau de certeza potencialmente útil valida alguma hipótese que usuário busca confirmar Quem é o pior inimigo do processo ? Inexistência de dados Dados irrelevantes Dados insuficientes Dados não confiáveis Modelagem Estatística e Datamining A partir da modelagem estatística e da descoberta de conhecimentos de interesse para a organização podemos inserir mais uma camada na nossa figura contendo duas das principais aplicações do DBM: apoiar as tomada de decisão dos profissionais de Marketing e facilitar o relacionamento com os clientes: