Buscar

BDII UNI 3

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

- -1
BANCO DE DADOS II
CAPÍTULO 3 - COMO LIDAR COM UM 
GRANDE VOLUME DE DADOS?
Josiane Boeira Kirinus Fernandes
- -2
Introdução
Nos tempos atuais, com o surgimento de novas configurações e maneiras de se fazer uso dos recursos e serviços
da tecnologia da informação, as empresas e instituições precisam repensar e transformar o modo como utilizam
esses dados e informações para auxiliarem e fundamentarem seu processo de tomada de decisão e, assim,
melhor conduzirem seus negócios e alcançarem os objetivos e resultados esperados.
Nesse contexto, as organizações se veem diante do grande desafio de como fazer uso desses dados e transformá-
los em informações úteis e de relevância.
Você tem ideia de como as empresas lidam com esse excesso de informações? Você conhece tecnologias
desenvolvidas justamente para trabalharem com essa quantidade enorme de informações? Você conhece
conceitos como ou mineração de dados? E como esses conceitos podem ser aplicados nas empresas?Big Data
Este capítulo tem como propósito apresentar e descrever os conceitos de e mineração de dados eBig Data
possibilitar a você a compreensão de como eles auxiliam as empresas, como funcionam e como são aplicados na
prática para alcançarem objetivos e metas estratégicas.
Vamos começar? Bons estudos!
3.1 Big Data
Um dos desafios das empresas na Era da Informação na qual vivemos é saber como lidar com a quantidade de
dados disponíveis e como usá-los de maneira útil, ou seja, como transformá-los em informações que serão
usadas nos processos de decisões e, assim, possibilitar a vantagem competitiva.
- -3
Figura 1 - As organizações têm o desafio de transformar grandes quantidade de dados e informações em 
conhecimento.
Fonte: Rawpixel.com, Shutterstock, 2018.
Com base nisso, começamos nossos estudos com o termo Big Data que compreende um enorme volume de dados
estruturados e não estruturados criados a todo o momento. Seu principal objetivo é disponibilizar dados e
informações que possam ser identificados e analisados para o auxílio da tomada de decisão empresarial.
Podemos dizer que é um conjunto de soluções de tecnologia que possuem a capacidade de lidar comBig Data
uma imensa quantidade de dados, de tipos antes não explorados.
Inicialmente, pode ficar um pouco difícil de compreender o que vem a ser essa nova solução tecnológica, pois
não podemos dizer que é um local, um , uma ferramenta e sim um conjunto de soluções para ajudar assoftware
empresas a lidarem com a imensa quantidade de dados presentes no dia-a-dia, seja aqueles estruturados e
VOCÊ QUER LER?
“ no Trabalho: Derrubando Mitos e Descobrindo Oportunidades” (DAVENPORT, 2014)Big Data
descreve casos de grandes empresas que utilizam o , como exploraram asBig Data
oportunidades, como venceram os desafios e conseguiram melhorar seus produtos e serviços.
- -4
empresas a lidarem com a imensa quantidade de dados presentes no dia-a-dia, seja aqueles estruturados e
gerados em bancos de dados, seja aqueles não estruturados gerados a partir de redes sociais, áudios, imagens,
equipamentos e dispositivos móveis em tempo real.
Segundo Siewert (2013, apud FERNANDES; ABREU, 2014, p. 557): 
é a captura, gerenciamento e a análise de dados que vão além dos dados tipicamente estruturados,
que podem ser consultados e pesquisados através de bancos de dados relacionais. Frequentemente
são dados obtidos de arquivos não estruturados como vídeo digital, imagens, dados de sensores,
arquivos de e de qualquer tipo de dados não contidos em registros típicos com campos quelogs
podem ser pesquisados.
Como mencionado acima, existem diferentes tipos de dados que o pode manipular entre eles os:Big Data
• dados gerados nos bancos de dados relacionais a partir das transações e processos da empresa;
• dados gerados a partir de máquinas (redes de sensores, );logs
• dados gerados em dispositivos móveis, como vídeos, mensagens, imagens, fotos;
• dados gerados de e-mails, redes sociais como, , entre outras;Facebook Twitter
• dados gerados pela comunicação entre equipamentos e máquinas, a tal da IoT “Internet das coisas”;
• dados gerados de documentos dos mais variados tipos.
Uma grande diferença no que tange ao é que antes os dados eram, em sua maioria, encontradosBig Data
internamente nas empresas e agora estão em toda parte. Podem “[...] incluir sequências do genoma humano,
sensores instalados em poços de petróleo, comportamentos de células cancerígenas, localização de produtos em
paletes, interações nas mídias sociais ou sinais vitais do paciente” (DAVENPORT, 2014, p. 119).
As aplicações e ferramentas de podem ser usadas em diferentes áreas para auxiliarem as empresas aBig Data
atingirem resultados relevantes e positivos. Segundo Fernandes e Abreu (2014), as aplicações do e daBig Data
análise de dados são variadas como:
• desenvolvimento de mercado;
• inovação;
• desenvolvimento de produtos e serviços;
• eficiência operacional;
• previsões de demanda de mercado;
• detecção de fraudes;
• gerenciamento de riscos;
• previsão de concorrência;
• vendas e campanhas de marketing;
• avaliação de desempenho de funcionários;
• identificação de potenciais compradores, entendimento da base de cliente entre outras.
De acordo com Isaca (2013, apud FERNANDES; ABREU, 2014), existem alguns pontos que precisam ser 
•
•
•
•
•
•
VOCÊ SABIA?
A Internet das Coisas, IoT, do inglês , promete ser uma nova revoluçãoInternet of Things
tecnológica com a capacidade de conectar equipamentos como eletrodomésticos, carros,
móveis, roupas, entre outros. Ou seja, é a integração de objetos à Internet, gerando muito mais
dados. De acordo com Taurion (2013), a Internet das Coisas, com seus objetos gerando dados a
todo instante, é um impulsionador poderoso para .Big Data
•
•
•
•
•
•
•
•
•
•
•
- -5
De acordo com Isaca (2013, apud FERNANDES; ABREU, 2014), existem alguns pontos que precisam ser 
levantados e levados em consideração em relação ao que podem auxiliar na identificação dos principaisBig Data
riscos: onde os dados serão armazenados, como esses dados serão protegidos e como fazer uso dos dados de
forma segura e legal.
Isaca (2013, apud FERNANDES; ABREU, 2014) ainda descreve os principais riscos que devem ser gerenciados, 
tais como: riscos de perda de dados importantes armazenados, como informações privadas, contas de clientes,
números de cartões de crédito, fórmulas, segredos industriais da empresa; as informações obtidas em redes
sociais englobam questões de privacidade e falta de consenso sobre legislação internacional, já que cada país
possui a sua; questões relacionadas à segurança da informação; a qualidade dos dados levantados para a análise,
disponibilidade e capacidade da infraestrutura tecnológica que dará suporte ao ; qualidade dasBig Data
ferramentas de exploração desenvolvidas para a análise; profissionais com a capacitação necessária, ou seja,
cientistas de dados, para o desenvolvimento de modelos e análise de dados entre outros.
Vale ressaltar que o possui algumas dimensões, que alguns denominam de os Vs do . VamosBig Data Big Data
conhecê-los? A ariedade diz respeito às múltiplas fontes de informações existente atualmente, além dosV
sistemas que geram dados estruturados e não estruturados, tem como exemplo as redes sociais, mensagens,
imagens e fotos, vídeos; a elocidade de acesso às informações, muitas vezes em tempo real; o olume,V V
relacionado com a vasta quantidade de informações geradas diariamente, resultado do crescente aumento na
variedade e velocidade de obtenção das informações; a eracidade, pois os dados necessitam ser autênticos eV
fazerem sentido; e alor, representando retorno que a empresa precisa ter com o investimento realizado.V
Você compreendeu o conceito de e qual seu papel em uma organização? No próximo tópico seráBig Data
abordada outra ferramenta importante na organização, análise e transformação de dados e informações em
conhecimento relevante: a mineração de dados.
VOCÊ QUER VER?
Transcendence – A Revolução (PAGLEN, 2014) tem ingredientes de InteligênciaArtificial (IA),
física quântica, nanotecnologia e . O filme leva a reflexão sobre como as relaçõesBig Data
humanas podem ser influenciadas pelas tecnologias. O ator Johnny Depp interpreta Dr. Will
Caster, reconhecido e famoso pesquisador na área de IA, que sofre tentativa de morte quando
está analisando milhares de dados sobre o cérebro, com o intuito de desenvolver uma máquina
com a capacidade de lidar com informações de todos os tipos e fontes ( ) com asBig Data
emoções humanas.
VOCÊ O CONHECE?
O cientista de dados é um profissional capacitado e especializado na área de Estatística, Ciência
da Computação ou Matemática e possui grande conhecimento e entendimento dos negócios da
empresa, capacidade de realizar análise de grandes volumes de dados e extrair desses dados
ideias que criem novas oportunidades e novos mercados.
- -6
3.2 Entendendo a mineração de dados
Segundo Elmasri e Navathe (2011, p. 698), “o objetivo de um (DW) é dar suporte à tomada dedata warehouse
decisão com dados”. A mineração de dados pode ser usada junto com um DW para ajudar certos tipos de
decisões, pode ser aplicada a bancos de dados operacionais com transações individuais, para extrair “novos
padrões significativos que não podem ser necessariamente encontrados apenas ao consultar ou processar dados
ou metadados no ” (ELMASRI; NAVATHE, 2011, p. 698). E para torná-la mais eficiente, o DWdata warehouse
deve ter uma coleção de dados agregada ou resumida.
Barbieri (2011) aponta que os conceitos de garimpagem ou mineração de dados estão relacionados com a
tendência (para aplicações comerciais) de buscar correlações escondidas em altos volumes de dados, nem
sempre evidentes, principalmente no tratamento cotidiano dos sistemas de informações.
Já para Santos e Ramos (2009), a mineração de dados é uma fase do processo de DCBD (Descoberta e
Conhecimento em Base de Dados) e consiste na procura de relacionamentos, padrões ou modelos que estão
implícitos nos dados armazenados sem grandes bases de dados.
Assim, a mineração de dados é um processo de extração de informações e de conhecimentos de enormes bases
de dados com o principal objetivo de localizar, de forma automática, regras e padrões com o intuito de
transformar esses dados, muitas vezes “escondidos”, em informações úteis e dotadas de relevância que
auxiliarão e fundamentarão o processo de tomada de decisão.
Muito bem, agora que apresentamos uma visão geral sobre o que é mineração da dados, vamos conhecer um
pouco mais desse conceito a partir de suas tarefas, que serão detalhadas no tópico a seguir.
3.2.1 Tarefas da mineração de dados
As tarefas associadas à mineração de dados podem ser divididas em dois grupos: descrição e previsão, na qual a
descrição possibilita a identificação de regras que caracterizam os dados analisados, e a previsão faz uso de
informações da base de dados para prever o valor de uma outra variável.
De acordo com Bery e Linoff (2000, apud SANTOS; RAMOS, 2009), existe uma diferença entre descrição e 
previsão, que depende do objetivo da tarefa da mineração de dados, possibilitando um aumento do
conhecimento a respeito dos dados e suporte ao processo de tomada de decisão.
Podemos dizer que quando se trata de previsão, o modelo melhor e mais adequado é o que possibilita a
realização de uma previsão mais acertada e elevada, demonstrando superioridade à probabilidade de acertos de
outros modelos disponíveis. Porém o melhor e mais adequado modelo em descrição não necessariamente é o
que disponibiliza dados mais precisos e, sim, o que possibilita conseguir um conhecimento mais ampliado dos
dados analisados.
Segundo Santos e Ramos (2009), algumas tarefas são associadas à mineração de dados, como classificação,
segmentação, sumarização e modelação de dependências.
VOCÊ QUER LER?
O livro ”Aprenda Mineração de Dados: Teoria e prática” (AMARAL, 2016) traz uma proposta
diferenciada, com uma linguagem mais didática para o entendimento dos fundamentos da
mineração de dados, com exemplos de aplicação por empresas.
- -7
A seguir, vamos apresentar as principais características das tarefas da mineração de dados.
• classificação: proporciona um dimensionamento do conjunto de dados dentro do que são denominadas 
classes predefinidas, realizando a identificação de qual classe cada elemento faz parte. A classificação de 
dados é um processo dividido em duas fases distintas, sendo a primeira relacionada à identificação de 
modelo que consiga a integração do grupo de classes que segmentam os dados. Já a segunda fase está 
relacionada com o processo que classifica, ou seja, esse modelo faz a aplicação do grupo de dados de 
testes, possibilitando a verificação do desempenho na classificação dos dados desconhecidos. Nos dados 
apresentados como resultados é realizada uma análise com intuito de averiguar o desempenho do 
modelo escolhido. E como é medida a precisão desse modelo? É estipulada com base na quantidade de 
registros classificados de forma correta, sendo comparado ao valor real disponibilizado e armazenado no 
grupo de dados de teste, com o valor previsto pelo modelo. Esta tarefa de classificação é tida como uma 
tarefa de aprendizagem supervisionada. Mas o que isso quer dizer? Que os atributos e as classes que 
compõem e nortearão o processo de classificação dos dados já são conhecidos inicialmente. Por exemplo, 
quando é necessária a utilização da classificação no reconhecimento do grupo ao qual o item faz parte, 
como uma empresa que necessita ter em mãos o padrão de comportamento dos clientes para identificar 
quais podem abandonar o serviço;
• segmentação: proporciona a identificação de um conjunto de classes ou segmentos os quais os dados 
analisados são divididos. É considerada uma tarefa não supervisionada, visto que quem a está utilizando 
não tem nenhum tipo de influência na definição das classes. Os segmentos ocorrem de agrupamentos 
encontrados nos dados e que seguem a métrica de similitude. Muitos algoritmos podem ser empregados 
para identificar segmentos dos dados. Primeiro, consideram que todos os dados fazem parte de um só 
segmento. Em um segundo momento, a divisão acontece entre dois ou mais segmentos, que são divididos 
novamente e assim sucessivamente. até que um número máximo de segmentos seja atingido, 
determinado por quem os estão utilizando, ou então até que métricas utilizadas sinalizem que foi obtido o 
melhor conjunto. Parece confuso? Vamos compreender melhor. A segmentação é semelhante à tarefa de 
classificação quando o grupo ainda não foi definido, por exemplo, na tentativa de classificar um perfil de 
cliente com base na localização;
• sumarização: possibilita a descrição de determinados grupos de dados, oferecendo descrições 
resumidas deles. É possível obter essas descrições a partir da generalização dos dados. Esse tipo de tarefa 
pode ser usado em uma análise exploratória de dados, com a identificação de grupos de valores ou 
descrições que permitem a caracterização dos dados analisados. Santos e Ramos (2009) ainda ressaltam 
que a descrição dos dados realizada a partir da sumarização é um dos objetivos da mineração dos dados 
por si só, ou também pode estar inserida e integrada em outras tarefas, como para a exploração de dados, 
possibilitando criar oportunidades para análises futuras. Quer um exemplo para facilitar a compreensão? 
Separar cliente por idade ou por área de residências possibilita um redirecionamento de campanhas de 
marketing e publicidade para grupos específicos;
• modelação de dependências: o objetivo desse tipo de tarefa está na identificação de um modelo que 
realize a descrição de dependências significativas entre as variáveis. Algumas situações pontuais da 
modelação de dependências encontram-se na descrição de associações e de sequências nos dados. A 
associação possibilita que se realize a identificação de relacionamentos entre os registros armazenados 
VOCÊ SABIA?
A mineração de dados também é conhecida como e trata-se de ferramentas queData Mining
realizam a extração de informaçõesde forma automática dos bancos de dados.
•
•
•
•
- -8
modelação de dependências encontram-se na descrição de associações e de sequências nos dados. A 
associação possibilita que se realize a identificação de relacionamentos entre os registros armazenados 
na base de dados, checando a correlação existente entre eles. Esses relacionamentos que surgem dos 
dados conseguem a apresentação de um nível de confiança importante, permitindo a avaliação do 
significado das relações encontradas. Como exemplo, podemos citar quando bens de consumo são 
comprados simultaneamente, ou seja, quando em um supermercado, é percebido que compradores de 
salgadinhos têm alta probabilidade de comprarem também uma bebida, como um refrigerante.
Portanto, a mineração de dados busca fazer relacionamentos e padrões que estão nos dados armazenados nos
imensos bancos de dados por meio das tarefas descritas neste tópico. Na sequência, vamos apresentar as
ferramentas disponíveis no mercado para a mineração de dados.
3.3 Ferramentas de mineração de dados
Hoje em dia, as ferramentas de mineração de dados comerciais disponíveis no mercado fazem uso de técnicas
para a extração de conhecimento. Algumas usam regras de associação, agrupamento, redes neurais,
sequenciação, análise estatística, árvore de decisão, entre outras.
Figura 2 - As ferramentas de mineração de dados fazem uso de técnicas para cumprir o objetivo de extrair 
conhecimento e informações de volumes imensos de dados.
Fonte: Haywiremedia, Shutterstock, 2018.
Também há ferramentas que fazem uso de técnicas mais elaboradas e avançadas, como lógica baseada em caso,
algoritmos genéticos, lógica , otimização combinatória, entre outras.fuzzy
Segundo Elmasri e Navathe (2011), a maioria das ferramentas de mineração de dados utilizam de uma interface
- -9
Segundo Elmasri e Navathe (2011), a maioria das ferramentas de mineração de dados utilizam de uma interface
denominada ODBC ( ), que é um padrão que opera com banco de dados, permitindoOpen Database Connectivity
acesso aos dados na maior parte dos sistemas de bancos de dados, como os conhecidos , , , Access dBase Oracle
, . Alguns desses sistemas possuem interfaces disponíveis para programas característicos deSQL Server Informix
bancos de dados. Uma grande parte dessas ferramentas roda em ambientes com sistema operacional eWindows
algumas com .Unix
A seguir serão apresentadas as ferramentas que fazem uso de interface com o usuário e interface de
programação de aplicações (ELMASRI; NAVATHE, 2011):
• interface com o usuário: grande parte das ferramentas conhecidas são executadas em ambiente que 
possui interface com o usuário, chamada GUI, ou seja, . Dentro dos recursos Graphic User Interface
disponíveis podem estar incluídas técnicas de visualização elaboradas e refinadas de exibição de dados e 
regras. Podemos apresentar como exemplo a ferramenta , da SGI, que possui a capacidade de MineSet
manipular dados de forma interativa. Outra forma de interface são as baseadas em textos. Disponível 
para ambientes Unix, o da empresa IBM é um exemplo;Intelligent Miner
• interface de programação de aplicações: a maior parte dos produtos disponíveis não possibilita a 
utilização de funções internas, entretanto, alguns fornecem a permissão para que o programador de 
aplicação realize a reutilização de seu código. As interfaces mais conhecidas são biblioteca C e Dynamic 
, as conhecidas DLLs. Um ponto importante para destacar é que algumas ferramentas ainda Link Libraries
podem incluir linguagens próprias de comando de banco de dados.
Elmasri e Navathe (2011) destacam que existem em torno de 100 ferramentas de mineração de dados
disponíveis pelo mundo, além das americanas, tem a holandesa Data Surveyor, e a russa PolyAnalyst.
•
•
- -10
Tabela 1 - Lista de ferramentas de mineração de dados disponíveis atualmente no mercado, com as devidas 
técnicas utilizadas por cada uma e o ambiente em que rodam.
Fonte: ELMASRI; NAVATHE, 2011, p. 717.
Com a crescente utilização de conceitos e aplicações de BI ( ), surgiu a necessidade deBusiness Intelligence
ferramentas variadas e especializadas em mineração de dados. Barbieri (2011) classifica as ferramentas de
mineração de dados em:
• ferramentas independentes de aplicação genérica: são as que disponibilizam um vasto conjunto de 
recursos e técnicas de visualização, com abordagens mais simplificadas, como é o caso da análise de 
regressão, e também abordagens mais elaboradas e avançadas, como as redes neurais, regras de 
associação e análises de agrupamentos. Essas ferramentas necessitam que uma equipe possua formação 
na área de Estatística para o momento de preparo dos dados a serem garimpados e extraídos, exigindo 
um tempo mais longo para a implantação do projeto. Nessa categoria de ferramentas podemos citar a 
IBM DB2 , da IBM Corp, apresentada em versão dedicada de forma exclusiva à mineração Intelligent Miner
de textos e versão que consegue a mineração de dados em geral; a , do SAS Inc, a Enterprise Miner
, da SPSS, posteriormente incorporada à IBM denominada de IBM SPSS , que Clementine Modeler
possibilita o projeto de mineração ser exportado como um programa na linguagem C e utilizado em 
•
- -11
, da SPSS, posteriormente incorporada à IBM denominada de IBM SPSS , que Clementine Modeler
possibilita o projeto de mineração ser exportado como um programa na linguagem C e utilizado em 
outros sistemas de suporte à decisão da empresa, e ainda a ferramenta Família , da Knowledge Angoss 
;Software Corp
• ferramentas orientadas para algoritmos: são as que fazem uso de tipos de algoritmos que podem 
proporcionar um melhor desempenho. Para tanto, é preciso um completo entendimento acerca da 
problemática a ser resolvida para a mais adequada e correta técnica a ser aplicada. Ferramentas dessa 
categoria podem proporcionar um resultado melhor do que as demais. Como exemplos estão Knowledge 
, da Angoss, utilizando árvores de decisão e a , da , para aplicações que Seeker NeuralWorks NeuralWare
necessitam de complexos algoritmos de redes neurais;
• ferramentas orientadas a aplicações específicas: se enquadram as ferramentas que precisaram 
passar por adaptações para conseguirem trabalhar com aplicações como CRM, marketing, entre data base
outras. São fáceis de serem utilizadas, possibilitando que se desenvolvam aplicações por meio da 
orientação de tutoriais, entretanto, são desenvolvidas para certos tipos de sistemas, não permitindo 
grandes variações. Podemos destacar o , da , que foi Portrait Customer Analytics Portrait Software
comprada pela , e as ferramentas da FICO ( );Pitney Bowes Fair Isaac Company
• ferramentas embutidas em soluções OLAP: geralmente são relacionadas a produtos de bancos de 
dados e aplicações de (BI) ou Processamento Analítico On-line (OLAP). Business Intelligence
Proporcionam recursos mais simples, com algoritmos comuns e de fácil aplicação. Como exemplos estão 
, da , o , da Cognos, que foi incorporada pela IBM, as ferramentas Business Miner Business Object Scenario
de dentro do SQL/ 2008 da e a Suíte de da ;data mining Server Microsoft data mining Oracle
• ferramentas e serviços de provedores externos: são as mais completas porque envolvem a prestação 
dos serviços de mineração de dados. Os serviços citados englobam desde a abordagem de metodologias 
para mineração de dados até dos serviços de garimpagem de dados, se enquadrando em um novo hosting 
conceito. O , fornecidos pela IBM, e HP são exemplos.DW Appliance Oracle
Podemos observar que existem diversas ferramentas de mineração de dados disponíveis no mercado, cada uma
com suas particularidades e aplicações. Agora vamos entender como a mineração de dados é utilizada na prática
pelas empresas? O próximo tópico traz exemplos de como organizações de diferentes áreas utilizaram a
mineração de dados para alcançarem seus objetivos estratégicos.
3.4 Mineração de dados na prática
Empresas dos mais variados segmentos da economia e de diversos portes fazem uso da mineraçãode dados para
alcançarem seus objetivos e metas estratégicas, tais como crescimento dos lucros, redução dos gastos, obtenção
de competitividade, superação da concorrência, expansão dos negócios, entre tantos outros. Ferramentas de
mineração de dados podem ser utilizadas em áreas como:
• saúde e medicina: para o auxílio e indicação de diagnósticos mais precisos e mais rápidos;
• política: para identificação do perfil e padrão comportamental dos eleitores;
• vendas e marketing: para a identificação do perfil, padrão de comportamento dos consumidores, bem 
como suas necessidades e preferências;
• setor financeiro: para a identificação de padrões para o auxílio no gerenciamento de relacionamento 
com o cliente;
• gestão de pessoas: identificação e análise de competências e habilidades nos currículos de candidatos;
• setor de cobranças: para detecção de fraudes;
• operadoras de cartões de crédito: para identificação e análise do mercado;
• segurança: na identificação e detecção de ações criminosas e de possíveis ataques terroristas.
Você consegue ter a dimensão de quão é importante e valioso para essas organizações terem acesso a
informações e, a partir disso, conseguirem alcançar resultados positivos e significativos?
Vamos, a seguir, conhecer alguns casos práticos de utilização de ferramentas de mineração de dados por grandes
•
•
•
•
•
•
•
•
•
•
•
•
- -12
Vamos, a seguir, conhecer alguns casos práticos de utilização de ferramentas de mineração de dados por grandes
empresas.
3.4.1 Grande loja de departamento
Barbieri (2011) relata o caso da utilização de mineração de dados em uma grande rede de lojas de
departamentos dos Estados Unidos. Em 2004, havia a previsão de um grande furacão em direção à região sul do
país. A empresa decidiu garimpar os dados de produtos de consumo registrados na área e descobriu que em
outras passagens de furacões houve um aumento significativo de produtos, não necessariamente relevantes a
uma situação de emergência. Com a realização das análises, a empresa descobriu que no lugar de lonas,
lanternas e pregos, uma torta de morango teve o consumo aumentado em sete vezes. Outra curiosidade
constatada é de que a cerveja foi o produto mais vendido no período antes da passagem do furacão.
Figura 3 - Com uso da mineração de dados descobriu-se que a cerveja foi um dos produtos mais consumidos 
pelos americanos no período anterior a passagem de um furacão.
Fonte: sspopov, Shutterstock, 2018.
Com o levantamento desses dados, a empresa decidiu organizar uma operação de logística para deslocamento de
estoques desses produtos para a região em questão. A análise realizada com base em históricos anteriores de
dados possibilitou a rede de departamentos a alcançar enormes lucros. A empresa conseguiu compreender o
comportamento de seus clientes em momentos de aflição, quando estão expostos a riscos de tornados e furacões,
a partir do uso da mineração de dados em um .data warehouse
- -13
3.4.2 Empresa do setor de Saúde no Brasil
Segundo Barbieri (2011), uma grande empresa de saúde do Brasil decidiu realizar a aplicação de técnicas de
mineração de dados em suas ações preventivas. 
Figura 4 - Exemplo de aplicação da mineração de dados é na área de saúde, com o objetivo de planejar ações 
preventivas e realizar ajustes de valores dos seus serviços.
Fonte: Phovoir, Shutterstock, 2018.
Por exemplo, clientes mulheres foram divididas por áreas de trabalho, e se constatou que existia um
comportamento padrão relacionado à faixa de idade quando se tornam gestantes. A partir dessa técnica foi
possível calcular com um grau de precisão mais elevado, os gastos médios de cada grupo e realizar ajustes
necessários nos valores dos serviços oferecidos pela empresa. Outra aplicação diz respeito à redução dos custos
com internações hospitalares. A empresa de saúde, por meio da aplicação de mineração de dados entre seus
mais de cinco milhões de beneficiários, coletou características e histórico de saúde, como obesidade,
hipertensão, diabetes ou indicadores elevados de colesterol, entre outros índices. Adicionando essas
informações a um sistema de call center, a empresa conseguiu uma interação maior com clientes, com intuito de
realizar a conscientização sobre essas condições de saúde, e implementar ações preventivas que resultaram em
redução em torno de 48% nas internações (BARBIERI, 2011).
3.4.3 Empresa do setor de alimentação e produtos farmacêuticos
De acordo com Santos e Ramos (2009), uma empresa, que vamos nos referir aqui como a Empresa G., combina a
comercialização de produtos alimentares e farmacêuticos. Criada em 1936 e espalhada por vários estados nos
Estados Unidos, a empresa emprega mais de 27.000 colaboradores e tem como meta e visão tornar-se a maior e
melhor empresa fornecedora de alimentos e produtos farmacêuticos do país. Para isso, procura sempre garantir
- -14
melhor empresa fornecedora de alimentos e produtos farmacêuticos do país. Para isso, procura sempre garantir
a qualidade dos produtos e serviços em um ambiente agradável e limpo.
A Empresa G. implantou um e que fornece e disponibiliza as ferramentas para apoiar edata warehous
fundamentar a tomada de decisão, entre elas as ferramentas de , ou seja, de mineração de dados. Adata mining
direção e os demais responsáveis pela tomada de decisões usam essas ferramentas para descobrir, dentro de
cada categoria de alimentos, quais são os produtos mais e menos vendidos, quem são os clientes e por que
compram e, dessa forma, saber como investir em produtos com maior rotatividade, lançar campanhas de
promoção e reduzir o espaço físico ocupado pelas marcas ou produtos com pouca venda.
O uso da mineração de dados tem possibilitado à Empresa G. um aumento significativo nas suas vendas e,
consequentemente, nos seus lucros e também uma melhoria no processo de tomada de decisão, utilizando as
informações úteis e relevantes para a resolução dos problemas.
Os gestores enfatizam que o foco não deve ser o uso das ferramentas de mineração de dados, porém seu uso é
peça-chave na transformação das práticas de gestão, presente no trabalho diário para garantir a evolução e
preferência no mercado e a fidelização dos clientes.
Um ponto para destacar é que a utilização das ferramentas de mineração de dados aumentou significativamente
a utilização de relatórios ajustados às necessidades do processo de tomada de decisão específica. E o que isso
significa? Embora as ferramentas utilizadas produzam relatórios que darão suporte à decisão, os responsáveis
podem criar relatórios de acordo com suas necessidades e conhecimentos do negócio e de seus processos. É a
partir desse conhecimento que os tomadores de decisão encontram as informações certas e específicas, seja para
preencherem lacunas de seu conhecimento, seja para a identificação de pontos importantes de negócio que a
empresa não tem conhecimento, como a tentativa de conhecer padrões de comportamento dos clientes.
Veja que as ferramentas de mineração de dados na Empresa G. proporcionaram uma oportunidade de
aproximação e de colaboração com parceiros, como seus fornecedores, trocando informações sobre o
comportamento dos seus produtos.
3.4.4 Grande fabricante de automóveis
Santos e Ramos (2009) destacam que uma grande fabricante de automóveis possui mais de 31.7000
colaboradores espalhados em 32 fábricas pelo mundo. Seus automóveis são vendidos para 200 países e sua sede
central fica em Detroit, nos Estados Unidos. Um executivo da fabricante realizou o lançamento de iniciativas com
o intuito de proporcionar o fortalecimento e a integração dos sistemas de apoio à cadeia de fornecimento e
procura, denominada rede de lealdade digital. Essa rede surgiu da constituição de três componentes
importantes: tecnologia da informação (digital), foco nos clientes, crescimento da sua lealdade e valor para a
empresa (lealdade) e coordenação e potenciação dos parceiros da cadeia de fornecimento e distribuição para
melhor atender aos clientes (rede). É importante ressaltar que o modelo de negóciosgeral dava para as
concessionárias a responsabilidade de gerenciar o relacionamento com seus clientes. Porém a gestão da
fabricante em questão sentiu necessidade de personalizar a interação com os consumidores e realizar ajustes na
fabricação dos veículos de acordo com as suas expectativas e, com isso, alcançar uma vantagem competitiva
sustentável, oferecendo novos serviços e apoio e reduzindo os custos de venda e de distribuição dos veículos.
- -15
Figura 5 - Grande fabricante de veículos fez uso da mineração de dados com o propósito de conhecer melhor 
seus clientes e atender suas necessidades e preferências.
Fonte: Phovoir, Shutterstock, 2018.
A fabricante de automóveis começou a fazer uso das bases de dados alimentadas com informações resultantes
das interações com os clientes, como forma de identificar padrões de gostos, necessidades e preferências.
Também como uma forma de manter contato e relacionamento com clientes que mudaram de endereço e assim
colocar à disposição seus produtos e serviços. Veja que mudanças significativas ocorreram com a introdução das
ferramentas de mineração de dados, no relacionamento com os clientes; tecnológicas, com o intuito de melhorar
o tempo de produção, logística e comunicação com fornecedores; culturais e na estrutura da empresa, resultando
em sucesso. Porém, para que a fabricante tivesse êxito, os executivos foram conscientizados e capacitados a
respeito da importância das ferramentas adotadas e com isso garantiram a utilização em seu grande potencial. A
implantação e utilização das ferramentas de mineração de dados proporcionou a grande integração da área de
marketing com todos os seus concessionários espalhados mundo a fora.
3.4.5 Empresa do setor de telecomunicações
Santos e Ramos (2009) também descrevem o caso de uma empresa privada do setor de telecomunicações que
fornece serviços de comunicação por satélite a empresas do mundo todo. Por meio da instalação de um data
 e de ferramentas de mineração de dados, foi possível fazer o levantamento da eficácia das novaswarehouse
vendas, das campanhas publicitárias, ações estratégicas, além de determinar os resultados dos novos produtos e
também da gestão de forma centralizada que a empresa passou a adotar.
As ferramentas de mineração de dados possibilitaram trabalhar com informações das mais variadas fontes, sem
- -16
As ferramentas de mineração de dados possibilitaram trabalhar com informações das mais variadas fontes, sem
a necessidade de transformação em um tipo de formato comum. Como assim? Por exemplo, não é necessário
normalizar códigos de vendedores usados em diversas áreas da empresa. Foi possível também realizar análises
em históricos da informação, saber quais produtos e quais clientes geram melhores resultados e lucros.
A empresa conseguiu extrair padrões das informações armazenadas nas diversas bases de dados e ter um
retorno em torno de três milhões de dólares.
3.4.6 Empresa do setor financeiro
Santos e Ramos (2009) descrevem que uma empresa do setor financeiro dos Estados Unidos, fundada em 1888,
é especializada em seguros de vida de acordo com as necessidades dos clientes, a classe média dos americanos.
Na década de 1980, a empresa passou a trabalhar com produtos financeiros para clientes pessoa física e
empresas.
Uma área de grande importância para a empresa é o setor de marketing, que necessita não só manter contato,
como também conhecer o perfil e comportamento de seus clientes. As informações da empresa estavam
armazenadas em mais de 25 sistemas informatizados diferentes e que não havia comunicação entre eles. Foi
então que a empresa decidiu implantar um de marketing que comportasse e abrangesse todasdata warehouse
as informações sobre os clientes. Esse poderoso banco de dados, alinhado com um conjunto de ferramentas de
mineração de dados, serviu de base para uma nova forma de gestão de relacionamento com clientes. A empresa
investiu em colaboradores com conhecimento do negócio e com competências técnicas para a melhor utilização
possível das informações armazenadas no .data warehouse
Figura 6 - A área de marketing de uma empresa pode utilizar o sistema de mineração de dados para melhor 
conhecer o padrão de comportamento de seus clientes.
Fonte: Rawpixel.com, Shutterstock, 2018.
Um ponto importante para o sucesso da implantação foi o trabalho a partir de algumas campanhas de marketing
- -17
Um ponto importante para o sucesso da implantação foi o trabalho a partir de algumas campanhas de marketing
que gerariam resultados imediatos e significativos como: campanha para adoção de pagamento eletrônico como
processo de preferência no momento de pagamento dos valores de apólices; campanha para contato com os
atuais clientes e oferecimento de produtos que complementasse os serviços já adquiridos, levando a
identificação daqueles clientes que poderiam comprar os produtos complementares e como resultado o
crescimento nas vendas; campanha de vendas de coberturas complementares com objetivo de identificar
clientes com poucos riscos que tivessem cobertura pela apólice e oferecer coberturas extras; campanha de
identificação dos clientes mais lucrativos e aqueles que poderiam adquirir outros produtos; e campanha que
visava fornecer informações sobre os clientes e mercados aos agentes de seguros.
O desenvolvimento de todas essas campanhas levou a empresa a resultados positivos e impactantes nas vendas,
além do melhor conhecimento sobre seus clientes necessidades e preferências.
Você conseguiu perceber que nos exemplos citados, as empresas, por meio de ferramentas de ,Big Data
conseguiram transformar a enorme quantidade de dados disponíveis em informações úteis e valiosas que
serviram de base e fundamentação para a tomada de decisão.
Portanto, as empresas necessitam ter o entendimento de que o armazenamento de uma vasta quantidade de
dados só possuirá valor se souberem tirar proveito do que possuem e, assim, alcançar os objetivos e resultados
esperados.
Síntese
Você concluiu os estudos do capítulo que apresentou o . Vimos que essa tecnologia nada mais é do queBig Data
um conceito que se refere a uma imensa quantidade de dados e informações armazenados e representa um
grande desafio às empresas contemporâneas, que precisam saber como lidar com esse excesso de dados e
transformá-los em informações úteis e relevantes para auxiliar na tomada de decisão. Outro ponto importante
destacado foi a mineração de dados, isto é, o processo de exploração e extração, feito de maneira automática, em
grandes quantidades de dados armazenados em bancos de dados e de como identificar padrões de
comportamento.
Neste capítulo, você teve a oportunidade de:
• reconhecer as diferentes tecnologias na área de banco de dados;
• identificar os conceitos de ;Big Data
CASO
Uma grande multinacional varejista no ramo de confecções e produtos para o lar passou a
fazer uso de ferramentas de para obter um melhoramento na previsão de necessidadeBig Data
e demanda de seus novos produtos. O caso envolvia questões relacionadas à identificação de
padrões associados ao clima, sazonalidade e tendências da moda. Para tanto, a empresa
desenvolveu um painel que controla, em tempo real, todas as informações sobre o histórico
das vendas, das não realizadas e da quantidade e disponibilidade de produtos nas prateleiras.
Essas informações realimentam suas previsões de vendas. Outro aspecto importante
proporcionado pela ferramenta foi o compartilhamento de informações com seus parceiros
fornecedores, em que foi possível identificar necessidades de produtos ou ainda de
abastecimento de produtos em pontos de venda.
•
•
- -18
• identificar os conceitos de ;Big Data
• analisar as soluções para ;Big Data
• identificar os princípios básicos da mineração de dados;
• conhecer as técnicas e ferramentas de mineração de dados;
• compreender como a mineração de dados é colocada em prática pelas empresas.
Bibliografia
AMARAL, F. : Teoria e prática. Rio de Janeiro: Alta Books Editora, 2016.Aprenda Mineração de Dados
BARBIERI, C.Modelagem & Qualidade. Rio de Janeiro: Elsevier, 2011.BI2 – : Business Intelligence
DAVENPORT, T. H. Derrubando Mitos e Descobrindo Oportunidades. Rio de Janeiro:Big Data no Trabalho: 
Elsevier, 2014.
FERNANDES, A. A.; FERNANDES, V. F. A. da estratégia à gestão dos processosImplantando a governança de TI:
e serviços. 4. ed. Rio de Janeiro: Brasport, 2014.
ELMASRI, R.; NAVATHE, S. B. 6. ed. São Paulo: Pearson Addison Wesley, 2011.Sistema de Banco de Dados.
OLSON, D. L; DELEN, D. . Advanced Data Mining Techniques Springer, 2008.
PAGLEN, J. . Direção: Transcendence – A Revolução Wally Pfister. Produção: Andrew Kosove, Broderick Johnson
. , Kate Cohen, Aaron Ryder, Annie Marter, Marisa Polvino, David Valdes EUA, 2014.
SANTOS, M. Y.; RAMOS, I. Tecnologias da Informação na Gestão de Conhecimento. Lisboa:: Business Intelligence 
FCA, 2009.
•
•
•
•
•
	Introdução
	3.1 Big Data
	3.2 Entendendo a mineração de dados
	3.2.1 Tarefas da mineração de dados
	3.3 Ferramentas de mineração de dados
	3.4 Mineração de dados na prática
	3.4.1 Grande loja de departamento
	3.4.2 Empresa do setor de Saúde no Brasil
	3.4.3 Empresa do setor de alimentação e produtos farmacêuticos
	3.4.4 Grande fabricante de automóveis
	3.4.5 Empresa do setor de telecomunicações
	3.4.6 Empresa do setor financeiro
	Síntese
	Bibliografia

Continue navegando