Gestão estrtégica da informação
253 pág.

Gestão estrtégica da informação


DisciplinaGestão Estrategica da Informação146 materiais701 seguidores
Pré-visualização32 páginas
para, através desse cálculo, chegar a um 
resultado. Por exemplo, imaginando que 
queremos prever o resultado das vendas de 
um estabelecimento, os modelos regres-
sores podem dar os seguintes coeficientes: 
Previsão de Vendas = (3.21 * quantidade de 
vendas mês anterior) + (4.78 * quantidade 
de peças abaixo da margem). Nesse caso, 
as constantes são representadas pelo [3.21, 
4.78] e os coeficientes são [quantidade de 
vendas mês anterior, quantidade de peças 
Unidade 4 \u2022 Utilizando os Dados: Mineração de Dados112/234
abaixo da margem]. 
E, por fim, na classificação bayesiana é utilizada uma abordagem probabilística para realizar essa 
classificação, em que devido à incerteza da realidade em relação ao modelo, essa incerteza é 
inserida no modelo através de probabilidades expressadas através de porcentagem. Se estivés-
semos utilizando a modelagem bayesiana para classificarmos se podemos ir jogar tênis ou não, 
essas probabilidades poderiam ser expressadas, por exemplo, {Jogar tênis: 75%, Não jogar tênis: 
25%}. 
As potencialidades de aplicação de mineração de dados podem estar na segmentação de mer-
cado, criação de personas (profiles) em CRM, detecção de fraudes, target marketing, análises de 
associações de produtos (market basket analysis).
Outros exemplos de aplicações podem ser vistos no Quadro 3: 
Quadro 3 | Técnicas de mineração de dados e aplicações práticas
Técnicas de mineração de dados e aplicações práticas
Regras de Associação Classificação Agrupamento
Combate a cartéis em licitações Divisão de segmentos demográ-
ficos de classes sociais
Análise de densidade de áreas 
florestais
Unidade 4 \u2022 Utilizando os Dados: Mineração de Dados113/234
Cruzamento de dados referen-
tes a Cartões de Pagamento do 
Governo Federal
Segmentação de distúrbios mé-
dicos
Prevenção e Combate ao des-
matamento
Correlação de causa e efeito em 
estudos sociais e políticas públi-
cas de segurança
Investigação e análise de amea-
ças à segurança nacional
Análise espacial de território
Relacionamento de consequên-
cias em políticas de saúde públi-
ca
Diferenciação de segmentos de 
crédito a grupos empresariais 
Segmentação de investimentos
Fonte: elaborado pelo autor.
1.4. Metodologias de implantação de mineração de dados
Para um projeto de sucesso em mineração de dados, algumas etapas são necessárias a fim de que 
o projeto tenha um desempenho adequado. Isso se faz necessário através do desenvolvimento 
de metodologias próprias e diferentes de projetos de tecnologia da informação convencionais 
(e.g. CMMI, PMBOK etc.).
Dentre as metodologias para implementação de projetos de mineração de dados, destacam-se 
Unidade 4 \u2022 Utilizando os Dados: Mineração de Dados114/234
duas: CRISP-DM (Cross Industry Standard 
Process for Data mining) e o SEMMA (Sam-
ple, Explore, Modify, Model, and Assess). 
O CRISP-DM foi criado em 1996 por um con-
sórcio de diversas companhias para reunir 
boas práticas de implementação de mine-
ração de dados, passando desde a parte de 
concepção dos projetos até mesmo a parte 
final, de entrega e avaliação final. 
O SEMMA foi criado pela empresa SAS para 
criar um modelo de trabalho para as suas 
ferramentas, e tem o foco muito mais na 
parte de experimentação propriamente dita 
do que no projeto em si. 
O CRISP-DM tem seis fases na sua imple-
mentação, que são:
Entendimento do negócio: nesse momen-
to há um ajuste de expectativas em relação 
aos objetivos e aos critérios de sucesso do 
projeto, e o valor a ser adicionado ao produ-
to ou ao serviço. Nesta fase há uma discus-
são sobre as ferramentas e as restrições e 
potencialidades.
Entendimento dos dados: nesta fase há a 
parte de coleta de dados, tratamento inicial 
das varáveis da base de dados, verificação 
da qualidade dos dados e algumas análises 
exploratórias de dados para identificação 
de potenciais variáveis interessantes para o 
modelo. 
Preparação dos dados: em preparação dos 
dados há o trabalho que consome cerca de 
80% do processo como um todo, que é a 
parte de seleção de campos, integração de 
múltiplas fontes de dados, limpeza e nor-
Unidade 4 \u2022 Utilizando os Dados: Mineração de Dados115/234
malização desses dados. 
Modelagem: a modelagem é a parte em que 
entram os algoritmos de mineração de da-
dos, e há uma escolha do algoritmo mais 
apropriado para o problema em questão. 
São construídos modelos base como refe-
rência de predição, e é a fase de experimen-
tação algorítmica. 
Avaliação: nesta fase há a validação do re-
sultado preditivo do modelo, e a validação 
se os modelos estão aderentes e se estão 
retornando com resultados corretos. Há 
também a definição de se o modelo entra-
rá em produção ou não e os seus tempos de 
recalibragem. 
Deployment ou implantação: aqui o mode-
lo é efetivamente colocado em produção, é 
monitorado e são feitas as manutenções de 
calibragem, além de serem informados os 
resultados e detalhes do processo em um 
relatório final. 
Já o SEMMA tem menos fases, e um foco 
maior nas tarefas típicas de mineração de 
dados, que são: Sample \u2013 Define a amostra-
gem e design experimental; Explore \u2013 rea-
lização de tarefas de análise exploratória 
como gráficos interativos, agrupamentos 
e associações e demais técnica; Modifiy \u2013 
modificação de variáveis, criação de novas 
features nos dados, e demais transforma-
ções destes; Model \u2013 utilização de modelos 
usando algoritmos como redes neurais 
artificiais, métodos baseados em árvore, 
Unidade 4 \u2022 Utilizando os Dados: Mineração de Dados116/234
modelos logísticos e modelos estatísticos; 
Assess \u2013 validação dos modelos levando em 
consideração a sua acurácia e o seu poder 
interpretativo (OLSON; DELEN, 2008).
1.5 Aplicações comerciais
Merck-Medco Managed Care (Empresa far-
macêutica): através do seu serviço de distri-
buição de medicamentos, por meio da mi-
neração em seu data warehouse, descobriu 
padrões em sua base, como doenças e tra-
tamentos medicamentosos mais eficientes, 
percepção de qual remédio era mais efi-
Link
Para entender, dentro da perspectiva da gestão 
estratégica da informação, como as organiza-
ções mesmo com uma infinidade de dados po-
dem ainda enfrentar problemas graves de falta 
de informação, leia a matéria a seguir, que mos-
tra como a mudança na cultura organizacional 
pode servir de alavanca para esse processo. SAL-
LES, Marcelo; SANCHES, Walter. Como evitar que 
as organizações afoguem-se em um oceano de 
dados. Portal Administradores. Publicado em: 09 
jun. 2017.
Unidade 4 \u2022 Utilizando os Dados: Mineração de Dados117/234
ciente para determinados tipos de pacien-
tes, criação de sistema especialista de re-
comendação de remédios que ajudou seus 
consumidores a economizarem de 10-15% 
nos custos de medicamentos. 
A. C. Milan (Clube de Futebol): através de 
um sistema especialista de análise de dados 
com data mining, o Milan conseguiu cons-
truir um sistema de recomendação de trei-
nos para os atletas de acordo com o seu bi-
ótipo, e um controle de prevenção de lesões 
no qual o clube consegue, de acordo com 
as cargas em treinos e jogos, predizer se um 
jogador está perto de sofrer uma lesão.
Wall Mart I (rede de hipermercados): a mi-
tologia sobre regras de associação foi ori-
ginária no Wall Mart em meados dos anos 
1990, no qual, através de um estudo em 
suas bases de dados, os analistas desco-
briram que sempre às quintas-feiras havia 
uma venda muito alta de dois itens bastan-
te distintos: cervejas e fraldas. Após uma 
análise mais cuidadosa, descobriram que 
geralmente esses itens eram vendidos para 
Unidade 4 \u2022 Utilizando os Dados: Mineração de Dados118/234
pais que tinham filhos pequenos em casa e aproveitavam para assistir o futebol americano na TV 
Link
Uma das primeiras referências do uso de mineração de dados como alavanca de vendas foi original-
mente pensada na rede de supermercados Wall Mart, em que os analistas de informação descobriram, 
através da mineração de dados, que havia uma relação direta entre a venda de fraldas