Buscar

AULA X - banco de dados - melhorando tomada de decisão

Prévia do material em texto

Gestão da Informação e 
tomada de decisão
Prof. Paulo Fagner 
Uninassau 2020.1 – Sist. de Informações Gerenciais
Banco de Dados Não Relacionais
● Trata-se de uma abordagem alternativa aos banco relacionais, que surgiram 
em função da crescente demanda de armazenamento oriunda do fenômeno 
do Big Data.
● Essa tecnologia é comumente chamada de “NoSQL”.
● Esses sistemas de banco de dados utilizam modelos mais flexíveis e são 
projetados para gerenciar grandes conjuntos de dados em vários 
computadores distribuídos.
2
Banco de Dados Não Relacionais
● São úteis em acelerar consultas simples a grandes volumes de dados 
(estruturados ou não-estruturados), incluindo:
○ Dados da web;
○ Dados de mídias sociais;
○ Gráficos e outras formas difíceis de se analisar com SQL.
● Um banco NoSQL, em geral, é capaz de receber informações estruturadas, 
semiestruturadas e não estruturadas, sem o rigor dos bancos relacionais.
3
BIG DATA
● Até aproximadamente o ano de 2008, a maioria dos dados coletados 
pelas organizações eram dados transacionais que poderiam facilmente se 
encaixar em linhas e colunas de um SGBD relacional.
● Desde então, tem ocorrido uma explosão de dados oriundos de fontes 
diversas: tráfego da web, e-mails, mídia social (tweets, atualizações de 
status) além de dados gerados por sensores.
● Esses dados não necessariamente serão estruturados.
4
BIG DATA
● Utiliza-se o termo Big Data para se referir tanto ao fenômeno da 
explosão da geração dos dados quanto aos dados em si.
● Volumes tão imensos a ponto de estarem além das capacidades que um 
SGBD típico tem para capturar, armazenar e analisar.
● Quantidades de dados na faixa dos petabytes e exabytes (bilhões a 
trilhões de registros, de fontes diversas).
1 petabyte = 1.000 terabytes
1 exabyte = 1.000 petabytes
5
BIG DATA
● Além das quantidades de dados envolvidas, a velocidade na geração de 
dados também é algo marcante no Big Data:
○ Um único motor a jato pode gerar 10 terabytes de dados em 30 minutos;
○ No Facebook / Instagram são adicionadas centenas de milhões de fotos 
diariamente;
○ O Twitter gera 8 terabytes de dados (texto) por dia
6
BIG DATA – interesse das empresas
● E por que as empresas tem interesse no Big Data?
○ Contém mais padrões (e anomalias) interessantes do que os conjuntos 
menores de dados;
○ Um conjunto maior de dados tem maior potencial de fornecer novas 
percepções sobre o comportamento do cliente, padrões climáticos, 
atividade do mercado financeiro ou outros fenômenos.
7
BIG DATA – interesse das empresas
● Para extrair valor empresarial a partir do Big Data as organizações 
precisam de novas tecnologias e ferramentas.
● Além disso, as organizações precisam saber quais perguntas precisam 
ser feitas sobre os dados.
● Big Data é caro: é importante ter uma compreensão clara do problema 
que o big data vai resolver para a empresa, pois as informações ali 
contidas podem não ajudar os tomadores de decisão.
8
Infraestrutura de inteligência empresarial
● Uma infraestrutura contemporânea para inteligência empresarial 
consiste em um conjunto de ferramentas para a obtenção de 
informações úteis
● Esses recursos incluem data warehouses (armazéns de dados), data
marts, Hadoop, computação em memória e plataformas analíticas.
9
Melhorando a tomada de decisão na empresa
● Os bancos de dados, em geral, são utilizados para monitorar e dar 
suporte às transações básicas das empresas (transações operacionais):
○ Pagamentos a fornecedores, 
○ Processamento de pedidos;
○ Atendimento a clientes;
○ Registro de vendas, etc
10
Melhorando a tomada de decisão na empresa
● Todavia, as empresas também precisam de bancos de dados que as 
ajudem a administrar o negócio de maneira mais eficiente e também 
ajudem gerentes e funcionários a tomar melhores decisões. Exemplos:
○ Se uma empresa quiser saber qual produto é mais aceito pelo mercado;
○ Quais os clientes mais lucrativos;
○ Analisar informações das compras de um cartão de crédito.
11
Melhorando a tomada de decisão na empresa
● Para isso, são necessários alguns recursos especiais para analisar as 
vastas quantidades de dados e extraí-los de múltiplos sistemas para 
dar-lhes uma utilidade. Nesse processo, destacam-se:
○ Data Warehouses
○ Data Marts
○ OLAP
○ Data mining
12
Data warehouse (DW)
● É um BD que armazena dados correntes e históricos de potencial 
interesse para a tomada de decisões.
● Os dados são originados de outros sistemas, como sistemas de vendas, 
contas do cliente, manufatura. 
● O DW consolida e padroniza as informações oriundas de diferentes
banco de dados.
● Os dados estão disponíveis para todos mas não podem ser alterados!
13
Data warehouse (DW)
14
Data warehouse (DW)
● Exemplos de uso:
○ A Receita Federal norte americana utiliza um DW para integrar e 
centralizar os dados dos contribuintes norte americanos que estão 
espalhados entre muitos sistemas criados ao longo dos anos;
○ Caso do jornal de Toronto estudado.
15
Data Mart
● É um subconjunto de um data warehouse, no qual uma quantidade de 
informações de um determinado setor da empresa é colocado em um 
banco de separado, destinado a um grupo específico de usuários.
● Uma empresa pode desenvolver um data mart de vendas e marketing 
para tratar informações de clientes.
16
Data Mart
17
Inteligência Empresarial
● Após o armazenamento das informações em DW e DM, os dados ficam 
disponíveis para análises posteriores.
● O usuário faz uso de diversas ferramentas que consolidam, analisam e 
acessam essas informações para decidir quais as melhores escolhas 
empresariais, muitas vezes chamadas de INTELIGÊNCIA EMPRESARIAL 
– BI – Business Intelligence.
18
Inteligência Empresarial
19
Inteligência Empresarial
● Entre as principais ferramentas, podemos destacar:
○ OLAP (Online Analytical Processing) – Processamento Analítico On-Line;
○ Data Mining (Mineração de dados).
20
OLAP
● Imagine uma empresa que vende quatro produtos diferentes: porcas, 
pinos, arruelas e parafusos – nas regiões leste, oeste e central.
● Se fosse preciso saber quantas arruelas foram vendidas no último 
trimestre, a resposta estaria no banco de dados de vendas.
● Mas, se fosse preciso saber quantas arruelas foram vendidas em cada 
região e também comparar os resultados reais com as projeções de 
vendas?
21
OLAP
● Seria necessário um PROCESSAMENTO ANALÍTICO ON-LINE ou OLAP.
● Permite a análise multidimensional de dados de forma que os usuários 
vejam os mesmos dados de diferentes maneiras, pois usa múltiplas 
dimensões.
● Cada aspecto da informação – produto, preço, custo, região ou período 
– representa uma dimensão diferente.
22
OLAP
23
Data Mining (Mineração de Dados)
● Fornece percepções dos dados corporativos que não podem ser 
obtidos através do OLAP. Data mining é orientado por descoberta.
● É o uso da tecnologia da informação para descobrir regras, identificar 
fatores e tendências-chave, descobrir padrões e relacionamentos 
ocultos em grandes bancos de dados para auxiliar a tomada de 
decisões sobre estratégia e vantagens competitivas.
● Faz uso intensivo da Estatística e da Inteligência Artificial (Aprendizagem 
de Máquina).
24
Data Mining (Mineração de Dados)
25
Gestão da Informação e Banco 
de Dados
Prof. Paulo Fagner 
Uninassau 2020.1 – Sist. De Informações Gerenciais

Continue navegando