Baixe o app para aproveitar ainda mais
Prévia do material em texto
Gestão da Informação e tomada de decisão Prof. Paulo Fagner Uninassau 2020.1 – Sist. de Informações Gerenciais Banco de Dados Não Relacionais ● Trata-se de uma abordagem alternativa aos banco relacionais, que surgiram em função da crescente demanda de armazenamento oriunda do fenômeno do Big Data. ● Essa tecnologia é comumente chamada de “NoSQL”. ● Esses sistemas de banco de dados utilizam modelos mais flexíveis e são projetados para gerenciar grandes conjuntos de dados em vários computadores distribuídos. 2 Banco de Dados Não Relacionais ● São úteis em acelerar consultas simples a grandes volumes de dados (estruturados ou não-estruturados), incluindo: ○ Dados da web; ○ Dados de mídias sociais; ○ Gráficos e outras formas difíceis de se analisar com SQL. ● Um banco NoSQL, em geral, é capaz de receber informações estruturadas, semiestruturadas e não estruturadas, sem o rigor dos bancos relacionais. 3 BIG DATA ● Até aproximadamente o ano de 2008, a maioria dos dados coletados pelas organizações eram dados transacionais que poderiam facilmente se encaixar em linhas e colunas de um SGBD relacional. ● Desde então, tem ocorrido uma explosão de dados oriundos de fontes diversas: tráfego da web, e-mails, mídia social (tweets, atualizações de status) além de dados gerados por sensores. ● Esses dados não necessariamente serão estruturados. 4 BIG DATA ● Utiliza-se o termo Big Data para se referir tanto ao fenômeno da explosão da geração dos dados quanto aos dados em si. ● Volumes tão imensos a ponto de estarem além das capacidades que um SGBD típico tem para capturar, armazenar e analisar. ● Quantidades de dados na faixa dos petabytes e exabytes (bilhões a trilhões de registros, de fontes diversas). 1 petabyte = 1.000 terabytes 1 exabyte = 1.000 petabytes 5 BIG DATA ● Além das quantidades de dados envolvidas, a velocidade na geração de dados também é algo marcante no Big Data: ○ Um único motor a jato pode gerar 10 terabytes de dados em 30 minutos; ○ No Facebook / Instagram são adicionadas centenas de milhões de fotos diariamente; ○ O Twitter gera 8 terabytes de dados (texto) por dia 6 BIG DATA – interesse das empresas ● E por que as empresas tem interesse no Big Data? ○ Contém mais padrões (e anomalias) interessantes do que os conjuntos menores de dados; ○ Um conjunto maior de dados tem maior potencial de fornecer novas percepções sobre o comportamento do cliente, padrões climáticos, atividade do mercado financeiro ou outros fenômenos. 7 BIG DATA – interesse das empresas ● Para extrair valor empresarial a partir do Big Data as organizações precisam de novas tecnologias e ferramentas. ● Além disso, as organizações precisam saber quais perguntas precisam ser feitas sobre os dados. ● Big Data é caro: é importante ter uma compreensão clara do problema que o big data vai resolver para a empresa, pois as informações ali contidas podem não ajudar os tomadores de decisão. 8 Infraestrutura de inteligência empresarial ● Uma infraestrutura contemporânea para inteligência empresarial consiste em um conjunto de ferramentas para a obtenção de informações úteis ● Esses recursos incluem data warehouses (armazéns de dados), data marts, Hadoop, computação em memória e plataformas analíticas. 9 Melhorando a tomada de decisão na empresa ● Os bancos de dados, em geral, são utilizados para monitorar e dar suporte às transações básicas das empresas (transações operacionais): ○ Pagamentos a fornecedores, ○ Processamento de pedidos; ○ Atendimento a clientes; ○ Registro de vendas, etc 10 Melhorando a tomada de decisão na empresa ● Todavia, as empresas também precisam de bancos de dados que as ajudem a administrar o negócio de maneira mais eficiente e também ajudem gerentes e funcionários a tomar melhores decisões. Exemplos: ○ Se uma empresa quiser saber qual produto é mais aceito pelo mercado; ○ Quais os clientes mais lucrativos; ○ Analisar informações das compras de um cartão de crédito. 11 Melhorando a tomada de decisão na empresa ● Para isso, são necessários alguns recursos especiais para analisar as vastas quantidades de dados e extraí-los de múltiplos sistemas para dar-lhes uma utilidade. Nesse processo, destacam-se: ○ Data Warehouses ○ Data Marts ○ OLAP ○ Data mining 12 Data warehouse (DW) ● É um BD que armazena dados correntes e históricos de potencial interesse para a tomada de decisões. ● Os dados são originados de outros sistemas, como sistemas de vendas, contas do cliente, manufatura. ● O DW consolida e padroniza as informações oriundas de diferentes banco de dados. ● Os dados estão disponíveis para todos mas não podem ser alterados! 13 Data warehouse (DW) 14 Data warehouse (DW) ● Exemplos de uso: ○ A Receita Federal norte americana utiliza um DW para integrar e centralizar os dados dos contribuintes norte americanos que estão espalhados entre muitos sistemas criados ao longo dos anos; ○ Caso do jornal de Toronto estudado. 15 Data Mart ● É um subconjunto de um data warehouse, no qual uma quantidade de informações de um determinado setor da empresa é colocado em um banco de separado, destinado a um grupo específico de usuários. ● Uma empresa pode desenvolver um data mart de vendas e marketing para tratar informações de clientes. 16 Data Mart 17 Inteligência Empresarial ● Após o armazenamento das informações em DW e DM, os dados ficam disponíveis para análises posteriores. ● O usuário faz uso de diversas ferramentas que consolidam, analisam e acessam essas informações para decidir quais as melhores escolhas empresariais, muitas vezes chamadas de INTELIGÊNCIA EMPRESARIAL – BI – Business Intelligence. 18 Inteligência Empresarial 19 Inteligência Empresarial ● Entre as principais ferramentas, podemos destacar: ○ OLAP (Online Analytical Processing) – Processamento Analítico On-Line; ○ Data Mining (Mineração de dados). 20 OLAP ● Imagine uma empresa que vende quatro produtos diferentes: porcas, pinos, arruelas e parafusos – nas regiões leste, oeste e central. ● Se fosse preciso saber quantas arruelas foram vendidas no último trimestre, a resposta estaria no banco de dados de vendas. ● Mas, se fosse preciso saber quantas arruelas foram vendidas em cada região e também comparar os resultados reais com as projeções de vendas? 21 OLAP ● Seria necessário um PROCESSAMENTO ANALÍTICO ON-LINE ou OLAP. ● Permite a análise multidimensional de dados de forma que os usuários vejam os mesmos dados de diferentes maneiras, pois usa múltiplas dimensões. ● Cada aspecto da informação – produto, preço, custo, região ou período – representa uma dimensão diferente. 22 OLAP 23 Data Mining (Mineração de Dados) ● Fornece percepções dos dados corporativos que não podem ser obtidos através do OLAP. Data mining é orientado por descoberta. ● É o uso da tecnologia da informação para descobrir regras, identificar fatores e tendências-chave, descobrir padrões e relacionamentos ocultos em grandes bancos de dados para auxiliar a tomada de decisões sobre estratégia e vantagens competitivas. ● Faz uso intensivo da Estatística e da Inteligência Artificial (Aprendizagem de Máquina). 24 Data Mining (Mineração de Dados) 25 Gestão da Informação e Banco de Dados Prof. Paulo Fagner Uninassau 2020.1 – Sist. De Informações Gerenciais
Compartilhar