Buscar

N1 - Arquitetura da Informação e Estratégias de Big Data - Data Lake como Repositório de Big Data de Crescimento Rápido e Desestruturado

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

DATA LAKE COMO REPOSITÓRIO DE BIG DATA DE 
CRESCIMENTO RÁPIDO E CADA VEZ MAIS DESESTRUTURADO 
Rafael Renoldi Siqueira 
 
O universo digital está se expandindo exponencialmente tornando os dados o 
combustível mais procurado da economia. Todos os tipos de dados – estruturados e 
não estruturados – estão sendo produzidos e precisam de um repositório de big data 
para serem armazenados e processados mais rápidos. 
 
Isto torna-se um desafio: você não pode combinar os dados certos de modo ágil e 
assertivo em um projeto de Big Data, se esses dados estiverem um pouco em todos 
os lugares, seja dentro ou fora de uma nuvem. 
 
Grandes quantidades de dados requerem capacidades diferentes e maiores 
armazenamento, e o Data Lake é uma delas. Um Data Lake é semelhante à um cofre, 
onde você pode armazenar todos os tipos de dados, sejam eles estruturados ou não-
estruturados, em qualquer escala. Os dados podem ser armazenados em sua forma 
mais bruta, sem a necessidade de estruturação, processamento ou análise. Junto com 
isso, os dados podem ser aceitos e retidos de todas as fontes de dados em um Data 
Lake, uma vez que suporta todos os tipos de dados. 
 
É justamente aqui que um Data Lake se destaca e se mostra mais eficiente que um 
Data Warehouse. Ele armazena dados que vêm de dados não relacionais, como 
aplicativos móveis, dispositivos IoT e até mídias sociais. Esses dados podem ser 
testados com diferentes tipos de análises, como consultas SQL, pesquisa de texto 
completo, análises em tempo real, aprendizado de máquina, etc., que podem fornecer 
insights úteis. 
 
Um Data Lake possibilitará uma tomada de decisão mais rápida, uma vez que existem 
todos os tipos de dados disponíveis que podem ser analisados de várias maneiras 
que podem produzir melhores resultados.

Continue navegando