Baixe o app para aproveitar ainda mais
Prévia do material em texto
DATA LAKE COMO REPOSITÓRIO DE BIG DATA DE CRESCIMENTO RÁPIDO E CADA VEZ MAIS DESESTRUTURADO Rafael Renoldi Siqueira O universo digital está se expandindo exponencialmente tornando os dados o combustível mais procurado da economia. Todos os tipos de dados – estruturados e não estruturados – estão sendo produzidos e precisam de um repositório de big data para serem armazenados e processados mais rápidos. Isto torna-se um desafio: você não pode combinar os dados certos de modo ágil e assertivo em um projeto de Big Data, se esses dados estiverem um pouco em todos os lugares, seja dentro ou fora de uma nuvem. Grandes quantidades de dados requerem capacidades diferentes e maiores armazenamento, e o Data Lake é uma delas. Um Data Lake é semelhante à um cofre, onde você pode armazenar todos os tipos de dados, sejam eles estruturados ou não- estruturados, em qualquer escala. Os dados podem ser armazenados em sua forma mais bruta, sem a necessidade de estruturação, processamento ou análise. Junto com isso, os dados podem ser aceitos e retidos de todas as fontes de dados em um Data Lake, uma vez que suporta todos os tipos de dados. É justamente aqui que um Data Lake se destaca e se mostra mais eficiente que um Data Warehouse. Ele armazena dados que vêm de dados não relacionais, como aplicativos móveis, dispositivos IoT e até mídias sociais. Esses dados podem ser testados com diferentes tipos de análises, como consultas SQL, pesquisa de texto completo, análises em tempo real, aprendizado de máquina, etc., que podem fornecer insights úteis. Um Data Lake possibilitará uma tomada de decisão mais rápida, uma vez que existem todos os tipos de dados disponíveis que podem ser analisados de várias maneiras que podem produzir melhores resultados.
Compartilhar