Prévia do material em texto
CARACTERÍSTICAS DE UM DATA LAKE Data Lake é um repositório para processamento de gigantescos volumes de dados armazenados em seu formato nativo, sendo um motor para processamento do Big Data. Veja um detalhamento sobre as características desejáveis em um Data Lake de alta performance. ARMAZENAMENTO Ecossistemas de Big Data precisam, sobretudo, ser capazes de armazenar quantidades enormes de dados multivariados, que chegam no Data Lake e precisam ser armazenados em alta velocidade. PODER COMPUTACIONAL Em um Data Lake, é essencial que se tenha poder computacional de grande capacidade, visto que são tratados inúmeros conjuntos de dados. Geralmente serviços em nuvem fornecem esse alto poder de processamento. BAIXO CUSTO Em geral, a maioria dos serviços de Data Lake é de baixo custo e conta com muitas ferramentas gratuitas disponíveis para tratamento dos dados. ESCALÁVEL Ao adicionar mais dispositivos de hardware chamados de nós), é possível aumentar poder sistêmico de manipulação de dados. Isso tudo pode ser feito com muita facilidade na maioria dos serviços de Data Lake. Com uso de Data Lakes, Big Data fica totalmente amparado por uma série de ferramentas que auxiliam no processamento dos dados.