Baixe o app para aproveitar ainda mais
Prévia do material em texto
Plataformas que suportam o data warehouse 1- Azure Synapse Analytics O Azure Synapse Analytics oferece serviços ilimitados de análise, reunindo integração de dados, data warehouse e big data analytics em um único software. A ideia é dar liberdade para profissionais consultarem dados da forma que desejarem, com opções sem servidor ou dedicadas, em escalas. Prós Integra perfeitamente com outros serviços de dados da Azure, permitindo uma análise de dados unificada.Microsoft Azure é desenvolvido com base em vários casos de uso, por isso é capaz de apresentar soluções prontas para tudo. Contras Muitos recursos de sintaxe de SQL não estão disponíveis e não há recursos de deduplicação no armazenamento.Alta codificação e conhecimento para recursos tradicionais de outros sistemas de DWs e sem ferramentas de conversão para código. 2- Oracle ADW Oracle Autonomous data warehouse é um serviço de DW em nuvem que prioriza eliminar as complexidades da operação de um data warehouse e demais serviços orientados por dados. O provisionamento, a configuração, a proteção, o ajuste, o dimensionamento e o backup do DW são automatizados. Prós A natureza autônoma do banco de dados do Oracle ajuda a reduzir as despesas de manutenção contínua.O desempenho do banco de dados é notável para as cargas de trabalho de análise após a instalação do Oracle ADW. Contras A integração com databases de servidor SQL exige um certo esforço para refatorar.O alto custo e o suporte oferecidos não são os melhores atrativos do serviço. 3- Amazon Redshift Uma das ferramentas de DW mais classificadas por usuários online. Assim como o nome sugere, o Redshift faz parte dos serviços de web oferecidos pela plataforma de cloud da Amazon. Opera como data warehouse em escala de petabytes completamente gerenciado na nuvem. Prós Automatiza tarefas administrativas, como gerenciar, monitorar e dimensionar o data warehouse.Permite a execução de consultas em dados não estruturados, o que faz economizar bastante tempo Contras Não oferece uma solução de várias nuvens, está disponível apenas na Amazon Web Services (AWS).É conhecido por ter problemas com o manuseio eficiente do armazenamento. 4- Google Big Query Ferramenta de armazenamento de dados sem servidor e baseada em nuvem oferecida pela Google. É capaz de armazenar grandes quantidades de dados e usa SQL em suas consultas.O Big Query é eficiente para gerar insights através das informações coletadas. Prós Os dados podem ser analisados em tempo real para obter informações atualizadas.Permite analisar petabytes de dados em uma velocidade eficiente, além de possuir uma ótima relação entre custo e benefício. Contras Usar o Big Query pode ser complexo para quem está começando, especialmente por conta da experiência de usuário que é comprometida pela interface da ferramenta.Operar uma API de Big Query exige conhecimento em programação, o que pode dificultar o manuseio por profissionais de fora dessas áreas. 5- Snowflake O Snowflake é uma plataforma baseada em nuvem que oferece ao data warehouse serviços para dados estruturados e semiestruturados. A arquitetura dessa ferramenta permite que o armazenamento e a computação sejam escalonados separadamente. Prós Sua nuvem possui uma natureza elástica, o que significa que uma grande quantidade de dados pode ser armazenada e várias consultas podem ser executadas simultaneamente.O recurso exclusivo é que dados estruturados e semiestruturados combinados podem ser carregados no banco de dados em nuvem sem se transformar em uma categoria fixa. Contras O Snowflake possui um preço alto, se comparado às demais ferramentas, não sendo uma opção muito acessível.A interface não é muito intuitiva e apresenta erros de navegação. 6- PostgreSQL É uma ferramenta de código aberto bastante popular que armazena, integra e analisa dados usando recursos embutidos e instrumentos de análise. Os procedimentos e a funções podem ser criados em várias linguagens de programação, como PL, pgSQL, Python etc. Prós É possível combinar o PostgreSQL com ferramentas e aplicativos externos para mineração de dados e relatório.Existe uma enorme quantidade e variedade de extensões terceirizadas para o PostgreSQL, tanto gratuitas quanto pagas. Contras O PostgreSQL não fornece recursos de compactação de dados, o que dificulta estudos e desempenhos.Apresenta instabilidades consideravelmente constantes, em especial nas queries que acabam ficando lentas. 7- Azure Databricks O Azure Databricks é a plataforma otimizada de análise de dados da Microsoft, integrada aos serviços de nuvem da empresa. Apesar de não se tratar necessariamente de um data warehouse, a ferramenta combina as funções de DW e data lake para empresas. Prós Excelente ambiente de desenvolvimento e interface amigável de fácil manuseio.Melhor desempenho através da consolidação de pequenos arquivos em tabelas delta.
Compartilhar