O Hive consegue otimizar consultas de forma automática, o que o torna muito eficaz. Entretanto, mesmo com essa funcionalidade, é para melhorar esse desempenho.
Particionar os dados em uma tabela é uma ótima opção, mas é necessário tomar alguns cuidados. Sabendo disso, qual seria a maneira c particionamentos?
· Particionamentos diminuem toda a eficácia na criação de consultas, e a utilização excessiva dessa técnica pode resultar em deixar os DataNodes do HD de tirar toda a eficácia em consultas, principalmente as agrupadas por GROUP BY.
· Particionamentos aumentam a eficácia na criação de consultas, e a utilização excessiva dessa técnica pode melhorar consideravelmente o desempenho além de aumentar ainda mais a eficácia em consultas agrupadas por GROUP BY.
· Particionamentos aumentam a eficácia na criação de consultas, mas a utilização excessiva dessa técnica pode resultar em deixar os DataNodes do HDF voltam a ter ótimos resultados caso as consultas sejam agrupadas por GROUP BY.
· Particionamentos aumentam a eficácia na criação de consultas, mas a utilização excessiva dessa técnica pode resultar em deixar os DataNodes do HDF toda a eficácia em consultas, principalmente as agrupadas por GROUP BY.
Para escrever sua resposta aqui, entre ou crie uma conta
Compartilhar