Buscar

Frameworks para Big Data III

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1. 
O Hadoop é um ecossistema de tecnologias versáteis que podem ser amplamente 
utilizadas para armazenamento, processamento e análise de grandes volumes de 
dados. Sobre os módulos básicos que formam o Hadoop, é correto afirmar que: 
 
Resposta correta. 
C. 
MapReduce é o sistema que permite a programação paralela de grandes volumes de dados. 
 
O HDFS é um sistema tolerante a falhas, ou seja, continua funcionando 
corretamente mesmo que um dos seus componentes tenha parado de funcionar. 
Sobre os mecanismos que possibilitam essa tolerância, é correto afirmar que: 
 
Resposta correta. 
B. 
o NameNode monitora o bom funcionamento de um DataNode a partir dos pulsos que este 
envia. 
 
3. 
Uma das principais características do armazenamento em nuvem é o fato de tanto a 
cobrança quanto o espaço disponível estarem atrelados à demanda da 
empresa. Sobre esse serviço "sob demanda", é verdade que: 
 
Você acertou! 
B. 
reduz os custos da empresa a longo prazo porque só se paga pelo que realmente é utilizado. 
 
 
 
 
 
 
 
4. 
A Amazon Web Service é a plataforma de computação em nuvem mais utilizada, 
contando com diferentes frameworks para análise e armazenamento de dados. 
Quanto à solução de armazenamento S3, sabe-se que 
 
 
Você acertou! 
E. 
tem a maior infraestrutura global, com mais de 60 zonas de disponibilidade. 
 
5. 
Amazon S3, Microsoft Azure, Google Cloud Storage e IBM Cloud Object Storage são 
as soluções de armazenamento mais conhecidas. Quando comparadas, é possível 
identificar algumas semelhanças e diferenças. É correto afirmar que: 
Você acertou! 
E. 
IBM Cloud é a que tem o menor custo de armazenamento TB/mês. 
 
 
 
1. 
Sabe-se que, independente de qual seja, as formas de armazenamento de dados 
devem ser capazes de gravar, armazenar e permitir a leitura de informações. 
Entretanto, quando se trata de um grande volume de dados, apenas isso não é o 
suficiente. É necessário que sejam cobertos pelo menos outros três pontos cruciais 
para a manipulação de big data. 
Quais são eles? 
 
Você acertou! 
D. 
Volume, variedade e velocidade. 
 
2. 
Existem diferentes tipos de armazenamento, como visto no nosso capítulo. 
Se o seu projeto envolve a transferência de dados entre usuários e dispositivos e o 
número de usuários é grande, qual tipo é mais indicado? 
 
Resposta correta. 
C. 
Storage area network. 
 
 
 
 
 
3. 
Cada framework de armazenamento guarda os dados em um determinado formato, de 
acordo com a arquitetura para a qual foi projetado. Esses dados podem 
ser armazenados em forma de arquivo, bloco ou objeto. 
Qual é a característica de um "objeto"? 
Você acertou! 
A. 
Possuir metadado e dado. 
 
4. 
O armazenamento em nuvem vem ganhando cada vez mais espaço. Os serviços 
prestados pela Amazon (S3), Microsoft (Azure) e Google (Cloud Storage) são alguns 
dos principais do mercado. 
Entre eles existem muitas coisas em comum, mas um se distingue principalmente 
por: 
 
Você acertou! 
C. 
abordagem de armazenamento. 
 
5. 
O armazenamento dos dados em nuvem apresenta algumas vantagens. 
Qual dos itens a seguir representa uma vantagem do armazenamento em nuvem em 
relação ao on-premise? 
 
 
Você acertou! 
D. 
O armazenamento em nuvem é mais barato porque o usuário geralmente só paga pelo 
que consome. 
 
 
1. 
O particionamento horizontal de um banco de dados (ou sharding) é realizado 
utilizando estruturas que permitem a identificação de cada partição. Quanto a estas, 
as três mais comuns são: 
 
Você acertou! 
C. 
hash, intervalo e diretório. 
 
2. 
O particionamento de dados está intimamente ligado à replicação. Quantos a esses 
dois processos, é verdade que: 
 
Você acertou! 
D. 
a integração do sharding com a replicação promove a alta disponibilidade. 
 
 
3. 
O Apache Cassandra utiliza uma estrutura de hash consistente para particionar os 
dados. Quanto a essa estrutura, escolha a alternativa correta: 
 
Você acertou! 
E. 
É organizado em uma estrutura visualizada como um anel 
 
4. 
Para realizar o sharding, o MongoDB necessita de uma estrutura mínima com três 
componentes: shards, roteadores de consulta e servidores de configuração. Quanto 
a esses componentes, é verdade que 
Você acertou! 
A. 
os roteadores de consulta são a interface entre o aplicativo cliente e os shards propriamente 
ditos. 
 
5. 
Os roteadores de consulta do MongoDB são chamados de mongos. Quanto aos 
mongos, é correto afirmar 
 
 
Você acertou! 
C. 
A cada consulta é necessário que os mongos acessem os metadados, mesmo que essa 
busca seja repetida 
 
1. 
Quando se deseja criar aplicações utilizando o Hadoop MapReduce, 
é necessário usar interfaces específicas. 
Assinale a alternativa que representa apenas interfaces de aplicações Hadoop 
MapReduce 
Você acertou! 
D. 
Mapper, Reducer, Partitioner e Counter 
 
2. 
Uma aplicação que utilize o Apache Spark para solucionar um desafio de Big Data tem 
operações de transformação e de ação. 
Assinale a alternativa que representa apenas funções de transformação: 
 
Você acertou! 
B. 
map, groupByKey e filter. 
 
3. 
A grosso modo, no Spark RDD, as operações que produzem novos RDDs são 
chamadas de transformações e as de ação representam funções para manipular um 
conjunto de dados no RDD atual. 
Assinale a alternativa que representa a operação de ação que grava o RDD no arquivo: 
 
Você acertou! 
E. 
saveAsTextFile. 
 
 
 
 
 
 
 
4. 
Com o MapReduce, é possível processar um conjunto de dados muito grande em 
paralelo e de forma distribuída. 
Assinale a alternativa que representa a afirmação verdadeira sobre as características 
e o funcionamento do MapReduce 
 
Você acertou! 
C. 
Com o MapReduce, é possível distribuir os dados em clusters que podem chegar a milhares 
de nós. 
 
 
5. 
O MapReduce superou desafios relacionados ao processamento paralelo e 
distribuído como divisão da tarefa entre os nós, confiabilidades e tolerância a falhas. 
Assinale a alternativa verdadeira em relação ao funcionamento do MapReduce: 
Resposta correta. 
A. 
As tarefas de mapeamento produzem pares chave-valor intermediários, que são as entradas 
para as tarefas de redução.

Continue navegando