Frameworks para Big Data III

•

UNIP

5

0

5

0

Jackson Garcia

18/05/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Fundamentos e Projeto de Big Data

832 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1.
O Hadoop é um ecossistema de tecnologias versáteis que podem ser amplamente
utilizadas para armazenamento, processamento e análise de grandes volumes de
dados. Sobre os módulos básicos que formam o Hadoop, é correto afirmar que:

Resposta correta.
C.
MapReduce é o sistema que permite a programação paralela de grandes volumes de dados.

O HDFS é um sistema tolerante a falhas, ou seja, continua funcionando
corretamente mesmo que um dos seus componentes tenha parado de funcionar.
Sobre os mecanismos que possibilitam essa tolerância, é correto afirmar que:

Resposta correta.
B.
o NameNode monitora o bom funcionamento de um DataNode a partir dos pulsos que este
envia.

3.
Uma das principais características do armazenamento em nuvem é o fato de tanto a
cobrança quanto o espaço disponível estarem atrelados à demanda da
empresa. Sobre esse serviço "sob demanda", é verdade que:

Você acertou!
B.
reduz os custos da empresa a longo prazo porque só se paga pelo que realmente é utilizado.

4.
A Amazon Web Service é a plataforma de computação em nuvem mais utilizada,
contando com diferentes frameworks para análise e armazenamento de dados.
Quanto à solução de armazenamento S3, sabe-se que

Você acertou!
E.
tem a maior infraestrutura global, com mais de 60 zonas de disponibilidade.

5.
Amazon S3, Microsoft Azure, Google Cloud Storage e IBM Cloud Object Storage são
as soluções de armazenamento mais conhecidas. Quando comparadas, é possível
identificar algumas semelhanças e diferenças. É correto afirmar que:
Você acertou!
E.
IBM Cloud é a que tem o menor custo de armazenamento TB/mês.

1.
Sabe-se que, independente de qual seja, as formas de armazenamento de dados
devem ser capazes de gravar, armazenar e permitir a leitura de informações.
Entretanto, quando se trata de um grande volume de dados, apenas isso não é o
suficiente. É necessário que sejam cobertos pelo menos outros três pontos cruciais
para a manipulação de big data.
Quais são eles?

Você acertou!
D.
Volume, variedade e velocidade.

2.
Existem diferentes tipos de armazenamento, como visto no nosso capítulo.
Se o seu projeto envolve a transferência de dados entre usuários e dispositivos e o
número de usuários é grande, qual tipo é mais indicado?

Resposta correta.
C.
Storage area network.

3.
Cada framework de armazenamento guarda os dados em um determinado formato, de
acordo com a arquitetura para a qual foi projetado. Esses dados podem
ser armazenados em forma de arquivo, bloco ou objeto.
Qual é a característica de um "objeto"?
Você acertou!
A.
Possuir metadado e dado.

4.
O armazenamento em nuvem vem ganhando cada vez mais espaço. Os serviços
prestados pela Amazon (S3), Microsoft (Azure) e Google (Cloud Storage) são alguns
dos principais do mercado.
Entre eles existem muitas coisas em comum, mas um se distingue principalmente
por:

Você acertou!
C.
abordagem de armazenamento.

5.
O armazenamento dos dados em nuvem apresenta algumas vantagens.
Qual dos itens a seguir representa uma vantagem do armazenamento em nuvem em
relação ao on-premise?

Você acertou!
D.
O armazenamento em nuvem é mais barato porque o usuário geralmente só paga pelo
que consome.

1.
O particionamento horizontal de um banco de dados (ou sharding) é realizado
utilizando estruturas que permitem a identificação de cada partição. Quanto a estas,
as três mais comuns são:

Você acertou!
C.
hash, intervalo e diretório.

2.
O particionamento de dados está intimamente ligado à replicação. Quantos a esses
dois processos, é verdade que:

Você acertou!
D.
a integração do sharding com a replicação promove a alta disponibilidade.

3.
O Apache Cassandra utiliza uma estrutura de hash consistente para particionar os
dados. Quanto a essa estrutura, escolha a alternativa correta:

Você acertou!
E.
É organizado em uma estrutura visualizada como um anel

4.
Para realizar o sharding, o MongoDB necessita de uma estrutura mínima com três
componentes: shards, roteadores de consulta e servidores de configuração. Quanto
a esses componentes, é verdade que
Você acertou!
A.
os roteadores de consulta são a interface entre o aplicativo cliente e os shards propriamente
ditos.

5.
Os roteadores de consulta do MongoDB são chamados de mongos. Quanto aos
mongos, é correto afirmar

Você acertou!
C.
A cada consulta é necessário que os mongos acessem os metadados, mesmo que essa
busca seja repetida

1.
Quando se deseja criar aplicações utilizando o Hadoop MapReduce,
é necessário usar interfaces específicas.
Assinale a alternativa que representa apenas interfaces de aplicações Hadoop
MapReduce
Você acertou!
D.
Mapper, Reducer, Partitioner e Counter

2.
Uma aplicação que utilize o Apache Spark para solucionar um desafio de Big Data tem
operações de transformação e de ação.
Assinale a alternativa que representa apenas funções de transformação:

Você acertou!
B.
map, groupByKey e filter.

3.
A grosso modo, no Spark RDD, as operações que produzem novos RDDs são
chamadas de transformações e as de ação representam funções para manipular um
conjunto de dados no RDD atual.
Assinale a alternativa que representa a operação de ação que grava o RDD no arquivo:

Você acertou!
E.
saveAsTextFile.

4.
Com o MapReduce, é possível processar um conjunto de dados muito grande em
paralelo e de forma distribuída.
Assinale a alternativa que representa a afirmação verdadeira sobre as características
e o funcionamento do MapReduce

Você acertou!
C.
Com o MapReduce, é possível distribuir os dados em clusters que podem chegar a milhares
de nós.

5.
O MapReduce superou desafios relacionados ao processamento paralelo e
distribuído como divisão da tarefa entre os nós, confiabilidades e tolerância a falhas.
Assinale a alternativa verdadeira em relação ao funcionamento do MapReduce:
Resposta correta.
A.
As tarefas de mapeamento produzem pares chave-valor intermediários, que são as entradas
para as tarefas de redução.