Baixe o app para aproveitar ainda mais
Prévia do material em texto
1. O Hadoop é um ecossistema de tecnologias versáteis que podem ser amplamente utilizadas para armazenamento, processamento e análise de grandes volumes de dados. Sobre os módulos básicos que formam o Hadoop, é correto afirmar que: Resposta correta. C. MapReduce é o sistema que permite a programação paralela de grandes volumes de dados. O HDFS é um sistema tolerante a falhas, ou seja, continua funcionando corretamente mesmo que um dos seus componentes tenha parado de funcionar. Sobre os mecanismos que possibilitam essa tolerância, é correto afirmar que: Resposta correta. B. o NameNode monitora o bom funcionamento de um DataNode a partir dos pulsos que este envia. 3. Uma das principais características do armazenamento em nuvem é o fato de tanto a cobrança quanto o espaço disponível estarem atrelados à demanda da empresa. Sobre esse serviço "sob demanda", é verdade que: Você acertou! B. reduz os custos da empresa a longo prazo porque só se paga pelo que realmente é utilizado. 4. A Amazon Web Service é a plataforma de computação em nuvem mais utilizada, contando com diferentes frameworks para análise e armazenamento de dados. Quanto à solução de armazenamento S3, sabe-se que Você acertou! E. tem a maior infraestrutura global, com mais de 60 zonas de disponibilidade. 5. Amazon S3, Microsoft Azure, Google Cloud Storage e IBM Cloud Object Storage são as soluções de armazenamento mais conhecidas. Quando comparadas, é possível identificar algumas semelhanças e diferenças. É correto afirmar que: Você acertou! E. IBM Cloud é a que tem o menor custo de armazenamento TB/mês. 1. Sabe-se que, independente de qual seja, as formas de armazenamento de dados devem ser capazes de gravar, armazenar e permitir a leitura de informações. Entretanto, quando se trata de um grande volume de dados, apenas isso não é o suficiente. É necessário que sejam cobertos pelo menos outros três pontos cruciais para a manipulação de big data. Quais são eles? Você acertou! D. Volume, variedade e velocidade. 2. Existem diferentes tipos de armazenamento, como visto no nosso capítulo. Se o seu projeto envolve a transferência de dados entre usuários e dispositivos e o número de usuários é grande, qual tipo é mais indicado? Resposta correta. C. Storage area network. 3. Cada framework de armazenamento guarda os dados em um determinado formato, de acordo com a arquitetura para a qual foi projetado. Esses dados podem ser armazenados em forma de arquivo, bloco ou objeto. Qual é a característica de um "objeto"? Você acertou! A. Possuir metadado e dado. 4. O armazenamento em nuvem vem ganhando cada vez mais espaço. Os serviços prestados pela Amazon (S3), Microsoft (Azure) e Google (Cloud Storage) são alguns dos principais do mercado. Entre eles existem muitas coisas em comum, mas um se distingue principalmente por: Você acertou! C. abordagem de armazenamento. 5. O armazenamento dos dados em nuvem apresenta algumas vantagens. Qual dos itens a seguir representa uma vantagem do armazenamento em nuvem em relação ao on-premise? Você acertou! D. O armazenamento em nuvem é mais barato porque o usuário geralmente só paga pelo que consome. 1. O particionamento horizontal de um banco de dados (ou sharding) é realizado utilizando estruturas que permitem a identificação de cada partição. Quanto a estas, as três mais comuns são: Você acertou! C. hash, intervalo e diretório. 2. O particionamento de dados está intimamente ligado à replicação. Quantos a esses dois processos, é verdade que: Você acertou! D. a integração do sharding com a replicação promove a alta disponibilidade. 3. O Apache Cassandra utiliza uma estrutura de hash consistente para particionar os dados. Quanto a essa estrutura, escolha a alternativa correta: Você acertou! E. É organizado em uma estrutura visualizada como um anel 4. Para realizar o sharding, o MongoDB necessita de uma estrutura mínima com três componentes: shards, roteadores de consulta e servidores de configuração. Quanto a esses componentes, é verdade que Você acertou! A. os roteadores de consulta são a interface entre o aplicativo cliente e os shards propriamente ditos. 5. Os roteadores de consulta do MongoDB são chamados de mongos. Quanto aos mongos, é correto afirmar Você acertou! C. A cada consulta é necessário que os mongos acessem os metadados, mesmo que essa busca seja repetida 1. Quando se deseja criar aplicações utilizando o Hadoop MapReduce, é necessário usar interfaces específicas. Assinale a alternativa que representa apenas interfaces de aplicações Hadoop MapReduce Você acertou! D. Mapper, Reducer, Partitioner e Counter 2. Uma aplicação que utilize o Apache Spark para solucionar um desafio de Big Data tem operações de transformação e de ação. Assinale a alternativa que representa apenas funções de transformação: Você acertou! B. map, groupByKey e filter. 3. A grosso modo, no Spark RDD, as operações que produzem novos RDDs são chamadas de transformações e as de ação representam funções para manipular um conjunto de dados no RDD atual. Assinale a alternativa que representa a operação de ação que grava o RDD no arquivo: Você acertou! E. saveAsTextFile. 4. Com o MapReduce, é possível processar um conjunto de dados muito grande em paralelo e de forma distribuída. Assinale a alternativa que representa a afirmação verdadeira sobre as características e o funcionamento do MapReduce Você acertou! C. Com o MapReduce, é possível distribuir os dados em clusters que podem chegar a milhares de nós. 5. O MapReduce superou desafios relacionados ao processamento paralelo e distribuído como divisão da tarefa entre os nós, confiabilidades e tolerância a falhas. Assinale a alternativa verdadeira em relação ao funcionamento do MapReduce: Resposta correta. A. As tarefas de mapeamento produzem pares chave-valor intermediários, que são as entradas para as tarefas de redução.
Compartilhar