Buscar

FRAMEWORKS PARA BIG DATA - Atividade 2

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

PERGUNTA 1
O Hadoop é um framework que pode ser utilizado em diversas linguagens, como, por exemplo, Java e Python. No framework há ferramentas importantes, podemos citar o MapReduce, que contém um mapeador e uma redutor. Um exemplo muito utilizado para expor o funcionamento do MapReduce é por meio de um contador de palavras.
 
A respeito deste exemplo do contador de palavras, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s).
 
( V ) É utilizado o stdin e stdout para ler e gravar dados.
( V ) O redutor gera palavra como chave e número de contagens como valor.
( F ) A função Mapper divide chave-valores em palavras complexas.
( F ) O redutor recebe linhas de entrada e conta o número de instâncias.
 
Assinale a alternativa que apresenta a sequência correta.
		V, V, F, V.
		V, V, V, V.
		F, V, F, V.
(x)		V, V, F, F.
		F, F, F, F.
1 pontos 
PERGUNTA 2
O Hadoop Streaming possui duas fases, o mapeador e o redutor. Uma tarefa importante realizada é o teste do código para confirmação de funcionamento do mesmo. Esta é uma tarefa que não é muito complicada, mas exige que seja feita conforme a determinação de algumas etapas.
Sobre o MapReduce, podemos afirmar corretamente que as etapas são:
 
(x)		Código do Mapeador e Código do Redutor.
		Job Stdin e Job Stdout.
		Cluster Hadoop e Script Hadoop.
		API Streaming Map e API Streaming Std.
 		Função Stdin e Função Stdout.
1 pontos 
PERGUNTA 3
O Hadoop Streaming é utilizado para o consumo de dados em tempo real, sendo utilizando em diferentes aplicativos executados em tempo real. Existem diversos aplicativos que utilizam o streaming do Hadoop, como, por exemplo, boletins meteorológicos. Alguns destes aplicativos utilizam a linguagem Python.
Sobre o mapeador em Python, é correto afirmar que:
 
		dispensa tratamento de dados porque manipula grandes dados de forma mais simples.
		somará a ocorrência de cada palavra e saída do arquivo saída, reduzindo na forma de par de chave-valor.
		ignora a soma de palavras de um arquivo, pois irá produzir uma nova palavra chave-valor.
(x)		lerá a linha de stdin, dividirá a linha nas palavras individuais e produzirá a palavra como par chave-valor.
		levará a entrada do mapper.py através do stdin. Esta é extensa e requer tratamento de dados.
1 pontos 
PERGUNTA 4
O Hadoop é um projeto da Apache Foundation que possibilita que sejam processados grandes volumes de forma distribuída e tem distribuições que possuem um módulo de segurança maduro. Podemos destacar entre os módulos o de processamento e análise de dados.
Considerando o trecho apresentado e conceitos relacionados ao Hadoop MapReduce, analise as afirmativas a seguir:
 
No MapReduce, as estruturas de dados utilizadas são linhas e colunas.
É um modelo de programação para processamento paralelo.
No MapReduce, a entrada da aplicação é uma lista de linhas paralelas.
É uma solução para problemas com análise de dados em larga escala.
 
Está correto o que se afirma em:
 
		I, II e IV, apenas.
(x)		II e IV, apenas.
		I, II e III, apenas.
		III e IV, apenas.
		II e III, apenas.
1 pontos 
PERGUNTA 5
O Hadoop, da Apache Foundation, é um Framework destinado ao processamento e armazenamento de grandes dados, que possui um modelo de processamento conhecido como MapReduce. Por ter a característica de manipular grandes volumes de dados, é muito utilizado no Big Data. 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
 
No MapReduce, dados são transmitidos utilizando o stdin e stdout.
 Pois:
Caso não haja erros no trabalho, será apresentado um log do console.
 
A seguir, assinale a alternativa correta.
 
(x)		As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
		A asserção I é uma proposição falsa e a II é uma proposição verdadeira.
		As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
		As asserções I e II são proposições falsas.
		A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
1 pontos 
PERGUNTA 6
O Big Data está ligado ao volume de dados a ser processado e analisado. Este possui um projeto, chamado de Hadoop, que possibilita a realização do processamento de grandes volumes. Dentro do Hadoop temos o MapReduce, uma importante ferramenta no processamento paralelo.
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
 
Uma etapa importante é a realização de teste do código.
 Pois:
Temos que garantir que o código funcione bem.
 
A seguir, assinale a alternativa correta.
 
		A asserção I é uma proposição falsa e a II é uma proposição verdadeira.
		A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
		As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
		As asserções I e II são proposições falsas.
(x)		As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
1 pontos 
PERGUNTA 7
O Hadoop Streaming é uma API genérica e permite escrever mapeadores e redutores. Em qualquer trabalho do MapReduce, temos entrada e saída como pares de chave/valor. O mesmo conceito é verdadeiro para a API Streaming, onde entrada e saída são sempre representadas como texto.
Considerando o exposto, para executar o job no Hadoop Cluster , podemos usar a API de Streaming, 
que possui as funções:
 
(x)		Stdin e Stdout.
		Cluster e Script.
		Undo e Redo.
		Streaming e Cluster.
		Job e API.
1 pontos 
PERGUNTA 8
O MapReduce é uma ferramenta do framework Hadoop e possui as funções mapeador (Mapper) e redutor (Reduce). Na linguagem Python, por exemplo, estas funções utilizam stdin e stdout para realizar tarefas relacionadas a entrada e saída de dados. 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
 
O redutor lerá linhas e produzirá uma palavra chave-valor.
 Pois:
O redutor utiliza o stdin e soma a ocorrência de cada palavra.
 
A seguir, assinale a alternativa correta.
 
		A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
		As asserções I e II são proposições falsas.
(x)		A asserção I é uma proposição falsa e a II é uma proposição verdadeira.
		As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
		As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
1 pontos 
PERGUNTA 9
O Hadoop possui características como escalabilidade, consistência, tolerância a falhas e capacidade de recuperação. Essas características quando bem implementadas garantem uma boa arquitetura. A arquitetura do Hadoop é composta por elementos como: MapReduce, Spark, Streaming, Cluster e outros.
A respeito das características do Hadoop Streaming, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s). 
 
( V ) O modelo chave-valor é bastante empregado em bancos de dados não relacionais ou NoSQL.
( V ) Quando um executável é especificado para reducers (redutores), as tarefas iniciam como um processo separado.
( F ) Quando um executável é especificado para mapeadores, cada tarefa deve iniciar o redutor repetidamente.
( V ) Na sequência lógica do Hadoop Streaming, a tarefa do mapeador é pegar a entrada linha por linha.
 
Assinale a alternativa que apresenta a sequência correta.
		V, V, V, V.
		V, V, F, F.
		F, F, F, F.
		F, V, F, V.
(x)		V, V, F, V.
1 pontos 
PERGUNTA 10
Hadoop Streaming 
é uma das ferramentas do Hadoop. Por mais que tenha esse nome, o streaming 
não tem características de fluxos de dados contínuos. Ele é um utilitário que permite o desenvolvimento de executáveis do MapReduce em linguagens diferentes de Java.
A partir do apresentado, analise as asserções
a seguir e a relação proposta entre elas. 
 
Quando falamos sobre o uso de outras linguagens de programação, não queremos dizer que o código escrito nessas linguagens precise ser convertido.
Pois:
Os códigos podem ser executados direto no ecossistema Hadoop usando o Hadoop Streaming.
 
A seguir, assinale a alternativa correta.
 
		As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
		A asserção I é uma proposição falsa e a II é uma proposição verdadeira.
		A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
		As asserções I e II são proposições falsas.
(x)		As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
1 pontos

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Continue navegando

Outros materiais