Baixe o app para aproveitar ainda mais
Prévia do material em texto
Revisar envio do teste: ATIVIDADE 2 (A2) GRA0749 FRAMEWORKS PARA BIG DATA BIGD - 202010.ead-4713.01 Unidade 2 Revisar envio do teste: ATIVIDADE 2 (A2) Usuário DIMITRI DE ASSIS COSTA Curso GRA0749 FRAMEWORKS PARA BIG DATA BIGD - 202010.ead-4713.01 Teste ATIVIDADE 2 (A2) Iniciado 24/05/20 17:16 Enviado 24/05/20 18:38 Status Completada Resultado da tenta�va 7 em 10 pontos Tempo decorrido 1 hora, 22 minutos Resultados exibidos Respostas enviadas, Respostas corretas, Comentários Pergunta 1 Resposta Selecionada: Resposta Correta: Feedback da resposta: O Hadoop Streaming faz parte dos componentes da ferramenta Hadoop, do projeto Apache Hadoop. É um u�litário que permite ao MapReduce, e às suas funções map() e reduce(), realizar a codificação em qualquer linguagem de programação, como por exemplo, a C, C++, Python e outros. Sobre o Hadoop Streaming, assinale a alterna�va que representa a sua principal função. Desenvolver executáveis. Desenvolver executáveis. Resposta correta. A alterna�va está correta, pois o Hadoop é uma das ferramentas do framework da Apache, denominada Hadoop Streaming. De maneira simples, o Hadoop Streaming é um u�litário que acompanha o Hadoop e permite que você desenvolva executáveis do MapReduce em linguagens diferentes de Java. Pergunta 2 Resposta Selecionada: Resposta Correta: Feedback da resposta: Uma das ferramentas do framework da Apache é o Hadoop Streaming . Este u�litário ajuda a criar e executar tarefas específicas do MadReduce com um executável e também a reduzir trabalhos. O Hadoop Streaming possui em sua composição um mapeador e um redutor, com suas funções map() e reduce(), respec�vamente. Sobre o mapeador e redutor do Hadoop Streaming, é correto afirmar que: a tarefa do redutor é pegar a entrada linha por linha e alimentar o stdout. o mapeador e o redutor devem ler entradas stdin e emi�r saídas stdout. Sua resposta está incorreta. A alterna�va está incorreta, pois na inicialização de cada tarefa Map ou Reduce, um novo processo será iniciado com o executável correspondente. Após a execução do redutor, ele novamente pega a linha de stdout e a converte no par de chave-valores a ser passado como o resultado final. A tarefa do mapeador pega a entrada linha por linha e alimenta as linhas para o stdin Minha Área 1 em 1 pontos 0 em 1 pontos DIMITRI DE ASSIS COSTA http://portal.anhembi.br/ https://anhembi.blackboard.com/webapps/blackboard/execute/courseMain?course_id=_562275_1 https://anhembi.blackboard.com/webapps/blackboard/content/listContent.jsp?course_id=_562275_1&content_id=_13214659_1&mode=reset https://anhembi.blackboard.com/webapps/portal/execute/tabs/tabAction?tab_tab_group_id=_358_1 https://anhembi.blackboard.com/webapps/login/?action=logout do executável do mapeador. O redutor pega o par de chave-valores e o converte em linhas, alimentando o executável do redutor usando stdin. Pergunta 3 Resposta Selecionada: Resposta Correta: Feedback da resposta: O Hadoop Streaming, do projeto Apache Hadoop, é um u�litário que permite ao usuário criar e executar trabalhos a par�r de um arquivo executável, ou, ainda, por meio de um script, conforme o mapa ou redutor, pois são essas as duas fases/funções existentes na ferramenta. Sobre o redutor em Python, é correto afirmar que: lerá a linha de stdin, dividirá a linha nas palavras individuais e produzirá a palavra como par chave-valor. somará a ocorrência de cada palavra e saída do arquivo saída, reduzindo na forma de par de chave-valor. Sua resposta está incorreta. A alterna�va está incorreta, pois caracterís�cas como: ler a linha de stdin; levar a entrada do arquivo reduce.py através do stdout; dispensar tratamento de dados por manipular grandes dados de forma mais simples; e ignorar a soma de palavras de um arquivo, são inexistentes em relação às funções chamadas de mapeador e redutor da ferramenta. Pergunta 4 Resposta Selecionada: Resposta Correta: Feedback da resposta: A respeito do Hadoop Streaming , da Apache Founda�on, independente da linguagem a ser u�lizada, alguns pré-requisitos precisam ser respeitados como forma de organizar o ambiente antes da execução dos scripts iniciais. Esses pré-requisitos, aplicados de forma correta, facilitam a u�lização da ferramenta. A par�r do apresentado, analise as asserções a seguir e a relação proposta entre elas. A tarefa redutora converte pares de linhas alimentando a entrada do processo reduce. Pois: O redutor coleta as saídas orientadas linha a linha a par�r da saída padrão do processo stdout. A seguir, assinale a alterna�va correta. A asserção I é uma proposição falsa e a II é uma proposição verdadeira. A asserção I é uma proposição falsa e a II é uma proposição verdadeira. Resposta correta. A alterna�va está correta, pois a asserção II é uma proposição verdadeira, uma vez que o redutor coleta as saídas orientadas linha a linha a par�r da saída padrão do processo stdout, convertendo cada linha em um par de chave-valor, que é coletado como a saída do redutor. Pergunta 5 O Hadoop, da Apache Founda�on, é um Framework des�nado ao processamento e armazenamento de grandes dados, que possui um modelo de processamento conhecido como MapReduce. Por ter a caracterís�ca de manipular grandes volumes de dados, é muito u�lizado no Big Data. A par�r do apresentado, analise as asserções a seguir e a relação proposta entre elas. 0 em 1 pontos 1 em 1 pontos 1 em 1 pontos Resposta Selecionada: Resposta Correta: Feedback da resposta: No MapReduce, dados são transmi�dos u�lizando o stdin e stdout. Pois: Caso não haja erros no trabalho, será apresentado um log do console. A seguir, assinale a alterna�va correta. As asserções I e II são proposições verdadeiras, e a II é uma jus�fica�va correta da I. As asserções I e II são proposições verdadeiras, e a II é uma jus�fica�va correta da I. Resposta correta. A alterna�va está correta, pois a asserção I é uma proposição verdadeira, uma vez que para executar o job no Hadoop Cluster, podemos usar a API de Streaming para que os dados possam ser transmi�dos entre o Mapper e o Reducer usando stdin e stdout. A asserção II também é verdadeira e jus�fica/complementa a I, pois depois que o trabalho for concluído, caso não apresente lançamento de exceções ou erros, será visto um log do console com a úl�ma linha mencionando o caminho em que a saída do job está armazenada. Pergunta 6 Resposta Selecionada: Resposta Correta: Feedback da resposta: O Hadoop Streaming possui algumas caracterís�cas ao ser executado, como, por exemplo, funções chamadas mapeador (map()) e o redutor (reduce()), que precisam ser executáveis e devem poder ler as entradas chamadas stdin , linha por linha, e emi�r a saída chamada stdout . A par�r do apresentado, analise as asserções a seguir e a relação proposta entre elas. O Hadoop Streaming armazena os dados gerando um conjunto de pares chave-valor. Pois: Uma chave representa unicamente cada valor associado. A seguir, assinale a alterna�va correta. As asserções I e II são proposições verdadeiras, e a II é uma jus�fica�va correta da asserção I. As asserções I e II são proposições verdadeiras, e a II é uma jus�fica�va correta da asserção I. Resposta correta. A alterna�va está correta, pois a asserção I é uma proposição verdadeira, visto que esse modelo armazena os dados gerando um conjunto de pares chave-valor, onde cada chave funciona como iden�ficador exclusivo. A asserção II também é verdadeira e jus�fica a I, pois uma chave representa unicamente cada valor associado, algo semelhante ao conceito de chave primária em bancos de dados no modelo Relacional. Pergunta 7 O Hadoop pertence ao Apache e possibilita realizar o processamento de grandes volumes de dados se u�lizando de uma caracterís�ca importante, a programação simples. No processamento e análise dos dados, 1 em 1 pontos 1 em 1 pontos Resposta Selecionada: Resposta Correta: Feedback da resposta: temos ferramentas como o MapReduce,que pode ser aplicado em diversas linguagens, como o Python. Considerando o trecho apresentado e conceitos relacionados à linguagem Python, analise as afirma�vas a seguir: Python é uma linguagem de programação orientada a objetos, open-source, e, atualmente, bastante popular. A linguagem foi lançada em 1994, no entanto, ela se tornou popular somente a par�r de 2016. É uma linguagem closed source, ou seja, código fechado, não podendo ser alterada. É muito u�lizada na linguagem de programação web para a análise de ciência de dados. Está correto o que se afirma em: I e IV, apenas. I e IV, apenas. Resposta correta. A afirma�va I está correta, pois Python é uma linguagem de programação orientada a objetos e bastante dinâmica. Por ser open-source, a linguagem começou a se tornar bastante popular como linguagem de programação para web. A afirma�va IV está correta, pois a linguagem começou a se tornar bastante popular tanto como linguagem de programação para web como para análise de dados, esta�s�ca e ciências de dados. Pergunta 8 Resposta Selecionada: Resposta Correta: Feedback da resposta: O Hadoop Streaming é uma API genérica e permite escrever mapeadores e redutores. Em qualquer trabalho do MapReduce, temos entrada e saída como pares de chave/valor. O mesmo conceito é verdadeiro para a API Streaming, onde entrada e saída são sempre representadas como texto. Considerando o exposto, para executar o job no Hadoop Cluster , podemos usar a API de Streaming, que possui as funções: Stdin e Stdout. Stdin e Stdout. Resposta correta. A alterna�va está correta, pois para executar o job no Hadoop Cluster, podemos usar a API de Streaming para que os dados possam ser transmi�dos entre o Mapper e o Reducer usando stdin e stdout. Depois que o trabalho for concluído, caso não apresente lançamento de exceções ou erros, será visto um log do console com a úl�ma linha mencionando o caminho em que a saída do job está armazenada. Pergunta 9 Resposta Selecionada: Resposta Correta: Feedback da resposta: O Hadoop Streaming é u�lizado para o consumo de dados em tempo real, sendo u�lizando em diferentes aplica�vos executados em tempo real. Existem diversos aplica�vos que u�lizam o streaming do Hadoop, como, por exemplo, bole�ns meteorológicos. Alguns destes aplica�vos u�lizam a linguagem Python. Sobre o mapeador em Python, é correto afirmar que: lerá a linha de stdin, dividirá a linha nas palavras individuais e produzirá a palavra como par chave-valor. lerá a linha de stdin, dividirá a linha nas palavras individuais e produzirá a palavra como par chave-valor. Resposta correta. A alterna�va está correta, pois a função Mapper presente no Python lerá a linha de stdin (que realiza a entrada de dados), dividirá a linha nas palavras individuais e produzirá a palavra como par chave-valor com valor 1 e palavra como sendo a chave, por exemplo: <palavra, 1>. 1 em 1 pontos 1 em 1 pontos Sábado, 20 de Junho de 2020 11h23min41s BRT Pergunta 10 Resposta Selecionada: Resposta Correta: Feedback da resposta: O Hadoop possui ferramentas que auxiliam nas mais diversas a�vidades, como serviços de integração, serviços de armazenamento e de processamento e análise de dados. Dentro deste, temos a ferramenta MapReduce, que tem a caracterís�ca de realizar o processamento paralelo. A respeito de programas MapReduce, analise as afirma�vas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s). ( ) O núcleo da classe do job é o método run(). ( ) O centro das ações são suas funções map() e reduce(). ( ) O método run() não permite alteração de parâmetros. ( ) Raramente escreve-se um programa MapReduce do zero. Assinale a alterna�va que apresenta a sequência correta. F, V, F, V. V, V, F, V. Sua resposta está incorreta. A sequência está incorreta. A afirma�va III é falsa, pois a importância do método run() está no fato de que ele permite que o usuário altere alguns dos parâmetros de configuração durante a chamada do job. Isso faz com que a execução seja personalizada de acordo com os parâmetros. ← OK 0 em 1 pontos javascript:launch('/webapps/gradebook/do/student/viewAttempts?course_id=_562275_1&method=list&nolaunch_after_review=true');
Compartilhar