Baixe o app para aproveitar ainda mais
Prévia do material em texto
23/06/2020 Revisar envio do teste: ATIVIDADE 2 (A2) – GRA0749 ... https://anhembi.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_35820478_1&course_id=_562275_1&content_id=_132146… 1/5 Revisar envio do teste: ATIVIDADE 2 (A2) GRA0749 FRAMEWORKS PARA BIG DATA BIGD - 202010.ead-4713.01 Unidade 2 Revisar envio do teste: ATIVIDADE 2 (A2) Usuário JULIANA DA SILVA DE MIRANDA Curso GRA0749 FRAMEWORKS PARA BIG DATA BIGD - 202010.ead-4713.01 Teste ATIVIDADE 2 (A2) Iniciado 20/06/20 20:55 Enviado 21/06/20 22:09 Status Completada Resultado da tentativa 8 em 10 pontos Tempo decorrido 25 horas, 13 minutos Resultados exibidos Respostas enviadas, Respostas corretas, Comentários Pergunta 1 Resposta Selecionada: Resposta Correta: Feedback da resposta: O Hadoop Streaming possui algumas características ao ser executado, como, por exemplo, funções chamadas mapeador (map()) e o redutor (reduce()), que precisam ser executáveis e devem poder ler as entradas chamadas stdin , linha por linha, e emitir a saída chamada stdout . A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. O Hadoop Streaming armazena os dados gerando um conjunto de pares chave-valor. Pois: Uma chave representa unicamente cada valor associado. A seguir, assinale a alternativa correta. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da asserção I. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da asserção I. Resposta correta. A alternativa está correta, pois a asserção I é uma proposição verdadeira, visto que esse modelo armazena os dados gerando um conjunto de pares chave-valor, onde cada chave funciona como identificador exclusivo. A asserção II também é verdadeira e justifica a I, pois uma chave representa unicamente cada valor associado, algo semelhante ao conceito de chave primária em bancos de dados no modelo Relacional. Pergunta 2 O Hadoop pertence ao Apache e possibilita realizar o processamento de grandes volumes de dados se utilizando de uma característica importante, a programação simples. No processamento e análise dos dados, temos ferramentas como o MapReduce, que pode ser aplicado em diversas linguagens, como o Minha Área 1 em 1 pontos 1 em 1 pontos JULIANA DA SILVA DE MIRANDA http://portal.anhembi.br/ https://anhembi.blackboard.com/webapps/blackboard/execute/courseMain?course_id=_562275_1 https://anhembi.blackboard.com/webapps/blackboard/content/listContent.jsp?course_id=_562275_1&content_id=_13214659_1&mode=reset https://anhembi.blackboard.com/webapps/portal/execute/tabs/tabAction?tab_tab_group_id=_358_1 https://anhembi.blackboard.com/webapps/login/?action=logout 23/06/2020 Revisar envio do teste: ATIVIDADE 2 (A2) – GRA0749 ... https://anhembi.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_35820478_1&course_id=_562275_1&content_id=_132146… 2/5 Resposta Selecionada: Resposta Correta: Feedback da resposta: Python. Considerando o trecho apresentado e conceitos relacionados à linguagem Python, analise as afirmativas a seguir: Python é uma linguagem de programação orientada a objetos, open-source, e, atualmente, bastante popular. A linguagem foi lançada em 1994, no entanto, ela se tornou popular somente a partir de 2016. É uma linguagem closed source, ou seja, código fechado, não podendo ser alterada. É muito utilizada na linguagem de programação web para a análise de ciência de dados. Está correto o que se afirma em: I e IV, apenas. I e IV, apenas. Resposta correta. A afirmativa I está correta, pois Python é uma linguagem de programação orientada a objetos e bastante dinâmica. Por ser open-source, a linguagem começou a se tornar bastante popular como linguagem de programação para web. A afirmativa IV está correta, pois a linguagem começou a se tornar bastante popular tanto como linguagem de programação para web como para análise de dados, estatística e ciências de dados. Pergunta 3 Resposta Selecionada: Resposta Correta: Feedback da resposta: O Hadoop, ao contrário do que as pessoas acham, não é um tipo de banco de dados. Ele é formado por diversos softwares com um sistema de arquivos conhecido como Hadoop Distributed Files System. Como características podemos destacar que é tolerante a falhas e possui escalabilidade. Dentre as ferramentas existentes, podemos destacar a Hadoop Streaming. Considerando o trecho apresentado e as características da ferramenta Hadoop Streaming, analise as afirmativas a seguir: O Hadoop Streaming é um utilitário que dá aos usuários a possibilidade de escrever tarefas MapReduce. Conforme a tarefa do Reduce é executada, ela converte suas entradas em linhas e alimenta a entrada do processo em stdout. No MapReduce o texto nas linhas até a primeira guia é considerado a chave e o restante da linha o valor. Depois de executado, as linhas do stdin são obtidas pelo mapeador e convertidas em um outro tipo de linhas maiores. Está correto o que se afirma em: I e III, apenas. I e III, apenas. Resposta correta. A alternativa está correta, pois a afirmativa I é verdadeira, sendo que o Hadoop Streaming é apenas um utilitário fornecido pela distribuição Hadoop MapReduce que dá aos usuários a possibilidade de escrever tarefas MapReduce em outras linguagens de programação além do Java, como Python, por exemplo. A afirmativa III está correta, pois no MapReduce, por padrão, o texto nas linhas até a primeira guia será considerado a chave e o restante da linha como valor. Caso não exista caractere de tabulação presente na linha, a linha inteira será usada como a chave e o valor será nulo. Pergunta 4 Hadoop Streaming é uma das ferramentas do Hadoop. Por mais que tenha esse nome, o streaming não tem características de fluxos de dados contínuos. Ele é um utilitário que permite o desenvolvimento de 1 em 1 pontos 1 em 1 pontos 23/06/2020 Revisar envio do teste: ATIVIDADE 2 (A2) – GRA0749 ... https://anhembi.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_35820478_1&course_id=_562275_1&content_id=_132146… 3/5 Resposta Selecionada: Resposta Correta: Feedback da resposta: executáveis do MapReduce em linguagens diferentes de Java. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. Quando falamos sobre o uso de outras linguagens de programação, não queremos dizer que o código escrito nessas linguagens precise ser convertido. Pois: Os códigos podem ser executados direto no ecossistema Hadoop usando o Hadoop Streaming. A seguir, assinale a alternativa correta. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Resposta correta. A alternativa está correta, uma vez que a asserção I é uma proposição verdadeira, pois quando falamos sobre o uso de outras linguagens de programação, não necessariamente o código escrito precisa ser convertido para Java. Por exemplo, se o código estiver em Python, não é necessário converter para Java usando ferramentas como Jython ou outro programa. A asserção II também é verdadeira e justifica a I, pois o código pode ser executado direto no ecossistema Hadoop usando o Hadoop Streaming. Por mais que o Hadoop MapReduce tenha sido idealizado para ser configurado e executado em Java, nada impede que outras linguagens possam ser utilizadas. Pergunta 5 Resposta Selecionada: Resposta Correta: Feedback da resposta: O Hadoop Streaming é uma API genérica e permite escrever mapeadores e redutores. Em qualquer trabalho do MapReduce, temos entrada e saída como pares de chave/valor. O mesmo conceito é verdadeiro para a API Streaming, onde entrada e saída são sempre representadas como texto. Considerando o exposto, para executar o job no Hadoop Cluster , podemos usar a API de Streaming, que possui as funções: Stdin e Stdout. Stdin e Stdout. Resposta correta. A alternativa está correta,pois para executar o job no Hadoop Cluster, podemos usar a API de Streaming para que os dados possam ser transmitidos entre o Mapper e o Reducer usando stdin e stdout. Depois que o trabalho for concluído, caso não apresente lançamento de exceções ou erros, será visto um log do console com a última linha mencionando o caminho em que a saída do job está armazenada. Pergunta 6 Resposta Selecionada: Resposta Correta: Feedback da resposta: O Hadoop Streaming possui duas fases, o mapeador e o redutor. Uma tarefa importante realizada é o teste do código para confirmação de funcionamento do mesmo. Esta é uma tarefa que não é muito complicada, mas exige que seja feita conforme a determinação de algumas etapas. Sobre o MapReduce, podemos afirmar corretamente que as etapas são: Código do Mapeador e Código do Redutor. Código do Mapeador e Código do Redutor. Resposta correta. A alternativa está correta, pois uma etapa importante, antes de enviar o código Python como tarefa MapReduce para um cluster Hadoop, é o teste do código para 1 em 1 pontos 1 em 1 pontos 23/06/2020 Revisar envio do teste: ATIVIDADE 2 (A2) – GRA0749 ... https://anhembi.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_35820478_1&course_id=_562275_1&content_id=_132146… 4/5 confirmar se ele funciona como deveria. Podemos realizar os dois testes seguindo as seguintes etapas: Código do mapeador e Código do redutor. Pergunta 7 Resposta Selecionada: Resposta Correta: Feedback da resposta: O Hadoop, da Apache Foundation, é um Framework destinado ao processamento e armazenamento de grandes dados, que possui um modelo de processamento conhecido como MapReduce. Por ter a característica de manipular grandes volumes de dados, é muito utilizado no Big Data. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. No MapReduce, dados são transmitidos utilizando o stdin e stdout. Pois: Caso não haja erros no trabalho, será apresentado um log do console. A seguir, assinale a alternativa correta. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Sua resposta está incorreta. A alternativa está incorreta, pois as duas proposições apresentadas são verdadeiras e a asserção II justifica a I, pois no MapReduce dados são transmitidos utilizando comandos de entrada e saída, sendo o stdin e o stdout, e ao final da realização da atividade, caso não haja problemas, será apresentado um log do console. Pergunta 8 Resposta Selecionada: Resposta Correta: Feedback da resposta: A respeito do Hadoop Streaming , da Apache Foundation, independente da linguagem a ser utilizada, alguns pré-requisitos precisam ser respeitados como forma de organizar o ambiente antes da execução dos scripts iniciais. Esses pré-requisitos, aplicados de forma correta, facilitam a utilização da ferramenta. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. A tarefa redutora converte pares de linhas alimentando a entrada do processo reduce. Pois: O redutor coleta as saídas orientadas linha a linha a partir da saída padrão do processo stdout. A seguir, assinale a alternativa correta. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. A asserção I é uma proposição falsa e a II é uma proposição verdadeira. Sua resposta está incorreta. A alternativa está incorreta, pois a asserção I é uma proposição incorreta, pois à medida que a tarefa redutora é executada, ela converte seus pares de chave-valores de entrada em linhas e alimenta as linhas para a entrada do processo Reduce. 0 em 1 pontos 0 em 1 pontos 23/06/2020 Revisar envio do teste: ATIVIDADE 2 (A2) – GRA0749 ... https://anhembi.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_35820478_1&course_id=_562275_1&content_id=_132146… 5/5 Terça-feira, 23 de Junho de 2020 19h26min56s BRT Pergunta 9 Resposta Selecionada: Resposta Correta: Feedback da resposta: Uma tarefa MapReduce, no Hadoop, divide o conjunto de dados de entrada em partes independentes que são processadas pelas tarefas de mapa de uma maneira completamente paralela. A estrutura classifica as sápidas dos mapas, que são inseridas nas tarefas de redução. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. A entrada e saída do trabalho são armazenados em um sistema de arquivos. Pois: A estrutura MapReduce e o Hadoop Distributed File System estão em execução no mesmo conjunto de nós. A seguir, assinale a alternativa correta. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Resposta correta. A alternativa está correta, pois a asserção I é uma proposição verdadeira, visto que normalmente a entrada e a saída do trabalho são armazenadas em um sistema de arquivos. A estrutura cuida de agendar tarefas, monitorando-as e executando novamente as tarefas com falha. A asserção II também é verdadeira e justifica/complementa a I, pois normalmente os nós de computação e os de armazenamento são os mesmos, ou seja, a estrutura MapReduce e o Hadoop Distributed File System estão em execução no mesmo conjunto de nós. Isso permite que a estrutura agende tarefas nos nós em que os dados já estão presentes. Pergunta 10 Resposta Selecionada: Resposta Correta: Feedback da resposta: O Hadoop Streaming faz parte dos componentes da ferramenta Hadoop, do projeto Apache Hadoop. É um utilitário que permite ao MapReduce, e às suas funções map() e reduce(), realizar a codificação em qualquer linguagem de programação, como por exemplo, a C, C++, Python e outros. Sobre o Hadoop Streaming, assinale a alternativa que representa a sua principal função. Desenvolver executáveis. Desenvolver executáveis. Resposta correta. A alternativa está correta, pois o Hadoop é uma das ferramentas do framework da Apache, denominada Hadoop Streaming. De maneira simples, o Hadoop Streaming é um utilitário que acompanha o Hadoop e permite que você desenvolva executáveis do MapReduce em linguagens diferentes de Java. ← OK 1 em 1 pontos 1 em 1 pontos javascript:launch('/webapps/gradebook/do/student/viewAttempts?course_id=_562275_1&method=list&nolaunch_after_review=true');
Compartilhar