Prévia do material em texto
03/04/2021 Vamos treinar UA3: Revisão da tentativa https://ava.etep.edu.br/mod/quiz/review.php?attempt=16367&cmid=26891 1/3 Iniciado em Saturday, 3 Apr 2021, 12�24 Estado Finalizada Concluída em Saturday, 3 Apr 2021, 12�25 Tempo empregado 1 minuto 17 segundos Notas 5,00/5,00 Avaliar 10,00 de um máximo de 10,00�100%� Questão 1 Correto Atingiu 1,00 de 1,00 O paradigma de programação MapReduce demonstrou ser adequado para trabalhar com problemas que podem ser particionados ou fragmentados em subproblemas. Isso porque se pode aplicar separadamente as funções map e reduce a um conjunto de dados. Sobre essas funções, analise as afirmativas a seguir e assinale a correta: a. A entrada da função Map é sempre um dado único, ao qual se aplica um conjunto de funções, mapeando-o para uma lista. b. A função map é executada no nó mestre, gerenciada pelo JobTracker, que envia a lista resultante do mapeamento para os nós escravos. c. A função reduce recebe uma lista como entrada e realiza um processo de ajuste de dados, gerando uma lista modificada na saída. d. A função reduce é executada no nó mestre para reduzir o volume dos dados que serão tratados pelos nós escravos. e. As funções map e reduce são normalmente utilizadas juntas, especificando que a saída da função map será a entrada da função reduce. RESPOSTA CORRETA A função map é executada nos nós escravos. Ela recebe uma lista como entrada e, aplicando uma função dada, gera uma nova lista como saída. A função reduce, similarmente à função map, vai receber como entrada uma lista e, em geral, aplicará uma função para que a entrada seja reduzida a um único valor na saída. Ela também é executada nos nós escravos. As funções map e reduce são normalmente utilizadas juntas, especificando que a saída da função map será a entrada da função reduce. Sua resposta está correta. A resposta correta é: As funções map e reduce são normalmente utilizadas juntas, especificando que a saída da função map será a entrada da função reduce.. Questão 2 Correto Atingiu 1,00 de 1,00 O Apache Hadoop é um framework que simplifica o trabalho com sistemas distribuídos, tornando transparentes diversas funções. Assinale a alternativa que apresenta uma característica do Hadoop: a. O Hadoop oferece estratégias automáticas para garantir o processamento em caso de falhas em computadores alocados para o processamento, garantindo continuidade. RESPOSTA CORRETA Possui licenciamento flexível, que torna possíveis as modificações e a redistribuição do programa-fonte. Possibilita a escalabilidade da aplicação, pois para o Hadoop é relativamente simples aumentar a quantidade de máquinas a serem utilizadas no processamento. O Hadoop oferece estratégias automáticas para garantir o processamento em caso de falhas em computadores alocados para o processamento, garantindo sua continuidade. No Hadoop, as operações são simples e especificadas por meio de funções de mapeamento (map) e de junção (reduce). O Apache Hadoop possui código aberto. b. O Hadoop possui licenciamento proprietário, o que torna modificações e a redistribuição do programa-fonte mais difíceis. c. O Hadoop possui código proprietário, que facilita a realização de adaptações. d. O Hadoop possui regras rígidas que restringem a escalabilidade da aplicação e limita o aumento da quantidade de máquinas a serem utilizadas no processamento. e. No Hadoop, as operações são complexas e ele exige especialistas focados na paralelização e na distribuição dos algoritmos e dados, respectivamente. - Meus cursos - - - Painel EAD�INTERNET DAS COISAS U.A. 03 - Introdução ao Hadoop Vamos treinar UA3 https://ava.etep.edu.br/my/ https://ava.etep.edu.br/course/view.php?id=197 https://ava.etep.edu.br/course/view.php?id=197§ion=4 https://ava.etep.edu.br/mod/quiz/view.php?id=26891 https://ava.etep.edu.br/ 03/04/2021 Vamos treinar UA3: Revisão da tentativa https://ava.etep.edu.br/mod/quiz/review.php?attempt=16367&cmid=26891 2/3 Sua resposta está correta. A resposta correta é: O Hadoop oferece estratégias automáticas para garantir o processamento em caso de falhas em computadores alocados para o processamento, garantindo continuidade.. Questão 3 Correto Atingiu 1,00 de 1,00 Para realizar sua função, o Hadoop possui um conjunto de componentes e cada um possui responsabilidades bem definidas. Analise as afirmativas a seguir e selecione aquela que apresenta corretamente um dos componentes do Hadoop. a. O TaskTracker possui a tarefa de controlar o plano de execução do MapReduce, designando os nós que serão utilizados. b. O JobTracker é o responsável pelo trabalho de execução das tarefas do MapReduce, que são realizadas nos nós. c. O SecondaryNameNode é responsável pela verificação dos checkpoints necessários para garantir a recuperação em caso de falha. RESPOSTA CORRETA NameNode: localiza-se no nó mestre, juntamente com o JobTracker, e é responsável pelo gerenciamento dos arquivos utilizados pelo HDFS (Hadoop Distributed File System). Ele mantém seus dados em memória por questões de performance, pois frequentemente precisa mapear a localização de arquivos, dividi-los em blocos e encaminhá-los aos nós escravos, além de gerenciar os metadados e réplicas dos arquivos. DataNode: localiza-se nos nós. São dados distribuídos e replicados. Cada DataNode reporta-se ao NameNode, indicando quais blocos guarda e as atualizações realizadas neles. JobTracker: controla o plano de execução das tarefas do MapReduce. Ele designa quais nós serão utilizados no processamento e os monitora. TaskTracker: executa uma tarefa map ou uma tarefa reduce que for a ele designada. Cada TaskTrackers executa em uma máquina virtual e podem existir várias máquinas virtuais em um único computador físico, utilizando melhor os seus recursos. SecondaryNameNode: auxilia o NameNode e é a alternativa para recuperação em caso de falha. Ele verifica os pontos de checagem (checkpointing) para garantir a sua recuperação. d. O DataNode localiza-se no nó mestre, identificando os dados que são distribuídos e replicados. e. O NameNode localiza-se nos nós e é responsável pelo gerenciamento de arquivos utilizados pelo HDFS. Sua resposta está correta. A resposta correta é: O SecondaryNameNode é responsável pela verificação dos checkpoints necessários para garantir a recuperação em caso de falha.. Questão 4 Correto Atingiu 1,00 de 1,00 O Hadoop possui alguns modos de execução e cada um deles possui configurações e formas de execução específicas. Analise as alternativas a seguir e selecione aquela que descreve corretamente um dos modos de execução do Hadoop: a. No pseudo-distributed mode, o Hadoop simula o processamento paralelo em uma única máquina. RESPOSTA CORRETA Standalone mode é o modo padrão, no qual utiliza-se uma única máquina. Já o modo pseudo- distributed mode é utilizado para simular a distribuição, usando um único computador. Por outro lado, o fully distributed mode é a distribuição real, que trabalha com conjunto de computadores especificados nos arquivos de configuração. Blank mode e single distributed mode não existem. b. No standalone mode, o Hadoop realiza o seu trabalho padrão, processamento paralelo e distribuído com o conjunto de máquinas definidas nos arquivos de configuração. c. No fully distributed mode, o Hadoop determina automaticamente as máquinas que serão utilizadas no processamento. d. No blank mode, o Hadoop utiliza estruturas padronizadas para realizar o processamento paralelo e distribuído da aplicação. e. No single distributed mode, o Hadoop utiliza um nó mestre e uma máquina escrava para realizar o processamento paralelo e distribuído. Sua resposta está correta. A resposta correta é: No pseudo-distributed mode, o Hadoop simula o processamento paralelo em uma única máquina.. Questão 5 Correto Atingiu 1,00 de 1,00 O Hadoop Distributed File System �HDFS� é o sistema de arquivos distribuídos do Hadoop. Ele deve garantir: https://ava.etep.edu.br/ 03/04/2021 Vamostreinar UA3: Revisão da tentativa https://ava.etep.edu.br/mod/quiz/review.php?attempt=16367&cmid=26891 3/3 a. Tolerância a falhas para que, em caso de falha de algum nó, os dados não sejam perdidos e o processamento não pare. RESPOSTA CORRETA Um sistema de arquivos distribuído deve garantir: Segurança - garantir o acesso às informações, cuidando do controle de privacidade e gerenciando as permissões de acesso. Tolerância a falhas - garantir a disponibilidade do sistema em casos de falhas. Integridade - controlar as modificações realizadas conforme permissões. Consistência - garantir que o dado visto seja o mesmo para todos. Desempenho - o desempenho do sistema de arquivos distribuído deve ser alto. b. Liberdade para todos usuários realizarem qualquer operação. c. Isolamento dos dados, garantindo que cada usuário somente veja os seus dados. d. Que os dados não sejam alterados, mantendo-se sempre inalterados. e. Desempenho inversamente proporcional ao volume de dados. Sua resposta está correta. A resposta correta é: Tolerância a falhas para que, em caso de falha de algum nó, os dados não sejam perdidos e o processamento não pare.. Terminar revisão Para assistir a aula on-line, cli… Seguir para... Na Prática UA3 https://ava.etep.edu.br/mod/quiz/view.php?id=26891 https://ava.etep.edu.br/mod/url/view.php?id=26889&forceview=1 https://ava.etep.edu.br/mod/assign/view.php?id=28769&forceview=1 https://ava.etep.edu.br/