Buscar

Avaliação II - Individual

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

21/03/2024, 10:41 Avaliação II - Individual
about:blank 1/5
Prova Impressa
GABARITO | Avaliação II - Individual (Cod.:886677)
Peso da Avaliação 1,50
Prova 74664236
Qtd. de Questões 10
Acertos/Erros 10/0
Nota 10,00
O Hadoop é um ótimo exemplo de software utilizado para esse fim, sendo usado em clusters 
computacionais para criar um ambiente que permita o processamento distribuído de dados, o Hadoop é 
executado por meio de clusters que permitem com que sejam utilizados hardware de mais baixo custo. 
Considerando os comandos em ambiente Hadoop, associe os itens, utilizando o código a seguir: 
I- setrep.
II- touchz.
III- test. 
IV- stat. 
( ) Imprime as informações a respeito do caminho. O formato é uma string que aceita tamanho do arquivo 
em blocos, pasta, tamanho de bloco, replicação e data de modificação.
( ) Cria um arquivo no caminho que contém o tempo atual, como um carimbo. Não se um arquivo já existe 
no caminho, a menos que o arquivo tenha o tamanho 0.
( ) Retorna 1 se existe caminho; possui comprimento zero; é um diretório ou 0, caso contrário.
( ) Copia o arquivo ou diretório identificado pela origem para o destino, dentro do HDFS.
Assinale a alternativa que apresenta a sequência CORRETA:
A I - II - III - IV.
B IV - II - I - III.
C II - III - I - IV.
D II - I - III - IV.
O Apache Hadoop é um framework de computação paralela e distribuída para processamento de 
grandes conjuntos de dados, dentre os fatores que permeiam sua arquitetura foi desenvolvido seguindo o 
paradigma de programação MapReduce. Sobre os comandos do Hadoop, classifique V para as sentenças 
verdadeiras e F para as falsas:
( ) O comando cat recupera todos os arquivos que correspondem ao caminho src, HDFS, e copia-os para 
um único arquivo mesclado no sistema de arquivos local identificado por localDest.
( ) O comando getmerge exibe o conteúdo do arquivo no stdout.
( ) O comando moveToLocal funciona como o get, mas exclui o HDFS cópia de sucesso.
( ) O comando mkdir cria um diretório chamado caminho HDFS.
Assinale a alternativa que apresenta a sequência CORRETA:
A V - F - V - V.
B V - V - V - F.
C F - F - F - V.
 VOLTAR
A+ Alterar modo de visualização
1
2
21/03/2024, 10:41 Avaliação II - Individual
about:blank 2/5
D F - F - V - V.
O Hadoop é um poderoso framework para Big Data. Sua instalação pode acontecer em diversos 
ambientes em cloud computing, bem como em diversos sistemas operacionais. Dentre eles o linux ubuntu. 
Sobre os passos necessários para instalar o Apache Hadoop, classifique V para as sentenças verdadeiras e F 
para as falsas:
( ) É necessária a instalação do OpenSSH.
( ) É necessário criar um grupo de usuários para o Hadoop.
( ) É necessário configurar o arquivo bashrhc.
( ) É necessário instalar o PostgreSQL. 
Assinale a alternativa que apresenta a sequência CORRETA:
A V - V - V - F.
B F - F - F - V.
C V - F - F - V.
D V - F - V - F.
Dentre suas funcionalidades, o apache Hadoop também é usado amplamente como motor de muitos 
sistemas de processamento de consultas básicas, bem como para processamento de grandes volumes de 
dados. Sobre os comandos do framework Apache Hadoop, classifique V para as sentenças verdadeiras e F 
para as falsas:
( ) O comando setrep define o alvo fator replicação de arquivos identificados pelo caminho para replicar (o 
verdadeiro fator replicação irá se mover para a meta ao longo do tempo)
( ) O comando touchz cria um arquivo no caminho que contém o tempo atual como um carimbo. Não se 
um arquivo já existente no caminho, a menos que o arquivo já está tamanho 0.
( ) O comando test retorna 1 se existe caminho; possui comprimento zero; ou é um diretório ou 0 caso 
contrário.
( ) O comando stat imprime as informações sobre o caminho. Formato é uma string que aceita tamanho do 
arquivo em blocos (%b), ficheiro (%n), tamanho de bloco ( %s), a replicação (%r), e data de modificação 
(%y, %Y).
Assinale a alternativa que apresenta a sequência CORRETA:
A F - V - F - V.
B V - F - V - V.
C V - F - V - F.
D V - V - V - V.
Inicialmente, as máquinas virtuais permitem a criação de um ambiente de execução, possivelmente 
com um conjunto de bibliotecas e sistemas operacionais próprios, onde uma aplicação pode executar sobre 
uma plataforma de hardware comum junto a outras máquinas. Sobre os nomes de distribuidores de máquinas 
virtuais com Apache Hadoop, assinale a alternativa CORRETA:
3
4
5
21/03/2024, 10:41 Avaliação II - Individual
about:blank 3/5
A NoSQL, Oracle e Microsoft.
B Coursera, Hortonworks, MapReduce e Bitnami.
C Google, Amazon AWS, IBM.
D Cloudera, Hortonworks, MapR e Bitnami.
Surgido como uma plataforma voltada ao armazenamento e ao processamento de dados em larga 
escala, o framework Apache Hadoop é uma tecnologia amplamente difundida e consolidada, tanto em termos 
comerciais quanto no ambiente acadêmico. Considerando os comandos em ambiente Hadoop, associe os 
itens, utilizando o código a seguir: 
I- lsr. 
II- du.
III- mv.
IV- dus.
( ) Exibe as entradas em todos os subdiretórios do caminho.
( ) Mostra o uso de disco, em bytes, para todos os arquivos que correspondem ao caminho; os nomes de 
arquivos são relatados com o protocolo completo HDFS prefixo.
( ) Imprime um resumo da utilização do disco de todos os arquivos/diretórios no path.
( ) Move o arquivo ou diretório indicado pelo src para dest, dentro do HDFS.
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: SANTOS, Carlos Eduardo Domingues dos. Processamento de imagens distribuído usando o 
Hadoop e HIPI. 2017. Trabalho de Conclusão de Curso. Universidade Tecnológica Federal do Paraná.
A IV - III - II - I.
B III - I - IV - II.
C I - II - IV - III.
D II - I - III - IV.
As soluções do Cloudera para clusters oferecem escalabilidade, flexibilidade, integração da plataforma 
que torna fácil o gerenciamento de grandes volumes e variedades de dados na maioria dos empreendimentos. 
Esta ferramenta permite a implantação e o gerenciamento do Apache Hadoop e de projetos relacionados para 
manipular e analisar os dados, bem como mantê-los. Sobre as soluções Cloudera, associe os itens, utilizando 
o código a seguir:
I- CDH.
II- Cloudera Impala.
III- Cloudera Manager.
IV- Cloudera Navigator.
( ) Uma ferramenta de gerenciamento de dados de ponta a ponta para uma plataforma CDH. Essa 
ferramenta permite administradores, gerentes de dados, e análise para explorar grandes amontoados de dados 
no Hadoop.
( ) Uma aplicação sofisticada usada para implantação, gerenciamento, monitoramento, e diagnóstico de 
problemas com a implantação do CDH. Este produto fornece um console Admin, em uma aplicação com 
interface web para o usuário, que torna a administração dos dados do empreendimento mais simples e 
6
7
21/03/2024, 10:41 Avaliação II - Individual
about:blank 4/5
diretos.
( ) Uma engine SQL de processamento paralelo massivo de análise interativa e para BI. Possui arquitetura 
altamente otimizada que o torna ideal para queries estilo BI tradicionais com joins, agregations e subqueries.
( ) A distribuição do Apache Hadoop do Cloudera e outros projetos open source relacionados incluem 
Cloudera Impala e Cloudera Search, sem contar da segurança e integração de várias soluções em hardware e 
software.
Assinale a alternativa que apresenta a sequência CORRETA:
A III - I - IV - II.
B IV - III - II - I.
C II - I - III - IV.
D I - II - IV - III.
Entre as muitas implementações do MapReduce disponíveis nos dias de hoje, o Apache Hadoop é o 
mais popular e possui código aberto. Hadoop também é usado amplamente como motor de muitos sistemas 
de processamento de consultas básicas. Sobre os comandos do Hadoop A, classifique V para as sentenças 
verdadeiras e F para as falsas:
( ) O comando copyfromlocal put copia o arquivo ou diretório no sistema de arquivos local identificado 
por localSrc ao destino dentro do HDFS.
( ) O comando put é idêntico ao copy no sistema de arquivos local identificadopor localSrc ao dest a 
HDFS, e, em seguida, o exclui a cópia local de sucesso.
( ) O comando movefromlocal copia o arquivo ou diretório em HDFS identificados pelo src para o 
caminho do sistema de arquivos local identificado pelo localDest.
( ) O comando get exibe o conteúdo do stdout.
Assinale a alternativa que apresenta a sequência CORRETA:
A V - V - F - F.
B V - F - V - V.
C F - F - F - F.
D F - F - V - V.
Dentre algumas empresas com estes objetivos temos a Amazon Web Service, Cloudera, Hortonworks, 
KarmaSphere, Pentaho e Tresada. Dentre muitos especialistas, a Cloudera já teve em sua chefia Douglas 
Cutting, um dos criadores do Apache Hadoop original, considerado o seu principal. Sobre a máquina virtual 
Cloudera, associe os itens a seguir:
I- CDH5.
II- Cloudera Express.
III- Cloudera Enterprise.
( ) Esta é a máquina virtual completa com todos os recursos de distribuição, uma versão paga, mas você 
pode utilizá-la em modo trial. Para executar essa versão, deve ter um equipamento com 12GB de memória 
RAM disponível.
( ) É a versão padrão da distribuição, muito similar ao projeto original, e, para executá-la, são necessários, 
no mínimo, 4GB de memória RAM.
( ) É uma versão com mais componentes, e, para executá-la, são necessários 8GB, no mínimo, de memória 
8
9
21/03/2024, 10:41 Avaliação II - Individual
about:blank 5/5
RAM.
Assinale a alternativa que apresenta a sequência CORRETA:
A I - III - II.
B II - I - III.
C I - II - III.
D III - I - II.
O Apache Spark é implementado em conjunto, com um cluster do Hadoop, e o Spark pode se 
beneficiar de vários recursos, como resultado. Por si só, o Spark é uma ferramenta poderosa para processar 
grandes volumes de dados, mas ainda não é adequado para cargas de trabalho de produção na empresa. 
Acerca da relação entre Spark e Hadoop, classifique V para as sentenças verdadeiras e F para as falsas:
( ) Fazem as mesmas coisas.
( ) Você pode usar um sem o outro.
( ) O Spark é uma linguagem de programador.
( ) O Hadoop é um banco de dados.
Assinale a alternativa que apresenta a sequência CORRETA:
A F - V - V - F.
B F - V - F - V.
C F - V - F - F.
D V - V - F - F.
10
Imprimir

Outros materiais