Prévia do material em texto
A B C D E 1 Marcar para revisão Em relação ao protocolo de transporte para transmissão de aplicações de streaming, selecione a opção correta. TCP HTTP UDP MQTT CoAP 2 Marcar para revisão Em relação aos V's que caracterizam os projetos de Big Data, selecione a opção que trata do processamento dos dados. 00 48 45 SM1 Tópicos De Big Data Em Python 22/08/2025, 22:13 estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ https://estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ 1/9 A B C D E A B C D E Variedade Valor Velocidade Volume Veracidade 3 Marcar para revisão Selecione a opção correta que contém a principal plataforma de tecnologia de nuvem que é usada como referência para as outras plataformas. Microsoft Azure Amazon AWS Oracle Cloud IBM Cloud Google Cloud 00 hora : 48 min : 45 seg Ocultar Questão 2 de 10 Respondidas (2) Em branco (8) Finalizar prova 1 2 3 4 5 6 7 8 9 10 22/08/2025, 22:13 estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ https://estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ 2/9 A B C D E 4 Marcar para revisão Em relação ao formato dos dados, selecione a opção correta que corresponde ao formato dos dados de transações bancárias. Dados estruturados Dados não estruturados Dados semiestruturados Dados de Internet das Coisas Dados de Big Data 5 Marcar para revisão Selecione a opção a respeito da computação em nuvem. 22/08/2025, 22:13 estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ https://estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ 3/9 Highlight Highlight Highlight Highlight Highlight A B C D E é uma outra forma de denominar a internet das coisas é a definição para aplicações de Big Data que utilizam os protocolos de internet trata-se da utilização de aplicações com finalidades específicas é um conjunto de tecnologias que disponibilizam sistemas e recursos na internet é uma forma de abstrair serviços da internet das coisas em redes locais distribuídas 6 Marcar para revisão A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados. 22/08/2025, 22:13 estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ https://estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ 4/9 A B C D E A B C YARN NameNode Bloco de dados Replicação DataNode 7 Marcar para revisão Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. Apenas estruturado Estruturado e semiestruturado Estruturado, não estruturado e semiestruturado 22/08/2025, 22:13 estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ https://estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ 5/9 D E A B Apenas não estruturado Apenas tabelas relacionais 8 Marcar para revisão Durante a execução de aplicações com Hadoop, a fase de redução desempenha papel fundamental no processamento final dos dados. Essa etapa é precedida por um processo que organiza e redistribui os pares chave-valor gerados pelas tarefas de mapeamento, otimizando a carga de trabalho entre os nós. Qual é o nome desse processo e qual é sua principal contribuição? Combinação – reduz a quantidade de tarefas no redutor ao eliminar duplicatas Classificação – organiza os dados em ordem alfabética antes da gravação final 22/08/2025, 22:13 estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ https://estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ 6/9 C D E Embaralhamento – redistribui os dados intermediários para os redutores corretos Particionamento – divide os dados em grupos com base em similaridade semântica Agendamento – determina quais tarefas devem ser executadas com prioridade 9 Marcar para revisão Organizações que lidam com grandes volumes de dados, como redes sociais e plataformas de streaming, frequentemente adotam soluções específicas para garantir desempenho, escalabilidade e tolerância a falhas. Uma dessas soluções é o Hadoop, cuja arquitetura é composta por diversos componentes que trabalham em conjunto. Considerando a função desses componentes, qual deles é responsável por armazenar os dados efetivos dentro do cluster Hadoop? 22/08/2025, 22:13 estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ https://estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ 7/9 A B C D E YARN, por ser o componente responsável pelo agendamento e gerenciamento de tarefas distribuídas NameNode, por conter os metadados que descrevem a localização dos arquivos armazenados MapReduce, por possibilitar a divisão das tarefas em pares chave-valor para processamento paralelo DataNode, por ser o responsável direto pelo armazenamento físico dos dados no cluster Hadoop Common, por fornecer bibliotecas e scripts necessários à execução dos demais componentes 10 Marcar para revisão 22/08/2025, 22:13 estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ https://estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ 8/9 A B C D E A arquitetura do Hadoop é projetada para garantir alto desempenho na manipulação de grandes volumes de dados distribuídos. Um de seus principais diferenciais é a capacidade de dividir tarefas entre diversos nós do cluster. Qual componente da arquitetura Hadoop é responsável por gerenciar os recursos computacionais disponíveis e monitorar o uso de CPU, memória e disco em cada máquina do cluster? NameNode NodeManager DataNode TaskTracker Mapper 22/08/2025, 22:13 estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ https://estacio.saladeavaliacoes.com.br/prova/68a9156a4a86d9d6ca7b9087/ 9/9