Baixe o app para aproveitar ainda mais
Prévia do material em texto
Apache Pig é uma linguagem de script usada para interagir com o HDFS. Hadoop tem um baixo custo, não apenas por ser livre, mas por permitir o uso de hardware simples, computadores de baixo custo, agrupados em cluster. Apache Pig tem um componente conhecido como _____________ que aceita os scripts Pig Latin como entrada e converte esses scripts em jobs MapReduce. _______________é um Data Warehouse que funciona com Hadoop e MapReduce. Quais as quatro categorias principais dos Bancos de Dados NoSQL? ______________ é um banco de dados NoSQL, distribuído, de alta performance, extremamente escalável e tolerante a falha. Sobre o Apache Spark é incorreto afirmar: O Hadoop utiliza Framework Mapreduce e o Spark alérgica. O Hadoop realiza o armazenamento distribuído e distribuída e a faísca utiliza somente a distribuição distribuída. O Hadoop não é ideal para trabalho iterativo enquanto o Spark é excelente para trabalhos iterativos. O Hadoop processa dados em memória e o Spark somente em disco. foi pensando considerando o tempo de leitura de um conjunto de dados inteiro e não apenas o primeiro registro. Quais são os 2 principais componentes de um cluster Hadoop? Hadoop File System e TaskTracker Sistema de arquivos MapReduce e Hadoop Job Tracker e MapReduce Job Tracker e Task Tracker Sobre o Apache Storm é correto afirmar: O Apache Storm é open-source, robusto e amigável. O Apache Storm é tolerante a falhas, flexível, confiável e suporte diversas linguagens de programação. O Apache Storm processa dados em lote. Somente aeb estão corretas. Qual esses componentes Hadoop é responsável pela coordenação de serviços em aplicações distribuídas? Porco apache Apache Hive Apache Hbase Apache Zookeeper Usa um tipo de análise de dados por força bruta. Todo o conjunto de dados é processado por cada consulta. Colmeia Mapreduce HDFS Cassandra Apache Flume é um serviço que funciona em ambiente distribuído para coletar, agregar e mover grandes quantidades de dados de forma eficiente. AWS Elastic MapReduce é uma plataforma de análise de dados bem construída e construída sobre a arquitetura HDFS. _______________ é um serviço de coordenação distribuída para gerenciar grandes conjuntos de hosts. Apache Hbase Tempestade Apache Apache Zookeeper Porco apache Em qual dos cursos da Data Science Academy você pode aprender sobre Big Data Analytics? Big Data Analytics com R e Microsoft Azure Machine Learning Big Data Real-Time Analytics com Python e Spark Aprendizado de máquina com Scala e Spark Todas as opções acima estão correta Apache ____________ é uma biblioteca de algoritmos de código aberto de aprendizagem de máquina, escalável e com foco em clustering, classificação e sistemas de recomendação. Porco Mahout MapReduce Flume __________ foi pensado para executar em clusters de computadores de baixo custo. HDFS Oráculo Apache ________ é um engine rápido e de uso geral para processamento de dados em larga escala. Fagulha Sqoop Hadoop não permite executar aplicações em sistemas distribuídas através de computadores diversos (nodes), envolvendo petabytes de dados. Qual das seguintes Formações da Data Science Academy você pode aprender como implementar uma infraestrutura de Big Data? Formação Cientista de Dados Formação Inteligência Artificial Formação Engenheiro de Dados Formação Java Para Data Science _______________ é um sistema de agendamento de workflow usado para gerenciar principalmente os Jobs de MapReduce. Apache Hbase Apache Oozie Apache HDFS Tempestade Apache Quais os 3 modos de configuração permitidos pelo Hadoop? Modo Standalone, Pseudo Distribuído e Totalmente Distribuído Modo em Batch, Pseudo Distribuído e Totalmente Distribuído Modo Standalone, Bath Distribuído e Totalmente Distribuído Modo em Bath, Distribuído e Totalmente Distribuíd Qual dos seguintes se refere ao tamanho dos dados em Big Data? Variedade Valentia Volume Velocidade Onde podemos usar o MongoDB? Big Data, Gestão de Conteúdo. Infraestrutura Social e Mobile. Gestão de Dados de Usuários. Hub de dados. Todas as respostas acima Esta categoria de Bancos de Dados NoSQL, geralmente é aderente a cenários de rede social online, onde os nós representam as entidades e os laços representam as interconexões entre eles. Bancos de dados de coluna Bancos de dados gráficos Bancos de dados de documentos Bancos de dados de Big Data Hadoop é um sistema de armazenamento combinado, distribuído e altamente confiável para processamento de grandes volumes de dados através de clusters de computadores. MapReduce transforma o problema de análise em um processo computacional que usa conjuntos de chaves e valores. Qual das seguintes opções pode ser usada como banco de dados OLTP para o Hadoop? Colmeia HBase Mahout Cassandra O Apache _________ é um sistema de gerenciamento de fluxos de dados em tempo real, gerado a partir de sites, aplicações e sensores. Kafka Porco HDFS Transmissão Nesta categoria, os dados são armazenados no formato key-value (chave-valor) e os valores (dados) são identificados pelas chaves. Bancos de dados de documentos Armazenamen Apache Hadoop é um software de código aberto para armazenamento e processamento em larga escala de grandes conjuntos de dados (Big Data), em clusters de hardware de baixo custo. ____________ é um projeto do ecosistema do Apache Hadoop, cuja responsabilidade é importar e exportar dados de bancos de dados relacionais. Apache Sqoop Apache ETL Pentaho PowerCenter Qual o mecanismo de segurança usado pelo Hadoop? ACL Proxy DE ANÚNCIOS Kerberos A qual categoria de bancos de dados o HBase pertence? Relacional Orientado a objeto Orientado a coluna Sistema de arqu Azure HDInsight é uma distribuição Apache Hadoop distribuída em Cloud. H Em qual das fases abaixo, o objetivo de um projeto de implementação de Big Data Analytics deve ser definido? Definição do Caso de Negócios Planejamento do Projeto Definição dos Requisitos Técnicos Criação de um “Avaliação do Valor Total do Negócio HDFS é otimizado para armazenar grandes arquivos. Qual das linguagens abaixo não é suportada pelo Apache Spark? R Pitão Scala Java Fortran Um bancos de dados NoSQL orientado a documento, substitui o conceito de ”linha” como em bancos de dados relacionais, por um modelo mais flexível, o ”documento”. H M 0:32 O HBase é um tipo de banco de dados ____________ e utiliza o valor-chave do modelo (chave-valor). NoSQL SQL Para escrever programas de análise de dados, Pig oferece uma linguagem de alto nível conhecida como ______________. Porco alemão Porco latino Porco espanhol Porco inglês Apache Flume é um serviço que basicamente permite enviar dados diretamente para o HDFS. Uma das principais características do Hadoop é a confiabilidade e sua capacidade de recuperação de falhas automaticamente. Qual dos itens abaixo é um componente do framework Spark para processamento de streams de dados em tempo real. Transmissão MLlib GraphX Testemunho HBase é um banco de dados orientado a uma coluna construída sobre o sistema de arquivos do Hadoop.
Compartilhar