Avaliação Big Data

•

UNIDERP - ANHANGUERA

0

2

0

2

0

Anderson Crivelaro

30/05/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Informática Tecnologia da Informação

4.952 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Apache Pig é uma linguagem de script usada para interagir com o HDFS.
Hadoop tem um baixo custo, não apenas por ser livre, mas por permitir o uso de hardware simples, computadores de baixo custo, agrupados em cluster.
Apache Pig tem um componente conhecido como _____________ que aceita os scripts Pig Latin como entrada e converte esses scripts em jobs MapReduce.
_______________é um Data Warehouse que funciona com Hadoop e MapReduce.
Quais as quatro categorias principais dos Bancos de Dados NoSQL?
______________ é um banco de dados NoSQL, distribuído, de alta performance, extremamente escalável e tolerante a falha.
Sobre o Apache Spark é incorreto afirmar:
O Hadoop utiliza Framework Mapreduce e o Spark alérgica.
O Hadoop realiza o armazenamento distribuído e distribuída e a faísca utiliza somente a distribuição distribuída.
O Hadoop não é ideal para trabalho iterativo enquanto o Spark é excelente para trabalhos iterativos.
O Hadoop processa dados em memória e o Spark somente em disco.
foi pensando considerando o tempo de leitura de um conjunto de dados inteiro e não apenas o primeiro registro.
Quais são os 2 principais componentes de um cluster Hadoop?
Hadoop File System e TaskTracker
Sistema de arquivos MapReduce e Hadoop
Job Tracker e MapReduce
Job Tracker e Task Tracker
Sobre o Apache Storm é correto afirmar:
O Apache Storm é open-source, robusto e amigável.
O Apache Storm é tolerante a falhas, flexível, confiável e suporte diversas linguagens de programação.
O Apache Storm processa dados em lote.
Somente aeb estão corretas.
Qual esses componentes Hadoop é responsável pela coordenação de serviços em aplicações distribuídas?
Porco apache
Apache Hive
Apache Hbase
Apache Zookeeper
Usa um tipo de análise de dados por força bruta. Todo o conjunto de dados é processado por cada consulta.
Colmeia
Mapreduce
HDFS
Cassandra
Apache Flume é um serviço que funciona em ambiente distribuído para coletar, agregar e mover grandes quantidades de dados de forma eficiente.
AWS Elastic MapReduce é uma plataforma de análise de dados bem construída e construída sobre a arquitetura HDFS.
_______________ é um serviço de coordenação distribuída para gerenciar grandes conjuntos de hosts.
Apache Hbase
Tempestade Apache
Apache Zookeeper
Porco apache
Em qual dos cursos da Data Science Academy você pode aprender sobre Big Data Analytics?
Big Data Analytics com R e Microsoft Azure Machine Learning
Big Data Real-Time Analytics com Python e Spark
Aprendizado de máquina com Scala e Spark
Todas as opções acima estão correta
Apache ____________ é uma biblioteca de algoritmos de código aberto de aprendizagem de máquina, escalável e com foco em clustering, classificação e sistemas de recomendação.
Porco
Mahout
MapReduce
Flume
__________ foi pensado para executar em clusters de computadores de baixo custo.
HDFS
Oráculo
Apache ________ é um engine rápido e de uso geral para processamento de dados em larga escala.
Fagulha
Sqoop
Hadoop não permite executar aplicações em sistemas distribuídas através de computadores diversos (nodes), envolvendo petabytes de dados.
Qual das seguintes Formações da Data Science Academy você pode aprender como implementar uma infraestrutura de Big Data?
Formação Cientista de Dados
Formação Inteligência Artificial
Formação Engenheiro de Dados
Formação Java Para Data Science
_______________ é um sistema de agendamento de workflow usado para gerenciar principalmente os Jobs de MapReduce.
Apache Hbase
Apache Oozie
Apache HDFS
Tempestade Apache
Quais os 3 modos de configuração permitidos pelo Hadoop?
Modo Standalone, Pseudo Distribuído e Totalmente Distribuído
Modo em Batch, Pseudo Distribuído e Totalmente Distribuído
Modo Standalone, Bath Distribuído e Totalmente Distribuído
Modo em Bath, Distribuído e Totalmente Distribuíd
Qual dos seguintes se refere ao tamanho dos dados em Big Data?
Variedade
Valentia
Volume
Velocidade
Onde podemos usar o MongoDB?
Big Data, Gestão de Conteúdo.
Infraestrutura Social e Mobile.
Gestão de Dados de Usuários.
Hub de dados.
Todas as respostas acima
Esta categoria de Bancos de Dados NoSQL, geralmente é aderente a cenários de rede social online, onde os nós representam as entidades e os laços representam as interconexões entre eles.
Bancos de dados de coluna
Bancos de dados gráficos
Bancos de dados de documentos
Bancos de dados de Big Data
Hadoop é um sistema de armazenamento combinado, distribuído e altamente confiável para processamento de grandes volumes de dados através de clusters de computadores.
MapReduce transforma o problema de análise em um processo computacional que usa conjuntos de chaves e valores.
Qual das seguintes opções pode ser usada como banco de dados OLTP para o Hadoop?
Colmeia
HBase
Mahout
Cassandra
O Apache _________ é um sistema de gerenciamento de fluxos de dados em tempo real, gerado a partir de sites, aplicações e sensores.
Kafka
Porco
HDFS
Transmissão
Nesta categoria, os dados são armazenados no formato key-value (chave-valor) e os valores (dados) são identificados pelas chaves.
Bancos de dados de documentos
Armazenamen
Apache Hadoop é um software de código aberto para armazenamento e processamento em larga escala de grandes conjuntos de dados (Big Data), em clusters de hardware de baixo custo.
____________ é um projeto do ecosistema do Apache Hadoop, cuja responsabilidade é importar e exportar dados de bancos de dados relacionais.
Apache Sqoop
Apache ETL
Pentaho
PowerCenter
Qual o mecanismo de segurança usado pelo Hadoop?
ACL
Proxy
DE ANÚNCIOS
Kerberos
A qual categoria de bancos de dados o HBase pertence?
Relacional
Orientado a objeto
Orientado a coluna
Sistema de arqu
Azure HDInsight é uma distribuição Apache Hadoop distribuída em Cloud.
H
Em qual das fases abaixo, o objetivo de um projeto de implementação de Big Data Analytics deve ser definido?
Definição do Caso de Negócios
Planejamento do Projeto
Definição dos Requisitos Técnicos
Criação de um “Avaliação do Valor Total do Negócio
HDFS é otimizado para armazenar grandes arquivos.
Qual das linguagens abaixo não é suportada pelo Apache Spark?
R
Pitão
Scala
Java
Fortran
Um bancos de dados NoSQL orientado a documento, substitui o conceito de ”linha” como em bancos de dados relacionais, por um modelo mais flexível, o ”documento”.
H
M
0:32
O HBase é um tipo de banco de dados ____________ e utiliza o valor-chave do modelo (chave-valor).
NoSQL
SQL
Para escrever programas de análise de dados, Pig oferece uma linguagem de alto nível conhecida como ______________.
Porco alemão
Porco latino
Porco espanhol
Porco inglês
Apache Flume é um serviço que basicamente permite enviar dados diretamente para o HDFS.
Uma das principais características do Hadoop é a confiabilidade e sua capacidade de recuperação de falhas automaticamente.
Qual dos itens abaixo é um componente do framework Spark para processamento de streams de dados em tempo real.
Transmissão
MLlib
GraphX
Testemunho
HBase é um banco de dados orientado a uma coluna construída sobre o sistema de arquivos do Hadoop.