BIG DATA

Big Data

•

ESTÁCIO EAD

Michel Gripp Rosa

05/04/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Disc.: BIG DATA 
Aluno(a): MICHEL GRIPP ROSA 202009287654
Acertos: 10,0 de 10,0 29/03/2021
 
 
Acerto: 1,0 / 1,0
Big Data se refere ao imenso volume de conjuntos de dados que alcançam elevadas ordens de magnitude. O
valor real do Big Data está no insight que ele produz quando analisado ¿ buscando padrões, derivando
significado, tomando decisões e, por fim, respondendo ao mundo com inteligência. Referente ao Big Data, é
correto afirmar que o termo variedade refere-se:
Aos data centers físicos que transformam os dados em informações pertinentes ao negócio
A um conjunto de dados que são gerados em tempo real, o que requer a oferta imediata de
informações úteis
 A um conjunto de dados mais diversos, incluindo dados estruturados, semiestruturados e não
estruturados. É heterogêneo e vem em muitos formatos, incluindo texto, documento, imagem, vídeo e
outros
Ao banco de dados homogêneo que trata de informações do mesmo tipo definindo padrões de
segurança
Ao controle de dados semiestruturados de formatos definidos como texto e números
Respondido em 05/04/2021 13:09:37
 
Acerto: 1,0 / 1,0
Com relação aos fundamentos e aos conceitos de Big Data, julgue os itens a seguir.
I - O volume de dados é uma característica importante de Big Data. 
II - Em Big Data, a qualidade do dado não tem importância, porque a transformação dos dados não impacta os
negócios. 
III - A característica de velocidade de entrada dos dados impacta o modelo de processamento e
armazenamento. 
IV - A variedade dos dados não é característica intrínseca nos fundamentos de Big Data.
Estão certos apenas os itens 
I, III e IV
 I e III
II, III e IV
II e IV
I e II
Respondido em 05/04/2021 13:09:42
 
Acerto: 1,0 / 1,0
Bancos de Dados não relacionais, também conhecidos como NoSQL, surgiram para armazenar dados não
estruturados, usando modelos de armazenamento específicos para os tipos de dados que são armazenados,
usualmente, fugindo do padrão de armazenamento de linhas e colunas dos bancos de dados tradicionais. Em
relação ao Banco de Dados NoSQL, quais são as categorias consideradas para esse tipo de armazenamento?
 Questão1
a
 Questão2
a
 Questão3
a
https://simulado.estacio.br/alunos/inicio.asp
javascript:voltar();
Banco de dados de grafos; Banco de dados orientados a linha; Formas normais de armazenamento
Armazéns chave-valor; Normalização; Banco de dados orientados a coluna
 Armazéns chave-valor; Banco de dados orientados a documentos; Banco de dados de grafos
Primeira forma normal; Banco de dados orientados a documentos; Normalização
Banco de dados orientados a linha; Normalização; Banco de dados orientados a coluna
Respondido em 05/04/2021 13:10:03
 
Acerto: 1,0 / 1,0
O conceito de computação em nuvem (em inglês, cloud computing) refere-se:
Ao armazenamento de dados feito em serviços que poderão ser acessados de qualquer lugar do
mundo, a qualquer hora, havendo necessidade de instalação de programas ou, por vezes, de
armazenar dados
Ao protocolo de comunicação da comada de aplicação utilizado para sistemas de informação de
hipermídia, distribuídos e colaborativos, representando a base para a comunicação de dados da World
Wide Web
 À utilização da memória e da capacidade de armazenamento e cálculo de computadores e servidores
compartilhados e interligados por meio da Internet, seguindo o princípio da computação em grade
À tecnologia de comunicação de dados que permite uma transmissão de dados mais rápida através de
linhas de telefone do que um modem convencional pode oferecer, sendo os dados transmitidos mais
rapidamente em uma direção do que na outra, assimetricamente
Ao programa que habilita seus usuários a interagirem com documentos HTML hospedados em um
servidor da rede, destacando-se na era da web 2.0, uma vez que quase tudo do que se necessita está
online
Respondido em 05/04/2021 13:10:13
 
Acerto: 1,0 / 1,0
Marque a opção que apresenta SOMENTE ferramentas utilizadas para análise de dados.
R e Apache Spark
HBase e Python
Hadoop MapReduce e Apache mahout
MarkLogic e Weka
 Apache mahout e Spark mllib
Respondido em 05/04/2021 13:10:20
 
Acerto: 1,0 / 1,0
Existe uma série de ferramentas para visualização de dados. Algumas delas foram desenvolvidas para serem
utilizadas no software R. Marque a opção em que SOMENTE há exemplos de recursos do software R.
Shiny e graphX
MarkLogic e graphX
Power BI e plotly
Matplotlib e pentaho
 Ploty e rcmdr
Respondido em 05/04/2021 13:10:23
 
Acerto: 1,0 / 1,0
Com referência a Big Data, assinale a opção correta.
 O MapReduce é considerado um modelo de programação que permite o processamento de dados
massivos em um algoritmo paralelo e distribuído.
Em Big Data, o sistema de arquivos HDFS é usado para armazenar arquivos muito grandes de forma
 Questão4
a
 Questão5
a
 Questão6
a
 Questão7
a
distribuída, tendo como princípio o write-many, read-once.
A definição mais ampla de Big Data restringe o termo a duas partes ¿ o volume absoluto e a
velocidade ¿, o que facilita a extração das informações e dos insights de negócios.
O sistema de arquivos distribuído Hadoop implementa o algoritmo Dijkstra modificado para busca
irrestrita de dados em árvores aglomeradas em clusters com criptografia.
Para armazenar e recuperar grande volume de dados, Big Data utiliza bancos SQL nativos, que são
bancos de dados que podem estar configurados em quatro tipos diferentes de armazenamentos: valor
chave, colunar, gráfico ou documento.
Respondido em 05/04/2021 13:10:34
 
Acerto: 1,0 / 1,0
O ecossistema do Hadoop possui um conjunto de ferramentas de alto nível para facilitar a manipulação dos
dados em sistemas distribuídos. Marque a opção que apresenta a ferramenta projetada para transferir dados
entre o Hadoop e um banco de dados relacional.
Mahout
 Sqoop
Hive
Cassandra
HBase
Respondido em 05/04/2021 13:10:45
 
Acerto: 1,0 / 1,0
Imagine uma situação hipotética onde uma Analista de Tecnologia da Informação foi solicitada para configurar
um Servidor de Arquivos implementando técnicas RAID (Redundant Array of Inexpensive Disks). Para realizar
a configuração do RAID, essa Analista pretende utilizar o Sistema Operacional GNU/Linux Debian pelo fato
desse sistema operacional suportar diversos tipos de RAID via software. Durante o processo de configuração
do RAID, ela optou pelo RAID do tipo 0. Qual foi a motivação dessa escolha?
Implementar redundância
Implementar um subsistema JBOD
Replicar o conteúdo do disco principal
Implementar redundância baseada em paridade
 Otimizar o desempenho
Respondido em 05/04/2021 13:10:52
 
Acerto: 1,0 / 1,0
O Apache Spark é um mecanismo de análise unificado para processamento de dados em grande escala com
várias vantagens. Marque a opção que NÃO representa uma dessas vantagens.
 O Spark tem um gerenciador de recursos do cluster próprio responsável por alocar e monitorar os
recursos disponíveis no cluster para todas as aplicações
O Spark tem um rico conjunto de bibliotecas para implementar processamentos em estilo SQL,
processamento de streaming, algoritmos de grafos e aprendizado de máquina
No Spark as aplicações têm possibilidade de serem escritas em Java, Scala, Python ou R
O Spark é tem a flexibilidade para processar dados em HDFS, HBase, Cassandra, Hive e qualquer
outro formato de entrada aceito pelo Hadoop
A combinação de DAG e RDD ajudam ao Spark realizar o processamento paralelo extremamente
rápido, em particular quando o cluster é grande o suficiente para armazenar todos os dados em
memória
Respondido em 05/04/2021 13:10:55
 
 
 Questão8
a
 Questão9
a
 Questão10
a
javascript:abre_colabore('38403','220378528','4443456697');