BIG DATA -SIMULADO AV

•

ESTÁCIO

1

0

1

0

Vinicius dos Passos Negrini

10/05/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 6 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Big Data

5.974 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Disc.: BIG DATA 
 
Acertos: 10,0 de 10,0 09/05/2022 
 
 
1a 
 Questão 
Acerto: 1,0 / 1,0 
 
ANAC 2016 - ANALISTA ADMINISTRATIVO - ANÁLISE DE SISTEMAS 
/ESAF) Big Data é: 
 
 
Dimensão + variedade + otimização + veracidade, tudo agregando + 
agilidade 
 
Volume + variedade + agilidade + efetividade, tudo agregando + valor 
+ atualidade 
 
Volume + disponibilidade + velocidade + portabilidade, tudo 
requerendo ¿ valor 
 
Volume + variedade + velocidade + veracidade, tudo agregando + 
valor 
 
Volume + oportunidade + segurança + veracidade, tudo agregando + 
valor 
 
 
 
Explicação: 
A proposta de uma solução de Big Data é oferecer uma abordagem 
consistente no tratamento do constante crescimento e da complexidade 
dos dados. Para tanto, o conceito considera os 5 V¿s do Big Data: 
o Volume, a Velocidade, a Variedade, a Veracidade e o Valo 
 
 
2a 
 Questão 
Acerto: 1,0 / 1,0 
 
Com relação aos fundamentos e aos conceitos de Big Data, julgue os itens a 
seguir. 
I - O volume de dados é uma característica importante de Big Data. 
II - Em Big Data, a qualidade do dado não tem importância, porque a 
transformação dos dados não impacta os negócios. 
III - A característica de velocidade de entrada dos dados impacta o modelo de 
processamento e armazenamento. 
IV - A variedade dos dados não é característica intrínseca nos fundamentos de 
Big Data. 
Estão certos apenas os itens 
 
 
I e II 
 
II e IV 
 
II, III e IV 
 
I, III e IV 
 
I e III 
 
 
 
3a 
 Questão 
Acerto: 1,0 / 1,0 
 
Bancos de Dados não relacionais, também conhecidos como NoSQL, surgiram 
para armazenar dados não estruturados, usando modelos de armazenamento 
específicos para os tipos de dados que são armazenados, usualmente, fugindo 
do padrão de armazenamento de linhas e colunas dos bancos de dados 
tradicionais. Em relação ao Banco de Dados NoSQL, quais são as categorias 
consideradas para esse tipo de armazenamento? 
 
 
Armazéns chave-valor; Normalização; Banco de dados orientados a 
coluna 
 
Primeira forma normal; Banco de dados orientados a documentos; 
Normalização 
 
Banco de dados de grafos; Banco de dados orientados a linha; Formas 
normais de armazenamento 
 
Banco de dados orientados a linha; Normalização; Banco de dados 
orientados a coluna 
 
Armazéns chave-valor; Banco de dados orientados a documentos; 
Banco de dados de grafos 
 
 
 
4a 
 Questão 
Acerto: 1,0 / 1,0 
 
O conceito de computação em nuvem (em inglês, cloud computing) refere-se: 
 
 
À utilização da memória e da capacidade de armazenamento e cálculo 
de computadores e servidores compartilhados e interligados por meio da 
Internet, seguindo o princípio da computação em grade 
 
Ao protocolo de comunicação da comada de aplicação utilizado para 
sistemas de informação de hipermídia, distribuídos e colaborativos, 
representando a base para a comunicação de dados da World Wide Web 
 
Ao armazenamento de dados feito em serviços que poderão ser 
acessados de qualquer lugar do mundo, a qualquer hora, havendo 
necessidade de instalação de programas ou, por vezes, de armazenar 
dados 
 
À tecnologia de comunicação de dados que permite uma transmissão de 
dados mais rápida através de linhas de telefone do que um modem 
convencional pode oferecer, sendo os dados transmitidos mais 
rapidamente em uma direção do que na outra, assimetricamente 
 
Ao programa que habilita seus usuários a interagirem com documentos 
HTML hospedados em um servidor da rede, destacando-se na era da 
web 2.0, uma vez que quase tudo do que se necessita está online 
 
 
 
5a 
 Questão 
Acerto: 1,0 / 1,0 
 
Existem algoritmos de análise que têm como objetivo utilizar atributos de um 
objeto para prever um valor numérico contínuo. Esses algoritmos são do tipo: 
 
 
Classificação 
 
Associação 
 
Regressão 
 
Sumarização 
 
Agrupamento 
 
 
Explicação: 
Regressão 
 
 
6a 
 Questão 
Acerto: 1,0 / 1,0 
 
Existe uma série de ferramentas para visualização de dados. Algumas delas 
foram desenvolvidas para serem utilizadas no software R. Marque a opção em 
que SOMENTE há exemplos de recursos do software R. 
 
 
Shiny e graphX 
 
Power BI e plotly 
 
MarkLogic e graphX 
 
Ploty e rcmdr 
 
Matplotlib e pentaho 
 
 
 
7a 
 Questão 
Acerto: 1,0 / 1,0 
 
Assinale a opção correta sobre MapReduce, de acordo com Hurwitz (2015) 
 
 
A técnica MapReduce é utilizada pelos SGBD para a criação de gatilhos 
nas tabelas no banco de dados relacionais. 
 
No MapReduce, a função Map coloca um valor inicial em uma variável 
acumuladora e, então, processa cada elemento de uma lista passada pela 
função Reduce e, ao final, retorna um resultado do acumulador. 
 
Apesar da utilização da técnica MapReduce para tratar grandes volumes 
de dados no contexto de Big Data, não é recomendável a sua utilização 
em uma arquitetura distribuída, virtualizada ou multiprocessada. 
 
No contexto de Big Data, a técnica MapReduce não é utilizada por ser 
pouco eficiente quando o volume de dados é muito alto. 
 
MapReduce é uma estrutura de software que permite que 
desenvolvedores escrevam programas que possam processar 
quantidades massivas de dados desestruturados em paralelo, por meio de 
um grupo distribuído de processadores. 
 
 
 
8a 
 Questão 
Acerto: 1,0 / 1,0 
 
O Sqoop foi projetado para transferir dados entre sistemas de gerenciamento 
de banco de dados relacional e o Hadoop. Ele automatiza a maior parte do 
processo de transformação de dados e realiza as importações e exportação via: 
 
 
JDBC 
 
ResourceManager 
 
Nimbus 
 
Spouts 
 
HQL 
 
 
Explicação: 
JDBC 
 
 
9a 
 Questão 
Acerto: 1,0 / 1,0 
 
(TRT - 11ª Região AM e RR 2016) Um dos servidores computacionais do 
TRT utiliza o esquema de armazenamento RAID 1 no qual os dados são 
armazenados de forma: 
 
 
 
fracionada byte a byte com a paridade armazenada em um disco 
dedicado. 
 
fracionada em setores com a paridade armazenada em um disco 
dedicado. 
 
fracionada com a paridade armazenada de forma distribuída nos discos. 
 
 
espelhada entre os discos para aumentar a confiabilidade. 
 
distribuída nos discos para aumentar o desempenho. 
 
 
Explicação: 
Espelhada entre os discos para aumentar a confiabilidade. 
 
 
10a 
 Questão 
Acerto: 1,0 / 1,0 
 
Marque a opção que melhor descreve as funcionalidades de GraphX. 
 
 
Conjunto de bibliotecas de alto nível que fornecem uma abstração para 
consultar um conjunto de dados em cache como se fossem tabelas de um 
bando de dados relacional; 
 
 
Ferramenta especializada em otimizar o processamento de dados em 
cluster através da divisão de jobs em pequenas tarefas relacionadas. Tais 
relacionamentos são expressos através de grafos direcionados acíclicos 
que são executadas em paralelo; 
 
Conjunto de bibliotecas com funcionalidades para agregar, comparar e 
unir dados heterogêneos. 
 
Framework que simplifica as tarefas de análise de gráficos, fornece a 
capacidade de realizar operações em grafos direcionados e com 
propriedades anexadas a cada vértice e aresta; 
 
 
Framework desenvolvido para coletar, agregar e mover grandes volumes 
de dados de várias fontes distintas para o conjunto de dados distribuídos 
resilientes do Spark; 
 
 
Explicação: 
Framework que simplifica as tarefas de análise de gráficos, fornece a 
capacidade de realizar operações em grafos direcionados e com 
propriedades anexadas a cada vértice e aresta.