QUIZ-BD-1-Arquitetura Big Data e Integração de Dados

•
Gran

ANDRELZ
13/05/2024
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Ciência de Dados

3.730 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
1Q3033265 
 Certa 
Os 5Vs do Big Data referem-se às características que o conceito essencialmente aborda. Qual dos seguintes aspectos 
representa um dos 5Vs do Big Data? 
• A 
Vazão 
• B 
Volume 
• C 
Variabilidade 
• D 
Validade 
• E 
Vantagem 
 
 
2Q3033269 
 Certa 
Em relação ao tempo de resposta, o que caracteriza o conceito de latência baixa? 
• A 
A quantidade de atraso de tempo que permite a execução de um serviço em um ambiente. 
• B 
O suporte tanto de fluxos de dados estruturados quanto de desestruturados. 
• C 
A capacidade de transformar dados. 
• D 
A capacidade de interpretar os metadados. 
• E 
A capacidade de sustentar certo nível de desempenho, mesmo sob cargas crescentes. 
 
3Q3033266 
 Certa 
Antes mesmo de serem definidos os 5Vs do Big Data, o conceito foi caracterizado por 3Vs, que eram: 
• A 
Volume, Velocidade e Variedade 
• B 
Vazão, Verdade e Velocidade 
• C 
Verdade, Variabilidade e Volume 
• D 
Veracidade, Valor e Velocidade 
• E 
Variedade, Veracidade e Valor 
 
4Q3033268 
 Certa 
A característica que faz com que o Big Data tenha grande potencial de crescimento, lidando com o aumento exponencial 
no volume de dados é chamada de: 
• A 
Complexidade 
• B 
Privacidade 
• C 
Acessibilidade 
• D 
Diversidade 
• E 
Escalabilidade 
 
5Q3033267 
 Certa 
Sobre os tipos de Big Data, são exemplos de dados não-estruturados: 
• A 
Bancos de dados SQL 
• B 
Vídeos 
• C 
E-mail 
• D 
Tabelas 
• E 
Arquivos XML 
 
1Q3033277 
 Certa 
O Hive é uma interface de programa de dados para consulta e análise de grandes conjuntos de dados construídos sobre 
o Apache Hadoop. Assinale a alternativa que aborda uma de suas principais características. 
• A 
O Apache Hive é uma ferramenta de monitoramento e análise de desempenho de servidores em ambientes 
distribuídos de processamento de dados. 
• B 
O Apache Hive é uma infraestrutura de armazenamento e consulta de dados, que permite o processamento e 
análise de dados estruturados armazenados em um sistema distribuído. 
• C 
O Apache Hive é um sistema de gerenciamento de bancos de dados NoSQL, otimizado para consultas complexas 
em grandes volumes de dados em tempo real. 
• D 
O Apache Hive é uma linguagem de programação de alto nível, voltada para a análise e visualização de dados 
em tempo real. 
• E 
O Apache Hive é uma biblioteca de algoritmos de aprendizado de máquina, utilizada para treinar modelos em 
grandes conjuntos de dados distribuídos. 
 
2Q3033279 
 Certa 
Os bancos de dados NoSQL surgiram como uma resposta inovadora para lidar com os crescentes desafios de 
armazenamento e processamento de dados que passaram a existir após a explosão da internet, aplicativos e redes 
sociais, que demandam cada vez mais tempo de resposta. Assinale a alternativa que apresenta um modelo de dados que 
faz parte do conceito NoSQL. 
• A 
Hierárquico 
• B 
Chave-Valor 
• C 
Objeto Relacional 
• D 
Orientado a Objeto 
• E 
Relacional 
 
3Q3033276 
 Certa 
O HDFS é otimizado para aplicativos de leitura e gravação de acesso pesado e para tolerância a falhas em ambientes de 
computação distribuída. Assim, como funciona a sua arquitetura de dados? 
• A 
Ela converte os dados não-relacionais em relacionais. 
• B 
Ela cria índice de dados e os armazena em bancos de dados relacionais. 
• C 
Ela cria metadados para melhor gerenciar os dados. 
• D 
Ela divide os dados em blocos e os distribui em diferentes nós de um cluster. 
• E 
Ela transforma os dados em pares chave-valor, depois os reagrupam com base na chave para gerar resultados 
finais. 
 
4Q3033278 
 Certa 
Em relação ao Apache Hive, assinale a alternativa que representa um benefício de sua aplicação em um ambiente Big 
Data. 
• A 
Familiaridade com SQL 
• B 
Aplicações OLTP com baixa latência 
• C 
Processos em SQL altamente complexos 
• D 
Dados altamente normalizados 
• E 
Consultas realizadas através de alto conhecimento de programação 
 
5Q3033275 
 Certa 
Em Big Data, costumamos nos referir a ecossistema como: 
• A 
o conjunto de regras que devem ser cumpridas para que a organização seja certificada como uma empresa TI 
Verde. 
• B 
o conjunto de bancos de dados NoSQL disponível na organização. 
• C 
os sistemas de informação resultantes de uma arquitetura de tecnologia da informação. 
• D 
o conjunto de tecnologias, ferramentas e processos que permitem às organizações manter uma arquitetura de 
Big Data. 
• E 
o conjunto de hardware necessário para fazer uma arquitetura funcionar. 
 
1Q3033274 
 Certa 
No processo de gerenciamento de dados uma atividade importante é chamada de expurgo. Na prática, expurgar dados 
significa: 
• A 
Apagar dados obsoletos. 
• B 
Transformar dados não relacionais em relacionais para dar carga nos repositórios importantes do Big Data. 
• C 
Modificar a tecnologia de armazenamento. 
• D 
Realizar importação de dados obsoletos para a base principal de dados. 
• E 
Arquivar temporariamente os dados. 
 
2Q3033271 
 Certa 
Foi dito que determinada base de dados era composta apenas por dados semiestruturados. Quais são os tipos de 
arquivos que provavelmente vamos encontrar nela? 
• A 
XML, HTML e JSON 
• B 
CSV, BSON e Áudios 
• C 
Tabelas, planilhas e textos 
• D 
Arquivos de bancos de dados NoSQL 
• E 
Textos, imagens e vídeos 
 
3Q3033272 
 Certa 
Sobre o processo de transformação de dados, está correto afirmar que: 
• A 
Pipeline e ETL são processos diferentes. 
• B 
O Databricks é uma ferramenta de armazenamento de dados. 
• C 
ETL e ELT funcionam do mesmo jeito. 
• D 
O Pipeline de dados tem a ver exclusivamente com o descarte dos dados. 
• E 
O ETL não está presente em um ecossistema de BI. 
 
4Q3033270 
 Certa 
Suponhamos que um analista recebeu a tarefa de carregar uma base de dados com imagens, vídeos e áudios em um Big 
Data. Nesse caso, estamos falando de dados do tipo: 
• A 
Não Relacionais 
• B 
Estruturados 
• C 
Não Estruturados 
• D 
Relacionais 
• E 
Semiestruturados 
 
5Q3033273 
 Certa 
Qual é a principal diferença entre ETL e ELT? 
• A 
O ELT é preferencialmente usado para a construção de Data Warehouse, e não para Big Data. 
• B 
O ETL trabalha com dados não relacionais, o ETL com dados relacionais. 
• C 
O ETL é o nome em inglês, o ELT é o nome em português. 
• D 
O ETL é usado exclusivamente em ecossistemas de Big Data. 
• E 
No ETL, transformamos os dados antes de carregar, no ELT, carregamos antes de transformar. 
1Q3033281 
 Certa 
Qual é a principal vantagem de um Data Lake em comparação com um Data Warehouse? 
• A 
Flexibilidade para armazenar dados brutos de vários tipos e sem transformação. 
• B 
Suporte apenas a dados numéricos. 
• C 
Armazenamento exclusivo de dados estruturados. 
• D 
Melhor desempenho de consultas. 
• E 
Requer menos espaço de armazenamento. 
 
2Q3033282 
 Certa 
Qual é a tecnologia frequentemente usada para processar e analisar dados em um Data Lake? 
• A 
Hadoop e Spark. 
• B 
Linguagem de consulta SQL padrão. 
• C 
Sistemas de gerenciamento de bancos de dados relacionais. 
• D 
Bancos de dados não-relacionais. 
• E 
Big Data. 
 
3Q3033283 
 Certa 
Quais são as principais camadas do Data Lake? 
• A 
Camada de acesso e camada de segurança. 
• B 
Camada de ingestão e camada de armazenamento. 
• C 
Camada de imagens e vídeos. 
• D 
Camada física e camada virtual. 
• E 
Camada de transformação e camada de análise. 
 
4Q3033280 
 Certa 
Uma das estruturas fundamentais de um Big Data é o Data Lake. Assinale a alternativa que o define. 
• A 
Uma técnica de processamento de dados. 
• B 
Um software específico para análise de dados. 
• C 
Um software para armazenamento de dados transacionais. 
• D 
Uma API que fornece dados não-relacionais.• E 
Um repositório de dados estruturados e não estruturados em grande escala. 
 
5Q3033284 
 Certa 
Em termos de estratégias na construção de um Data Lake, existem as estratégias conhecidas por Schema-on-Read e 
Schema-on-Write. Comparando uma abordagem à outra, em que contexto o Schema-on-Read é mais vantajoso? 
• A 
Quando precisamos detectar logo os erros. 
• B 
Quando precisamos de rapidez na carga dos dados. 
• C 
Quando necessitamos de performance em todo o processo. 
• D 
Quando precisamos reduzir custos iniciais. 
• E 
Quando temos um ambiente complexo.
QUIZ-BD-1-Arquitetura Big Data e Integração de Dados

Gran

Ciência de Dados

Continue navegando

Outros materiais