Buscar

PROVA_FINAL-BD-1-Arquitetura Big Data e Integração de Dados-Apostila_Slide-FULL

Prévia do material em texto

1Q3028413 
 Certa 
O Big Data passou a ser amplamente utilizado para todos os negócios que envolvem dados há 
alguns anos. Em um contexto técnico, podemos dizer que o Big Data é: 
• A 
Um software com alto poder de processamento de dados. 
• B 
Um hardware capaz de armazenar um grande volume de dados. 
• C 
Um conjunto de software e hardware preparado para armazenar um grande volume de 
dados. 
• D 
Um conceito que envolve o processamento de grandes volumes de dados na velocidade e 
tempo certos. 
• E 
Um conjunto de ferramentas que faz parte de um ecossistema open source. 
 
 
2Q3028414 
 Certa 
Atualmente, usamos os chamados 5Vs para definir as propriedades do Big Data, mas inicialmente 
essas características eram tratadas como 3Vs. Quais eram essas características iniciais? 
• A 
Volume, Velocidade e Valor 
• B 
Variedade, Veracidade e Valor 
• C 
Valor, Volume e Veracidade 
• D 
Volume, Velocidade e Variedade 
• E 
Veracidade, Variedade e Velocidade 
 
3Q3028415 
 Certa 
Um dos Vs do Big Data é a Variedade. O que visa essa característica? 
• A 
À diversidade de tipos e fontes de dados. 
• B 
Aos vários componentes que fazem parte do ciclo de vida. 
• C 
À variada quantidade de softwares que podem ser aplicados. 
• D 
À variedade de relatórios que podem ser gerados. 
• E 
À variedade de algoritmos de machine learning que podem ser usados. 
 
4Q3028421 
 Certa 
Quando estamos falando sobre a elaboração de uma estrutura de Big Data, é comum nos 
referirmos ao termo “Ecossistema de Big Data”. Na prática, isso significa especificamente: 
• A 
Uma arquitetura orientada ao descarte tecnológico sustentável. 
• B 
Um conjunto de software de transformação de dados. 
• C 
Um conjunto de tecnologias, ferramentas e processos para tratar de grandes volumes de 
dados. 
• D 
Uma arquitetura totalmente baseada na nuvem. 
• E 
Uma arquitetura de dados relacionais que pode ser persistida na nuvem ou no próprio 
ambiente da organização. 
 
5Q3028419 
 Certa 
O Hadoop é um framework de código aberto muito utilizado em um ecossistema de Big Data. 
Assinale a alternativa que descreve a sua função nesse ambiente. 
• A 
Uma linguagem de programação orientada a objetos usada para análise de dados em tempo 
real. 
• B 
Uma plataforma para a realização de consultas SQL em grandes volumes de dados. 
• C 
Uma estrutura de software de para processamento distribuído de grandes volumes de dados. 
• D 
Um sistema operacional projetado especificamente para ambiente de Big Data. 
• E 
Um software para gerenciamento de dados não relacionais. 
 
6Q3028420 
 Certa 
O que é o HDFS (Hadoop Distributed File System) e qual é a sua principal característica em 
ambientes de processamento de big data? 
• A 
O HDFS é um sistema operacional de código aberto, projetado para suportar dispositivos 
móveis e tablets, tornando o acesso a dados mais eficiente. 
• B 
O HDFS é uma linguagem de programação de alto nível, que facilita a análise de grandes 
volumes de dados em tempo real. 
• C 
O HDFS é uma plataforma para criação e gerenciamento de bancos de dados relacionais, 
oferecendo alta performance em consultas complexas. 
• D 
HDFS é um sistema de arquivos distribuído, especialmente projetado para armazenar e 
processar grandes volumes de dados em clusters de computadores. 
• E 
O HDFS é uma biblioteca de algoritmos de aprendizado de máquina, voltada para aplicações 
de inteligência artificial e aprendizado profundo. 
 
7Q3028422 
 Certa 
Comumente, costumamos classificar os dados por seu tipo ou formato. Especificamente falando 
em classificação por tipo, podemos dizer que os dados podem ser classificados como estruturados, 
semiestruturados e não-estruturados. No caso dos dados estruturados, assinale a alternativa 
verdadeira. 
• A 
Dados estruturados possuem formatos variados e não podem ser organizados em tabelas. 
• B 
Dados estruturados têm uma estrutura rígida e não podem ser facilmente adaptados a 
diferentes necessidades. 
• C 
Dados estruturados são altamente organizados em formatos tabulares e podem ser 
eficientemente armazenados em bancos de dados relacionais. 
• D 
Dados estruturados são tipicamente desprovidos de metadados, tornando difícil a sua 
interpretação e análise. 
• E 
Dados estruturados não podem ser consultados usando linguagens de consulta como SQL, 
pois não possuem uma organização pré-definida. 
 
8Q3028426 
 Certa 
Dados não estruturados não possuem um formato predefinido e podem incluir uma ampla gama de 
informações. Quais dos seguintes exemplos são representativos de dados não estruturados? 
• A 
Uma planilha contendo informações de vendas mensais, organizada em colunas de data, 
produto e valor. 
• B 
Um banco de dados de estudantes, com informações de nome, idade, endereço e notas em 
disciplinas. 
• C 
Um arquivo de áudio contendo uma gravação de uma entrevista com um cliente sobre suas 
preferências de produto. 
• D 
Um conjunto de registros de transações financeiras em um formato tabular, incluindo datas, 
valores e categorias. 
• E 
Uma tabela de dados climáticos, incluindo datas, temperaturas mínimas e máximas e níveis 
de precipitação. 
 
9Q3028428 
 Certa 
Uma das estruturas mais importantes em um ecossistema de Big Data é o Data Lake. O que é um 
Data Lake quando abordamos o conceito de gerenciamento de dados? 
• A 
Um ambiente em que dados de diferentes fontes são armazenados sem organização. 
• B 
Uma infraestrutura para armazenar apenas dados estruturados. 
• C 
Uma abordagem para armazenar todos os tipos de dados em seu formato original, 
permitindo análises flexíveis. 
• D 
Um sistema dedicado a armazenar somente dados tabulares. 
• E 
Uma técnica para compactar e otimizar dados antes de armazená-los. 
 
10Q3028431 
 Certa 
Podemos dizer que Delta Lake é uma extensão do conceito de Data Lake. Qual alternativa define 
corretamente o Delta Lake? 
• A 
Uma técnica para processar dados não estruturados em um Data Lake. 
• B 
Uma abordagem para dividir dados em várias camadas de armazenamento no Data Lake. 
• C 
Um sistema de gerenciamento de bancos de dados relacionais. 
• D 
Uma extensão do Data Lake que oferece recursos de controle de transações e histórico de 
versões. 
• E 
Um algoritmo de otimização para consulta de dados em Data Lakes.