PROVA_FINAL-BD-1-Arquitetura Big Data e Integração de Dados-Apostila_Slide-FULL

•

Gran

ANDRELZ

13/05/2024

Prévia do material em texto

1Q3028413
Certa
O Big Data passou a ser amplamente utilizado para todos os negócios que envolvem dados há
alguns anos. Em um contexto técnico, podemos dizer que o Big Data é:
• A
Um software com alto poder de processamento de dados.
• B
Um hardware capaz de armazenar um grande volume de dados.
• C
Um conjunto de software e hardware preparado para armazenar um grande volume de
dados.
• D
Um conceito que envolve o processamento de grandes volumes de dados na velocidade e
tempo certos.
• E
Um conjunto de ferramentas que faz parte de um ecossistema open source.

2Q3028414
Certa
Atualmente, usamos os chamados 5Vs para definir as propriedades do Big Data, mas inicialmente
essas características eram tratadas como 3Vs. Quais eram essas características iniciais?
• A
Volume, Velocidade e Valor
• B
Variedade, Veracidade e Valor
• C
Valor, Volume e Veracidade
• D
Volume, Velocidade e Variedade
• E
Veracidade, Variedade e Velocidade

3Q3028415
Certa
Um dos Vs do Big Data é a Variedade. O que visa essa característica?
• A
À diversidade de tipos e fontes de dados.
• B
Aos vários componentes que fazem parte do ciclo de vida.
• C
À variada quantidade de softwares que podem ser aplicados.
• D
À variedade de relatórios que podem ser gerados.
• E
À variedade de algoritmos de machine learning que podem ser usados.

4Q3028421
Certa
Quando estamos falando sobre a elaboração de uma estrutura de Big Data, é comum nos
referirmos ao termo “Ecossistema de Big Data”. Na prática, isso significa especificamente:
• A
Uma arquitetura orientada ao descarte tecnológico sustentável.
• B
Um conjunto de software de transformação de dados.
• C
Um conjunto de tecnologias, ferramentas e processos para tratar de grandes volumes de
dados.
• D
Uma arquitetura totalmente baseada na nuvem.
• E
Uma arquitetura de dados relacionais que pode ser persistida na nuvem ou no próprio
ambiente da organização.

5Q3028419
Certa
O Hadoop é um framework de código aberto muito utilizado em um ecossistema de Big Data.
Assinale a alternativa que descreve a sua função nesse ambiente.
• A
Uma linguagem de programação orientada a objetos usada para análise de dados em tempo
real.
• B
Uma plataforma para a realização de consultas SQL em grandes volumes de dados.
• C
Uma estrutura de software de para processamento distribuído de grandes volumes de dados.
• D
Um sistema operacional projetado especificamente para ambiente de Big Data.
• E
Um software para gerenciamento de dados não relacionais.

6Q3028420
Certa
O que é o HDFS (Hadoop Distributed File System) e qual é a sua principal característica em
ambientes de processamento de big data?
• A
O HDFS é um sistema operacional de código aberto, projetado para suportar dispositivos
móveis e tablets, tornando o acesso a dados mais eficiente.
• B
O HDFS é uma linguagem de programação de alto nível, que facilita a análise de grandes
volumes de dados em tempo real.
• C
O HDFS é uma plataforma para criação e gerenciamento de bancos de dados relacionais,
oferecendo alta performance em consultas complexas.
• D
HDFS é um sistema de arquivos distribuído, especialmente projetado para armazenar e
processar grandes volumes de dados em clusters de computadores.
• E
O HDFS é uma biblioteca de algoritmos de aprendizado de máquina, voltada para aplicações
de inteligência artificial e aprendizado profundo.

7Q3028422
Certa
Comumente, costumamos classificar os dados por seu tipo ou formato. Especificamente falando
em classificação por tipo, podemos dizer que os dados podem ser classificados como estruturados,
semiestruturados e não-estruturados. No caso dos dados estruturados, assinale a alternativa
verdadeira.
• A
Dados estruturados possuem formatos variados e não podem ser organizados em tabelas.
• B
Dados estruturados têm uma estrutura rígida e não podem ser facilmente adaptados a
diferentes necessidades.
• C
Dados estruturados são altamente organizados em formatos tabulares e podem ser
eficientemente armazenados em bancos de dados relacionais.
• D
Dados estruturados são tipicamente desprovidos de metadados, tornando difícil a sua
interpretação e análise.
• E
Dados estruturados não podem ser consultados usando linguagens de consulta como SQL,
pois não possuem uma organização pré-definida.

8Q3028426
Certa
Dados não estruturados não possuem um formato predefinido e podem incluir uma ampla gama de
informações. Quais dos seguintes exemplos são representativos de dados não estruturados?
• A
Uma planilha contendo informações de vendas mensais, organizada em colunas de data,
produto e valor.
• B
Um banco de dados de estudantes, com informações de nome, idade, endereço e notas em
disciplinas.
• C
Um arquivo de áudio contendo uma gravação de uma entrevista com um cliente sobre suas
preferências de produto.
• D
Um conjunto de registros de transações financeiras em um formato tabular, incluindo datas,
valores e categorias.
• E
Uma tabela de dados climáticos, incluindo datas, temperaturas mínimas e máximas e níveis
de precipitação.

9Q3028428
Certa
Uma das estruturas mais importantes em um ecossistema de Big Data é o Data Lake. O que é um
Data Lake quando abordamos o conceito de gerenciamento de dados?
• A
Um ambiente em que dados de diferentes fontes são armazenados sem organização.
• B
Uma infraestrutura para armazenar apenas dados estruturados.
• C
Uma abordagem para armazenar todos os tipos de dados em seu formato original,
permitindo análises flexíveis.
• D
Um sistema dedicado a armazenar somente dados tabulares.
• E
Uma técnica para compactar e otimizar dados antes de armazená-los.

10Q3028431
Certa
Podemos dizer que Delta Lake é uma extensão do conceito de Data Lake. Qual alternativa define
corretamente o Delta Lake?
• A
Uma técnica para processar dados não estruturados em um Data Lake.
• B
Uma abordagem para dividir dados em várias camadas de armazenamento no Data Lake.
• C
Um sistema de gerenciamento de bancos de dados relacionais.
• D
Uma extensão do Data Lake que oferece recursos de controle de transações e histórico de
versões.
• E
Um algoritmo de otimização para consulta de dados em Data Lakes.