prova_big_data

•

ESTÁCIO

Jorge Romero

17/06/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 3 páginas

Prévia do material em texto

1 - Em relação aos modelos de serviço de nuvem, selecione a opção correta com o modelo
de serviço focado no hardware.
MaaS
CaaS
HaaS
IaaS
PaaS
2 - Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as
transações em um banco de dados como uma unidade indivisível.
Atomicidade.
Durabilidade.
Indivisibilidade.
Consistência.
Isolamento.

3 - O Apache Spark é um framework de código aberto aplicado para projetos de Big Data.
Selecione a opção correta que contenha apenas funções que podem ser categorizadas
como ações no Spark.
count, collect e map.
first, take e reduce. // conforme pessoal informou era essa, acabei colocando outra
reduce, map e filter.
take, filter e sample.
collect, flatMap e sample.

4 - A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados.
Sobre ela podemos afirmar que:
I - O nome Pandas se refere a dados em painel ou panel data
II - O DataFrame é o coletivo de listas (lists)

III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de
dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a
alternativa correta.
Apenas II.
Apenas I e II.
Apenas I.
Apenas I e III.
Apenas II e III.

5 - Qual o tipo de método nos permite visualizar a árvore de decisão na biblioteca Scikit-Learn?
plot_tree
printf
print
cout
console.log

6 – 3m relação à fase de mapeamento do Hadoop, selecione a opção correta que apresenta o
responsável pela geração de fragmento para os componentes da fase de redução.
Particionador.
Mapeador.
Combinador.
Leitor de registros.
Redutor.

7 - Os dados que, por alguma razão, normalmente interferência humana, não chegam com
todos os atributos esperados durante a coleta de dados, são conhecidos como:

Embaralhados.
Nulos.
Faltantes.
Corrompidos.
Enviesados.

8 – Selecione a opção correta sobre o uso de big data:

O grande volumes de dados são uteis para testar a capacidade dos servidores de
gerenciamento de dados

O volume e diversidade dos dados podem dar uma visão realística que esta sendo observado.

É impossível não utilizar aplicações de big data para gerenciar projetos de internet das coisas

Projetos de big de big data são uma forma de organizar tabelas normalizadas com grande
volume de dados.

Com projetos de big data é sempre possível detectar fraudes em operações financeiras.

9 – O boom de ia se deve ao surgimento de novas tecnologias e dispositivos que por estarem
sempre conectados produzem uma quantidade enorme de daods. Estes dados que alimentam
os modelos de aprendizado de máquina também são conhecidos como:

Dados Faltantes
Big data
Observações
Conhecimento
Informações

10 – Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o
profissional de tecnologia da informação. Sendo assim, analise as alternativas e selecione a
opção que apresenta o componente responsável por desempenhar o papel de mestre na
arquitetura do Hadoop.
DataNode
HServerMao
NameNode
Bloco de dados
Replicador