Buscar

prova_big_data

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 3 páginas

Prévia do material em texto

1 - Em relação aos modelos de serviço de nuvem, selecione a opção correta com o modelo 
de serviço focado no hardware. 
MaaS 
CaaS 
HaaS 
IaaS 
PaaS 
2 - Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as 
transações em um banco de dados como uma unidade indivisível. 
Atomicidade. 
Durabilidade. 
Indivisibilidade. 
Consistência. 
Isolamento. 
 
3 - O Apache Spark é um framework de código aberto aplicado para projetos de Big Data. 
Selecione a opção correta que contenha apenas funções que podem ser categorizadas 
como ações no Spark. 
count, collect e map. 
first, take e reduce. // conforme pessoal informou era essa, acabei colocando outra 
reduce, map e filter. 
take, filter e sample. 
collect, flatMap e sample. 
 
4 - A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. 
Sobre ela podemos afirmar que: 
I - O nome Pandas se refere a dados em painel ou panel data 
II - O DataFrame é o coletivo de listas (lists) 
 
III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de 
dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a 
alternativa correta. 
Apenas II. 
Apenas I e II. 
Apenas I. 
Apenas I e III. 
Apenas II e III. 
 
5 - Qual o tipo de método nos permite visualizar a árvore de decisão na biblioteca Scikit-Learn? 
plot_tree 
printf 
print 
cout 
console.log 
 
6 – 3m relação à fase de mapeamento do Hadoop, selecione a opção correta que apresenta o 
responsável pela geração de fragmento para os componentes da fase de redução. 
Particionador. 
Mapeador. 
Combinador. 
Leitor de registros. 
Redutor. 
 
7 - Os dados que, por alguma razão, normalmente interferência humana, não chegam com 
todos os atributos esperados durante a coleta de dados, são conhecidos como: 
 
Embaralhados. 
Nulos. 
Faltantes. 
Corrompidos. 
Enviesados. 
 
8 – Selecione a opção correta sobre o uso de big data: 
 
O grande volumes de dados são uteis para testar a capacidade dos servidores de 
gerenciamento de dados 
 
O volume e diversidade dos dados podem dar uma visão realística que esta sendo observado. 
 
É impossível não utilizar aplicações de big data para gerenciar projetos de internet das coisas 
 
Projetos de big de big data são uma forma de organizar tabelas normalizadas com grande 
volume de dados. 
 
Com projetos de big data é sempre possível detectar fraudes em operações financeiras. 
 
9 – O boom de ia se deve ao surgimento de novas tecnologias e dispositivos que por estarem 
sempre conectados produzem uma quantidade enorme de daods. Estes dados que alimentam 
os modelos de aprendizado de máquina também são conhecidos como: 
 
Dados Faltantes 
Big data 
Observações 
Conhecimento 
Informações 
 
 
10 – Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o 
profissional de tecnologia da informação. Sendo assim, analise as alternativas e selecione a 
opção que apresenta o componente responsável por desempenhar o papel de mestre na 
arquitetura do Hadoop. 
DataNode 
HServerMao 
NameNode 
Bloco de dados 
Replicador

Mais conteúdos dessa disciplina