Buscar

AV TOPICOS BIG DATA 10

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Avaliação
 AV 
 avalie seus conhecimentos 
 
 
 
 
Lupa Calc. Notas 
 
 
 
 
 
 
VERIFICAR E ENCAMINHAR 
 
Disciplina: EEX0174 - TÓP BIG EM PYT Período: 2022.3 EAD (GT) 
Aluno: 
 
Matr.: 
 
 Turma: 9001 
 
 
Prezado(a) Aluno(a), 
Responda a todas as questões com atenção. Somente clique no botão FINALIZAR PROVA ao ter certeza de 
que respondeu a todas as questões e que não precisará mais alterá-las. 
 
A prova será SEM consulta. O aluno poderá fazer uso, durante a prova, de uma folha em branco, para 
rascunho. Nesta folha não será permitido qualquer tipo de anotação prévia, cabendo ao aplicador, nestes 
casos, recolher a folha de rascunho do aluno. 
Valor da prova: 10 pontos. 
 
 
 
1 ponto 
 
1. 
 
 
Em relação aos formatos que os dados de Big Data, selecione a opção que corresponde a 
quantidade de formas que podem ser encontrados. 
 (Ref.: 202013190785) 
 
 
 
 
3 
 
 
2 
 
 
5 
 
 
4 
 
 
6 
 
 
 
 
1 ponto 
https://simulado.estacio.br/provas_emcasa_linear.asp
javascript:voltar();
javascript:diminui();
javascript:aumenta();
javascript:calculadora_on();
javascript:anotar_on();
 
2. 
 
 
Em relação às características do processamento de fluxo de dados, selecione a opção 
correta. 
 (Ref.: 202013190606) 
 
 
 
 
O fluxo de dados é intermitente 
 
 
São invariáveis no tempo 
 
 
Sempre são do mesmo tipo 
 
 
São relacionados à aplicações de internet das coisas 
 
 
Representam o estado de um sistema em um dado momento 
 
 
 
 
1 ponto 
 
3. 
 
 
Em relação à fase de mapeamento do Hadoop, selecione a opção correta que apresenta 
o responsável pela geração de fragmento para os componentes da fase de redução. 
 (Ref.: 202013199539) 
 
 
 
 
Particionador. 
 
 
Mapeador. 
 
 
Redutor. 
 
 
Combinador. 
 
 
Leitor de registros. 
 
 
 
 
1 ponto 
 
4. 
 
 
O sistema de arquivos distribuídos do Hadoop, conhecido como HDFS, foi idealizado 
para trabalhar com grandes volumes de dados. Selecione a opção correta que 
apresenta o paradigma como o HDFS funciona. 
 (Ref.: 202013199598) 
 
 
 
 
Distribuído e distribuído. 
 
 
Mestre e escravo. 
 
 
Centralizado e distribuído. 
 
 
Centralizado e centralizado. 
 
 
Distribuído e centralizado. 
 
 
 
 
1 ponto 
 
5. 
 
 
Selecione a opção correta que contenha a ação responsável por retornar os elementos de 
um conjunto de dados como um vetor. 
 (Ref.: 202013205765) 
 
 
 
 
collect 
 
 
reduce 
 
 
take 
 
 
coalesce 
 
 
join 
 
 
 
 
1 ponto 
 
6. 
 
 
A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação 
recorrente para aplicações de Big Data. Nesse sentido, selecione a opção que contém a 
estrutura de dados que possibilita o Cientista de dados atribuir nome para as colunas. 
 (Ref.: 202013199408) 
 
 
 
 
PySpark 
 
 
RDD 
 
 
numpy.array 
 
 
SQL 
 
 
DataFrame 
 
 
 
 
1 ponto 
 
7. 
 
 
A coleta e preparação dos dados para análise no Python são de extrema importância. Os 
dados secundários são assim definidos devido: 
 (Ref.: 202013200312) 
 
 
 
 
A sua baixa qualidade. 
 
 
O fato de terem sido obtidos a partir de terceiros. 
 
 
O fato de virem de uma fonte alternativa não convencional. 
 
 
O fato de requererem muito mais pré-processamento. 
 
 
O fato de ocuparem menos espaço de memória. 
 
 
 
 
1 ponto 
 
8. 
 
 
O seguinte constructo da linguagem Python representa o condicional simples: 
 (Ref.: 202013200027) 
 
 
 
 
for 
 
 
else 
 
 
if 
 
 
while 
 
 
with 
 
 
 
 
1 ponto 
 
9. 
 
 
O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem 
sempre conectados produzem uma quantidade enorme de dados. Estes dados que 
alimentam os modelos de aprendizado de máquina também são conhecidos como: 
 (Ref.: 202013199229) 
 
 
 
 
Dados Faltantes. 
 
 
Observações. 
 
 
Big Data. 
 
 
Conhecimento. 
 
 
Informações. 
 
 
 
 
1 ponto 
 
10. 
 
 
Os modelos simbólicos são aqueles que: 
 (Ref.: 202013199227) 
 
 
 
 
Se baseiam em lógica e regras de inferência para aprender e raciocinar 
 
 
São aqueles que lidam apenas com problemas numéricos 
 
 
Se baseiam em táticas de agrupamento por similaridade 
 
 
São aqueles que só lidam com problemas categóricos 
 
 
Se baseiam estritamente em dados e inferências estatísticas em cima deles 
 
 
VERIFICAR E ENCAMINHAR 
 
 
Legenda: Questão não respondida Questão não gravada Questão gravada 
 
 
 
 
 
 
 
https://simulado.estacio.br/provas_emcasa_linear.asp
javascript:abre_colabore();

Continue navegando