AV TOPICOS BIG DATA 10

3

0

3

0

Jordania Luz

07/09/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Análise e Desenvolvimento de Sistemas

48.726 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Avaliação
AV
avalie seus conhecimentos

Lupa Calc. Notas

VERIFICAR E ENCAMINHAR

Disciplina: EEX0174 - TÓP BIG EM PYT Período: 2022.3 EAD (GT)
Aluno:

Matr.:

Turma: 9001

Prezado(a) Aluno(a),
Responda a todas as questões com atenção. Somente clique no botão FINALIZAR PROVA ao ter certeza de
que respondeu a todas as questões e que não precisará mais alterá-las.

A prova será SEM consulta. O aluno poderá fazer uso, durante a prova, de uma folha em branco, para
rascunho. Nesta folha não será permitido qualquer tipo de anotação prévia, cabendo ao aplicador, nestes
casos, recolher a folha de rascunho do aluno.
Valor da prova: 10 pontos.

1 ponto

1.

Em relação aos formatos que os dados de Big Data, selecione a opção que corresponde a
quantidade de formas que podem ser encontrados.
(Ref.: 202013190785)

3

2

5

4

6

1 ponto
https://simulado.estacio.br/provas_emcasa_linear.asp
javascript:voltar();
javascript:diminui();
javascript:aumenta();
javascript:calculadora_on();
javascript:anotar_on();

2.

Em relação às características do processamento de fluxo de dados, selecione a opção
correta.
(Ref.: 202013190606)

O fluxo de dados é intermitente

São invariáveis no tempo

Sempre são do mesmo tipo

São relacionados à aplicações de internet das coisas

Representam o estado de um sistema em um dado momento

1 ponto

3.

Em relação à fase de mapeamento do Hadoop, selecione a opção correta que apresenta
o responsável pela geração de fragmento para os componentes da fase de redução.
(Ref.: 202013199539)

Particionador.

Mapeador.

Redutor.

Combinador.

Leitor de registros.

1 ponto

4.

O sistema de arquivos distribuídos do Hadoop, conhecido como HDFS, foi idealizado
para trabalhar com grandes volumes de dados. Selecione a opção correta que
apresenta o paradigma como o HDFS funciona.
(Ref.: 202013199598)

Distribuído e distribuído.

Mestre e escravo.

Centralizado e distribuído.

Centralizado e centralizado.

Distribuído e centralizado.

1 ponto

5.

Selecione a opção correta que contenha a ação responsável por retornar os elementos de
um conjunto de dados como um vetor.
(Ref.: 202013205765)

collect

reduce

take

coalesce

join

1 ponto

6.

A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação
recorrente para aplicações de Big Data. Nesse sentido, selecione a opção que contém a
estrutura de dados que possibilita o Cientista de dados atribuir nome para as colunas.
(Ref.: 202013199408)

PySpark

RDD

numpy.array

SQL

DataFrame

1 ponto

7.

A coleta e preparação dos dados para análise no Python são de extrema importância. Os
dados secundários são assim definidos devido:
(Ref.: 202013200312)

A sua baixa qualidade.

O fato de terem sido obtidos a partir de terceiros.

O fato de virem de uma fonte alternativa não convencional.

O fato de requererem muito mais pré-processamento.

O fato de ocuparem menos espaço de memória.

1 ponto

8.

O seguinte constructo da linguagem Python representa o condicional simples:
(Ref.: 202013200027)

for

else

if

while

with

1 ponto

9.

O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem
sempre conectados produzem uma quantidade enorme de dados. Estes dados que
alimentam os modelos de aprendizado de máquina também são conhecidos como:
(Ref.: 202013199229)

Dados Faltantes.

Observações.

Big Data.

Conhecimento.

Informações.

1 ponto

10.

Os modelos simbólicos são aqueles que:
(Ref.: 202013199227)

Se baseiam em lógica e regras de inferência para aprender e raciocinar

São aqueles que lidam apenas com problemas numéricos

Se baseiam em táticas de agrupamento por similaridade

São aqueles que só lidam com problemas categóricos