TÓPICOS DE BIG DATA EM PYTHON

•

ESTÁCIO

8

0

8

0

1

Rafael Mendonça

14/06/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 3 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Big Data

5.744 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1a Questão (Ref.: 202007099984)
Selecione a opção correta a respeito do processamento e streaming de dados.
Os dados são caracterizados também são denominados de lotes estáticos.
Os dados podem vir de várias fontes
Os dados sempre estão no mesmo formato
Os dados sempre são provenientes de aplicações transacionais
Caracterizam-se pelo envio do mesmo dado por várias fontes
 2a Questão (Ref.: 202007099978)
Em relação às redes de Internet das coisas, selecione a opção correta que relaciona os dispositivos entre si.
São um relacionamento máquina a máquina
São redes locais
São interconectados entre si
É uma conexão rede a rede
São um conjunto de sinais
 3a Questão (Ref.: 202007108720)
A respeito dos componentes do ecossistema do Hadoop, selecione a opção correta que apresenta o componente
responsável pelo gerenciamento dos clusters.
Spark
Zookeeper
Flume
HBase
HCluster
 4a Questão (Ref.: 202007108384)
Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o profissional de Tecnologia
da Informação. Sendo assim, analise as alternativas e selecione a opção que apresenta o componente responsável
por desempenhar o papel de mestre na arquitetura do Hadoop.
NameNode
Replicador
Bloco de dados
HServerMap
DataNode
 5a Questão (Ref.: 202007114889)
Selecione a opção correta que contenha a ação responsável por retornar os elementos de um conjunto de dados como
um vetor.
take
reduce
join
collect
coalesce
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067461\n\nStatus da quest%C3%A3o: Liberada para Uso.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067455\n\nStatus da quest%C3%A3o: Liberada para Uso.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076197\n\nStatus da quest%C3%A3o: Liberada para Uso.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075861\n\nStatus da quest%C3%A3o: Liberada para Uso.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6082366\n\nStatus da quest%C3%A3o: Liberada para Uso.');
 6a Questão (Ref.: 202007114885)
O MapReduce é uma técnica de computação distribuída considerada extremamente eficiente para o processamento de
dados, desempenhando papel fundamental no Spark. Em relação ao MapReduce, selecione a opção correta.
Só é possível utilizar o MapReduce no Spark através do PySpark.
As fases de processamento do MapReduce podem variar de acordo com a aplicação.
A principal característica do MapReduce é a utilização eficiente da memória.
Pode ser aplicada para projetos que envolvam grandes volumes e variedade de dados.
Projetos de big data só podem ser tratados por MapReduce.
 7a Questão (Ref.: 202007109151)
O seguinte constructo da linguagem Python representa o condicional simples:
if
for
else
while
with
 8a Questão (Ref.: 202007109287)
A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos afirmar
que:
I - O nome Pandas se refere a dados em painel ou panel data
II - O DataFrame é o coletivo de listas (lists)
III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs,
Excels, e JSONsAnalise as frases listadas e assinale a alternativa correta.
Apenas II.
Apenas I e III.
Apenas I e II.
Apenas I.
Apenas II e III.
 9a Questão (Ref.: 202007108351)
Os modelos simbólicos são aqueles que:
Se baseiam em lógica e regras de inferência para aprender e raciocinar
São aqueles que lidam apenas com problemas numéricos
Se baseiam estritamente em dados e inferências estatísticas em cima deles
Se baseiam em táticas de agrupamento por similaridade
São aqueles que só lidam com problemas categóricos
 10a Questão (Ref.: 202007108636)
Qual o tipo de método nos permite visualizar a árvore de decisão na biblioteca Scikit-Learn?
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6082362\n\nStatus da quest%C3%A3o: Liberada para Uso.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076628\n\nStatus da quest%C3%A3o: Liberada para Uso.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076764\n\nStatus da quest%C3%A3o: Liberada para Uso.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075828\n\nStatus da quest%C3%A3o: Liberada para Uso.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076113\n\nStatus da quest%C3%A3o: Liberada para Uso.');
console.log
cout
plot_tree
printf
print