Prévia do material em texto
1a Questão (Ref.: 202007121600)
Selecione a opção correta sobre o uso de Big Data.
Grandes volumes de dados são úteis para testar a capacidade dos servidores de
gerenciamento de dados.
O volume e diversidade dos dados podem dar uma visão realística do que está sendo
observado.
É impossível não utilizar aplicações de Big Data para gerenciar projetos de internet das
coisas.
Projetos de big de Big Data são uma forma de organizar tabelas normalizadas com grande
volume de dados.
Com projetos de Big Data é sempre possível detectar fraudes em operações financeiras.
2a Questão (Ref.: 202007121783)
Em relação aos formatos que os dados de Big Data, selecione a opção que corresponde a
quantidade de formas que podem ser encontrados.
5
2
4
6
3
3a Questão (Ref.: 202007130537)
Em relação à fase de mapeamento do Hadoop, selecione a opção correta que apresenta o
responsável pela geração de fragmento para os componentes da fase de redução.
Leitor de registros.
Particionador.
Redutor.
Combinador.
Mapeador.
4a Questão (Ref.: 202007130258)
Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o
profissional de Tecnologia da Informação. Sendo assim, analise as alternativas e selecione a
opção que apresenta o componente responsável por desempenhar o papel de mestre na
arquitetura do Hadoop.
DataNode
NameNode
Bloco de dados
Replicador
HServerMap
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067203/n/nStatus da quest%C3%A3o: Liberada para Uso.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067386/n/nStatus da quest%C3%A3o: Liberada para Uso.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076140/n/nStatus da quest%C3%A3o: Liberada para Uso.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075861/n/nStatus da quest%C3%A3o: Liberada para Uso.');
5a Questão (Ref.: 202007130308)
O Spark é um framework de alto desempenho usado para aplicações de Big Data. Em
relação à arquitetura do Spark, selecione a opção correta.
O gerenciador de cluster do Spark oferece suporte a Hadoop YARN.
O Executor e os Worker Nodes desempenham papeis equivalentes na arquitetura do
Spark.
Os Worker Nodes da arquitetura Spark são responsáveis pelo gerenciamento das
máquinas que executarão como escravos.
O gerenciador de cluster do Spark faz o gerenciamento da execução das tarefas.
O Executor corresponde ao conjunto de máquina que executam como escravos.
6a Questão (Ref.: 202007130400)
Compreender os conceitos e princípios do framework Apache Spark é fundamental para o
cientista de dados. Selecione a opção correta que contém o componente do
ecossistema Spark responsável por dar suporte para tratar fluxo de dados típicos de
aplicações de tempo real.
Spark Core
Spark SQL
Spark Hadoop
Spark Streaming
RDDs
7a Questão (Ref.: 202007131025)
O seguinte constructo da linguagem Python representa o condicional simples:
if
for
with
while
else
8a Questão (Ref.: 202007131161)
A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados.
Sobre ela podemos afirmar que:
I - O nome Pandas se refere a dados em painel ou panel data
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075911/n/nStatus da quest%C3%A3o: Liberada para Uso.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076003/n/nStatus da quest%C3%A3o: Liberada para Uso.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076628/n/nStatus da quest%C3%A3o: Liberada para Uso.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076764/n/nStatus da quest%C3%A3o: Liberada para Uso.');
II - O DataFrame é o coletivo de listas (lists)
III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados,
principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a alternativa
correta.
Apenas I e II.
Apenas I e III.
Apenas II e III.
Apenas II.
Apenas I.
9a Questão (Ref.: 202007130229)
Luís foi contratado recentemente para trabalhar em uma empresa de consultoria de análise
de dados. O projeto no qual foi alocado já havia começado, e os colegas de Luís lhe disseram
que estavam preparando o conjunto de dados para poder passar os mesmos por um modelo
de árvore de decisão. Já que especificamente os colegas de Luís estão removendo dados
faltantes, em qual etapa do processo de KDD, Luís se encontra:
Descoberta de Padrões.
Coleta de Dados.
Transformação de Dados.
Pré-Processamento .
Avaliação.
10a Questão (Ref.: 202007130225)
Os modelos simbólicos são aqueles que:
São aqueles que lidam apenas com problemas numéricos
São aqueles que só lidam com problemas categóricos
Se baseiam estritamente em dados e inferências estatísticas em cima deles
Se baseiam em lógica e regras de inferência para aprender e raciocinar
Se baseiam em táticas de agrupamento por similaridade
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075832/n/nStatus da quest%C3%A3o: Liberada para Uso.');
javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075828/n/nStatus da quest%C3%A3o: Liberada para Uso.');