Prévia do material em texto
Disciplina: TÓPICOS DE BIG DATA EM PYTHON
Aluno:
Turma: 9001
EEX0174_AV_ 13/06/2022
Avaliação:
6,0
Nota Partic.: Nota SIA:
8,0 pts
02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS
1. Ref.: 6076630 Pontos: 0,00 / 1,00
No contexto de Coleta de Dados, o que podemos afirmar sobre Dados Primários:
I - São dados obtidos em primeira mão pelo cientista de dados ou pelo analista de dados
II - São dados que precisam ser pré-processados para análise, e serão feitos exclusivamente
no primeiro momento pelo dono dos dados, o analista em questão
III - São obtidos através de softwares de monitoramento de logs, surveys, e bancos de
dados
Analise as frases listadas e assinale a alternativa correta.
Apenas a opção II.
Apenas as opções I e III.
Apenas a opção I.
Apenas as opções II e III.
As opções I, II, e III estão corretas.
2. Ref.: 6076628 Pontos: 1,00 / 1,00
O seguinte constructo da linguagem Python representa o condicional simples:
with
else
if
for
while
02318 - BIG DATA ANALYTICS
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206076630.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206076628.');
3. Ref.: 6075832 Pontos: 1,00 / 1,00
Luís foi contratado recentemente para trabalhar em uma empresa de consultoria de análise
de dados. O projeto no qual foi alocado já havia começado, e os colegas de Luís lhe disseram
que estavam preparando o conjunto de dados para poder passar os mesmos por um modelo
de árvore de decisão. Já que especificamente os colegas de Luís estão removendo dados
faltantes, em qual etapa do processo de KDD, Luís se encontra:
Descoberta de Padrões.
Pré-Processamento .
Coleta de Dados.
Transformação de Dados.
Avaliação.
4. Ref.: 6075828 Pontos: 1,00 / 1,00
Os modelos simbólicos são aqueles que:
Se baseiam em lógica e regras de inferência para aprender e raciocinar
Se baseiam em táticas de agrupamento por similaridade
São aqueles que lidam apenas com problemas numéricos
São aqueles que só lidam com problemas categóricos
Se baseiam estritamente em dados e inferências estatísticas em cima deles
02508 - HADOOP E ARMAZENAMENTO DE DADOS
5. Ref.: 6076138 Pontos: 1,00 / 1,00
Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as
transações em um banco de dados como uma unidade indivisível.
Indivisibilidade.
Durabilidade.
Atomicidade.
Consistência.
Isolamento.
6. Ref.: 6076197 Pontos: 1,00 / 1,00
A respeito dos componentes do ecossistema do Hadoop, selecione a opção correta que
apresenta o componente responsável pelo gerenciamento dos clusters.
HCluster
Flume
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206075832.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206075828.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206076138.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206076197.');
Zookeeper
HBase
Spark
02727 - PRINCÍPIOS DE BIG DATA
7. Ref.: 6067388 Pontos: 0,00 / 1,00
Em relação às aplicações de Internet das coisas, selecione a opção correta sobre os seus
objetivos.
Aumentar a diversidade dos dados
Melhorar a interatividade com o usuário
Aumentar a complexidade do processo de gestão dos dados
Ampliar o volume de dados da aplicação
Obter dados que sirvam como base na tomada de decisão
8. Ref.: 6067205 Pontos: 0,00 / 1,00
Em relação aos modelos de serviço de nuvem, selecione a opção correta com o modelo de
serviço focado no hardware.
MaaS
IaaS
HaaS
CaaS
PaaS
02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON
9. Ref.: 6076011 Pontos: 0,00 / 1,00
A escolha adequada de uma linguagem de programação é fundamental para a maximização
dos resultados almejados. Nesse sentido, selecione a opção que contém a linguagem de
programação mais adequada para desenvolver aplicações para o Spark.
Java
R
Python
Java Script
Scala
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206067388.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206067205.');
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206076011.');
10. Ref.: 6076003 Pontos: 1,00 / 1,00
Compreender os conceitos e princípios do framework Apache Spark é fundamental para o
cientista de dados. Selecione a opção correta que contém o componente do
ecossistema Spark responsável por dar suporte para tratar fluxo de dados típicos de
aplicações de tempo real.
RDDs
Spark Core
Spark SQL
Spark Streaming
Spark Hadoop
javascript:alert('C%C3%B3digo%20da%20quest%C3%A3o:%206076003.');