Simulado AV TÓPICOS DE BIG DATA EM PYTHON

•

ESTÁCIO

71

0

71

0

Victor Amadeu Santos

29/03/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Big Data

5.940 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

29/03/2022 00:37 Estácio: Alunos
https://simulado.estacio.br/alunos/ 1/5

Simulado AV
Teste seu conhecimento acumulado

Disc.: TÓPICOS DE BIG DATA EM PYTHON
Aluno(a): VICTOR AMADEU OLIVEIRA PIRES DOS SANTOS 202107296313
Acertos: 7,0 de 10,0 29/03/2022

Acerto: 1,0 / 1,0
Em relação aos desafios do processamento de fluxo de dados, selecione a opção correta.
Garantir a qualidade dos dados através de ferramentas de controle que não aceitem qualquer
inconsistência.
Usar algoritmos de criptografia nos dados para evitar o acesso indevido.
Garantir a consistência da informação através da ordenação dos dados.
Dimensionar o projeto logo no início para evitar a necessidade de expansão posteriormente.
Aplicar recursos de redundância no projeto para reduzir a volatilidade dos dados.
Respondido em 29/03/2022 00:34:32

Explicação:
Nas aplicações de streaming de dados, dificilmente não vai ocorrer alguma inconsistência, pois, normalmente,
elas estão contextualizadas em ambientes dinâmicos. Portanto, deve-se ordenar os dados para manter a
consistência dos dados e, além disso, o sistema deve ter uma tolerância a falhas sendo capaz de operar ainda
que haja problemas, desde que estejam dentro de um patamar de qualidade pré-estabelecido.

Acerto: 1,0 / 1,0
Em relação ao protocolo de transporte para transmissão de aplicações de streaming, selecione a opção correta.
CoAP
UDP
HTTP
TCP
MQTT
Respondido em 29/03/2022 00:17:58

Explicação:
O protocolo UDP - protocolo de datagrama do usuário - é utilizado para aplicações de streaming por ser mais
rápido. O protocolo TCP é orientado à confiabilidade e, no caso de aplicações de streaming, ele é muito lento
inviabilizando a aplicação. Os protocolos HTTP, MQTT e CoAP não se enquadram no transporte de dados.

Questão1
a
Questão2
a
https://simulado.estacio.br/alunos/inicio.asp
javascript:voltar();
29/03/2022 00:37 Estácio: Alunos
https://simulado.estacio.br/alunos/ 2/5

Acerto: 1,0 / 1,0
O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta
que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop.
Lua
Java Script
Perl
Java
Python
Respondido em 29/03/2022 00:11:59

Explicação:
O Hadoop foi desenvolvido usando, originalmente, a linguagem de programação Java na distribuição livre da
Apache Foundation. Atualmente, diferentes distribuições do framework estão implementadas em diversas
linguagens, entre as quais o Python.

Acerto: 0,0 / 1,0
O Hadoop é um framework de código aberto voltado para aplicações de Big Data. Neste sentido, selecione
a alternativa correta que apresenta um grande desafio no processo de configuração e gerenciamento do
Hadoop.
Tratar dados não-estruturados.
Aplicar políticas de segurança.
Processos de extração, transformação e carregamento dos dados.
Gerenciamento do armazenamento de dados.
Mecanismo para melhorar o processamento dos dados.
Respondido em 29/03/2022 00:27:03

Explicação:
O tratamento da segurança da informação é um grande desafio para o Hadoop, pois o profissional responsável
por essa etapa terá que configurar o sistema que, pela natureza dos problemas de Big Data, é uma tarefa
complexa.

Acerto: 1,0 / 1,0
Selecione a opção correta que contenha a operação responsável por retornar um subconjunto aleatório dos
dados de entrada.
distinct
mapRandom
random
sample
filter
Respondido em 29/03/2022 00:28:31

Explicação:
Gabarito: sample
Questão3
a
Questão4
a
Questão5
a
29/03/2022 00:37 Estácio: Alunos
https://simulado.estacio.br/alunos/ 3/5
Justificativa: A operação responsável por retornar um subconjunto aleatório dos dados é a sample. É uma
operação da categoria de transformação, sendo que se encaixa em transformações amplas, pois pode ser
necessário realizar movimentações entre as partições. Filter é uma função que retorna um subconjunto de
dados em relação a alguma condição imposta, portanto não há aleatoriedade. Random e mapRandom não são
funções válidas para o Spark. Distinct retorna um RDD com elementos diferentes de um RDD de entrada.

Acerto: 1,0 / 1,0
Atualmente, o Apache Spark, é o mais bem-sucedido framework para Big Data. Selecione a opção correta que
contenha apenas funções que podem ser categorizadas como transformações no Spark.
map, filter e union.
count, collect e take.
map, take e reduce.
map, sample e collect.
reduce, first e map.
Respondido em 29/03/2022 00:35:56

Explicação:
Gabarito: map, filter e union.
Justificativa: Algumas das funções de transformação no Spark são: map, filter, union, flatMap, mapPartitions e
sample. As citadas transformações, denominadas de transformações estreitas, resultam da aplicação de funções
de mapeamento e de filtragem, sendo que os dados se originam de uma única partição.

Acerto: 1,0 / 1,0
A linguagem Python se destaca como intuitiva e de fácil aprendizagem. Analise o código abaixo que apresenta
laços condicionais e instruções de repetição.
for i in range(10):
if (i%2==0):
print(i)
Qual a saída esperada após a execução do programa?
Serão impressos no console os números ímpares entre 0 e 9.
Serão impressos no console os números pares entre 1 e 10.
Serão impressos no console os números pares entre 0 e 9.
Serão impressos no console os números ímpares entre 0 e 10.
Serão impressos no console os números racionais entre 0 e 9.
Respondido em 29/03/2022 00:30:10

Explicação:
O constructo de laço que itera sobre uma sequência dos números reais de 0 a 9, e cujo condicional dentro do
laço escolhe apenas os números cujo resto de sua divisão por 2 seja 0, condição lógica que define se um
número é par ou não.

Acerto: 0,0 / 1,0
Dados categóricos são aqueles normalmente expressos por texto, que representam rótulos, nomes e símbolos.
Questão6
a
Questão7
a
Questão8
a
29/03/2022 00:37 Estácio: Alunos
https://simulado.estacio.br/alunos/ 4/5
Qual tipo de visualização de dados abaixo é recomendado para dados categóricos?
Gráficos de Barra.
Gráficos de Linha.
Gráfico de Estrela.
Gráfico de Faces de Chernoff.
Gráfico de Matriz de Dispersão.
Respondido em 29/03/2022 00:32:42

Explicação:
O gráfico de barras mostra as proporções dos dados categóricos assim evidenciando os extratos da amostra.
Lembrando que os dados categóricos não se encaixam nos gráficos de dados numéricos, como o de dispersão
causando confusão na função de visualização ou quebrando a mesma dependendo da biblioteca escolhida.

Acerto: 0,0 / 1,0
Como podemos checar as métricas de classificação do modelo neural da biblioteca Scikit-Learn?
Gráfico de Histograma
Regressão Linear
Classification Report
Gráfico de Matriz de Dispersão
Plotly
Respondido em 29/03/2022 00:36:26

Explicação:
O classification report é um dos métodos oferecidos pelo scikit-learn que nos permite usar um conjunto ground
truth para comparar contra as predições de um modelo e este calculará as métricas de acurácia, precisão e
medida F de cada classe possível e também as mesmas métricas em um nível macro.

Acerto: 1,0 / 1,0
Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial?
KDM.
SIGKDD.
SIGM.
KDD-DM.
CRISP-DM.
Respondido em 29/03/2022 00:15:56

Explicação:
O processo de tamanho similar ao KDD cujo âmbito industrial se beneficia mais devido à suas etapas de
entendimento do negócio é o CRISP-DM, processo esse que, diferentemente do KDD, contempla a entrega do
artefato de aprendizado de máquina.

Questão9
a
Questão10
a
29/03/2022 00:37 Estácio: Alunos
https://simulado.estacio.br/alunos/ 5/5

javascript:abre_colabore('38403','279167845','5167478947');