TÓPICOS DE BIG DATA EM PYTHON (Simulado AV2)

•

ESTÁCIO

8

0

8

0

IGoR Estácio

15/05/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Big Data

6.045 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Simulado AV
Teste seu conhecimento acumulado

Disc.: TÓPICOS DE BIG DATA EM PYTHON
Aluno(a):
Acertos: 10,0 de 10,0 14/05/2022

Acerto: 1,0 / 1,0
A respeito das aplicações de fluxos de dados, selecione a opção correta.
Reapresentação de programas de televisão.
Transações bancárias, como o serviço de PIX.
Serviços de compras online
Serviços sob demanda, como serviços de filme online.
Serviço de correio eletrônico
Respondido em 14/05/2022 22:56:16

Explicação:
Os serviços de fluxo de dado de aplicações de mídia de streaming são arquivos enviados em partes por serviço
e reproduzidos por um cliente conforme a entrega continua. As demais opções estão erradas, pois são exemplos
de serviços em que os dados já foram gerados, ou que são usados apenas esporadicamente.

Acerto: 1,0 / 1,0
Selecione a opção em que a camada fornece comunicação ponta a ponta nas aplicações de internet das coisas.
Camada de transporte
Camada lógica
Camada de sessão
Camada de aplicação
Camada de enlace de dados
Respondido em 14/05/2022 22:58:41

Explicação:
A camada de transporte é encarregada pela comunicação ponta a ponta entre as aplicações e oferece
confiabilidade, além de garantir que os pacotes serão entregues da mesma forma que o usuário os enviou. Em
relação às outras opções, a camada lógica simplesmente não existe. Já a camada de enlace de dados detecta
erros e, quando necessário, os corrige. A camada de sessão trata dos processos responsáveis pela transferência
de dados. Por fim, a camada de aplicação é responsável pela comunicação fim-a-fim entre processos.

Questão1
a
Questão2
a
https://simulado.estacio.br/alunos/inicio.asp
javascript:voltar();

Acerto: 1,0 / 1,0
A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma
de blocos de dados.
Bloco de dados
YARN
DataNode
Replicação
NameNode
Respondido em 14/05/2022 22:59:48

Explicação:
O DataNode é componente da arquitetura do HDFS responsável pelo armazenamento dos dados na forma de
blocos de dados.

Acerto: 1,0 / 1,0
Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser
armazenado(s) nele.
estruturado e semiestruturado
apenas não estruturado
apenas estruturado
apenas tabelas relacionais
estruturado, não estruturado e semiestruturado
Respondido em 14/05/2022 23:00:05

Explicação:
O Data Lake pode armazenar dados estruturados, semiestruturados e não estruturados que correspondem a
característica de variedade dos dados que é bem típica de aplicações de Big Data.

Acerto: 1,0 / 1,0
O MapReduce é uma técnica clássica de programação e é bastante utilizada por diversos frameworks como o
Spark, por exemplo. Em relação à técnica MapReduce, selecione a opção correta.
Só pode ser aplicada para grandes volumes de dados
Foi substituída no Spark por acesso direto à memória
Consiste em uma técnica de programação sequencial
É uma técnica lenta para processamento de grandes volumes de dados
É uma técnica de computação distribuída
Respondido em 14/05/2022 23:02:21

Explicação:
Gabarito: É uma técnica de computação distribuída
Justificativa: O MapReduce é uma técnica de computação distribuída que apesar de clássica ainda é
considerada muito eficiente para processamento de grandes volumes de dados. Apesar de ser adequada para
Questão3
a
Questão4
a
Questão5
a
projetos de big data, ela também pode ser utilizada para menores volumes, mas não é apropriada para esses
casos.

Acerto: 1,0 / 1,0
O paradigma MapReduce é uma estratégia de computação com capacidade de processar grandes conjuntos de
dados de maneira distribuída em várias máquinas. Em relação à técnica MapReduce, selecione a opção que é
responsável por consolidar os resultados produzidos ao longo do processamento.
Agregação
Separação
Processamento
Mapeamento
Redução
Respondido em 14/05/2022 23:02:39

Explicação:
Gabarito: Redução
Justificativa: A função de redução agrupa os pares após a fase de embaralhamento concluindo o
processamento dos dados. O MapReduce é uma técnica clássica de programação distribuída e é bastante
utilizada por diversos frameworks como o Spark, por exemplo.

Acerto: 1,0 / 1,0
A visualização dos dados é fundamental no processo de análise e interpretação. Qual o tipo de visualização de
dados mais indicada para dados temporais?
Gráfico de Faces de Chernoff.
Gráfico de Linha.
Gráfico de Barra.
Gráfico de Estrela.
Gráfico de Matriz de Dispersão.
Respondido em 14/05/2022 23:02:48

Explicação:
O gráfico de linhas passa a visualização de cronologia, acompanhando a linha de vida do dado, mostrando
através das inclinações ou gradientes, o crescimento ou decrescimento do dado. As demais alternativas indicam
tipos de visualização inadequados para dados temporais.

Acerto: 1,0 / 1,0
Eduardo quer mostrar aos gestores da empresa como as ações da carteira de investimentos recomendada que
ele e o time dele propuseram estão valorizando e gerando muitos dividendos aos clientes. Para isso, Eduardo
construiu um gráfico de ______, pois está lidando com dados ________ e quer mostrar o quão bem as
recomendações geradas por seu time estão evoluindo.
Respectivamente a resposta que completa as duas lacunas é:
Pizza; Categóricos
Linha; Temporais
Pizza; Numéricos
Linha; Categóricos
Questão6
a
Questão7
a
Questão8
a
Linha; Numéricos
Respondido em 14/05/2022 23:03:56

Explicação:
O gráfico correto é o de linhas, pois os dados são temporais, uma vez que Eduardo quer mostrar cronologia
para os acionistas e o gráfico de linha representa muito bem isto, e os dados em questão variam ao longo de
meses ou anos. Gráficos de pizza não se aplicam a dados temporais. Os dados não são simplesmente numéricos
pois, em essência, estamos lidando com a cronologia, logo são dados temporais. O tipo de dados em que
números variam no tempo não pode ser classificado como tipo categórico.

Acerto: 1,0 / 1,0
No modelo de aprendizado profundo, as camadas internas ocultas representam:

I - Abstrações de aspectos de dados complexos
II - Informação relevante dos dados de entrada
III - Pesos e Viéses

Apenas II e III

Apenas I e III

Apenas I

Apenas III

As alternativas I, II e III

Respondido em 14/05/2022 23:05:13

Explicação:
Os modelos de aprendizado profundo são modelos conexionistas que usam suas camadas internas para abstrair
automaticamente abstrações de aspectos complexos dos dados, como uma linha reta ou uma curva, e até
mesmo combinações de aspectos descobertos em camadas anteriores.

alternativa I - Abstrações de aspectos de dados complexos ¿ está correta pois os modelos de aprendizado
profundo são modelos conexionistas que usam suas camadas internas para abstrair automaticamente
abstrações de aspectos complexos dos dados, como uma linha reta ou uma curva, e até mesmo combinações de
aspectos descobertos em camadas anteriores.

A alternativa II - Informação relevante dos dados de entrada - está incorreta por estar relacionada com o
conceito de sistema de informação, que é uma coleção de partes que recebe dados como insumo, processa-os
por meio de dinâmicas internas das partes e devolve informação relevante ao usuário final.

A alternativa III ¿ Pesos e Vieses ¿ está incorreta, pois o aprendizado profundo tenta modelar abstrações de alto
nível de dados, sendo os grafos empregados nessa área as redes neurais artificiais, onde as camadas ocultas
mapeiam de forma equivariante os pesos e os filtros para as camadas subsequentes.

Questão9
a
Acerto: 1,0 / 1,0
Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial?
SIGM.
CRISP-DM.
KDM.
SIGKDD.
KDD-DM.
Respondido em 14/05/2022 23:06:22

Explicação:
O processo de tamanho similar ao KDD cujo âmbito industrial se beneficia mais devido à suas etapas de
entendimento do negócio é o CRISP-DM, processoesse que, diferentemente do KDD, contempla a entrega do
artefato de aprendizado de máquina.

Questão10a
javascript:abre_colabore('38403','283921615','5361075460');