Simulado de Tópicos de Big Data em Python

•

FGV-RJ

0

Nilo Silva Neto

18/11/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Fundamentos e Projeto de Big Data

822 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

18/11/2022 15:38 Estácio: Alunos
https://ead.estacio.br/alunos/ 1/5

Meus
Simulados
Teste seu conhecimento acumulado

Disc.: TÓPICOS DE BIG DATA EM PYTHON
Aluno(a): NILO SILVA NETO 202012017875
Acertos: 10,0 de 10,0 18/11/2022

Acerto: 1,0 / 1,0
Em relação ao formato dos dados, selecione a opção correta que corresponde ao formato dos dados de
transações bancárias.
dados de Internet das Coisas
dados de Big Data
dados semiestruturados
dados não estruturados
dados estruturados
Respondido em 18/11/2022 15:14:32

Explicação:
Os dados de transações bancárias são salvos em tabelas e, portanto, correspondem a dados estruturados, que
são típicos de sistemas de transações on line armazenados em banco de dados. As demais alternativas tratam
de dados não convencionais que não são armazenados em bancos de dados tradicionais.

Acerto: 1,0 / 1,0
(NC-UFPR/2019 - Adaptada) Sobre a IoT (Internet das coisas) e seus blocos básicos de construção, identifique
como verdadeiras (V) ou falsas (F) as seguintes afirmativas:
( ) Na IoT, os objetos podem prover comunicação entre usuários e dispositivos, viabilizando diversas
aplicações, tais como coleta de dados de pacientes e monitoramento de idosos e sensoriamento de ambientes
de difícil acesso.
( ) A tecnologia de IoT consiste na coexistência colaborativa de dois componentes: As "coisas" e os protocolos
de rede que permitem a sua comunicação.
( ) Protocolos de comunicação: Viabilizam a troca de dados via Internet entre os objetos físicos e outros
sistemas.

Assinale a alternativa que apresenta a sequência correta, de cima para baixo.
V V F
F V F
F F F
V F V
Questão1
a
Questão2
a
https://ead.estacio.br/alunos/inicio.asp
javascript:voltar();
18/11/2022 15:38 Estácio: Alunos
https://ead.estacio.br/alunos/ 2/5
F V V
Respondido em 18/11/2022 15:23:34

Explicação:
O avanço da tecnologia criou dispositivos e sensores eletrônicos que geram enormes quantidades de dados.
Esses equipamentos podem ser utilizados em diversas aplicações, tais como: coleta de dados de pacientes e
monitoramento de idosos e sensoriamento de ambientes de difícil acesso. A tecnologia de IoT consiste na
coexistência colaborativa de quatro componentes: Objetos físicos (ou "coisas"), Computação, Protocolos de
comunicação e Serviços.

Acerto: 1,0 / 1,0
O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta
que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop.
Python
Java
Lua
Java Script
Perl
Respondido em 18/11/2022 15:20:05

Explicação:
O Hadoop foi desenvolvido usando, originalmente, a linguagem de programação Java na distribuição livre da
Apache Foundation. Atualmente, diferentes distribuições do framework estão implementadas em diversas
linguagens, entre as quais o Python.

Acerto: 1,0 / 1,0
Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia da Informação.
Selecione a opção correta a respeito do Data Lake.
Possui alta latência para acesso dos dados.
Armazenam os dados de modo eficiente.
Demandam por equipamentos especiais.
São exclusivos da distribuição Hadoop Apache.
Aplicam processos de tratamento nos dados.
Respondido em 18/11/2022 15:23:56

Explicação:
O Data Lake utiliza um método muito eficiente para fazer o armazenamento dos dados. Dessa forma ele possui
baixa latência para acessar os dados. Além disso, o Data Lake não demanda por equipamentos especiais e não
é de uso exclusivo da distribuição Hadoop Apache.

Acerto: 1,0 / 1,0
Os componentes do Spark têm como objetivo facilitar o desenvolvimento de projetos com finalidades
específicas. Selecione a opção que contém o componente do ecossistema do Spark especializado em
aplicações de aprendizado de máquina.
Questão3
a
Questão4
a
Questão5
a
18/11/2022 15:38 Estácio: Alunos
https://ead.estacio.br/alunos/ 3/5
GraphX Learning
MLlib
MLSpark
RDDs
Spark Learning
Respondido em 18/11/2022 15:25:08

Explicação:
Gabarito: MLlib
Justificativa: O componente MLlib é o componente do ecossistema do Spark usado para implementar
algoritmos estatísticos e de aprendizado de máquina para simplificar pipelines de aprendizado de máquina em
projetos de big data. As opções Spark Learning, GraphX Learning e MLSpark não são componentes válidos do
Spark. Os RDDs são componentes para conjunto de dados resilientes.

Acerto: 1,0 / 1,0
O paradigma MapReduce é uma estratégia de computação com capacidade de processar grandes conjuntos de
dados de maneira distribuída em várias máquinas. Em relação à técnica MapReduce, selecione a opção que é
responsável por consolidar os resultados produzidos ao longo do processamento.
Processamento
Mapeamento
Agregação
Redução
Separação
Respondido em 18/11/2022 15:25:43

Explicação:
Gabarito: Redução
Justificativa: A função de redução agrupa os pares após a fase de embaralhamento concluindo o
processamento dos dados. O MapReduce é uma técnica clássica de programação distribuída e é bastante
utilizada por diversos frameworks como o Spark, por exemplo.

Acerto: 1,0 / 1,0
Dados categóricos são aqueles normalmente expressos por texto, que representam rótulos, nomes e símbolos.
Qual tipo de visualização de dados abaixo é recomendado para dados categóricos?
Gráfico de Matriz de Dispersão.
Gráficos de Barra.
Gráfico de Estrela.
Gráficos de Linha.
Gráfico de Faces de Chernoff.
Respondido em 18/11/2022 15:37:33

Explicação:
O gráfico de barras mostra as proporções dos dados categóricos assim evidenciando os extratos da amostra.
Lembrando que os dados categóricos não se encaixam nos gráficos de dados numéricos, como o de dispersão
causando confusão na função de visualização ou quebrando a mesma dependendo da biblioteca escolhida.

Questão6
a
Questão7
a
18/11/2022 15:38 Estácio: Alunos
https://ead.estacio.br/alunos/ 4/5

Acerto: 1,0 / 1,0
Bibliotecas poderosas de análise e manipulação de dados podem ser utilizadas com a linguagem Python. Qual
o método utilizado para fazer a junção entre DataFrames no pandas?
set_index
merge
values
reset_index
sum
Respondido em 18/11/2022 15:36:24

Explicação:
O método merge é equivalente ao join da SQL que junta dois DataFrames a partir de indexes do mesmo nome,
ou de indexes pré-definidos pelo cientista de dados. As demais alternativas não dizem respeito à operação de
junção entre DataFrames.

Acerto: 1,0 / 1,0
As redes neurais são implementadas em Python através de uma biblioteca de processamento de cálculos em
paralelo baseada em grafos. Qual o nome desta biblioteca?
Numpy
Scipy
Pandas
Plotly
Tensorflow
Respondido em 18/11/2022 15:34:01

Explicação:
A biblioteca TensorFlow foi criada com a finalidade de processar cálculos de forma paralela, em estruturas de
grafos a fim de otimizar estes tipos de processamento, mas, devido à natureza dos modelos conexionistas, tal
biblioteca foi redefinida como a principal biblioteca para implementação de redes neurais.

Acerto: 1,0 / 1,0
Leonardo começou seu trabalho de conclusão de curso. Nesse trabalho, Leonardo quer elaborar um
classificador de imagem, mas, não sabe se decidir com relação à configuração das camadas de sua rede
neural. É muito comum utilizarmos o conjunto ________ para fazermos o benchmark de modelos de
______________:
Pizzas; Categorias
MNIST; Processamento de Imagens
IRIS; Processamento de Imagens
IRIS; Processamento da Linguagem Natural
MNIST; Processamento de Linguagem Natural
Respondido em 18/11/2022 15:28:46

Explicação:
Questão8
a
Questão9
a
Questão10
a
18/11/2022 15:38 Estácio: Alunos
https://ead.estacio.br/alunos/ 5/5
O conjunto MNIST de dígitos escritos a mão é um dos conjuntos mais conhecidos na literatura de aprendizado
de máquina. Mas, essa fama não é à toa, pois esse é o conjunto de comparação entre modelos de
processamentode imagens, uma vez que uma boa configuração de rede neural deve ser capaz de reconhecer os
dígitos escritos a mão do MNIST.

javascript:abre_colabore('38403','299980794','5946949028');