Buscar

Tópicos de Big data em Python - SimuladoNAV

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

8/25/23, 1:31 PM Estácio: Alunos
https://simulado.estacio.br/bdq_simulados_avaliacao_parcial_resultado.asp?cod_hist_prova=314937226&cod_prova=6584203806&f_cod_disc= 1/6
 
Meus
Simulados
Teste seu conhecimento acumulado
Disc.: TÓPICOS DE BIG DATA EM PYTHON   
Aluno(a): FABRÍCIO MATHEUS DA COSTA 202105177759
Acertos: 10,0 de 10,0 25/08/2023
Acerto: 1,0  / 1,0
Selecione a opção em que a camada fornece comunicação ponta a ponta nas aplicações de internet das coisas.
Camada de aplicação
Camada de sessão
Camada lógica
Camada de enlace de dados
 Camada de transporte
Respondido em 25/08/2023 13:27:14
Explicação:
A camada de transporte é encarregada pela comunicação ponta a ponta entre as aplicações e oferece con�abilidade, além
de garantir que os pacotes serão entregues da mesma forma que o usuário os enviou. Em relação às outras opções, a
camada lógica simplesmente não existe. Já a camada de enlace de dados detecta erros e, quando necessário, os corrige. A
camada de sessão trata dos processos responsáveis pela transferência de dados. Por �m, a camada de aplicação é
responsável pela comunicação �m-a-�m entre processos.
Acerto: 1,0  / 1,0
Em relação às plataformas para Internet das Coisas, selecione a opção correta sobre o Arduino.
É o outro nome para Raspberry PI
É um programa
É uma placa de hardware
 É um ecossistema que envolve software e hardware
É um protocolo de internet das coisas
Respondido em 25/08/2023 13:27:27
Explicação:
 Questão1
a
 Questão2
a
https://simulado.estacio.br/alunos/inicio.asp
javascript:voltar();
8/25/23, 1:31 PM Estácio: Alunos
https://simulado.estacio.br/bdq_simulados_avaliacao_parcial_resultado.asp?cod_hist_prova=314937226&cod_prova=6584203806&f_cod_disc= 2/6
O arduino é uma tecnologia que combina hardware e software e é utilizada para internet das coisas. Portanto, não é um
programa, nem uma placa de hardware e tão pouco um protocolo de comunicação. Já o Raspberry PI não é o mesmo que
Arduino, pois se trata de uma outra tecnologia para internet das coisas.
Acerto: 1,0  / 1,0
O Hadoop é um framework de código aberto voltado para aplicações de Big Data. Neste sentido, selecione a
alternativa correta que apresenta um grande desa�o no processo de con�guração e gerenciamento do Hadoop.
Mecanismo para melhorar o processamento dos dados.
Processos de extração, transformação e carregamento dos dados.
 Aplicar políticas de segurança.
Tratar dados não-estruturados.
Gerenciamento do armazenamento de dados.
Respondido em 25/08/2023 13:27:50
Explicação:
O tratamento da segurança da informação é um grande desa�o para o Hadoop, pois o pro�ssional responsável por essa
etapa terá que con�gurar o sistema que, pela natureza dos problemas de Big Data, é uma tarefa complexa.
Acerto: 1,0  / 1,0
A respeito dos arquivos de con�guração do Hadoop, selecione a opção correta com as tags que fornecem acesso
aos parâmetros de con�guração.
 
Respondido em 25/08/2023 13:28:04
Explicação:
As con�gurações dos arquivos do Hadoop são especi�cadas entre as tags con�gurations. As demais opções não
representam tags corretas para parâmetros de con�gurações do Hadoop.
Acerto: 1,0  / 1,0
O PySpark caracteriza-se como uma biblioteca Spark responsável por executar programas usando recursos do
Apache Spark. Selecione a opção correta que contenha itens que são pré-requisitos de instalação para utilização do
PySpark.
 Questão3
a
 Questão4
a
 Questão5
a
8/25/23, 1:31 PM Estácio: Alunos
https://simulado.estacio.br/bdq_simulados_avaliacao_parcial_resultado.asp?cod_hist_prova=314937226&cod_prova=6584203806&f_cod_disc= 3/6
 Java e Python
Hadoop e Spark
Python e Escala
Java e R
Casandra e Spark
Respondido em 25/08/2023 13:28:28
Explicação:
Gabarito: Java e Python
Justi�cativa: A utilização do PySpark depende principalmente de três pré-requisitos: instalação e con�guração do Java,
Python e do Spark. Além disso, é necessário tratar detalhes da plataforma sobre a qual o Spark vai rodar. No caso do
Google Colab, é necessário instalar o FindSpark e o próprio PySpark também.
Acerto: 1,0  / 1,0
O MapReduce é uma técnica clássica de programação e é bastante utilizada por diversos frameworks como o Spark,
por exemplo. Em relação à técnica MapReduce, selecione a opção correta.
Foi substituída no Spark por acesso direto à memória
Consiste em uma técnica de programação sequencial
 É uma técnica de computação distribuída
É uma técnica lenta para processamento de grandes volumes de dados
Só pode ser aplicada para grandes volumes de dados
Respondido em 25/08/2023 13:28:55
Explicação:
Gabarito: É uma técnica de computação distribuída
Justi�cativa: O MapReduce é uma técnica de computação distribuída que apesar de clássica ainda é considerada muito
e�ciente para processamento de grandes volumes de dados. Apesar de ser adequada para projetos de big data, ela
também pode ser utilizada para menores volumes, mas não é apropriada para esses casos.
Acerto: 1,0  / 1,0
A linguagem Python fornece para o cientista de dados uma grande variedade de funções e bibliotecas. Qual o
método que faz a projeção do Dataframe orientado pelos rótulos das colunas do conjunto?
sum
reset_index
shuf�e
iloc
 loc
Respondido em 25/08/2023 13:29:32
 Questão6
a
 Questão7
a
8/25/23, 1:31 PM Estácio: Alunos
https://simulado.estacio.br/bdq_simulados_avaliacao_parcial_resultado.asp?cod_hist_prova=314937226&cod_prova=6584203806&f_cod_disc= 4/6
Explicação:
Através do método loc, passando o nome da coluna ou colunas desejadas entre colchetes, é aplicada a operação de
projeção do DataFrame, de acordo com o objetivo desejado. As demais alternativas não dizem respeito à projeção do
DataFrame.
Acerto: 1,0  / 1,0
A visualização dos dados é fundamental no processo de análise e interpretação. Qual o tipo de visualização de
dados mais indicada para dados temporais?
Grá�co de Estrela.
Grá�co de Barra.
Grá�co de Faces de Chernoff.
Grá�co de Matriz de Dispersão.
 Grá�co de Linha.
Respondido em 25/08/2023 13:29:49
Explicação:
O grá�co de linhas passa a visualização de cronologia, acompanhando a linha de vida do dado, mostrando através das
inclinações ou gradientes, o crescimento ou decrescimento do dado. As demais alternativas indicam tipos de visualização
inadequados para dados temporais.
Acerto: 1,0  / 1,0
Qual destes modelos é adequado para um problema de classi�cação?
I - SVM
II - Árvore de Decisão
III - K-Médias
Todas as opções I, II e III
Apenas as opções II e III
Apenas as opções I e III
Apenas a opção III
 Apenas as opções I e II
Respondido em 25/08/2023 13:30:07
Explicação:
O aprendizado supervisionado contempla duas técnicas de aprendizado de máquina, a regressão e a classi�cação. Da
classi�cação nossas opções são a árvore de decisão, a SVM, o KNN, as redes neurais entre outras. Mas, o modelo k-médias
é uma técnica de aprendizado não supervisionado.
 Questão8
a
 Questão9
a
8/25/23, 1:31 PM Estácio: Alunos
https://simulado.estacio.br/bdq_simulados_avaliacao_parcial_resultado.asp?cod_hist_prova=314937226&cod_prova=6584203806&f_cod_disc= 5/6
Acerto: 1,0  / 1,0 Questão10
a
8/25/23, 1:31 PM Estácio: Alunos
https://simulado.estacio.br/bdq_simulados_avaliacao_parcial_resultado.asp?cod_hist_prova=314937226&cod_prova=6584203806&f_cod_disc= 6/6
Leonardo começou seu trabalho de conclusão de curso. Nesse trabalho, Leonardo quer elaborar um classi�cador de
imagem, mas, não sabe se decidir com relação à con�guração das camadas de sua rede neural. É muito comum
utilizarmos o conjunto ________ para fazermos o benchmark de modelos de ______________:
IRIS; Processamento de Imagens
MNIST; Processamento de Linguagem Natural
Pizzas; Categorias
 MNIST; Processamento de Imagens
IRIS; Processamento da Linguagem Natural
Respondido em 25/08/2023 13:30:38
Explicação:
O conjunto MNIST de dígitos escritos a mão é um dos conjuntos mais conhecidos na literatura de aprendizado de
máquina. Mas,essa fama não é à toa, pois esse é o conjunto de comparação entre modelos de processamento de imagens,
uma vez que uma boa con�guração de rede neural deve ser capaz de reconhecer os dígitos escritos a mão do MNIST.

Mais conteúdos dessa disciplina