Prévia do material em texto
8/25/23, 1:31 PM Estácio: Alunos https://simulado.estacio.br/bdq_simulados_avaliacao_parcial_resultado.asp?cod_hist_prova=314937226&cod_prova=6584203806&f_cod_disc= 1/6 Meus Simulados Teste seu conhecimento acumulado Disc.: TÓPICOS DE BIG DATA EM PYTHON Aluno(a): FABRÍCIO MATHEUS DA COSTA 202105177759 Acertos: 10,0 de 10,0 25/08/2023 Acerto: 1,0 / 1,0 Selecione a opção em que a camada fornece comunicação ponta a ponta nas aplicações de internet das coisas. Camada de aplicação Camada de sessão Camada lógica Camada de enlace de dados Camada de transporte Respondido em 25/08/2023 13:27:14 Explicação: A camada de transporte é encarregada pela comunicação ponta a ponta entre as aplicações e oferece con�abilidade, além de garantir que os pacotes serão entregues da mesma forma que o usuário os enviou. Em relação às outras opções, a camada lógica simplesmente não existe. Já a camada de enlace de dados detecta erros e, quando necessário, os corrige. A camada de sessão trata dos processos responsáveis pela transferência de dados. Por �m, a camada de aplicação é responsável pela comunicação �m-a-�m entre processos. Acerto: 1,0 / 1,0 Em relação às plataformas para Internet das Coisas, selecione a opção correta sobre o Arduino. É o outro nome para Raspberry PI É um programa É uma placa de hardware É um ecossistema que envolve software e hardware É um protocolo de internet das coisas Respondido em 25/08/2023 13:27:27 Explicação: Questão1 a Questão2 a https://simulado.estacio.br/alunos/inicio.asp javascript:voltar(); 8/25/23, 1:31 PM Estácio: Alunos https://simulado.estacio.br/bdq_simulados_avaliacao_parcial_resultado.asp?cod_hist_prova=314937226&cod_prova=6584203806&f_cod_disc= 2/6 O arduino é uma tecnologia que combina hardware e software e é utilizada para internet das coisas. Portanto, não é um programa, nem uma placa de hardware e tão pouco um protocolo de comunicação. Já o Raspberry PI não é o mesmo que Arduino, pois se trata de uma outra tecnologia para internet das coisas. Acerto: 1,0 / 1,0 O Hadoop é um framework de código aberto voltado para aplicações de Big Data. Neste sentido, selecione a alternativa correta que apresenta um grande desa�o no processo de con�guração e gerenciamento do Hadoop. Mecanismo para melhorar o processamento dos dados. Processos de extração, transformação e carregamento dos dados. Aplicar políticas de segurança. Tratar dados não-estruturados. Gerenciamento do armazenamento de dados. Respondido em 25/08/2023 13:27:50 Explicação: O tratamento da segurança da informação é um grande desa�o para o Hadoop, pois o pro�ssional responsável por essa etapa terá que con�gurar o sistema que, pela natureza dos problemas de Big Data, é uma tarefa complexa. Acerto: 1,0 / 1,0 A respeito dos arquivos de con�guração do Hadoop, selecione a opção correta com as tags que fornecem acesso aos parâmetros de con�guração. Respondido em 25/08/2023 13:28:04 Explicação: As con�gurações dos arquivos do Hadoop são especi�cadas entre as tags con�gurations. As demais opções não representam tags corretas para parâmetros de con�gurações do Hadoop. Acerto: 1,0 / 1,0 O PySpark caracteriza-se como uma biblioteca Spark responsável por executar programas usando recursos do Apache Spark. Selecione a opção correta que contenha itens que são pré-requisitos de instalação para utilização do PySpark. Questão3 a Questão4 a Questão5 a 8/25/23, 1:31 PM Estácio: Alunos https://simulado.estacio.br/bdq_simulados_avaliacao_parcial_resultado.asp?cod_hist_prova=314937226&cod_prova=6584203806&f_cod_disc= 3/6 Java e Python Hadoop e Spark Python e Escala Java e R Casandra e Spark Respondido em 25/08/2023 13:28:28 Explicação: Gabarito: Java e Python Justi�cativa: A utilização do PySpark depende principalmente de três pré-requisitos: instalação e con�guração do Java, Python e do Spark. Além disso, é necessário tratar detalhes da plataforma sobre a qual o Spark vai rodar. No caso do Google Colab, é necessário instalar o FindSpark e o próprio PySpark também. Acerto: 1,0 / 1,0 O MapReduce é uma técnica clássica de programação e é bastante utilizada por diversos frameworks como o Spark, por exemplo. Em relação à técnica MapReduce, selecione a opção correta. Foi substituída no Spark por acesso direto à memória Consiste em uma técnica de programação sequencial É uma técnica de computação distribuída É uma técnica lenta para processamento de grandes volumes de dados Só pode ser aplicada para grandes volumes de dados Respondido em 25/08/2023 13:28:55 Explicação: Gabarito: É uma técnica de computação distribuída Justi�cativa: O MapReduce é uma técnica de computação distribuída que apesar de clássica ainda é considerada muito e�ciente para processamento de grandes volumes de dados. Apesar de ser adequada para projetos de big data, ela também pode ser utilizada para menores volumes, mas não é apropriada para esses casos. Acerto: 1,0 / 1,0 A linguagem Python fornece para o cientista de dados uma grande variedade de funções e bibliotecas. Qual o método que faz a projeção do Dataframe orientado pelos rótulos das colunas do conjunto? sum reset_index shuf�e iloc loc Respondido em 25/08/2023 13:29:32 Questão6 a Questão7 a 8/25/23, 1:31 PM Estácio: Alunos https://simulado.estacio.br/bdq_simulados_avaliacao_parcial_resultado.asp?cod_hist_prova=314937226&cod_prova=6584203806&f_cod_disc= 4/6 Explicação: Através do método loc, passando o nome da coluna ou colunas desejadas entre colchetes, é aplicada a operação de projeção do DataFrame, de acordo com o objetivo desejado. As demais alternativas não dizem respeito à projeção do DataFrame. Acerto: 1,0 / 1,0 A visualização dos dados é fundamental no processo de análise e interpretação. Qual o tipo de visualização de dados mais indicada para dados temporais? Grá�co de Estrela. Grá�co de Barra. Grá�co de Faces de Chernoff. Grá�co de Matriz de Dispersão. Grá�co de Linha. Respondido em 25/08/2023 13:29:49 Explicação: O grá�co de linhas passa a visualização de cronologia, acompanhando a linha de vida do dado, mostrando através das inclinações ou gradientes, o crescimento ou decrescimento do dado. As demais alternativas indicam tipos de visualização inadequados para dados temporais. Acerto: 1,0 / 1,0 Qual destes modelos é adequado para um problema de classi�cação? I - SVM II - Árvore de Decisão III - K-Médias Todas as opções I, II e III Apenas as opções II e III Apenas as opções I e III Apenas a opção III Apenas as opções I e II Respondido em 25/08/2023 13:30:07 Explicação: O aprendizado supervisionado contempla duas técnicas de aprendizado de máquina, a regressão e a classi�cação. Da classi�cação nossas opções são a árvore de decisão, a SVM, o KNN, as redes neurais entre outras. Mas, o modelo k-médias é uma técnica de aprendizado não supervisionado. Questão8 a Questão9 a 8/25/23, 1:31 PM Estácio: Alunos https://simulado.estacio.br/bdq_simulados_avaliacao_parcial_resultado.asp?cod_hist_prova=314937226&cod_prova=6584203806&f_cod_disc= 5/6 Acerto: 1,0 / 1,0 Questão10 a 8/25/23, 1:31 PM Estácio: Alunos https://simulado.estacio.br/bdq_simulados_avaliacao_parcial_resultado.asp?cod_hist_prova=314937226&cod_prova=6584203806&f_cod_disc= 6/6 Leonardo começou seu trabalho de conclusão de curso. Nesse trabalho, Leonardo quer elaborar um classi�cador de imagem, mas, não sabe se decidir com relação à con�guração das camadas de sua rede neural. É muito comum utilizarmos o conjunto ________ para fazermos o benchmark de modelos de ______________: IRIS; Processamento de Imagens MNIST; Processamento de Linguagem Natural Pizzas; Categorias MNIST; Processamento de Imagens IRIS; Processamento da Linguagem Natural Respondido em 25/08/2023 13:30:38 Explicação: O conjunto MNIST de dígitos escritos a mão é um dos conjuntos mais conhecidos na literatura de aprendizado de máquina. Mas,essa fama não é à toa, pois esse é o conjunto de comparação entre modelos de processamento de imagens, uma vez que uma boa con�guração de rede neural deve ser capaz de reconhecer os dígitos escritos a mão do MNIST.