Baixe o app para aproveitar ainda mais
Prévia do material em texto
29/03/2022 00:37 Estácio: Alunos https://simulado.estacio.br/alunos/ 1/5 Simulado AV Teste seu conhecimento acumulado Disc.: TÓPICOS DE BIG DATA EM PYTHON Aluno(a): VICTOR AMADEU OLIVEIRA PIRES DOS SANTOS 202107296313 Acertos: 7,0 de 10,0 29/03/2022 Acerto: 1,0 / 1,0 Em relação aos desafios do processamento de fluxo de dados, selecione a opção correta. Garantir a qualidade dos dados através de ferramentas de controle que não aceitem qualquer inconsistência. Usar algoritmos de criptografia nos dados para evitar o acesso indevido. Garantir a consistência da informação através da ordenação dos dados. Dimensionar o projeto logo no início para evitar a necessidade de expansão posteriormente. Aplicar recursos de redundância no projeto para reduzir a volatilidade dos dados. Respondido em 29/03/2022 00:34:32 Explicação: Nas aplicações de streaming de dados, dificilmente não vai ocorrer alguma inconsistência, pois, normalmente, elas estão contextualizadas em ambientes dinâmicos. Portanto, deve-se ordenar os dados para manter a consistência dos dados e, além disso, o sistema deve ter uma tolerância a falhas sendo capaz de operar ainda que haja problemas, desde que estejam dentro de um patamar de qualidade pré-estabelecido. Acerto: 1,0 / 1,0 Em relação ao protocolo de transporte para transmissão de aplicações de streaming, selecione a opção correta. CoAP UDP HTTP TCP MQTT Respondido em 29/03/2022 00:17:58 Explicação: O protocolo UDP - protocolo de datagrama do usuário - é utilizado para aplicações de streaming por ser mais rápido. O protocolo TCP é orientado à confiabilidade e, no caso de aplicações de streaming, ele é muito lento inviabilizando a aplicação. Os protocolos HTTP, MQTT e CoAP não se enquadram no transporte de dados. Questão1 a Questão2 a https://simulado.estacio.br/alunos/inicio.asp javascript:voltar(); 29/03/2022 00:37 Estácio: Alunos https://simulado.estacio.br/alunos/ 2/5 Acerto: 1,0 / 1,0 O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop. Lua Java Script Perl Java Python Respondido em 29/03/2022 00:11:59 Explicação: O Hadoop foi desenvolvido usando, originalmente, a linguagem de programação Java na distribuição livre da Apache Foundation. Atualmente, diferentes distribuições do framework estão implementadas em diversas linguagens, entre as quais o Python. Acerto: 0,0 / 1,0 O Hadoop é um framework de código aberto voltado para aplicações de Big Data. Neste sentido, selecione a alternativa correta que apresenta um grande desafio no processo de configuração e gerenciamento do Hadoop. Tratar dados não-estruturados. Aplicar políticas de segurança. Processos de extração, transformação e carregamento dos dados. Gerenciamento do armazenamento de dados. Mecanismo para melhorar o processamento dos dados. Respondido em 29/03/2022 00:27:03 Explicação: O tratamento da segurança da informação é um grande desafio para o Hadoop, pois o profissional responsável por essa etapa terá que configurar o sistema que, pela natureza dos problemas de Big Data, é uma tarefa complexa. Acerto: 1,0 / 1,0 Selecione a opção correta que contenha a operação responsável por retornar um subconjunto aleatório dos dados de entrada. distinct mapRandom random sample filter Respondido em 29/03/2022 00:28:31 Explicação: Gabarito: sample Questão3 a Questão4 a Questão5 a 29/03/2022 00:37 Estácio: Alunos https://simulado.estacio.br/alunos/ 3/5 Justificativa: A operação responsável por retornar um subconjunto aleatório dos dados é a sample. É uma operação da categoria de transformação, sendo que se encaixa em transformações amplas, pois pode ser necessário realizar movimentações entre as partições. Filter é uma função que retorna um subconjunto de dados em relação a alguma condição imposta, portanto não há aleatoriedade. Random e mapRandom não são funções válidas para o Spark. Distinct retorna um RDD com elementos diferentes de um RDD de entrada. Acerto: 1,0 / 1,0 Atualmente, o Apache Spark, é o mais bem-sucedido framework para Big Data. Selecione a opção correta que contenha apenas funções que podem ser categorizadas como transformações no Spark. map, filter e union. count, collect e take. map, take e reduce. map, sample e collect. reduce, first e map. Respondido em 29/03/2022 00:35:56 Explicação: Gabarito: map, filter e union. Justificativa: Algumas das funções de transformação no Spark são: map, filter, union, flatMap, mapPartitions e sample. As citadas transformações, denominadas de transformações estreitas, resultam da aplicação de funções de mapeamento e de filtragem, sendo que os dados se originam de uma única partição. Acerto: 1,0 / 1,0 A linguagem Python se destaca como intuitiva e de fácil aprendizagem. Analise o código abaixo que apresenta laços condicionais e instruções de repetição. for i in range(10): if (i%2==0): print(i) Qual a saída esperada após a execução do programa? Serão impressos no console os números ímpares entre 0 e 9. Serão impressos no console os números pares entre 1 e 10. Serão impressos no console os números pares entre 0 e 9. Serão impressos no console os números ímpares entre 0 e 10. Serão impressos no console os números racionais entre 0 e 9. Respondido em 29/03/2022 00:30:10 Explicação: O constructo de laço que itera sobre uma sequência dos números reais de 0 a 9, e cujo condicional dentro do laço escolhe apenas os números cujo resto de sua divisão por 2 seja 0, condição lógica que define se um número é par ou não. Acerto: 0,0 / 1,0 Dados categóricos são aqueles normalmente expressos por texto, que representam rótulos, nomes e símbolos. Questão6 a Questão7 a Questão8 a 29/03/2022 00:37 Estácio: Alunos https://simulado.estacio.br/alunos/ 4/5 Qual tipo de visualização de dados abaixo é recomendado para dados categóricos? Gráficos de Barra. Gráficos de Linha. Gráfico de Estrela. Gráfico de Faces de Chernoff. Gráfico de Matriz de Dispersão. Respondido em 29/03/2022 00:32:42 Explicação: O gráfico de barras mostra as proporções dos dados categóricos assim evidenciando os extratos da amostra. Lembrando que os dados categóricos não se encaixam nos gráficos de dados numéricos, como o de dispersão causando confusão na função de visualização ou quebrando a mesma dependendo da biblioteca escolhida. Acerto: 0,0 / 1,0 Como podemos checar as métricas de classificação do modelo neural da biblioteca Scikit-Learn? Gráfico de Histograma Regressão Linear Classification Report Gráfico de Matriz de Dispersão Plotly Respondido em 29/03/2022 00:36:26 Explicação: O classification report é um dos métodos oferecidos pelo scikit-learn que nos permite usar um conjunto ground truth para comparar contra as predições de um modelo e este calculará as métricas de acurácia, precisão e medida F de cada classe possível e também as mesmas métricas em um nível macro. Acerto: 1,0 / 1,0 Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial? KDM. SIGKDD. SIGM. KDD-DM. CRISP-DM. Respondido em 29/03/2022 00:15:56 Explicação: O processo de tamanho similar ao KDD cujo âmbito industrial se beneficia mais devido à suas etapas de entendimento do negócio é o CRISP-DM, processo esse que, diferentemente do KDD, contempla a entrega do artefato de aprendizado de máquina. Questão9 a Questão10 a 29/03/2022 00:37 Estácio: Alunos https://simulado.estacio.br/alunos/ 5/5 javascript:abre_colabore('38403','279167845','5167478947');
Compartilhar