Prévia do material em texto
Simulado AV Teste seu conhecimento acumulado Disc.: TÓPICOS DE BIG DATA EM PYTHON Aluno(a): WILLAMES RIBEIRO DE ASSIS 202003083551 Acertos: 6,0 de 10,0 29/03/2022 Acerto: 1,0 / 1,0 Em relação aos V's que caracterizam os projetos de Big Data, selecione a opção que trata do processamento dos dados. variedade volume veracidade velocidade valor Respondido em 29/03/2022 17:35:29 Explicação: A característica velocidade trata da rapidez de geração e processamento dos dados. Variedade diz respeito ao formato dos dados, valor está relacionado ao resultado útil da análise dos dados, volume significa a quantidade de dados disponíveis para tratamento e a veracidade diz respeito à confiabilidade da origem dos dados. Acerto: 0,0 / 1,0 Em relação às plataformas para Internet das Coisas, selecione a opção correta sobre o Arduino. É um ecossistema que envolve software e hardware É um programa É um protocolo de internet das coisas É uma placa de hardware É o outro nome para Raspberry PI Respondido em 29/03/2022 17:38:41 Explicação: O arduino é uma tecnologia que combina hardware e software e é utilizada para internet das coisas. Portanto, não é um programa, nem uma placa de hardware e tão pouco um protocolo de comunicação. Já o Raspberry PI não é o mesmo que Arduino, pois se trata de uma outra tecnologia para internet das coisas. Questão1 a Questão2 a https://simulado.estacio.br/alunos/inicio.asp javascript:voltar(); Acerto: 1,0 / 1,0 Selecione a opção que indica o processo responsável por executar uma tarefa atribuída a ele pelo Job Tracker. Task Tracker Job Tracker Slave MapReduce MapTracker MapJob Respondido em 29/03/2022 17:56:54 Explicação: O JobTracker envia as informações necessárias para a execução de uma tarefa para o TaskTracker que, por sua vez, executa a tarefa e envia os resultados de volta para JobTracker, além de fazer o seu rastreamento. Acerto: 0,0 / 1,0 Em relação as fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela geração de pares intermediários de valor e chave. Redução Combinação Agrupamento Gravação da saída Embaralhamento Respondido em 29/03/2022 18:26:16 Explicação: Através do processo de embaralhamento, também conhecido pelo termo em inglês "shuffling", o mecanismo MapReduce faz a geração de pares intermediários de valor e chave que são transferidos para a fase de redução, o que é realizado em paralelo com outras tarefas da fase de mapeamento. Acerto: 1,0 / 1,0 O PySpark caracteriza-se como uma biblioteca Spark responsável por executar programas usando recursos do Apache Spark. Selecione a opção correta que contenha itens que são pré-requisitos de instalação para utilização do PySpark. Java e R Hadoop e Spark Python e Escala Java e Python Casandra e Spark Respondido em 29/03/2022 18:24:35 Explicação: Gabarito: Java e Python Justificativa: A utilização do PySpark depende principalmente de três pré-requisitos: instalação e configuração do Java, Python e do Spark. Além disso, é necessário tratar detalhes da plataforma sobre a qual o Spark vai rodar. No caso do Google Colab, é necessário instalar o FindSpark e o próprio PySpark também. Questão3 a Questão4 a Questão5 a Acerto: 0,0 / 1,0 Observe o trecho de código abaixo query = "SELECT * FROM tabela_teste WHERE valor = "+str(str_valor) registros = spark.sql(query) Selecione a opção correta a respeito dele. É possível afirmar que a tabela_teste existe. Trata-se de um exemplo de utilização do Spark SQL É um exemplo de aplicação de GraphX. A execução do trecho de código vai funcionar corretamente. A implementação do trecho de código está errada. Respondido em 29/03/2022 18:23:47 Explicação: Gabarito: Trata-se de um exemplo de utilização do Spark SQL Justificativa: O trecho de código corresponde a uma aplicação do Spark SQL. Esse componente viabiliza a utilização de código SQL que facilita bastante a manipulação de dados estruturados. A implementação está codificada corretamente, apesar de não ser possível afirmar se vai executar sem erros, pois no código não aparecem informações que permitam fazer afirmações sobre a execução. Acerto: 1,0 / 1,0 A linguagem Python se destaca como intuitiva e de fácil aprendizagem. Analise o código abaixo que apresenta laços condicionais e instruções de repetição. for i in range(10): if (i%2==0): print(i) Qual a saída esperada após a execução do programa? Serão impressos no console os números pares entre 0 e 9. Serão impressos no console os números racionais entre 0 e 9. Serão impressos no console os números pares entre 1 e 10. Serão impressos no console os números ímpares entre 0 e 10. Serão impressos no console os números ímpares entre 0 e 9. Respondido em 29/03/2022 18:08:08 Explicação: O constructo de laço que itera sobre uma sequência dos números reais de 0 a 9, e cujo condicional dentro do laço escolhe apenas os números cujo resto de sua divisão por 2 seja 0, condição lógica que define se um número é par ou não. Acerto: 1,0 / 1,0 A visualização dos dados é fundamental no processo de análise e interpretação. Qual o tipo de visualização de Questão6 a Questão7 a Questão8 a dados mais indicada para dados temporais? Gráfico de Estrela. Gráfico de Faces de Chernoff. Gráfico de Linha. Gráfico de Barra. Gráfico de Matriz de Dispersão. Respondido em 29/03/2022 18:11:29 Explicação: O gráfico de linhas passa a visualização de cronologia, acompanhando a linha de vida do dado, mostrando através das inclinações ou gradientes, o crescimento ou decrescimento do dado. As demais alternativas indicam tipos de visualização inadequados para dados temporais. Acerto: 1,0 / 1,0 Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial? KDM. SIGM. SIGKDD. CRISP-DM. KDD-DM. Respondido em 29/03/2022 18:14:01 Explicação: O processo de tamanho similar ao KDD cujo âmbito industrial se beneficia mais devido à suas etapas de entendimento do negócio é o CRISP-DM, processo esse que, diferentemente do KDD, contempla a entrega do artefato de aprendizado de máquina. Acerto: 0,0 / 1,0 Alfredo começou em um laboratório de pesquisa e inovação no começo deste ano. Este laboratório investiga a relação entre trocas de mensagens em redes sociais e variações na bolsa de valores, dependendo principalmente de modelos de redes neurais recorrentes. Com qual tipo de IA Alfredo está lidando? IA Pura IA Quântica IA Simbólica IA SubSimbólica IA Biológica Respondido em 29/03/2022 18:22:26 Explicação: As redes neurais são modelos conexionistas ou subsimbólicas, pois encontram conhecimento nos dados a partir de inferências estatísticas sem requerer regras pré-definidas, sendo essa a sua maior diferença dos modelos simbólicos, e sua vantagem sobre aqueles é a capacidade de atingir melhores predições por exatidão. Questão9 a Questão10 a javascript:abre_colabore('38403','279227573','5169491874'); javascript:abre_colabore('38403','279227573','5169491874');