Prévia do material em texto
BIG DATA SIMULADO 5 FASE 1a Questão Acerto: 1,0 / 1,0 Selecione a opção em que a computação se refere à execução de aplicações e serviços em uma rede distribuída usando recursos virtualizados. Computação de banco de dados Computação em Nuvem Computação centralizada Computação de Big Data Computação Paralela Respondido em 07/03/2023 16:53:12 Explicação: As aplicações de computação em nuvem são acessadas por protocolos de Internet e padrões de rede. As demais opções estão erradas, pois nenhuma delas trabalha obrigatoriamente com protocolos de internet. 2a Questão Acerto: 1,0 / 1,0 (NC-UFPR/2019 - Adaptada) Sobre a IoT (Internet das coisas) e seus blocos básicos de construção, identifique como verdadeiras (V) ou falsas (F) as seguintes afirmativas: ( ) Na IoT, os objetos podem prover comunicação entre usuários e dispositivos, viabilizando diversas aplicações, tais como coleta de dados de pacientes e monitoramento de idosos e sensoriamento de ambientes de difícil acesso. ( ) A tecnologia de IoT consiste na coexistência colaborativa de dois componentes: As "coisas" e os protocolos de rede que permitem a sua comunicação. ( ) Protocolos de comunicação: Viabilizam a troca de dados via Internet entre os objetos físicos e outros sistemas. Assinale a alternativa que apresenta a sequência correta, de cima para baixo. F V F V F V F F F V V F F V V Respondido em 07/03/2023 17:00:03 Explicação: O avanço da tecnologia criou dispositivos e sensores eletrônicos que geram enormes quantidades de dados. Esses equipamentos podem ser utilizados em diversas aplicações, tais como: coleta de dados de pacientes e monitoramento de idosos e sensoriamento de ambientes de difícil acesso. A tecnologia de IoT consiste na coexistência colaborativa de quatro componentes: Objetos físicos (ou "coisas"), Computação, Protocolos de comunicação e Serviços. 3a Questão Acerto: 1,0 / 1,0 A respeito do Hadoop, selecione a opção correta com o componente que faz o rastreamento de tarefas. MapReduce HDFS Mrjob Camada de ingestão Task manager Respondido em 07/03/2023 17:01:21 Explicação: O mecanismo MapReduce é responsável pela distribuição de tarefas em um cluster, através de rastreamento de tarefas (Task Trackers) e de trabalhos (Job Trackers). As demais alternativas, embora tenham relação com o Hadoop, não possuem a funcionalidade de rastreamento de tarefas. 4a Questão Acerto: 1,0 / 1,0 A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados. Replicação Bloco de dados YARN NameNode DataNode Respondido em 07/03/2023 17:02:29 Explicação: O DataNode é componente da arquitetura do HDFS responsável pelo armazenamento dos dados na forma de blocos de dados. 5a Questão Acerto: 1,0 / 1,0 Observe o trecho de código abaixo query = "SELECT * FROM tabela_teste WHERE valor = "+str(str_valor) registros = spark.sql(query) Selecione a opção correta a respeito dele. É um exemplo de aplicação de GraphX. A implementação do trecho de código está errada. É possível afirmar que a tabela_teste existe. Trata-se de um exemplo de utilização do Spark SQL A execução do trecho de código vai funcionar corretamente. Respondido em 07/03/2023 17:03:03 Explicação: Gabarito: Trata-se de um exemplo de utilização do Spark SQL Justificativa: O trecho de código corresponde a uma aplicação do Spark SQL. Esse componente viabiliza a utilização de código SQL que facilita bastante a manipulação de dados estruturados. A implementação está codificada corretamente, apesar de não ser possível afirmar se vai executar sem erros, pois no código não aparecem informações que permitam fazer afirmações sobre a execução. 6a Questão Acerto: 1,0 / 1,0 O paradigma MapReduce é uma estratégia de computação com capacidade de processar grandes conjuntos de dados de maneira distribuída em várias máquinas. Em relação à técnica MapReduce, selecione a opção que é responsável por consolidar os resultados produzidos ao longo do processamento. Redução Agregação Separação Mapeamento Processamento Respondido em 07/03/2023 17:04:09 Explicação: Gabarito: Redução Justificativa: A função de redução agrupa os pares após a fase de embaralhamento concluindo o processamento dos dados. O MapReduce é uma técnica clássica de programação distribuída e é bastante utilizada por diversos frameworks como o Spark, por exemplo. 7a Questão Acerto: 1,0 / 1,0 A visualização dos dados é fundamental no processo de análise e interpretação. Qual o tipo de visualização de dados mais indicada para dados temporais? Gráfico de Faces de Chernoff. Gráfico de Barra. Gráfico de Estrela. Gráfico de Matriz de Dispersão. Gráfico de Linha. Respondido em 07/03/2023 17:05:22 Explicação: O gráfico de linhas passa a visualização de cronologia, acompanhando a linha de vida do dado, mostrando através das inclinações ou gradientes, o crescimento ou decrescimento do dado. As demais alternativas indicam tipos de visualização inadequados para dados temporais. 8a Questão Acerto: 1,0 / 1,0 Eduardo quer mostrar aos gestores da empresa como as ações da carteira de investimentos recomendada que ele e o time dele propuseram estão valorizando e gerando muitos dividendos aos clientes. Para isso, Eduardo construiu um gráfico de ______, pois está lidando com dados ________ e quer mostrar o quão bem as recomendações geradas por seu time estão evoluindo. Respectivamente a resposta que completa as duas lacunas é: Linha; Numéricos Pizza; Numéricos Linha; Temporais Pizza; Categóricos Linha; Categóricos Respondido em 07/03/2023 16:54:30 Explicação: O gráfico correto é o de linhas, pois os dados são temporais, uma vez que Eduardo quer mostrar cronologia para os acionistas e o gráfico de linha representa muito bem isto, e os dados em questão variam ao longo de meses ou anos. Gráficos de pizza não se aplicam a dados temporais. Os dados não são simplesmente numéricos pois, em essência, estamos lidando com a cronologia, logo são dados temporais. O tipo de dados em que números variam no tempo não pode ser classificado como tipo categórico. 9a Questão Acerto: 1,0 / 1,0 Qual o objetivo da inteligência artificial ao simular comportamentos humanos na máquina? Viabilizar a computação paralela. Incrementar o uso da memória de longa duração do sistema. Fazer com que computadores acessem a internet mais rápido. Melhorar a capacidade de processamento de dados do sistema. Otimizar algoritmos para que eles se adaptem a contextos não previamente codificados. Respondido em 07/03/2023 17:06:29 Explicação: A razão por trás da existência da inteligência artificial é criar algoritmos e soluções capazes de se adaptar a novas situações que não necessariamente foram pré-programadas, mas se adapte pela experiência passada com casos similares. 10a Questão Acerto: 1,0 / 1,0 Luís foi contratado recentemente para trabalhar em uma empresa de consultoria de análise de dados. O projeto no qual foi alocado já havia começado, e os colegas de Luís lhe disseram que estavam preparando o conjunto de dados para poder passar os mesmos por um modelo de árvore de decisão. Já que especificamente os colegas de Luís estão removendo dados faltantes, em qual etapa do processo de KDD, Luís se encontra: Coleta de Dados. Transformação de Dados. Descoberta de Padrões. Pré-Processamento . Avaliação. Respondido em 07/03/2023 17:07:42 Explicação: Luís se encontra na faseque ocorre logo após selecionarmos dados, e antes da transformação do conjunto, que é justamente a fase de pré-processamento ou limpeza dos dados.