Baixe o app para aproveitar ainda mais
Prévia do material em texto
Disc.: BIG DATA Acertos: 10,0 de 10,0 09/05/2022 1a Questão Acerto: 1,0 / 1,0 ANAC 2016 - ANALISTA ADMINISTRATIVO - ANÁLISE DE SISTEMAS /ESAF) Big Data é: Dimensão + variedade + otimização + veracidade, tudo agregando + agilidade Volume + variedade + agilidade + efetividade, tudo agregando + valor + atualidade Volume + disponibilidade + velocidade + portabilidade, tudo requerendo ¿ valor Volume + variedade + velocidade + veracidade, tudo agregando + valor Volume + oportunidade + segurança + veracidade, tudo agregando + valor Explicação: A proposta de uma solução de Big Data é oferecer uma abordagem consistente no tratamento do constante crescimento e da complexidade dos dados. Para tanto, o conceito considera os 5 V¿s do Big Data: o Volume, a Velocidade, a Variedade, a Veracidade e o Valo 2a Questão Acerto: 1,0 / 1,0 Com relação aos fundamentos e aos conceitos de Big Data, julgue os itens a seguir. I - O volume de dados é uma característica importante de Big Data. II - Em Big Data, a qualidade do dado não tem importância, porque a transformação dos dados não impacta os negócios. III - A característica de velocidade de entrada dos dados impacta o modelo de processamento e armazenamento. IV - A variedade dos dados não é característica intrínseca nos fundamentos de Big Data. Estão certos apenas os itens I e II II e IV II, III e IV I, III e IV I e III 3a Questão Acerto: 1,0 / 1,0 Bancos de Dados não relacionais, também conhecidos como NoSQL, surgiram para armazenar dados não estruturados, usando modelos de armazenamento específicos para os tipos de dados que são armazenados, usualmente, fugindo do padrão de armazenamento de linhas e colunas dos bancos de dados tradicionais. Em relação ao Banco de Dados NoSQL, quais são as categorias consideradas para esse tipo de armazenamento? Armazéns chave-valor; Normalização; Banco de dados orientados a coluna Primeira forma normal; Banco de dados orientados a documentos; Normalização Banco de dados de grafos; Banco de dados orientados a linha; Formas normais de armazenamento Banco de dados orientados a linha; Normalização; Banco de dados orientados a coluna Armazéns chave-valor; Banco de dados orientados a documentos; Banco de dados de grafos 4a Questão Acerto: 1,0 / 1,0 O conceito de computação em nuvem (em inglês, cloud computing) refere-se: À utilização da memória e da capacidade de armazenamento e cálculo de computadores e servidores compartilhados e interligados por meio da Internet, seguindo o princípio da computação em grade Ao protocolo de comunicação da comada de aplicação utilizado para sistemas de informação de hipermídia, distribuídos e colaborativos, representando a base para a comunicação de dados da World Wide Web Ao armazenamento de dados feito em serviços que poderão ser acessados de qualquer lugar do mundo, a qualquer hora, havendo necessidade de instalação de programas ou, por vezes, de armazenar dados À tecnologia de comunicação de dados que permite uma transmissão de dados mais rápida através de linhas de telefone do que um modem convencional pode oferecer, sendo os dados transmitidos mais rapidamente em uma direção do que na outra, assimetricamente Ao programa que habilita seus usuários a interagirem com documentos HTML hospedados em um servidor da rede, destacando-se na era da web 2.0, uma vez que quase tudo do que se necessita está online 5a Questão Acerto: 1,0 / 1,0 Existem algoritmos de análise que têm como objetivo utilizar atributos de um objeto para prever um valor numérico contínuo. Esses algoritmos são do tipo: Classificação Associação Regressão Sumarização Agrupamento Explicação: Regressão 6a Questão Acerto: 1,0 / 1,0 Existe uma série de ferramentas para visualização de dados. Algumas delas foram desenvolvidas para serem utilizadas no software R. Marque a opção em que SOMENTE há exemplos de recursos do software R. Shiny e graphX Power BI e plotly MarkLogic e graphX Ploty e rcmdr Matplotlib e pentaho 7a Questão Acerto: 1,0 / 1,0 Assinale a opção correta sobre MapReduce, de acordo com Hurwitz (2015) A técnica MapReduce é utilizada pelos SGBD para a criação de gatilhos nas tabelas no banco de dados relacionais. No MapReduce, a função Map coloca um valor inicial em uma variável acumuladora e, então, processa cada elemento de uma lista passada pela função Reduce e, ao final, retorna um resultado do acumulador. Apesar da utilização da técnica MapReduce para tratar grandes volumes de dados no contexto de Big Data, não é recomendável a sua utilização em uma arquitetura distribuída, virtualizada ou multiprocessada. No contexto de Big Data, a técnica MapReduce não é utilizada por ser pouco eficiente quando o volume de dados é muito alto. MapReduce é uma estrutura de software que permite que desenvolvedores escrevam programas que possam processar quantidades massivas de dados desestruturados em paralelo, por meio de um grupo distribuído de processadores. 8a Questão Acerto: 1,0 / 1,0 O Sqoop foi projetado para transferir dados entre sistemas de gerenciamento de banco de dados relacional e o Hadoop. Ele automatiza a maior parte do processo de transformação de dados e realiza as importações e exportação via: JDBC ResourceManager Nimbus Spouts HQL Explicação: JDBC 9a Questão Acerto: 1,0 / 1,0 (TRT - 11ª Região AM e RR 2016) Um dos servidores computacionais do TRT utiliza o esquema de armazenamento RAID 1 no qual os dados são armazenados de forma: fracionada byte a byte com a paridade armazenada em um disco dedicado. fracionada em setores com a paridade armazenada em um disco dedicado. fracionada com a paridade armazenada de forma distribuída nos discos. espelhada entre os discos para aumentar a confiabilidade. distribuída nos discos para aumentar o desempenho. Explicação: Espelhada entre os discos para aumentar a confiabilidade. 10a Questão Acerto: 1,0 / 1,0 Marque a opção que melhor descreve as funcionalidades de GraphX. Conjunto de bibliotecas de alto nível que fornecem uma abstração para consultar um conjunto de dados em cache como se fossem tabelas de um bando de dados relacional; Ferramenta especializada em otimizar o processamento de dados em cluster através da divisão de jobs em pequenas tarefas relacionadas. Tais relacionamentos são expressos através de grafos direcionados acíclicos que são executadas em paralelo; Conjunto de bibliotecas com funcionalidades para agregar, comparar e unir dados heterogêneos. Framework que simplifica as tarefas de análise de gráficos, fornece a capacidade de realizar operações em grafos direcionados e com propriedades anexadas a cada vértice e aresta; Framework desenvolvido para coletar, agregar e mover grandes volumes de dados de várias fontes distintas para o conjunto de dados distribuídos resilientes do Spark; Explicação: Framework que simplifica as tarefas de análise de gráficos, fornece a capacidade de realizar operações em grafos direcionados e com propriedades anexadas a cada vértice e aresta.
Compartilhar