Prévia do material em texto
Disc.: BIG DATA Aluno(a): MICHEL GRIPP ROSA 202009287654 Acertos: 10,0 de 10,0 29/03/2021 Acerto: 1,0 / 1,0 Big Data se refere ao imenso volume de conjuntos de dados que alcançam elevadas ordens de magnitude. O valor real do Big Data está no insight que ele produz quando analisado ¿ buscando padrões, derivando significado, tomando decisões e, por fim, respondendo ao mundo com inteligência. Referente ao Big Data, é correto afirmar que o termo variedade refere-se: Aos data centers físicos que transformam os dados em informações pertinentes ao negócio A um conjunto de dados que são gerados em tempo real, o que requer a oferta imediata de informações úteis A um conjunto de dados mais diversos, incluindo dados estruturados, semiestruturados e não estruturados. É heterogêneo e vem em muitos formatos, incluindo texto, documento, imagem, vídeo e outros Ao banco de dados homogêneo que trata de informações do mesmo tipo definindo padrões de segurança Ao controle de dados semiestruturados de formatos definidos como texto e números Respondido em 05/04/2021 13:09:37 Acerto: 1,0 / 1,0 Com relação aos fundamentos e aos conceitos de Big Data, julgue os itens a seguir. I - O volume de dados é uma característica importante de Big Data. II - Em Big Data, a qualidade do dado não tem importância, porque a transformação dos dados não impacta os negócios. III - A característica de velocidade de entrada dos dados impacta o modelo de processamento e armazenamento. IV - A variedade dos dados não é característica intrínseca nos fundamentos de Big Data. Estão certos apenas os itens I, III e IV I e III II, III e IV II e IV I e II Respondido em 05/04/2021 13:09:42 Acerto: 1,0 / 1,0 Bancos de Dados não relacionais, também conhecidos como NoSQL, surgiram para armazenar dados não estruturados, usando modelos de armazenamento específicos para os tipos de dados que são armazenados, usualmente, fugindo do padrão de armazenamento de linhas e colunas dos bancos de dados tradicionais. Em relação ao Banco de Dados NoSQL, quais são as categorias consideradas para esse tipo de armazenamento? Questão1 a Questão2 a Questão3 a https://simulado.estacio.br/alunos/inicio.asp javascript:voltar(); Banco de dados de grafos; Banco de dados orientados a linha; Formas normais de armazenamento Armazéns chave-valor; Normalização; Banco de dados orientados a coluna Armazéns chave-valor; Banco de dados orientados a documentos; Banco de dados de grafos Primeira forma normal; Banco de dados orientados a documentos; Normalização Banco de dados orientados a linha; Normalização; Banco de dados orientados a coluna Respondido em 05/04/2021 13:10:03 Acerto: 1,0 / 1,0 O conceito de computação em nuvem (em inglês, cloud computing) refere-se: Ao armazenamento de dados feito em serviços que poderão ser acessados de qualquer lugar do mundo, a qualquer hora, havendo necessidade de instalação de programas ou, por vezes, de armazenar dados Ao protocolo de comunicação da comada de aplicação utilizado para sistemas de informação de hipermídia, distribuídos e colaborativos, representando a base para a comunicação de dados da World Wide Web À utilização da memória e da capacidade de armazenamento e cálculo de computadores e servidores compartilhados e interligados por meio da Internet, seguindo o princípio da computação em grade À tecnologia de comunicação de dados que permite uma transmissão de dados mais rápida através de linhas de telefone do que um modem convencional pode oferecer, sendo os dados transmitidos mais rapidamente em uma direção do que na outra, assimetricamente Ao programa que habilita seus usuários a interagirem com documentos HTML hospedados em um servidor da rede, destacando-se na era da web 2.0, uma vez que quase tudo do que se necessita está online Respondido em 05/04/2021 13:10:13 Acerto: 1,0 / 1,0 Marque a opção que apresenta SOMENTE ferramentas utilizadas para análise de dados. R e Apache Spark HBase e Python Hadoop MapReduce e Apache mahout MarkLogic e Weka Apache mahout e Spark mllib Respondido em 05/04/2021 13:10:20 Acerto: 1,0 / 1,0 Existe uma série de ferramentas para visualização de dados. Algumas delas foram desenvolvidas para serem utilizadas no software R. Marque a opção em que SOMENTE há exemplos de recursos do software R. Shiny e graphX MarkLogic e graphX Power BI e plotly Matplotlib e pentaho Ploty e rcmdr Respondido em 05/04/2021 13:10:23 Acerto: 1,0 / 1,0 Com referência a Big Data, assinale a opção correta. O MapReduce é considerado um modelo de programação que permite o processamento de dados massivos em um algoritmo paralelo e distribuído. Em Big Data, o sistema de arquivos HDFS é usado para armazenar arquivos muito grandes de forma Questão4 a Questão5 a Questão6 a Questão7 a distribuída, tendo como princípio o write-many, read-once. A definição mais ampla de Big Data restringe o termo a duas partes ¿ o volume absoluto e a velocidade ¿, o que facilita a extração das informações e dos insights de negócios. O sistema de arquivos distribuído Hadoop implementa o algoritmo Dijkstra modificado para busca irrestrita de dados em árvores aglomeradas em clusters com criptografia. Para armazenar e recuperar grande volume de dados, Big Data utiliza bancos SQL nativos, que são bancos de dados que podem estar configurados em quatro tipos diferentes de armazenamentos: valor chave, colunar, gráfico ou documento. Respondido em 05/04/2021 13:10:34 Acerto: 1,0 / 1,0 O ecossistema do Hadoop possui um conjunto de ferramentas de alto nível para facilitar a manipulação dos dados em sistemas distribuídos. Marque a opção que apresenta a ferramenta projetada para transferir dados entre o Hadoop e um banco de dados relacional. Mahout Sqoop Hive Cassandra HBase Respondido em 05/04/2021 13:10:45 Acerto: 1,0 / 1,0 Imagine uma situação hipotética onde uma Analista de Tecnologia da Informação foi solicitada para configurar um Servidor de Arquivos implementando técnicas RAID (Redundant Array of Inexpensive Disks). Para realizar a configuração do RAID, essa Analista pretende utilizar o Sistema Operacional GNU/Linux Debian pelo fato desse sistema operacional suportar diversos tipos de RAID via software. Durante o processo de configuração do RAID, ela optou pelo RAID do tipo 0. Qual foi a motivação dessa escolha? Implementar redundância Implementar um subsistema JBOD Replicar o conteúdo do disco principal Implementar redundância baseada em paridade Otimizar o desempenho Respondido em 05/04/2021 13:10:52 Acerto: 1,0 / 1,0 O Apache Spark é um mecanismo de análise unificado para processamento de dados em grande escala com várias vantagens. Marque a opção que NÃO representa uma dessas vantagens. O Spark tem um gerenciador de recursos do cluster próprio responsável por alocar e monitorar os recursos disponíveis no cluster para todas as aplicações O Spark tem um rico conjunto de bibliotecas para implementar processamentos em estilo SQL, processamento de streaming, algoritmos de grafos e aprendizado de máquina No Spark as aplicações têm possibilidade de serem escritas em Java, Scala, Python ou R O Spark é tem a flexibilidade para processar dados em HDFS, HBase, Cassandra, Hive e qualquer outro formato de entrada aceito pelo Hadoop A combinação de DAG e RDD ajudam ao Spark realizar o processamento paralelo extremamente rápido, em particular quando o cluster é grande o suficiente para armazenar todos os dados em memória Respondido em 05/04/2021 13:10:55 Questão8 a Questão9 a Questão10 a javascript:abre_colabore('38403','220378528','4443456697');