Baixe o app para aproveitar ainda mais
Prévia do material em texto
21/03/2024, 10:41 Avaliação I - Individual about:blank 1/5 Prova Impressa GABARITO | Avaliação I - Individual (Cod.:886680) Peso da Avaliação 1,50 Prova 73531109 Qtd. de Questões 10 Acertos/Erros 10/0 Nota 10,00 Surgido como uma plataforma voltada ao armazenamento e ao processamento de dados em larga escala, o framework Apache Hadoop é uma tecnologia amplamente difundida e consolidada, tanto em termos comerciais quanto no ambiente acadêmico. Considerando os componentes do Apache Hadoop, associe os itens, utilizando o código a seguir: I- Hadoop Streaming. II- HDFS. III- Hive. IV- Hue. ( ) Componente que permite codificar aplicações em diversas linguagens, não somente em Java. ( ) É o sistema gerenciador de dados distribuídos do Hadoop, este gerencia o armazenamento dos dados e a distribuição. ( ) É um framework que em sua principal funcionalidade permite implementar data warehouse, favorecendo processos de Business Intelligence e mineração de dados. ( ) É um SDK (Software Development Kit - Kit de Desenvolvimento de Software) que gera uma interface com usuário, permitindo com que a informação seja manipulada tanto utilizando linguagem SQL, bem como através de uma interface visual. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: FAZUL, Rhauani; CARDOSO, Paulo Vinicius; BARCELOS, Patricia Pitthan. Análise do impacto da replicação de dados implementada pelo apache hadoop no balanceamento de carga. In: Anais do X Computer on the Beach (CotB 2019). 2019. A I - II - III - IV. B II - I - III - IV. C IV - III - II - I. D III - I - IV - II. Big Data é visto como um hype, sim, pode ser verdade, mas é um tsunami no alto mar ainda, e não pode ser ignorado. Quando se estabilizar, será chamado apenas Data, com um volume absurdamente grande, mas juntamente com os outros Vs (velocidade, variedade, veracidade e valor) estarão combinados para gerar novos processos, tratar e analisar os dados será tão importante para as organizações quanto os demais fatores, como recursos humanos, tecnológicos e financeiros. As empresas simplesmente não viverão sem analisar dados continuamente. A velocidade é um dos pilares de Big Data, sobre Big Data Streaming e a velocidade, assinale a alternativa CORRETA: A Os frameworks de Big Data Streaming tem o desafio de coletar, processar e armazenar dados em um volume o mais próximo possível do tempo real. B Os frameworks de Big Data Streaming tem o desafio de coletar, processar e armazenar dados em uma velocidade o mais longe possível do tempo real. VOLTAR A+ Alterar modo de visualização 1 2 21/03/2024, 10:41 Avaliação I - Individual about:blank 2/5 C Os frameworks de Big Data Streaming têm o desafio de coletar, processar e armazenar dados em uma velocidade sem preocupação com tempo. D Os frameworks de Big Data Streaming tem o desafio de coletar, processar e armazenar dados em uma velocidade o mais próximo possível do tempo real. Na era do Big Data, deixaremos de viver como as 10000 gerações que nos antecederam. Para alguns pesquisadores, o Big Data é tão revolucionário na vida humana quanto a descoberta do fogo ou o início da agricultura. Afinal, temos aplicações nos mais diversos setores. Considerando os componentes Volume e Variedade de dados, associe os itens, utilizando o código a seguir: I- Big Data. II- Web. III- CRM. IV- ERP. ( ) Interação com Clientes e Detalhes de Oferta. ( ) Dinâmica de preços e Redes de afiliados. ( ) Sensores RFID e Informações Consolidadas. ( ) Detalhe de Compra e Registro de Compra. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: PETRY, André. O berço do Big Data. Revista Veja, São Paulo, Abril, v. 2321, n. 20, p. 71-76, 2013. A I - II - III - IV. B III - II - I - IV. C IV - III - II - I. D I - IV - III - II. O dado tem sido considerado o petróleo da nova era. A tecnologia existente hoje é completamente confiável, mas os softwares e as plataformas apenas ajudam a organizar. Tornar o projeto viável depende de conhecer conceitos e a própria cultura do ambiente corporativo. De acordo com estudos, 80% do conteúdo produzido em uma empresa normal é em formato não estruturado. Sobre Big Data, assinale a alternativa CORRETA: FONTE: https://pt.wikibooks.org/wiki/SQL/Dados_Estruturados,_Semi- Estruturados_e_N%C3%A3o_Estruturados. Acesso em: 8 maio 2021. A Big Data tem como tradução literal "grandes dados", termo inicialmente instituído para determinar o grande volume de dados gerados pelos sistemas de informação, podendo ser representado sobre a soma de volume, variedade e velocidade. B Big Data tem como tradução literal "pequenos dados", termo inicialmente instituído para determinar o grande volume de dados gerados pelos sistemas de informação, podendo ser representado sobre a soma de volume, variedade e velocidade. C Big data são os dados semiestruturados. D Big Data é um tipo de banco de dados relacional. 3 4 21/03/2024, 10:41 Avaliação I - Individual about:blank 3/5 Atualmente, geramos muito mais dados com dispositivos como celular e TVs. Além disso, temos as mídias sociais que geram a todo tempo informações majoritariamente públicas. Hoje já é realidade a existência de carros, geladeiras e dispositivos vestíveis (wearable devices) conectados entre si e gerando ainda mais dados para serem processados e transformados em informações úteis. Sobre as arquiteturas, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Na arquitetura paralela, o objetivo é "paralelizar" os processos, ou seja, dividir entre os núcleos. ( ) Na arquitetura paralela, o objetivo é "paralelizar" os processos, ou seja, distribuir entre vários computadores. ( ) Na arquitetura paralela, o objetivo é "unificar" os processos, ou seja, unificar entre os núcleos. ( ) Na arquitetura paralela, o objetivo é "paralelizar" os processos, ou seja, pegar os processos de vários núcleos e executar em apenas um. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: http://marketingpordados.com/analise-de-dados/o-que-e-big-data-%F0%9F%A4%96/. Acesso em: 7 jun. 2021. A V - F - F - F. B V - F - V - V. C V - V - V - F. D F - F - F - V. Para conseguir os insights certos, big data é, normalmente, dividido em três características: Volume, Velocidade e Variedade. Esses são considerados pilares de Big Data, mas também necessitam de outros sistemas de informação para que possam existir. Considerando os componentes Volume e Variedade de dados e sua relação com outros sistemas, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Em ERP são considerados Interação com Clientes e Detalhes de Oferta. ( ) Em Big Data são considerados Dinâmica de preços e Redes de afiliados. ( ) Na Web são considerados Sensores RFID e Informações Consolidadas. ( ) Em CRM Detalhe de Compra e Registro de Compra. Assinale a alternativa que apresenta a sequência CORRETA: A F - F - V - V. B F - F - F - F. C F - V - F - F. D V - F - V - F. A panóplia de frameworks de Big Data existentes e a complexidade, tanto da escolha das ferramentas adequadas como da sua implementação, requer um processo de investigação exigente, de forma a proporcionar uma solução exequível e o mais próximo possível da resolução do problema. Sobre a definição de framework, assinale a alternativa CORRETA: A Um framework é um conjunto de códigos SQL. 5 6 7 21/03/2024, 10:41 Avaliação I - Individual about:blank 4/5 B Um framework é um conjunto de códigos python. C Um framework é um conjunto de problemas. D Um framework é um conjunto de soluções para um conjunto de problemas. Na última década, o rápido aumento da criação de dados em todos os domínios do conhecimento, como tráfego, medicina, rede social, indústria etc., destacou a necessidade de aprimorar o processo de análise de grandes volumes de dados, a fim de ser capaz de gerenciá-los com mais facilidade e, além disso, descobrir novas relações que nelas se escondem. Big Data é a abordagemquando um volume de dados extremamente grande é analisado. Considerando os componentes do framework Apache Spark, associe os itens a seguir: I- MLlib. II- SPARQL. III- GraphX. IV- Spark Streaming. ( ) É uma extensão que faz parte do núcleo da API Spark. O Spark Streaming facilita a criação de fluxos de processamento tolerante a falhas sobre dados em streaming e em tempo real. ( ) É a API do Apache Spark para gráficos (por exemplo, Web-Graphs e Redes Sociais) e computação em paralelo gráfico (por exemplo, PageRank e Collaborative Filtering). Inclui uma biblioteca embutida de algoritmos de gráficos e construtores. ( ) É uma recomendação do W3C a partir de janeiro de 2008. Seu propósito é permitir que arquivos RDF sejam consultados através de uma linguagem. O Spark é uma linguagem de consumo de dados, assim como a SQL. ( ) Através deste componente será possível utilizar recursos de aprendizado de máquina. A diferença desta biblioteca para as convencionais utilizadas pelas linguagens de programação é que foi desenvolvida para uso paralelo e distribuído. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: BARBA GONZÁLEZ, C. et al. Big Data Optimization: Algorithmic Framework for Data Analysis Guided by Semantics. 2018. A II - I - III - IV. B IV - III - II - I. C III - I - II - IV. D I - II - III - IV. Sendo um dos principais frameworks de Big Data, uma plataforma voltada ao armazenamento e ao processamento de dados em larga escala, o framework Apache Hadoop é uma tecnologia amplamente difundida e consolidada, tanto em termos comerciais quanto no ambiente acadêmico. Sobre os componentes do framework Apache Hadoop, classifique V para as sentenças verdadeiras e F para as falsas: ( ) O HDFS é um componente que permite codificar aplicações em diversas linguagens, não somente em Java. ( ) O Hadoop Streaming é o sistema gerenciador de dados distribuídos do Hadoop, este gerencia o armazenamento dos dados e a distribuição. ( ) O Hive é um framework que em sua principal funcionalidade permite implementar data warehouse, favorecendo processos de Business Intelligence e mineração de dados. A partir do Hive é possível executar uma linguagem denominada HiveQL (Hive Query Language- Linguagem de Consulta Hive), muito similar ao SQL (Structured Query Language - Linguagem de Consulta Estruturada). O Hive executa os comandos 8 9 21/03/2024, 10:41 Avaliação I - Individual about:blank 5/5 HiveQL e automaticamente traduz as consultas em um ou mais trabalhos de MapReduce. ( ) O Hue é um SDK (Software Development Kit - Kit de Desenvolvimento de Software) que gera uma interface com usuário, permitindo com que a informação seja manipulada tanto utilizando linguagem SQL, bem como através de uma interface visual. Assinale a alternativa que apresenta a sequência CORRETA: A V - F - V - F. B V - F - F - F. C F - V - F - V. D F - F - V - V. O Apache Spark é uma plataforma voltada ao processamento distribuído de dados em memória. O Apache Spark é um framework open source que oferece uma plataforma voltada para a computação distribuída e paralela, com ênfase em Big Data Streaming. Sobre os componentes do framework Apache Spark, classifique V para as sentenças verdadeiras e F para as falsas: ( ) MLib é uma extensão que faz parte do núcleo da API Spark. O Spark Streaming facilita a criação de fluxos de processamento tolerante a falhas sobre dados em streaming e em tempo real. ( ) GraphX é a API do Apache Spark para gráficos (por exemplo, Web-Graphs e Redes Sociais) e computação em paralelo gráfico (por exemplo, PageRank e Collaborative Filtering). Inclui uma biblioteca embutida de algoritmos de gráficos e construtores. ( ) SPARQL é uma recomendação do W3C a partir de janeiro de 2008. Seu propósito é permitir que arquivos RDF sejam consultados através de uma linguagem. O Spark é uma linguagem de consumo de dados, assim como a SQL. ( ) Spark Streaming permite utilizar recursos de aprendizado de máquina. A diferença desta biblioteca para as convencionais utilizadas pelas linguagens de programação é que foi desenvolvida para uso paralelo e distribuído. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: CARDOSO, Paulo Vinicus; FAZUL, Rhauani Weber Aita; BARCELOS, Patrícia Pitthan. Validação de Políticas para o Estabelecimento Dinâmico de Checkpoints no Apache Spark. In: Anais do XXXVIII Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos - SBC, 2020. p. 29-42. A V - F - V - V. B F - V - F - F. C F - V - F - V. D F - V - V - F. 10 Imprimir
Compartilhar