Buscar

Avaliação I - Big Data Stream Arquitetura de Coleta e Armazenamento

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Avaliação I - Individual 
Parte superior do formulário
1Surgido como uma plataforma voltada ao armazenamento e ao processamento de dados em larga escala, o framework Apache Hadoop é uma tecnologia amplamente difundida e consolidada, tanto em termos comerciais quanto no ambiente acadêmico. Considerando os componentes do Apache Hadoop, associe os itens, utilizando o código a seguir: 
I- Hadoop Streaming.
 II- HDFS.
 III- Hive. 
IV- Hue.
 ( ) Componente que permite codificar aplicações em diversas linguagens, não somente em Java.
 ( ) É o sistema gerenciador de dados distribuídos do Hadoop, este gerencia o armazenamento dos dados e a distribuição. 
( ) É um framework que em sua principal funcionalidade permite implementar data warehouse, favorecendo processos de Business Intelligence e mineração de dados. 
( ) É um SDK (Software Development Kit - Kit de Desenvolvimento de Software) que gera uma interface com usuário, permitindo com que a informação seja manipulada tanto utilizando linguagem SQL, bem como através de uma interface visual. 
Assinale a alternativa que apresenta a sequência CORRETA: FONTE: FAZUL, Rhauani; CARDOSO, Paulo Vinicius; BARCELOS, Patricia Pitthan. Análise do impacto da replicação de dados implementada pelo apache hadoop no balanceamento de carga. In: Anais do X Computer on the Beach (CotB 2019). 2019.
A)  IV - III - II - I.
B)  III - I - IV - II.
C)  II - I - III - IV.
D)  I - II - III - IV.
2O dado tem sido considerado o petróleo da nova era. A tecnologia existente hoje é completamente confiável, mas os softwares e as plataformas apenas ajudam a organizar. Tornar o projeto viável depende de conhecer conceitos e a própria cultura do ambiente corporativo. De acordo com estudos, 80% do conteúdo produzido em uma empresa normal é em formato não estruturado. Sobre Big Data, assinale a alternativa CORRETA: FONTE: https://pt.wikibooks.org/wiki/SQL/Dados_Estruturados,_Semi-Estruturados_e_N%C3%A3o_Estruturados. Acesso em: 8 maio 2021.
A)  Big Data é um tipo de banco de dados relacional.
B)  Big data são os dados semiestruturados.
C)  Big Data tem como tradução literal "grandes dados", termo inicialmente instituído para determinar o grande volume de dados gerados pelos sistemas de informação, podendo ser representado sobre a soma de volume, variedade e velocidade.
D)  Big Data tem como tradução literal "pequenos dados", termo inicialmente instituído para determinar o grande volume de dados gerados pelos sistemas de informação, podendo ser representado sobre a soma de volume, variedade e velocidade.
3Na era do Big Data, deixaremos de viver como as 10000 gerações que nos antecederam. Para alguns pesquisadores, o Big Data é tão revolucionário na vida humana quanto a descoberta do fogo ou o início da agricultura. Afinal, temos aplicações nos mais diversos setores. Considerando os componentes Volume e Variedade de dados, associe os itens, utilizando o código a seguir: 
I- Big Data.
 II- Web.
 III- CRM.
 IV- ERP. 
( ) Interação com Clientes e Detalhes de Oferta.
 ( ) Dinâmica de preços e Redes de afiliados.
 ( ) Sensores RFID e Informações Consolidadas.
 ( ) Detalhe de Compra e Registro de Compra. 
Assinale a alternativa que apresenta a sequência CORRETA: FONTE: PETRY, André. O berço do Big Data. Revista Veja, São Paulo, Abril, v. 2321, n. 20, p. 71-76, 2013.
A)  IV - III - II - I.
B)  I - IV - III - II.
C)  III - II - I - IV.
D)  I - II - III - IV.
4Sendo um dos principais frameworks de Big Data, uma plataforma voltada ao armazenamento e ao processamento de dados em larga escala, o framework Apache Hadoop é uma tecnologia amplamente difundida e consolidada, tanto em termos comerciais quanto no ambiente acadêmico. Sobre os componentes do framework Apache Hadoop, classifique V para as sentenças verdadeiras e F para as falsas:
 ( ) O HDFS é um componente que permite codificar aplicações em diversas linguagens, não somente em Java. 
( ) O Hadoop Streaming é o sistema gerenciador de dados distribuídos do Hadoop, este gerencia o armazenamento dos dados e a distribuição. 
( ) O Hive é um framework que em sua principal funcionalidade permite implementar data warehouse, favorecendo processos de Business Intelligence e mineração de dados. A partir do Hive é possível executar uma linguagem denominada HiveQL (Hive Query Language- Linguagem de Consulta Hive), muito similar ao SQL (Structured Query Language - Linguagem de Consulta Estruturada). O Hive executa os comandos HiveQL e automaticamente traduz as consultas em um ou mais trabalhos de MapReduce. 
( ) O Hue é um SDK (Software Development Kit - Kit de Desenvolvimento de Software) que gera uma interface com usuário, permitindo com que a informação seja manipulada tanto utilizando linguagem SQL, bem como através de uma interface visual. Assinale a alternativa que apresenta a sequência CORRETA:
A)  V - F - F - F.
B)  F - V - F - V.
C)  V - F - V - F.
D)  F - F - V - V.
5Atualmente, geramos muito mais dados com dispositivos como celular e TVs. Além disso, temos as mídias sociais que geram a todo tempo informações majoritariamente públicas. Hoje já é realidade a existência de carros, geladeiras e dispositivos vestíveis (wearable devices) conectados entre si e gerando ainda mais dados para serem processados e transformados em informações úteis. Sobre as arquiteturas, classifique V para as sentenças verdadeiras e F para as falsas: 
( ) Na arquitetura paralela, o objetivo é "paralelizar" os processos, ou seja, dividir entre os núcleos.
 ( ) Na arquitetura paralela, o objetivo é "paralelizar" os processos, ou seja, distribuir entre vários computadores.
 ( ) Na arquitetura paralela, o objetivo é "unificar" os processos, ou seja, unificar entre os núcleos.
 ( ) Na arquitetura paralela, o objetivo é "paralelizar" os processos, ou seja, pegar os processos de vários núcleos e executar em apenas um. 
Assinale a alternativa que apresenta a sequência CORRETA: FONTE: http://marketingpordados.com/analise-de-dados/o-que-e-big-data-%F0%9F%A4%96/. Acesso em: 7 jun. 2021.
A)  F - F - F - V.
B)  V - V - V - F.
C)  V - F - F - F.
D)  V - F - V - V.
6Na última década, o rápido aumento da criação de dados em todos os domínios do conhecimento, como tráfego, medicina, rede social, indústria etc., destacou a necessidade de aprimorar o processo de análise de grandes volumes de dados, a fim de ser capaz de gerenciá-los com mais facilidade e, além disso, descobrir novas relações que nelas se escondem. Big Data é a abordagem quando um volume de dados extremamente grande é analisado. Considerando os componentes do framework Apache Spark, associe os itens a seguir: 
I- MLlib.
 II- SPARQL. 
III- GraphX. 
IV- Spark Streaming.
 ( ) É uma extensão que faz parte do núcleo da API Spark. O Spark Streaming facilita a criação de fluxos de processamento tolerante a falhas sobre dados em streaming e em tempo real.
 ( ) É a API do Apache Spark para gráficos (por exemplo, Web-Graphs e Redes Sociais) e computação em paralelo gráfico (por exemplo, PageRank e Collaborative Filtering). Inclui uma biblioteca embutida de algoritmos de gráficos e construtores. 
( ) É uma recomendação do W3C a partir de janeiro de 2008. Seu propósito é permitir que arquivos RDF sejam consultados através de uma linguagem. O Spark é uma linguagem de consumo de dados, assim como a SQL. 
( ) Através deste componente será possível utilizar recursos de aprendizado de máquina. A diferença desta biblioteca para as convencionais utilizadas pelas linguagens de programação é que foi desenvolvida para uso paralelo e distribuído. 
Assinale a alternativa que apresenta a sequência CORRETA: FONTE: BARBA GONZÁLEZ, C. et al. Big Data Optimization: Algorithmic Framework for Data Analysis Guided by Semantics. 2018.
A)  III - I - II - IV.
B)  II - I - III - IV.
C)  IV - III - II - I.
D)  I - II - III - IV.
7A panóplia de frameworks de Big Data existentes e a complexidade, tanto da escolha das ferramentas adequadas como da sua implementação, requer um processo de investigação exigente, de forma a proporcionar uma solução exequível e o maispróximo possível da resolução do problema. Sobre a definição de framework, assinale a alternativa CORRETA:
A)  Um framework é um conjunto de códigos python.
B)  Um framework é um conjunto de soluções para um conjunto de problemas.
C)  Um framework é um conjunto de problemas.
D)  Um framework é um conjunto de códigos SQL.
8Para conseguir os insights certos, big data é, normalmente, dividido em três características: Volume, Velocidade e Variedade. Esses são considerados pilares de Big Data, mas também necessitam de outros sistemas de informação para que possam existir. Considerando os componentes Volume e Variedade de dados e sua relação com outros sistemas, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Em ERP são considerados Interação com Clientes e Detalhes de Oferta.
 ( ) Em Big Data são considerados Dinâmica de preços e Redes de afiliados.
 ( ) Na Web são considerados Sensores RFID e Informações Consolidadas.
 ( ) Em CRM Detalhe de Compra e Registro de Compra. 
Assinale a alternativa que apresenta a sequência CORRETA:
A)  F - F - F - F.
B)  F - V - F - F.
C)  V - F - V - F.
D)  F - F - V - V.
9Big Data é visto como um hype, sim, pode ser verdade, mas é um tsunami no alto mar ainda, e não pode ser ignorado. Quando se estabilizar, será chamado apenas Data, com um volume absurdamente grande, mas juntamente com os outros Vs (velocidade, variedade, veracidade e valor) estarão combinados para gerar novos processos, tratar e analisar os dados será tão importante para as organizações quanto os demais fatores, como recursos humanos, tecnológicos e financeiros. As empresas simplesmente não viverão sem analisar dados continuamente. A velocidade é um dos pilares de Big Data, sobre Big Data Streaming e a velocidade, assinale a alternativa CORRETA:
A)  Os frameworks de Big Data Streaming tem o desafio de coletar, processar e armazenar dados em uma velocidade o mais próximo possível do tempo real.
B)  Os frameworks de Big Data Streaming tem o desafio de coletar, processar e armazenar dados em uma velocidade o mais longe possível do tempo real.
C)  Os frameworks de Big Data Streaming tem o desafio de coletar, processar e armazenar dados em um volume o mais próximo possível do tempo real.
D)  Os frameworks de Big Data Streaming têm o desafio de coletar, processar e armazenar dados em uma velocidade sem preocupação com tempo.
10O Apache Spark é uma plataforma voltada ao processamento distribuído de dados em memória. O Apache Spark é um framework open source que oferece uma plataforma voltada para a computação distribuída e paralela, com ênfase em Big Data Streaming. Sobre os componentes do framework Apache Spark, classifique V para as sentenças verdadeiras e F para as falsas:
 ( ) MLib é uma extensão que faz parte do núcleo da API Spark. O Spark Streaming facilita a criação de fluxos de processamento tolerante a falhas sobre dados em streaming e em tempo real.
 ( ) GraphX é a API do Apache Spark para gráficos (por exemplo, Web-Graphs e Redes Sociais) e computação em paralelo gráfico (por exemplo, PageRank e Collaborative Filtering). Inclui uma biblioteca embutida de algoritmos de gráficos e construtores. 
( ) SPARQL é uma recomendação do W3C a partir de janeiro de 2008. Seu propósito é permitir que arquivos RDF sejam consultados através de uma linguagem. O Spark é uma linguagem de consumo de dados, assim como a SQL.
 ( ) Spark Streaming permite utilizar recursos de aprendizado de máquina. A diferença desta biblioteca para as convencionais utilizadas pelas linguagens de programação é que foi desenvolvida para uso paralelo e distribuído. 
Assinale a alternativa que apresenta a sequência CORRETA:
 FONTE: CARDOSO, Paulo Vinicus; FAZUL, Rhauani Weber Aita; BARCELOS, Patrícia Pitthan. Validação de Políticas para o Estabelecimento Dinâmico de Checkpoints no Apache Spark. In: Anais do XXXVIII Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos - SBC, 2020. p. 29-42.
A)  F - V - F - V.
B)  V - F - V - V.
C)  F - V - V - F.
D)  F - V - F - F.
Parte inferior do formulário

Continue navegando