prova 1 big data stream

•

UNIASSELVI IERGS

4

1

4

1

0

enio ricardo de farias

28/11/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Big Data

5.799 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

27/11/2021 18:49 AVA
https://ava2.uniasselvi.com.br/subject/grades-and-tests/answer-book/eyJ0ZXN0Ijp7InRlc3RDb2RlIjoiNjg5MjI0IiwiZGVzY3JpcHRpb… 1/4
Avaliação I - Individual (Cod.:)
Peso da Avaliação
1,50 Prova
Qtd. de Questões
10
Acertos/Erros
9/1
Nota
9,00
Para conseguir os insights certos, big data é, normalmente, dividido em três características: Volume, Velocidade e Variedade. Esses
são considerados pilares de Big Data, mas também necessitam de outros sistemas de informação para que possam existir. Considerando
os componentes Volume e Variedade de dados e sua relação com outros sistemas, classifique V para as sentenças verdadeiras e F para as
falsas:
 
(    ) Em ERP são considerados Interação com Clientes e Detalhes de Oferta.
 (    ) Em Big Data são considerados Dinâmica de preços e Redes de afiliados.
 (    ) Na Web são considerados Sensores RFID e Informações Consolidadas.
 (    ) Em CRM Detalhe de Compra e Registro de Compra.
 
Assinale a alternativa que apresenta a sequência CORRETA:
A V - F - V - F.
B F - F - F - F.
C F - V - F - F.
D F - F - V - V.
Atualmente, geramos muito mais dados com dispositivos como celular e TVs. Além disso, temos as mídias sociais que geram a
todo tempo informações majoritariamente públicas. Hoje já é realidade a existência de carros, geladeiras e dispositivos vestíveis
(wearable devices) conectados entre si e gerando ainda mais dados para serem processados e transformados em informações úteis. Sobre
as arquiteturas, classifique V para as sentenças verdadeiras e F para as falsas:
 
(    ) Na arquitetura paralela, o objetivo é "paralelizar" os processos, ou seja, dividir entre os núcleos.
 (    ) Na arquitetura paralela, o objetivo é "paralelizar" os processos, ou seja, distribuir entre vários computadores.
 (    ) Na arquitetura paralela, o objetivo é "unificar" os processos, ou seja, unificar entre os núcleos.
 (    ) Na arquitetura paralela, o objetivo é "paralelizar" os processos, ou seja, pegar os processos de vários núcleos e executar em apenas
um.
 
Assinale a alternativa que apresenta a sequência CORRETA:
 
FONTE: http://marketingpordados.com/analise-de-dados/o-que-e-big-data-%F0%9F%A4%96/. Acesso em: 7 jun. 2021.
A F - F - F - V.
B V - V - V - F.
C V - F - F - F.
D V - F - V - V.
Na última década, o rápido aumento da criação de dados em todos os domínios do conhecimento, como tráfego, medicina, rede
social, indústria etc., destacou a necessidade de aprimorar o processo de análise de grandes volumes de dados, a fim de ser capaz de
gerenciá-los com mais facilidade e, além disso, descobrir novas relações que nelas se escondem. Big Data é a abordagem quando um
volume de dados extremamente grande é analisado. Considerando os componentes do framework Apache Spark, associe os itens a
seguir:
 
I- MLlib.
 II- SPARQL.
 III- GraphX.
 IV- Spark Streaming.
 
(    ) É uma extensão que faz parte do núcleo da API Spark. O Spark Streaming facilita a criação de fluxos de processamento tolerante a
falhas sobre dados em streaming e em tempo real.
 (    ) É a API do Apache Spark para gráficos (por exemplo, Web-Graphs e Redes Sociais) e computação em paralelo gráfico (por
exemplo, PageRank e Collaborative Filtering). Inclui uma biblioteca embutida de algoritmos de gráficos e construtores.
 (    ) É uma recomendação do W3C a partir de janeiro de 2008. Seu propósito é permitir que arquivos RDF sejam consultados através de
uma linguagem. O Spark é uma linguagem de consumo de dados, assim como a SQL.
A+ Alterar modo de visualização
1
2
3
27/11/2021 18:49 AVA
https://ava2.uniasselvi.com.br/subject/grades-and-tests/answer-book/eyJ0ZXN0Ijp7InRlc3RDb2RlIjoiNjg5MjI0IiwiZGVzY3JpcHRpb… 2/4
(    ) Através deste componente será possível utilizar recursos de aprendizado de máquina. A diferença desta biblioteca para as
convencionais utilizadas pelas linguagens de programação é que foi desenvolvida para uso paralelo e distribuído.
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: BARBA GONZÁLEZ, C. et al. Big Data Optimization: Algorithmic Framework for Data Analysis Guided by Semantics. 2018.
A IV - III - II - I.
B II - I - III - IV.
C I - II - III - IV.
D III - I - II - IV.
O Apache Hadoop também é usado amplamente como motor de muitos sistemas de processamento de consultas básicas, bem como
para processamento de grandes volumes de dados. Sobre os componentes do framework Apache Hadoop, classifique V para as sentenças
verdadeiras e F para as falsas:
(    ) Hbase é o banco NOSQL (Not Only SQL) que é nativo dentro do apache Hadoop.
(    ) Sqoop é um framework que implementa o modelo de programação MapReduce, o qual visa dividir a informação para processar em
blocos separados e concorrentes.
(    ) Hadoop MapReduce é uma ferramenta que cria uma interface do Apache Hadoop com bancos de dados relacionais e ferramentas de
data warehouse.
(    ) Zookeeper é um serviço de distribuição de coordenadas do Apache Hadoop, desenvolvido para trabalhar em clusters do qual
existem diversos outros componentes.
Assinale a alternativa que apresenta a sequência CORRETA:
A V - F - V - V.
B V - F - F - V.
C F - V - V - V.
D V - F - V - F.
Sendo um dos principais frameworks de Big Data, uma plataforma voltada ao armazenamento e ao processamento de dados em
larga escala, o framework Apache Hadoop é uma tecnologia amplamente difundida e consolidada, tanto em termos comerciais quanto no
ambiente acadêmico. Sobre os componentes do framework Apache Hadoop, classifique V para as sentenças verdadeiras e F para as
falsas:
(    ) O HDFS é um componente que permite codificar aplicações em diversas linguagens, não somente em Java.
(    ) O Hadoop Streaming é o sistema gerenciador de dados distribuídos do Hadoop, este gerencia o armazenamento dos dados e a
distribuição.
(    ) O Hive é um framework que em sua principal funcionalidade permite implementar data warehouse, favorecendo processos de
Business Intelligence e mineração de dados. A partir do Hive é possível executar uma linguagem denominada HiveQL (Hive Query
Language- Linguagem de Consulta Hive), muito similar ao SQL (Structured Query Language - Linguagem de Consulta Estruturada). O
Hive executa os comandos HiveQL e automaticamente traduz as consultas em um ou mais trabalhos de MapReduce.
(    ) O Hue é um SDK (Software Development Kit - Kit de Desenvolvimento de Software) que gera uma interface com usuário,
permitindo com que a informação seja manipulada tanto utilizando linguagem SQL, bem como através de uma interface visual.
Assinale a alternativa que apresenta a sequência CORRETA:
A V - F - V - F.
B F - V - F - V.
C V - F - F - F.
D F - F - V - V.
Big Data é visto como um hype, sim, pode ser verdade, mas é um tsunami no alto mar ainda, e não pode ser ignorado. Quando se
estabilizar, será chamado apenas Data, com um volume absurdamente grande, mas juntamente com os outros Vs (velocidade, variedade,
veracidade e valor) estarão combinados para gerar novos processos, tratar e analisar os dados será tão importante para as organizações
quanto os demais fatores, como recursos humanos, tecnológicos e financeiros. As empresas simplesmente não viverão sem analisar
4
5
6
27/11/2021 18:49 AVA
https://ava2.uniasselvi.com.br/subject/grades-and-tests/answer-book/eyJ0ZXN0Ijp7InRlc3RDb2RlIjoiNjg5MjI0IiwiZGVzY3JpcHRpb… 3/4
dados continuamente. A velocidade é um dos pilares de Big Data, sobre Big Data Streaming e a velocidade, assinale a alternativa
CORRETA:
A Os frameworks de Big Data Streaming têm o desafio de coletar, processar e armazenar dados em uma velocidade sem preocupação
com tempo.
B Os frameworks de Big Data Streaming tem o desafio de coletar, processar e armazenar dados em um volume o mais próximo
possível do tempo real.
C Os frameworks de Big Data Streaming tem o desafio de coletar, processar e armazenar dados em uma velocidade o mais longe
possível do tempo real.
D Os frameworks de Big Data Streaming tem o desafio de coletar, processar e armazenar dados em uma velocidade o maispróximo
possível do tempo real.
Na era do Big Data, deixaremos de viver como as 10000 gerações que nos antecederam. Para alguns pesquisadores, o Big Data é
tão revolucionário na vida humana quanto a descoberta do fogo ou o início da agricultura. Afinal, temos aplicações nos mais diversos
setores. Considerando os componentes Volume e Variedade de dados, associe os itens, utilizando o código a seguir:
I- Big Data.
II- Web.
III- CRM.
IV- ERP.
(    ) Interação com Clientes e Detalhes de Oferta.
(    ) Dinâmica de preços e Redes de afiliados.
(    ) Sensores RFID e Informações Consolidadas.
(    ) Detalhe de Compra e Registro de Compra.
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: PETRY, André. O berço do Big Data. Revista Veja, São Paulo, Abril, v. 2321, n. 20, p. 71-76, 2013.
A I - II - III - IV.
B III - II - I - IV.
C IV - III - II - I.
D I - IV - III - II.
O dado tem sido considerado o petróleo da nova era. A tecnologia existente hoje é completamente confiável, mas os softwares e as
plataformas apenas ajudam a organizar. Tornar o projeto viável depende de conhecer conceitos e a própria cultura do ambiente
corporativo. De acordo com estudos, 80% do conteúdo produzido em uma empresa normal é em formato não estruturado. Sobre Big
Data, assinale a alternativa CORRETA:
FONTE: https://pt.wikibooks.org/wiki/SQL/Dados_Estruturados,_Semi-Estruturados_e_N%C3%A3o_Estruturados. Acesso em: 8 maio
2021.
A Big Data tem como tradução literal "pequenos dados", termo inicialmente instituído para determinar o grande volume de dados
gerados pelos sistemas de informação, podendo ser representado sobre a soma de volume, variedade e velocidade.
B Big data são os dados semiestruturados.
C Big Data tem como tradução literal "grandes dados", termo inicialmente instituído para determinar o grande volume de dados gerados
pelos sistemas de informação, podendo ser representado sobre a soma de volume, variedade e velocidade.
D Big Data é um tipo de banco de dados relacional.
Em um cenário de grandes volumes de dados, a primeira etapa é a coleta, a segunda é a preparação e, por último, o armazenamento
que permite futuras análises. Para isso, comumente utilizamos os ditos frameworks de Big Data. Sobre os frameworks A, classifique V
para as sentenças verdadeiras e F para as falsas:
(    ) Um framework é um conjunto de códigos SQL.
(    ) Um framework é um conjunto de códigos python.
(    ) Um framework é um conjunto de problemas.
(    ) Um framework é um conjunto de soluções para um conjunto de problemas.
7
8
9
27/11/2021 18:49 AVA
https://ava2.uniasselvi.com.br/subject/grades-and-tests/answer-book/eyJ0ZXN0Ijp7InRlc3RDb2RlIjoiNjg5MjI0IiwiZGVzY3JpcHRpb… 4/4
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: http://marketingpordados.com/analise-de-dados/o-que-e-big-data-%F0%9F%A4%96/. Acesso em: 7 jun. 2021.
A V - V - F - F.
B F - F - F - V.
C V - F - V - V.
D V - F - V - V.
O Apache Spark é uma plataforma voltada ao processamento distribuído de dados em memória. O Apache Spark é um framework
open source que oferece uma plataforma voltada para a computação distribuída e paralela, com ênfase em Big Data Streaming. Sobre os
componentes do framework Apache Spark, classifique V para as sentenças verdadeiras e F para as falsas:
(    ) MLib é uma extensão que faz parte do núcleo da API Spark. O Spark Streaming facilita a criação de fluxos de processamento
tolerante a falhas sobre dados em streaming e em tempo real.
(    ) GraphX é a API do Apache Spark para gráficos (por exemplo, Web-Graphs e Redes Sociais) e computação em paralelo gráfico (por
exemplo, PageRank e Collaborative Filtering). Inclui uma biblioteca embutida de algoritmos de gráficos e construtores.
(    ) SPARQL é uma recomendação do W3C a partir de janeiro de 2008. Seu propósito é permitir que arquivos RDF sejam consultados
através de uma linguagem. O Spark é uma linguagem de consumo de dados, assim como a SQL.
(    ) Spark Streaming permite utilizar recursos de aprendizado de máquina. A diferença desta biblioteca para as convencionais utilizadas
pelas linguagens de programação é que foi desenvolvida para uso paralelo e distribuído.
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: CARDOSO, Paulo Vinicus; FAZUL, Rhauani Weber Aita; BARCELOS, Patrícia Pitthan. Validação de Políticas para o
Estabelecimento Dinâmico de Checkpoints no Apache Spark. In: Anais do XXXVIII Simpósio Brasileiro de Redes de Computadores e
Sistemas Distribuídos - SBC, 2020. p. 29-42.
A F - V - V - F.
B V - F - V - V.
C F - V - F - F.
D F - V - F - V.
10