Avaliação III - Individual

•

UNIASSELVI

0

Caio Vinícius Nolasco Freitas

21/03/2024

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Big Data

5.738 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

21/03/2024, 10:41 Avaliação I - Individual
about:blank 1/5
Prova Impressa
GABARITO | Avaliação I - Individual (Cod.:886680)
Peso da Avaliação 1,50
Prova 73531109
Qtd. de Questões 10
Acertos/Erros 10/0
Nota 10,00
Surgido como uma plataforma voltada ao armazenamento e ao processamento de dados em larga 
escala, o framework Apache Hadoop é uma tecnologia amplamente difundida e consolidada, tanto em termos 
comerciais quanto no ambiente acadêmico. Considerando os componentes do Apache Hadoop, associe os 
itens, utilizando o código a seguir: 
I- Hadoop Streaming.
II- HDFS.
III- Hive.
IV- Hue.
( ) Componente que permite codificar aplicações em diversas linguagens, não somente em Java.
( ) É o sistema gerenciador de dados distribuídos do Hadoop, este gerencia o armazenamento dos dados e a 
distribuição.
( ) É um framework que em sua principal funcionalidade permite implementar data warehouse, 
favorecendo processos de Business Intelligence e mineração de dados. 
( ) É um SDK (Software Development Kit - Kit de Desenvolvimento de Software) que gera uma interface 
com usuário, permitindo com que a informação seja manipulada tanto utilizando linguagem SQL, bem como 
através de uma interface visual. 
Assinale a alternativa que apresenta a sequência CORRETA: 
FONTE: FAZUL, Rhauani; CARDOSO, Paulo Vinicius; BARCELOS, Patricia Pitthan. Análise do impacto 
da replicação de dados implementada pelo apache hadoop no balanceamento de carga. In: Anais do X 
Computer on the Beach (CotB 2019). 2019.
A I - II - III - IV.
B II - I - III - IV.
C IV - III - II - I.
D III - I - IV - II.
Big Data é visto como um hype, sim, pode ser verdade, mas é um tsunami no alto mar ainda, e não 
pode ser ignorado. Quando se estabilizar, será chamado apenas Data, com um volume absurdamente grande, 
mas juntamente com os outros Vs (velocidade, variedade, veracidade e valor) estarão combinados para gerar 
novos processos, tratar e analisar os dados será tão importante para as organizações quanto os demais fatores, 
como recursos humanos, tecnológicos e financeiros. As empresas simplesmente não viverão sem analisar 
dados continuamente. A velocidade é um dos pilares de Big Data, sobre Big Data Streaming e a velocidade, 
assinale a alternativa CORRETA:
A Os frameworks de Big Data Streaming tem o desafio de coletar, processar e armazenar dados em um
volume o mais próximo possível do tempo real.
B Os frameworks de Big Data Streaming tem o desafio de coletar, processar e armazenar dados em uma
velocidade o mais longe possível do tempo real.
 VOLTAR
A+ Alterar modo de visualização
1
2
21/03/2024, 10:41 Avaliação I - Individual
about:blank 2/5
C Os frameworks de Big Data Streaming têm o desafio de coletar, processar e armazenar dados em uma
velocidade sem preocupação com tempo.
D Os frameworks de Big Data Streaming tem o desafio de coletar, processar e armazenar dados em uma
velocidade o mais próximo possível do tempo real.
Na era do Big Data, deixaremos de viver como as 10000 gerações que nos antecederam. Para alguns 
pesquisadores, o Big Data é tão revolucionário na vida humana quanto a descoberta do fogo ou o início da 
agricultura. Afinal, temos aplicações nos mais diversos setores. Considerando os componentes Volume e 
Variedade de dados, associe os itens, utilizando o código a seguir: 
I- Big Data.
II- Web.
III- CRM.
IV- ERP.
( ) Interação com Clientes e Detalhes de Oferta.
( ) Dinâmica de preços e Redes de afiliados.
( ) Sensores RFID e Informações Consolidadas.
( ) Detalhe de Compra e Registro de Compra.
Assinale a alternativa que apresenta a sequência CORRETA: 
FONTE: PETRY, André. O berço do Big Data. Revista Veja, São Paulo, Abril, v. 2321, n. 20, p. 71-76, 2013.
A I - II - III - IV.
B III - II - I - IV.
C IV - III - II - I.
D I - IV - III - II.
O dado tem sido considerado o petróleo da nova era. A tecnologia existente hoje é completamente 
confiável, mas os softwares e as plataformas apenas ajudam a organizar. Tornar o projeto viável depende de 
conhecer conceitos e a própria cultura do ambiente corporativo. De acordo com estudos, 80% do conteúdo 
produzido em uma empresa normal é em formato não estruturado. Sobre Big Data, assinale a alternativa 
CORRETA:
FONTE: https://pt.wikibooks.org/wiki/SQL/Dados_Estruturados,_Semi-
Estruturados_e_N%C3%A3o_Estruturados. Acesso em: 8 maio 2021.
A
Big Data tem como tradução literal "grandes dados", termo inicialmente instituído para determinar o
grande volume de dados gerados pelos sistemas de informação, podendo ser representado sobre a soma
de volume, variedade e velocidade.
B
Big Data tem como tradução literal "pequenos dados", termo inicialmente instituído para determinar o
grande volume de dados gerados pelos sistemas de informação, podendo ser representado sobre a soma
de volume, variedade e velocidade.
C Big data são os dados semiestruturados.
D Big Data é um tipo de banco de dados relacional.
3
4
21/03/2024, 10:41 Avaliação I - Individual
about:blank 3/5
Atualmente, geramos muito mais dados com dispositivos como celular e TVs. Além disso, temos as 
mídias sociais que geram a todo tempo informações majoritariamente públicas. Hoje já é realidade a 
existência de carros, geladeiras e dispositivos vestíveis (wearable devices) conectados entre si e gerando 
ainda mais dados para serem processados e transformados em informações úteis. Sobre as arquiteturas, 
classifique V para as sentenças verdadeiras e F para as falsas:
( ) Na arquitetura paralela, o objetivo é "paralelizar" os processos, ou seja, dividir entre os núcleos.
( ) Na arquitetura paralela, o objetivo é "paralelizar" os processos, ou seja, distribuir entre vários 
computadores.
( ) Na arquitetura paralela, o objetivo é "unificar" os processos, ou seja, unificar entre os núcleos.
( ) Na arquitetura paralela, o objetivo é "paralelizar" os processos, ou seja, pegar os processos de vários 
núcleos e executar em apenas um.
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: http://marketingpordados.com/analise-de-dados/o-que-e-big-data-%F0%9F%A4%96/. Acesso em: 
7 jun. 2021.
A V - F - F - F.
B V - F - V - V.
C V - V - V - F.
D F - F - F - V.
Para conseguir os insights certos, big data é, normalmente, dividido em três características: Volume, 
Velocidade e Variedade. Esses são considerados pilares de Big Data, mas também necessitam de outros 
sistemas de informação para que possam existir. Considerando os componentes Volume e Variedade de dados 
e sua relação com outros sistemas, classifique V para as sentenças verdadeiras e F para as falsas:
( ) Em ERP são considerados Interação com Clientes e Detalhes de Oferta.
( ) Em Big Data são considerados Dinâmica de preços e Redes de afiliados.
( ) Na Web são considerados Sensores RFID e Informações Consolidadas.
( ) Em CRM Detalhe de Compra e Registro de Compra.
Assinale a alternativa que apresenta a sequência CORRETA:
A F - F - V - V.
B F - F - F - F.
C F - V - F - F.
D V - F - V - F.
A panóplia de frameworks de Big Data existentes e a complexidade, tanto da escolha das ferramentas 
adequadas como da sua implementação, requer um processo de investigação exigente, de forma a 
proporcionar uma solução exequível e o mais próximo possível da resolução do problema. Sobre a definição 
de framework, assinale a alternativa CORRETA:
A Um framework é um conjunto de códigos SQL.
5
6
7
21/03/2024, 10:41 Avaliação I - Individual
about:blank 4/5
B Um framework é um conjunto de códigos python.
C Um framework é um conjunto de problemas.
D Um framework é um conjunto de soluções para um conjunto de problemas.
Na última década, o rápido aumento da criação de dados em todos os domínios do conhecimento, como 
tráfego, medicina, rede social, indústria etc., destacou a necessidade de aprimorar o processo de análise de 
grandes volumes de dados, a fim de ser capaz de gerenciá-los com mais facilidade e, além disso, descobrir 
novas relações que nelas se escondem. Big Data é a abordagemquando um volume de dados extremamente 
grande é analisado. Considerando os componentes do framework Apache Spark, associe os itens a seguir:
I- MLlib.
II- SPARQL.
III- GraphX.
IV- Spark Streaming.
( ) É uma extensão que faz parte do núcleo da API Spark. O Spark Streaming facilita a criação de fluxos de 
processamento tolerante a falhas sobre dados em streaming e em tempo real.
( ) É a API do Apache Spark para gráficos (por exemplo, Web-Graphs e Redes Sociais) e computação em 
paralelo gráfico (por exemplo, PageRank e Collaborative Filtering). Inclui uma biblioteca embutida de 
algoritmos de gráficos e construtores.
( ) É uma recomendação do W3C a partir de janeiro de 2008. Seu propósito é permitir que arquivos RDF 
sejam consultados através de uma linguagem. O Spark é uma linguagem de consumo de dados, assim como a 
SQL.
( ) Através deste componente será possível utilizar recursos de aprendizado de máquina. A diferença desta 
biblioteca para as convencionais utilizadas pelas linguagens de programação é que foi desenvolvida para uso 
paralelo e distribuído. 
Assinale a alternativa que apresenta a sequência CORRETA: 
FONTE: BARBA GONZÁLEZ, C. et al. Big Data Optimization: Algorithmic Framework for Data Analysis 
Guided by Semantics. 2018.
A II - I - III - IV.
B IV - III - II - I.
C III - I - II - IV.
D I - II - III - IV.
Sendo um dos principais frameworks de Big Data, uma plataforma voltada ao armazenamento e ao 
processamento de dados em larga escala, o framework Apache Hadoop é uma tecnologia amplamente 
difundida e consolidada, tanto em termos comerciais quanto no ambiente acadêmico. Sobre os componentes 
do framework Apache Hadoop, classifique V para as sentenças verdadeiras e F para as falsas:
( ) O HDFS é um componente que permite codificar aplicações em diversas linguagens, não somente em 
Java.
( ) O Hadoop Streaming é o sistema gerenciador de dados distribuídos do Hadoop, este gerencia o 
armazenamento dos dados e a distribuição.
( ) O Hive é um framework que em sua principal funcionalidade permite implementar data warehouse, 
favorecendo processos de Business Intelligence e mineração de dados. A partir do Hive é possível executar 
uma linguagem denominada HiveQL (Hive Query Language- Linguagem de Consulta Hive), muito similar 
ao SQL (Structured Query Language - Linguagem de Consulta Estruturada). O Hive executa os comandos 
8
9
21/03/2024, 10:41 Avaliação I - Individual
about:blank 5/5
HiveQL e automaticamente traduz as consultas em um ou mais trabalhos de MapReduce. 
( ) O Hue é um SDK (Software Development Kit - Kit de Desenvolvimento de Software) que gera uma 
interface com usuário, permitindo com que a informação seja manipulada tanto utilizando linguagem SQL, 
bem como através de uma interface visual. 
Assinale a alternativa que apresenta a sequência CORRETA:
A V - F - V - F.
B V - F - F - F.
C F - V - F - V.
D F - F - V - V.
O Apache Spark é uma plataforma voltada ao processamento distribuído de dados em memória. O 
Apache Spark é um framework open source que oferece uma plataforma voltada para a computação 
distribuída e paralela, com ênfase em Big Data Streaming. Sobre os componentes do framework Apache 
Spark, classifique V para as sentenças verdadeiras e F para as falsas:
( ) MLib é uma extensão que faz parte do núcleo da API Spark. O Spark Streaming facilita a criação de 
fluxos de processamento tolerante a falhas sobre dados em streaming e em tempo real.
( ) GraphX é a API do Apache Spark para gráficos (por exemplo, Web-Graphs e Redes Sociais) e 
computação em paralelo gráfico (por exemplo, PageRank e Collaborative Filtering). Inclui uma biblioteca 
embutida de algoritmos de gráficos e construtores.
( ) SPARQL é uma recomendação do W3C a partir de janeiro de 2008. Seu propósito é permitir que 
arquivos RDF sejam consultados através de uma linguagem. O Spark é uma linguagem de consumo de 
dados, assim como a SQL.
( ) Spark Streaming permite utilizar recursos de aprendizado de máquina. A diferença desta biblioteca para 
as convencionais utilizadas pelas linguagens de programação é que foi desenvolvida para uso paralelo e 
distribuído. 
Assinale a alternativa que apresenta a sequência CORRETA: 
FONTE: CARDOSO, Paulo Vinicus; FAZUL, Rhauani Weber Aita; BARCELOS, Patrícia Pitthan. Validação 
de Políticas para o Estabelecimento Dinâmico de Checkpoints no Apache Spark. In: Anais do XXXVIII 
Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos - SBC, 2020. p. 29-42.
A V - F - V - V.
B F - V - F - F.
C F - V - F - V.
D F - V - V - F.
10
Imprimir