Buscar

Avaliação I - Individual

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

21/03/2024, 10:39 Avaliação I - Individual
about:blank 1/5
Prova Impressa
GABARITO | Avaliação I - Individual (Cod.:770133)
Peso da Avaliação 1,50
Prova 57278612
Qtd. de Questões 10
Acertos/Erros 10/0
Nota 10,00
O Apache Hadoop também é usado amplamente como motor de muitos sistemas de processamento de 
consultas básicas, bem como para processamento de grandes volumes de dados. Sobre os componentes do 
framework Apache Hadoop, classifique V para as sentenças verdadeiras e F para as falsas:
( ) Hbase é o banco NOSQL (Not Only SQL) que é nativo dentro do apache Hadoop.
( ) Sqoop é um framework que implementa o modelo de programação MapReduce, o qual visa dividir a 
informação para processar em blocos separados e concorrentes.
( ) Hadoop MapReduce é uma ferramenta que cria uma interface do Apache Hadoop com bancos de dados 
relacionais e ferramentas de data warehouse.
( ) Zookeeper é um serviço de distribuição de coordenadas do Apache Hadoop, desenvolvido para trabalhar 
em clusters do qual existem diversos outros componentes.
Assinale a alternativa que apresenta a sequência CORRETA:
A F - V - V - V.
B V - F - V - V.
C V - F - V - F.
D V - F - F - V.
Surgido como uma plataforma voltada ao armazenamento e ao processamento de dados em larga 
escala, o framework Apache Hadoop é uma tecnologia amplamente difundida e consolidada, tanto em termos 
comerciais quanto no ambiente acadêmico. Considerando os componentes do Apache Hadoop, associe os 
itens, utilizando o código a seguir: 
I- Hadoop Streaming.
II- HDFS.
III- Hive.
IV- Hue.
( ) Componente que permite codificar aplicações em diversas linguagens, não somente em Java.
( ) É o sistema gerenciador de dados distribuídos do Hadoop, este gerencia o armazenamento dos dados e a 
distribuição.
( ) É um framework que em sua principal funcionalidade permite implementar data warehouse, 
favorecendo processos de Business Intelligence e mineração de dados. 
( ) É um SDK (Software Development Kit - Kit de Desenvolvimento de Software) que gera uma interface 
com usuário, permitindo com que a informação seja manipulada tanto utilizando linguagem SQL, bem como 
através de uma interface visual. 
Assinale a alternativa que apresenta a sequência CORRETA: 
FONTE: FAZUL, Rhauani; CARDOSO, Paulo Vinicius; BARCELOS, Patricia Pitthan. Análise do impacto 
da replicação de dados implementada pelo apache hadoop no balanceamento de carga. In: Anais do X 
Computer on the Beach (CotB 2019). 2019.
 VOLTAR
A+ Alterar modo de visualização
1
2
21/03/2024, 10:39 Avaliação I - Individual
about:blank 2/5
A I - II - III - IV.
B III - I - IV - II.
C IV - III - II - I.
D II - I - III - IV.
Na era do Big Data, deixaremos de viver como as 10000 gerações que nos antecederam. Para alguns 
pesquisadores, o Big Data é tão revolucionário na vida humana quanto a descoberta do fogo ou o início da 
agricultura. Afinal, temos aplicações nos mais diversos setores. Considerando os componentes Volume e 
Variedade de dados, associe os itens, utilizando o código a seguir: 
I- Big Data.
II- Web.
III- CRM.
IV- ERP.
( ) Interação com Clientes e Detalhes de Oferta.
( ) Dinâmica de preços e Redes de afiliados.
( ) Sensores RFID e Informações Consolidadas.
( ) Detalhe de Compra e Registro de Compra.
Assinale a alternativa que apresenta a sequência CORRETA: 
FONTE: PETRY, André. O berço do Big Data. Revista Veja, São Paulo, Abril, v. 2321, n. 20, p. 71-76, 2013.
A I - II - III - IV.
B I - IV - III - II.
C III - II - I - IV.
D IV - III - II - I.
A panóplia de frameworks de Big Data existentes e a complexidade, tanto da escolha das ferramentas 
adequadas como da sua implementação, requer um processo de investigação exigente, de forma a 
proporcionar uma solução exequível e o mais próximo possível da resolução do problema. Sobre a definição 
de framework, assinale a alternativa CORRETA:
A Um framework é um conjunto de códigos SQL.
B Um framework é um conjunto de códigos python.
C Um framework é um conjunto de problemas.
D Um framework é um conjunto de soluções para um conjunto de problemas.
Na última década, o rápido aumento da criação de dados em todos os domínios do conhecimento, como 
tráfego, medicina, rede social, indústria etc., destacou a necessidade de aprimorar o processo de análise de 
3
4
5
21/03/2024, 10:39 Avaliação I - Individual
about:blank 3/5
grandes volumes de dados, a fim de ser capaz de gerenciá-los com mais facilidade e, além disso, descobrir 
novas relações que nelas se escondem. Big Data é a abordagem quando um volume de dados extremamente 
grande é analisado. Considerando os componentes do framework Apache Spark, associe os itens a seguir:
I- MLlib.
II- SPARQL.
III- GraphX.
IV- Spark Streaming.
( ) É uma extensão que faz parte do núcleo da API Spark. O Spark Streaming facilita a criação de fluxos de 
processamento tolerante a falhas sobre dados em streaming e em tempo real.
( ) É a API do Apache Spark para gráficos (por exemplo, Web-Graphs e Redes Sociais) e computação em 
paralelo gráfico (por exemplo, PageRank e Collaborative Filtering). Inclui uma biblioteca embutida de 
algoritmos de gráficos e construtores.
( ) É uma recomendação do W3C a partir de janeiro de 2008. Seu propósito é permitir que arquivos RDF 
sejam consultados através de uma linguagem. O Spark é uma linguagem de consumo de dados, assim como a 
SQL.
( ) Através deste componente será possível utilizar recursos de aprendizado de máquina. A diferença desta 
biblioteca para as convencionais utilizadas pelas linguagens de programação é que foi desenvolvida para uso 
paralelo e distribuído. 
Assinale a alternativa que apresenta a sequência CORRETA: 
FONTE: BARBA GONZÁLEZ, C. et al. Big Data Optimization: Algorithmic Framework for Data Analysis 
Guided by Semantics. 2018.
A II - I - III - IV.
B I - II - III - IV.
C IV - III - II - I.
D III - I - II - IV.
Big Data é visto como um hype, sim, pode ser verdade, mas é um tsunami no alto mar ainda, e não 
pode ser ignorado. Quando se estabilizar, será chamado apenas Data, com um volume absurdamente grande, 
mas juntamente com os outros Vs (velocidade, variedade, veracidade e valor) estarão combinados para gerar 
novos processos, tratar e analisar os dados será tão importante para as organizações quanto os demais fatores, 
como recursos humanos, tecnológicos e financeiros. As empresas simplesmente não viverão sem analisar 
dados continuamente. A velocidade é um dos pilares de Big Data, sobre Big Data Streaming e a velocidade, 
assinale a alternativa CORRETA:
A Os frameworks de Big Data Streaming tem o desafio de coletar, processar e armazenar dados em um
volume o mais próximo possível do tempo real.
B Os frameworks de Big Data Streaming têm o desafio de coletar, processar e armazenar dados em uma
velocidade sem preocupação com tempo.
C Os frameworks de Big Data Streaming tem o desafio de coletar, processar e armazenar dados em uma
velocidade o mais próximo possível do tempo real.
D Os frameworks de Big Data Streaming tem o desafio de coletar, processar e armazenar dados em uma
velocidade o mais longe possível do tempo real.
Atualmente, geramos muito mais dados com dispositivos como celular e TVs. Além disso, temos as 
mídias sociais que geram a todo tempo informações majoritariamente públicas. Hoje já é realidade a 
existência de carros, geladeiras e dispositivos vestíveis (wearable devices) conectados entre si e gerando 
6
7
21/03/2024, 10:39 Avaliação I - Individual
about:blank 4/5
ainda mais dados para serem processados e transformados em informações úteis. Sobre as arquiteturas, 
classifique V para as sentenças verdadeiras e F para as falsas:
( ) Na arquitetura paralela, o objetivo é "paralelizar" os processos, ou seja, dividir entre os núcleos.
( ) Na arquitetura paralela, o objetivo é "paralelizar" os processos, ou seja, distribuir entre vários 
computadores.
( ) Na arquitetura paralela, o objetivo é "unificar" os processos, ou seja, unificar entre osnúcleos.
( ) Na arquitetura paralela, o objetivo é "paralelizar" os processos, ou seja, pegar os processos de vários 
núcleos e executar em apenas um.
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: http://marketingpordados.com/analise-de-dados/o-que-e-big-data-%F0%9F%A4%96/. Acesso em: 
7 jun. 2021.
A V - F - V - V.
B V - F - F - F.
C F - F - F - V.
D V - V - V - F.
Em um cenário de grandes volumes de dados, a primeira etapa é a coleta, a segunda é a preparação e, 
por último, o armazenamento que permite futuras análises. Para isso, comumente utilizamos os ditos 
frameworks de Big Data. Sobre os frameworks A, classifique V para as sentenças verdadeiras e F para as 
falsas:
( ) Um framework é um conjunto de códigos SQL.
( ) Um framework é um conjunto de códigos python.
( ) Um framework é um conjunto de problemas.
( ) Um framework é um conjunto de soluções para um conjunto de problemas.
Assinale a alternativa que apresenta a sequência CORRETA: 
FONTE: http://marketingpordados.com/analise-de-dados/o-que-e-big-data-%F0%9F%A4%96/. Acesso em: 
7 jun. 2021.
A F - F - F - V.
B V - V - F - F.
C V - F - V - V.
D V - F - V - V.
Para conseguir os insights certos, big data é, normalmente, dividido em três características: Volume, 
Velocidade e Variedade. Esses são considerados pilares de Big Data, mas também necessitam de outros 
sistemas de informação para que possam existir. Considerando os componentes Volume e Variedade de dados 
e sua relação com outros sistemas, classifique V para as sentenças verdadeiras e F para as falsas:
( ) Em ERP são considerados Interação com Clientes e Detalhes de Oferta.
( ) Em Big Data são considerados Dinâmica de preços e Redes de afiliados.
( ) Na Web são considerados Sensores RFID e Informações Consolidadas.
( ) Em CRM Detalhe de Compra e Registro de Compra.
8
9
21/03/2024, 10:39 Avaliação I - Individual
about:blank 5/5
Assinale a alternativa que apresenta a sequência CORRETA:
A F - F - F - F.
B F - V - F - F.
C F - F - V - V.
D V - F - V - F.
O dado tem sido considerado o petróleo da nova era. A tecnologia existente hoje é completamente 
confiável, mas os softwares e as plataformas apenas ajudam a organizar. Tornar o projeto viável depende de 
conhecer conceitos e a própria cultura do ambiente corporativo. De acordo com estudos, 80% do conteúdo 
produzido em uma empresa normal é em formato não estruturado. Sobre Big Data, assinale a alternativa 
CORRETA:
FONTE: https://pt.wikibooks.org/wiki/SQL/Dados_Estruturados,_Semi-
Estruturados_e_N%C3%A3o_Estruturados. Acesso em: 8 maio 2021.
A Big Data é um tipo de banco de dados relacional.
B Big data são os dados semiestruturados.
C
Big Data tem como tradução literal "grandes dados", termo inicialmente instituído para determinar o
grande volume de dados gerados pelos sistemas de informação, podendo ser representado sobre a soma
de volume, variedade e velocidade.
D
Big Data tem como tradução literal "pequenos dados", termo inicialmente instituído para determinar o
grande volume de dados gerados pelos sistemas de informação, podendo ser representado sobre a soma
de volume, variedade e velocidade.
10
Imprimir

Outros materiais