PROVA_PROVA ONLINE_ 10 Integração e Processamento de Fluxo Contínuo de Dados (2019)

•

PUC-MINAS

2

0

2

0

KaLe Technology

09/12/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Big Data

5.974 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

08/12/2021 21:12 PROVA ONLINE: 10. Integração e Processamento de Fluxo Contínuo de Dados (2019)
https://pucminas.instructure.com/courses/1764/quizzes/60823 1/7
PROVA ONLINE
Entrega Sem prazo Pontos 60 Perguntas 10
Disponível depois 15 de mai de 2020 em 10:00 Limite de tempo 60 Minutos
Tentativas permitidas Sem limite
Instruções
Histórico de tentativas
Tentativa Tempo Pontuação
MAIS RECENTE Tentativa 1 19 minutos 48 de 60
Pontuação desta tentativa: 48 de 60
Enviado 8 dez em 21:11
Esta tentativa levou 19 minutos.
ATENÇÃO: Verifique em "Notas" se você não atingiu o aproveitamento necessário
nesta disciplina.
Caso você já tenha realizado uma prova anterior e opte por uma nova tentativa, será
identificado como uma prova extra e resultará em pagamento de taxa extra.
INSTRUÇÕES DA AVALIAÇÃO ON-LINE
A prova tem a duração de 60 minutos.
Ao clicar em PROVA ON-LINE, no menu “Testes” você iniciará a prova. A partir daí não será possível
desistir de realizá-la.
A prova é composta de 10 questões objetivas, cada uma no valor de 6 pontos.
Ao final do teste não se esqueça de enviá-lo, clicando no botão “ENVIAR TESTE”. Só utilize esse botão
quando tiver finalizado a avaliação.
Se necessário, durante a prova, entre em contato pelo link “Atendimento”.
ATENÇÃO: Todas as provas iniciadas e que não houverem sido submetidas serão automaticamente
encerradas pelo sistema transcorridos os 60 minutos de duração.
Boa Prova!
Fazer o teste novamente
0 / 6 ptsPergunta 1
Existem diversas aplicações no mundo real que trabalham com fluxos
contínuos de dados.
https://pucminas.instructure.com/courses/1764/quizzes/60823/history?version=1
https://pucminas.instructure.com/courses/1764/quizzes/60823/take?user_id=46471
08/12/2021 21:12 PROVA ONLINE: 10. Integração e Processamento de Fluxo Contínuo de Dados (2019)
https://pucminas.instructure.com/courses/1764/quizzes/60823 2/7
O que é o Apache Flume?
Ferramenta para armazenamento de informações – um banco NoSQL.
Ferramenta para processamento de streams. Você respondeuVocê respondeu
Ferramenta para visualização de dados.

Ferramenta coletora de dados de uma determinada fonte, e que possui um
destino definido para enviar essas informações.
Resposta corretaResposta correta
O Apache Flume é uma ferramenta que faz parte da coleta de dados, e
envia para um sink, ou destino, definido no arquivo de configuração do
seu agente.
6 / 6 ptsPergunta 2
Os sistemas de recomendação estão presentes na vida de praticamente
todas as pessoas. Quem abriu o Gmail, YouTube ou Facebook, sem dúvida
se deparou com uma recomendação.
Os sistemas de recomendação são uma disciplina de estudo associados com
qual área?
Integração e APIs.
Aprendizado de Máquina. Correto!Correto!
Redes de computadores.
Sistemas operacionais.
Os sistemas de recomendação são uma área de estudo dentro do
Aprendizado de Máquina.
08/12/2021 21:12 PROVA ONLINE: 10. Integração e Processamento de Fluxo Contínuo de Dados (2019)
https://pucminas.instructure.com/courses/1764/quizzes/60823 3/7
6 / 6 ptsPergunta 3
O Apache Flume trabalha utilizando agentes que farão a coleta de
informações de algum local e enviar para outro.
A matriz de ratings transposta é utilizada para recomendações de qual tipo?
Item Item.
Usuários para itens. Correto!Correto!
Itens para usuários.
Usuário Usuário.
Em geral a matriz de ratings possui os usuários nas linhas e os itens
nas colunas. E assim é utilizada para recomendar itens para usuário.
Quando fazemos a transposição, ela passa a recomendar Usuários
para itens.
6 / 6 ptsPergunta 4
Existem diversas opções de frameworks de processamento de fluxos
contínuos de dados no mercado, atualmente.
Qual das opções abaixo é uma delas?
Cassandra.
MongoDB.
HBase.
Apache spark. Correto!Correto!
08/12/2021 21:12 PROVA ONLINE: 10. Integração e Processamento de Fluxo Contínuo de Dados (2019)
https://pucminas.instructure.com/courses/1764/quizzes/60823 4/7
O Apache Spark é a única ferramenta da lista que faz processamento,
as demais são opções de bancos de dados NoSQL.
6 / 6 ptsPergunta 5
O Apache Spark não pode ser considerado como real time de verdade. Ele é
visto como próximo do tempo real.
Isso ocorre porque ele trabalha com
eventos individuais à medida que chegam.
processa apenas uma única informação por vez.
eventos separados.
microbatches. Correto!Correto!
O Apache Spark trabalha com pequenos pacotes, composto por pelo
menos um evento, podendo chegar a blocos de alguns eventos.
Apesar de ser muito rápido, não pode ser considerado real time.
6 / 6 ptsPergunta 6
Existe uma arquitetura denominada Flafka por diversas empresas. Ela possui
a combinação de duas ferramentas muito utilizadas na etapa de ingestão de
dados.
Quais são essas duas ferramentas?
Kafka e Storm.
Storm e Spark.
08/12/2021 21:12 PROVA ONLINE: 10. Integração e Processamento de Fluxo Contínuo de Dados (2019)
https://pucminas.instructure.com/courses/1764/quizzes/60823 5/7
Flume e Storm.
Flume e Kafka. Correto!Correto!
Esse nome é a combinação de Kafka e Flume.
0 / 6 ptsPergunta 7
Atualmente as empresas que trabalham com Big Data em aplicações de
tempo real utilizam soluções com infraestrutura em Cloud.
Indique a alternativa que explica por que essas soluções atendem muito bem
a este tipo de demanda e possui um custo bem reduzido em comparação a
uma infraestrutura criada toda internamente, para resolver o mesmo
problema:
Exige um número grande máquinas para criar um cluster local.
Pouco poder de processamento.
Elevado custo de manutenção. Você respondeuVocê respondeu
Baixo custo de manutenção. Resposta corretaResposta correta
As soluções em nuvem evitam muitos custos com manutenção da
infraestrutura.
6 / 6 ptsPergunta 8
Existem diversas aplicações no mundo real que trabalham com fluxos
contínuos de dados e algumas delas trabalham na ingestão dessas
informações.
O que é o Apache Kafka?
08/12/2021 21:12 PROVA ONLINE: 10. Integração e Processamento de Fluxo Contínuo de Dados (2019)
https://pucminas.instructure.com/courses/1764/quizzes/60823 6/7
Ferramenta para armazenamento de informações – um banco NoSQL.

É uma ferramenta de mensageria que funciona como buffer para as
informações, colocando cada uma em um tópico.
Correto!Correto!

Ferramenta coletora de dados de uma determinada fonte e que possui um
destino definido para enviar essas informações.
Ferramenta para visualização de dados.
Executar um simples cadastro de usuário de forma offline não é algo
feito o tempo todo e não ocorre chegadas nem envios de informação.
É uma aplicação comum, não representando um fluxo contínuo de
dados.
6 / 6 ptsPergunta 9
A grande utilização da internet permitiu a obtenção de mais dados
relacionados aos usuários, utilizados para sistemas de recomendação.
Esses dados são:
Fotos que o usuário posta.
APIs que o usuário usa.
Páginas não ligadas à venda de produtos.
Feedback. Correto!Correto!
08/12/2021 21:12 PROVA ONLINE: 10. Integração e Processamento de Fluxo Contínuo de Dados (2019)
https://pucminas.instructure.com/courses/1764/quizzes/60823 7/7
As diversas formas de feedback fornecidas pelo usuário, são as
principais informações utilizadas para sistemas de recomendação, pois
representam a interação do usuário com o sistema, para que padrões
possam ser identificados e recomendações mais corretas sejam
geradas.
6 / 6 ptsPergunta 10
Existe um tipo específico de arquitetura que trabalha com a parte on-line,
parte batch e a parte de serviços.
Qual é essa arquitetura?
Arquitetura de microsserviços.
Arquitetura Lambda. Correto!Correto!
Arquitetura Batch.
Arquitetura On-line.
A arquitetura lambda é muito utilizada em Big Data e aborda tanto
parte online, quanto batch e uma camada de serviços, que apresenta
os dados, armazena e outros.
Pontuação do teste: 48 de 60