Buscar

4- Prova - Integração e Processamento de Fluxo Contínuo de Dados (2021)


Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Pontuação desta tentativa: 60 de 60
Enviado 21 de ago de 2021 em 18:52
Esta tentativa levou 12 minutos.
6 / 6 ptsPergunta 1
Existem diversos tipos de sistemas de recomendação, inclusive os
baseados em filtros colaborativos e os baseados em conteúdo.
Acerca desses dois tipos de sistemas de recomendação, assinale a
afirmativa INCORRETA:
 
Os sistemas baseados em conteúdo não utilizam as informações do
produto para fazer recomendações.
 
Correto!Correto!
 
Os sistemas baseados em filtros colaborativos utilizam as interações
dos usuários com o sistema para gerar as recomendações.
 
 
Podemos ter um sistema híbrido com as duas abordagens, para evitar
o problema do cold start e para evitar o problema de pouca
generalização do sistema baseado em conteúdo.
 
 
Os sistemas baseados em conteúdo utilizam as informações do
produto para as recomendações.
 
Os sistemas baseados em conteúdo utilizam as informações do
produto como principal fonte de informação para fazer a
recomendação.
6 / 6 ptsPergunta 2
Existem diversas opções de frameworks de processamento de fluxos
contínuos de dados no mercado, atualmente.
Qual das opções abaixo é uma delas?
 Cassandra. 
 Apache spark. Correto!Correto!
 HBase. 
 MongoDB. 
O Apache Spark é a única ferramenta da lista que faz
processamento, as demais são opções de bancos de dados
NoSQL.
6 / 6 ptsPergunta 3
O Apache Flume trabalha utilizando agentes que farão a coleta de
informações de algum local e enviar para outro.
A matriz de ratings transposta é utilizada para recomendações de qual
tipo?
 Item Item. 
 Usuários para itens. Correto!Correto!
 Itens para usuários. 
 Usuário Usuário. 
Em geral a matriz de ratings possui os usuários nas linhas e os
itens nas colunas. E assim é utilizada para recomendar itens
para usuário. Quando fazemos a transposição, ela passa a
recomendar Usuários para itens.
6 / 6 ptsPergunta 4
Atualmente as empresas que trabalham com Big Data em aplicações
de tempo real utilizam soluções com infraestrutura em Cloud.
Indique a alternativa que explica por que essas soluções atendem
muito bem a este tipo de demanda e possui um custo bem reduzido
em comparação a uma infraestrutura criada toda internamente, para
resolver o mesmo problema:
 Elevado custo de manutenção. 
 Exige um número grande máquinas para criar um cluster local. 
 Pouco poder de processamento. 
 Baixo custo de manutenção. Correto!Correto!
As soluções em nuvem evitam muitos custos com manutenção
da infraestrutura.
6 / 6 ptsPergunta 5
Uma das principais formas de se identificar padrões de comportamento
do usuário, principalmente para sistemas de recomendação, é por
meio dos ratings, formas com a qual o usuário pode avaliar direta ou
indiretamente um item ou produto.
O rating de uma página foi feito representado por dois valores, -1 e 1,
correspondentes a gostei e não gostei. Esse rating é de qual tipo?
 Binário. Correto!Correto!
 Contínuo. 
 Unário. 
 Ordinal. 
Esse formato de rating é binário. Assume apenas dois valores,
sendo 1 ou -1, poderia também ser representado por 0 ou 1.
6 / 6 ptsPergunta 6
Além do Apache Storm, vimos – ao longo da disciplina – uma outra
ferramenta para processamento de dados via stream.
Qual ferramenta é essa?
 Spark. Correto!Correto!
 Flume. 
 Kafka. 
 Kylin. 
O Apache Spark é uma ferramenta de processamento online
próximo ao tempo real. Muito utilizada no mercado.
6 / 6 ptsPergunta 7
O Apache Spark não pode ser considerado como real time de verdade.
Ele é visto como próximo do tempo real.
Isso ocorre porque ele trabalha com
 processa apenas uma única informação por vez. 
 microbatches. Correto!Correto!
 eventos individuais à medida que chegam. 
 eventos separados. 
O Apache Spark trabalha com pequenos pacotes, composto por
pelo menos um evento, podendo chegar a blocos de alguns
eventos. Apesar de ser muito rápido, não pode ser considerado
real time.
6 / 6 ptsPergunta 8
A grande utilização da internet permitiu a obtenção de mais dados
relacionados aos usuários, utilizados para sistemas de recomendação.
Esses dados são:
 Feedback. Correto!Correto!
 Páginas não ligadas à venda de produtos. 
 Fotos que o usuário posta. 
 APIs que o usuário usa. 
As diversas formas de feedback fornecidas pelo usuário, são as
principais informações utilizadas para sistemas de
recomendação, pois representam a interação do usuário com o
sistema, para que padrões possam ser identificados e
recomendações mais corretas sejam geradas.
6 / 6 ptsPergunta 9
Os sistemas de recomendação estão presentes na vida de
praticamente todas as pessoas. Quem abriu o Gmail, YouTube ou
Facebook, sem dúvida se deparou com uma recomendação.
Os sistemas de recomendação são uma disciplina de estudo
associados com qual área?
 Integração e APIs. 
 Sistemas operacionais. 
 Aprendizado de Máquina. Correto!Correto!
 Redes de computadores. 
Os sistemas de recomendação são uma área de estudo dentro
do Aprendizado de Máquina.
6 / 6 ptsPergunta 10
O Apache Spark Streaming é um módulo do Spark que trabalha com
eventos em microbatches, próximo ao tempo real.
Em qual parte de uma arquitetura de Big Data Online, o Apache Spark
Streaming é normalmente utilizado?
 Ingestão. 
 Armazenamento. 
 Visualização. 
 Processamento. Correto!Correto!
O Apache Spark Streaming é o módulo do Apache Spark que
trabalha com microbatches para processamento próximo ao
tempo real.
Pontuação do teste: 60 de 60

Mais conteúdos dessa disciplina