Prévia do material em texto
Pontuação desta tentativa: 60 de 60 Enviado 21 de ago de 2021 em 18:52 Esta tentativa levou 12 minutos. 6 / 6 ptsPergunta 1 Existem diversos tipos de sistemas de recomendação, inclusive os baseados em filtros colaborativos e os baseados em conteúdo. Acerca desses dois tipos de sistemas de recomendação, assinale a afirmativa INCORRETA: Os sistemas baseados em conteúdo não utilizam as informações do produto para fazer recomendações. Correto!Correto! Os sistemas baseados em filtros colaborativos utilizam as interações dos usuários com o sistema para gerar as recomendações. Podemos ter um sistema híbrido com as duas abordagens, para evitar o problema do cold start e para evitar o problema de pouca generalização do sistema baseado em conteúdo. Os sistemas baseados em conteúdo utilizam as informações do produto para as recomendações. Os sistemas baseados em conteúdo utilizam as informações do produto como principal fonte de informação para fazer a recomendação. 6 / 6 ptsPergunta 2 Existem diversas opções de frameworks de processamento de fluxos contínuos de dados no mercado, atualmente. Qual das opções abaixo é uma delas? Cassandra. Apache spark. Correto!Correto! HBase. MongoDB. O Apache Spark é a única ferramenta da lista que faz processamento, as demais são opções de bancos de dados NoSQL. 6 / 6 ptsPergunta 3 O Apache Flume trabalha utilizando agentes que farão a coleta de informações de algum local e enviar para outro. A matriz de ratings transposta é utilizada para recomendações de qual tipo? Item Item. Usuários para itens. Correto!Correto! Itens para usuários. Usuário Usuário. Em geral a matriz de ratings possui os usuários nas linhas e os itens nas colunas. E assim é utilizada para recomendar itens para usuário. Quando fazemos a transposição, ela passa a recomendar Usuários para itens. 6 / 6 ptsPergunta 4 Atualmente as empresas que trabalham com Big Data em aplicações de tempo real utilizam soluções com infraestrutura em Cloud. Indique a alternativa que explica por que essas soluções atendem muito bem a este tipo de demanda e possui um custo bem reduzido em comparação a uma infraestrutura criada toda internamente, para resolver o mesmo problema: Elevado custo de manutenção. Exige um número grande máquinas para criar um cluster local. Pouco poder de processamento. Baixo custo de manutenção. Correto!Correto! As soluções em nuvem evitam muitos custos com manutenção da infraestrutura. 6 / 6 ptsPergunta 5 Uma das principais formas de se identificar padrões de comportamento do usuário, principalmente para sistemas de recomendação, é por meio dos ratings, formas com a qual o usuário pode avaliar direta ou indiretamente um item ou produto. O rating de uma página foi feito representado por dois valores, -1 e 1, correspondentes a gostei e não gostei. Esse rating é de qual tipo? Binário. Correto!Correto! Contínuo. Unário. Ordinal. Esse formato de rating é binário. Assume apenas dois valores, sendo 1 ou -1, poderia também ser representado por 0 ou 1. 6 / 6 ptsPergunta 6 Além do Apache Storm, vimos – ao longo da disciplina – uma outra ferramenta para processamento de dados via stream. Qual ferramenta é essa? Spark. Correto!Correto! Flume. Kafka. Kylin. O Apache Spark é uma ferramenta de processamento online próximo ao tempo real. Muito utilizada no mercado. 6 / 6 ptsPergunta 7 O Apache Spark não pode ser considerado como real time de verdade. Ele é visto como próximo do tempo real. Isso ocorre porque ele trabalha com processa apenas uma única informação por vez. microbatches. Correto!Correto! eventos individuais à medida que chegam. eventos separados. O Apache Spark trabalha com pequenos pacotes, composto por pelo menos um evento, podendo chegar a blocos de alguns eventos. Apesar de ser muito rápido, não pode ser considerado real time. 6 / 6 ptsPergunta 8 A grande utilização da internet permitiu a obtenção de mais dados relacionados aos usuários, utilizados para sistemas de recomendação. Esses dados são: Feedback. Correto!Correto! Páginas não ligadas à venda de produtos. Fotos que o usuário posta. APIs que o usuário usa. As diversas formas de feedback fornecidas pelo usuário, são as principais informações utilizadas para sistemas de recomendação, pois representam a interação do usuário com o sistema, para que padrões possam ser identificados e recomendações mais corretas sejam geradas. 6 / 6 ptsPergunta 9 Os sistemas de recomendação estão presentes na vida de praticamente todas as pessoas. Quem abriu o Gmail, YouTube ou Facebook, sem dúvida se deparou com uma recomendação. Os sistemas de recomendação são uma disciplina de estudo associados com qual área? Integração e APIs. Sistemas operacionais. Aprendizado de Máquina. Correto!Correto! Redes de computadores. Os sistemas de recomendação são uma área de estudo dentro do Aprendizado de Máquina. 6 / 6 ptsPergunta 10 O Apache Spark Streaming é um módulo do Spark que trabalha com eventos em microbatches, próximo ao tempo real. Em qual parte de uma arquitetura de Big Data Online, o Apache Spark Streaming é normalmente utilizado? Ingestão. Armazenamento. Visualização. Processamento. Correto!Correto! O Apache Spark Streaming é o módulo do Apache Spark que trabalha com microbatches para processamento próximo ao tempo real. Pontuação do teste: 60 de 60