Baixe o app para aproveitar ainda mais
Prévia do material em texto
08/12/2021 21:12 PROVA ONLINE: 10. Integração e Processamento de Fluxo Contínuo de Dados (2019) https://pucminas.instructure.com/courses/1764/quizzes/60823 1/7 PROVA ONLINE Entrega Sem prazo Pontos 60 Perguntas 10 Disponível depois 15 de mai de 2020 em 10:00 Limite de tempo 60 Minutos Tentativas permitidas Sem limite Instruções Histórico de tentativas Tentativa Tempo Pontuação MAIS RECENTE Tentativa 1 19 minutos 48 de 60 Pontuação desta tentativa: 48 de 60 Enviado 8 dez em 21:11 Esta tentativa levou 19 minutos. ATENÇÃO: Verifique em "Notas" se você não atingiu o aproveitamento necessário nesta disciplina. Caso você já tenha realizado uma prova anterior e opte por uma nova tentativa, será identificado como uma prova extra e resultará em pagamento de taxa extra. INSTRUÇÕES DA AVALIAÇÃO ON-LINE A prova tem a duração de 60 minutos. Ao clicar em PROVA ON-LINE, no menu “Testes” você iniciará a prova. A partir daí não será possível desistir de realizá-la. A prova é composta de 10 questões objetivas, cada uma no valor de 6 pontos. Ao final do teste não se esqueça de enviá-lo, clicando no botão “ENVIAR TESTE”. Só utilize esse botão quando tiver finalizado a avaliação. Se necessário, durante a prova, entre em contato pelo link “Atendimento”. ATENÇÃO: Todas as provas iniciadas e que não houverem sido submetidas serão automaticamente encerradas pelo sistema transcorridos os 60 minutos de duração. Boa Prova! Fazer o teste novamente 0 / 6 ptsPergunta 1 Existem diversas aplicações no mundo real que trabalham com fluxos contínuos de dados. https://pucminas.instructure.com/courses/1764/quizzes/60823/history?version=1 https://pucminas.instructure.com/courses/1764/quizzes/60823/take?user_id=46471 08/12/2021 21:12 PROVA ONLINE: 10. Integração e Processamento de Fluxo Contínuo de Dados (2019) https://pucminas.instructure.com/courses/1764/quizzes/60823 2/7 O que é o Apache Flume? Ferramenta para armazenamento de informações – um banco NoSQL. Ferramenta para processamento de streams. Você respondeuVocê respondeu Ferramenta para visualização de dados. Ferramenta coletora de dados de uma determinada fonte, e que possui um destino definido para enviar essas informações. Resposta corretaResposta correta O Apache Flume é uma ferramenta que faz parte da coleta de dados, e envia para um sink, ou destino, definido no arquivo de configuração do seu agente. 6 / 6 ptsPergunta 2 Os sistemas de recomendação estão presentes na vida de praticamente todas as pessoas. Quem abriu o Gmail, YouTube ou Facebook, sem dúvida se deparou com uma recomendação. Os sistemas de recomendação são uma disciplina de estudo associados com qual área? Integração e APIs. Aprendizado de Máquina. Correto!Correto! Redes de computadores. Sistemas operacionais. Os sistemas de recomendação são uma área de estudo dentro do Aprendizado de Máquina. 08/12/2021 21:12 PROVA ONLINE: 10. Integração e Processamento de Fluxo Contínuo de Dados (2019) https://pucminas.instructure.com/courses/1764/quizzes/60823 3/7 6 / 6 ptsPergunta 3 O Apache Flume trabalha utilizando agentes que farão a coleta de informações de algum local e enviar para outro. A matriz de ratings transposta é utilizada para recomendações de qual tipo? Item Item. Usuários para itens. Correto!Correto! Itens para usuários. Usuário Usuário. Em geral a matriz de ratings possui os usuários nas linhas e os itens nas colunas. E assim é utilizada para recomendar itens para usuário. Quando fazemos a transposição, ela passa a recomendar Usuários para itens. 6 / 6 ptsPergunta 4 Existem diversas opções de frameworks de processamento de fluxos contínuos de dados no mercado, atualmente. Qual das opções abaixo é uma delas? Cassandra. MongoDB. HBase. Apache spark. Correto!Correto! 08/12/2021 21:12 PROVA ONLINE: 10. Integração e Processamento de Fluxo Contínuo de Dados (2019) https://pucminas.instructure.com/courses/1764/quizzes/60823 4/7 O Apache Spark é a única ferramenta da lista que faz processamento, as demais são opções de bancos de dados NoSQL. 6 / 6 ptsPergunta 5 O Apache Spark não pode ser considerado como real time de verdade. Ele é visto como próximo do tempo real. Isso ocorre porque ele trabalha com eventos individuais à medida que chegam. processa apenas uma única informação por vez. eventos separados. microbatches. Correto!Correto! O Apache Spark trabalha com pequenos pacotes, composto por pelo menos um evento, podendo chegar a blocos de alguns eventos. Apesar de ser muito rápido, não pode ser considerado real time. 6 / 6 ptsPergunta 6 Existe uma arquitetura denominada Flafka por diversas empresas. Ela possui a combinação de duas ferramentas muito utilizadas na etapa de ingestão de dados. Quais são essas duas ferramentas? Kafka e Storm. Storm e Spark. 08/12/2021 21:12 PROVA ONLINE: 10. Integração e Processamento de Fluxo Contínuo de Dados (2019) https://pucminas.instructure.com/courses/1764/quizzes/60823 5/7 Flume e Storm. Flume e Kafka. Correto!Correto! Esse nome é a combinação de Kafka e Flume. 0 / 6 ptsPergunta 7 Atualmente as empresas que trabalham com Big Data em aplicações de tempo real utilizam soluções com infraestrutura em Cloud. Indique a alternativa que explica por que essas soluções atendem muito bem a este tipo de demanda e possui um custo bem reduzido em comparação a uma infraestrutura criada toda internamente, para resolver o mesmo problema: Exige um número grande máquinas para criar um cluster local. Pouco poder de processamento. Elevado custo de manutenção. Você respondeuVocê respondeu Baixo custo de manutenção. Resposta corretaResposta correta As soluções em nuvem evitam muitos custos com manutenção da infraestrutura. 6 / 6 ptsPergunta 8 Existem diversas aplicações no mundo real que trabalham com fluxos contínuos de dados e algumas delas trabalham na ingestão dessas informações. O que é o Apache Kafka? 08/12/2021 21:12 PROVA ONLINE: 10. Integração e Processamento de Fluxo Contínuo de Dados (2019) https://pucminas.instructure.com/courses/1764/quizzes/60823 6/7 Ferramenta para armazenamento de informações – um banco NoSQL. É uma ferramenta de mensageria que funciona como buffer para as informações, colocando cada uma em um tópico. Correto!Correto! Ferramenta coletora de dados de uma determinada fonte e que possui um destino definido para enviar essas informações. Ferramenta para visualização de dados. Executar um simples cadastro de usuário de forma offline não é algo feito o tempo todo e não ocorre chegadas nem envios de informação. É uma aplicação comum, não representando um fluxo contínuo de dados. 6 / 6 ptsPergunta 9 A grande utilização da internet permitiu a obtenção de mais dados relacionados aos usuários, utilizados para sistemas de recomendação. Esses dados são: Fotos que o usuário posta. APIs que o usuário usa. Páginas não ligadas à venda de produtos. Feedback. Correto!Correto! 08/12/2021 21:12 PROVA ONLINE: 10. Integração e Processamento de Fluxo Contínuo de Dados (2019) https://pucminas.instructure.com/courses/1764/quizzes/60823 7/7 As diversas formas de feedback fornecidas pelo usuário, são as principais informações utilizadas para sistemas de recomendação, pois representam a interação do usuário com o sistema, para que padrões possam ser identificados e recomendações mais corretas sejam geradas. 6 / 6 ptsPergunta 10 Existe um tipo específico de arquitetura que trabalha com a parte on-line, parte batch e a parte de serviços. Qual é essa arquitetura? Arquitetura de microsserviços. Arquitetura Lambda. Correto!Correto! Arquitetura Batch. Arquitetura On-line. A arquitetura lambda é muito utilizada em Big Data e aborda tanto parte online, quanto batch e uma camada de serviços, que apresenta os dados, armazena e outros. Pontuação do teste: 48 de 60
Compartilhar