Prévia do material em texto
Banco de dados relacional e big data Professor(a): Cassio Rodolfo Aveiro da Silva (Mestrado acadêmico) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! Alternativas: I – B; II – A; III – C. CORRETO I – C; II – B; III – A. I – C; II – A; III – B. I – A; II – B; III – C. INCORRETO I – A; II – C; III – B. Código da questão: 56506 Assinale a alternativa que possui algumas tecnologias que dão suporte ao Big Data. Alternativas: Hapop e MapReduce, Cassandra. Hadoop e MapReduce, Cassandra. CORRETO Hadoop e MapRoad, Cassandra. Hadoop e NoteReduce, Cassandra. Hadoop e MapReduce, Lisandra. Código da questão: 56488 Resolução comentada: o Data Mart é o que gera grupos menores de dados selecionados de acordo com os interesses finais, enquanto os Hadoops MapReduce e Distributed File System são responsáveis respectivamente por mapear dados, escolhendo e fragmentando em tuplas de interesse para serem combinados e fornecer o resultado para a consulta; e dividir os dados em pequenos blocos e realizar cópias de segurança destes. Resolução comentada: algumas tecnologias dão suporte ao Big Data, como Hadoop e MapReduce, Cassandra, (sistema open source), muito utilizados pelas redes sociais, na parte de análise e de infraestrutura, para armazenar e processar os dados. O Hadoop é um projeto open source, desenvolvido pelos projetos Hadoop MapReduce (HMR), utilizado para processamento paralelo; Hadoop Distributed File System (HDFS), utilizados para trabalho com dados não estruturados. 3) 4) 5) Em relação aos dois módulos principais do sistema de gestão de banco de dados, qual das alternativas apresenta corretamente tais módulos? Alternativas: Módulo de escrita e módulo de leitura. Módulo empresarial e módulo pessoal. Módulo automático e módulo manual. Módulo cliente e módulo servidor. CORRETO Módulo integrado e módulo dividido. Código da questão: 56501 Pensando na definição de Big Data, qual das alternativas a seguir traz corretamente as palavras-chave dessa concepção? Alternativas: Distribuição; transparência; otimização; análises. Valor; criação; avaliação; consultas; processamento. Estratégia; oferta; objetivos; velocidade; distribuição. Volume; velocidade; veracidade; variedade; valor. CORRETO Integração; agregação; segurança; dispersão. Código da questão: 56508 Sobre os componentes e módulos de um DBMS, considere as seguintes afirmações: ( ) O armazenamento é realizado em disco rígido para DBMS instalados fisicamente em uma empresa. ( ) Os gerenciadores de armazenamento são os responsáveis por controlar o armazenamento físico dos dados. ( ) O processador runtime é o responsável em manipular os buffers de memória. ( ) O catálogo de dados não se enquadra como componente de um DBMS. ( ) O compilador de consulta é responsável em gerenciar o quantitativo de dados no DBMS. Assinale a alternativa que contenha a sequência correta: Alternativas: F – V – F – F – F. V – F – F – F – F. V – V – F – F – F. CORRETO Resolução comentada: Os sistemas de gestão de banco de dados são baseados na relação cliente-servidor. Consequentemente, os dois principais módulos são o Módulo Cliente (com interfaces relacionais com o usuário) e o Módulo Servidor (para a realização das operações físicas do banco de dados). Resolução comentada: conhecidos como 5Vs, o volume, a velocidade, a veracidade, a variedade e o valor são palavras que definem o que é Big Data e sua concepção. 6) 7) V – V – F – F – V. V – V – F – V – F. Código da questão: 56498 Em relação à cardinalidade, existem dois tipos. Assinale a alternativa que os define bem: Alternativas: Cardinalidade máxima: o número mínimo de vezes em que pode haver ocorrência de uma entidade A em B. Cardinalidade mínima: o número mínimo de vezes que pode haver ocorrência de uma entidade A em uma entidade B. Cardinalidade máxima: o número máximo de vezes em que pode haver ocorrência de uma entidade A em B.Cardinalidade mínima: o número mínimo de vezes que pode haver ocorrência de uma entidade A em uma entidade B. CORRETO Cardinalidade máxima: o número máximo de vezes em que um banco de dados pode ser repetido em outras empresas.Cardinalidade mínima: o número mínimo de vezes que um banco de dados pode ser repetido em outras empresas. Cardinalidade máxima: o número máximo de vezes em que pode haver ocorrência de um banco possuir Big Data.Cardinalidade mínima: o número mínimo de vezes que pode haver ocorrência de um banco possuir Big Data. Cardinalidade máxima: o número máximo de vezes em que pode haver ocorrência de erros.Cardinalidade mínima: o número mínimo de vezes que pode haver ocorrência de erros. Código da questão: 56489 Um conceito também importante no banco de dados é a cardinalidade, que pode ser entendida como: Alternativas: A capacidade de fabricação e armazenamento dos dados. O número de racionamento das ocorrências de determinadas entidades. O grau de raciocínio das ocorrências de determinadas entidades. Resolução comentada: o gerenciador de armazenamento é responsável por controlar o armazenamento físico de dados no disco rígido. O compilador de consulta analisa os comandos de consulta solicitados e gera códigos de acesso ao processador runtime, o qual é responsável por controlar esse acesso ao banco de dados em tempo de execução, logo após o gerenciador de buffers carregar todos os buffers necessários ao sistema. Todos os detalhes de acesso e manipulação de dados são salvos no componente chamado catálogo de dados. Resolução comentada: cardinalidade máxima: refere-se ao número máximo de vezes em que pode haver ocorrência de uma entidade A em B. Cardinalidade mínima: refere-se ao número mínimo de vezes que pode haver ocorrência de uma entidade A em uma entidade B. Os valores possíveis são zero ou um. Nos relacionamentos em que temos a possibilidade de ocorrência N vezes, temos então uma cardinalidade máxima para esses casos. 8) A sequência de dados organizados das entidades. O grau de relacionamento das ocorrências de determinadas entidades. CORRETO Código da questão: 56495 Sobre os impactos do uso de Big Data, pode-se afirmar que: I. As ações preditivas são permitidas graças ao imenso volume de dados analisados de diferentes fontes e, consequentemente, diferentes lugares. II. Decisões automatizadas roubam o lugar do ser humano, caracterizando-se como impacto negativo. III. Os interesses individuais de usuários consumidores estão cada vez mais compreendidos pelas empresas, obtendo resultados relevantes em suas consultas. IV. O aumento do processamento de dados trouxe menos transparência de informações. V. Os planos de negócio são otimizados com Big Data, revendo ações estratégicas em função das informações obtidas sobre os padrões de clientes e de consumo de regiões selecionadas. São verdadeiras: Alternativas: I – III – IV. II – III – IV. I – IV – V. III – IV – V. I – III – V. CORRETO Código da questão: 56507 Resolução comentada: um conceito também importante no banco de dados é a cardinalidade, que pode ser entendida como o grau de relacionamento das ocorrências de determinadas entidades. Resolução comentada: a afirmação I é verdadeira, pois esse imenso volume de informações permite encontrar padrões e relações recorrentes em dados, o que permite prever a ocorrência de um fenômeno ou evento; a III é correta, pois trata-se da segmentação da população ao nível individual do usuário em virtude de que o processamento de dados em massa permite identificar padrões comportamentais como os de consumo, filtrando e apresentando apenas resultados que realmente serão interessantes; e a V é correta, pois a identificaçãode padrões individuais ou regionais permite mudar os planos de negócio de uma empresa, otimizando práticas de venda cruzada, marketing direcionado à localidade, manutenção de clientes, entre outras mudanças. A II está errada, pois as decisões automatizadas são impactos positivos e que não surgiram para substituir o homem, e sim auxiliá-lo em situações que exigem ultrarrapidez em processamento de dados, o que o ser humano é incapaz de realizar. A IV é errônea, na verdade, o aumento do processamento de dados foi gerado também por um aumento do acesso a dados, que antes eram inacessíveis, permitindo cruzamentos de informações que podem gerar visualizações de demanda populacionais ou mesmo desvios em contas públicas, de modo geral, maior transparência. 9) 10) Sobre os cinco “Vs” de Big Data, considere as seguintes afirmações: ( ) Compreende as características valor, veracidade, volume, velocidade e variedade. ( ) Obtenção de dados estruturados ou não, em diversas fontes, é o que define variedade de Big Data. ( ) Veracidade relaciona-se ao rápido processamento de dados, em tempo real, garantindo sua integridade e, consequentemente, confiabilidade. ( ) Dados são sinônimos de valor quando são tratados de forma a serem importantes e com potencial de agregar valor às empresas. ( ) Volume corresponde à seleção de pequenos grupos de dados importantes, com posterior descarte dos que não trarão retorno. Assinale a alternativa que contenha a sequência correta: Alternativas: F – V – F – V – F. V – V – F – V – V. V – V – F – V – F. CORRETO V – F – F – V – F. V – V – F – F – F. Código da questão: 56505 Qual das alternativas a seguir apresenta corretamente os tipos de informações obtidas por meio do data mining (mineração de dados)? Alternativas: De incrementação; funcionais; emergenciais; valiosas; de descarte. Associativas; sequenciais; classificativas; de aglomeração; de prognósticos. CORRETO De incrementação; sequenciais; de aglomeração; colaborativas; de seleção. Retroativas; corporativas; funcionais; estruturais; de visualização. De incrementação; associativas; colaborativas; introdutória; de seleção. Código da questão: 56509 Resolução comentada: os 5Vs de Big Data são: volume (quanto mais informações, mais possibilidades de se obterem informações valiosas); velocidade (processamento em tempo real); veracidade (garantia de que os dados são confiáveis, imparciais e não tendenciosos); variedade (os dados devem vir das mais variadas fontes possíveis, podem ser estruturados ou não); e valor (os dados devem agregar valor às empresas, trazendo retorno financeiro). Resolução comentada: os tipos de informações obtidas do data mining são: associativas, referentes a ocorrências de um mesmo evento; sequenciais, que ocorrem durante o evento; classificativas, que definem o perfil de clientes; de aglomeração, agrupando perfis identificados; e de prognósticos, que preveem valores a partir da análise de outros valores. Arquivos e Links