Prévia do material em texto
Aula 00 Curso: Informática – Teoria e Questões comentadas p/ TRF Professor: Gustavo Cavalcante Informática/Análise de Informações 75 Questões para ISS Aracaju Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 3 de 51 www.exponencialconcursos.com.br Fala pessoal, tudo tranquilo? Trago para vocês 75 Questões Comentadas de Análise de Informações para a Prefeitura de Aracaju (ISS-Aracaju). Neste material, busquei trazer as questões mais recentes da banca CESPE. Você pode usar este material para avaliar como a banca cobra os principais assuntos do seu edital ou ainda como um simulado. Aproveito para te indicar nossas transmissões no Youtube, em que você pode acompanhar nossa discussão a respeito de cada um dos tópicos do edital ao vivo ou mesmo nos vídeos gravados. Veja, por exemplo, nosso primeiro encontro de Análise de Informações: https://www.youtube.com/watch?v=3h5520GvCk8 Playlist completa em: https://www.youtube.com/watch?v=3h5520GvCk8&list=PLva2C7MtgiEeKtPsG M4kw-eJ487MmsFOz 75 Questões Comentadas de Análise de Informações (ISS Aracaju) Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 4 de 51 www.exponencialconcursos.com.br Caso tenha interesse em nosso curso completo para este concurso, deixo o link a seguir https://bit.ly/324FSUF Ah, e pode usar meu cupom de desconto ramon10 para obter 10% de desconto nos cursos do site. As questões foram organizadas da seguinte forma: ASSUNTOS PÁGINA 1. CONCEITOS BÁSICOS ................................................................... 5 2. BANCOS DE DADOS RELACIONAIS................................................ 12 3. BUSINESS INTELLIGENCE ........................................................... 24 4. DATA MINING ............................................................................ 36 5. BIG DATA ................................................................................. 45 Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 5 de 51 www.exponencialconcursos.com.br 1. CONCEITOS BÁSICOS 1- (CESPE - 2018 - TCM-BA - Auditor Estadual de Controle Externo) O diretor de uma montadora de veículos necessita tomar uma decisão acerca da continuidade ou não de um dos produtos vendidos no Brasil. Para tanto, solicitou um relatório sobre as vendas de carros da marca do último trimestre de 2018, por faixa de preço, região, modelo e cor. Nessa situação, no contexto de análise da informação, o relatório representa a) conhecimento. b) inteligência. c) dados. d) informação. e) sabedoria. Resolução: Meus caros, talvez este seja o tipo de questão mais difícil que pode aparecer na prova sobre o tema dado, informação, conhecimento e inteligência, pois requer que você não só conheça os conceitos, mas também consiga identificar o conceito mais adequado para uma dada situação. Vamos então aos itens: a) Incorreto: conhecimento é uma informação valiosa da mente humana, não podendo ser facilmente estruturada. Portanto, um relatório não representa um conhecimento, mas será utilizado pelo diretor para gerar conhecimento. b) Incorreto: inteligência é o conhecimento sintetizado e aplicado a determinada situação para ganhar maior profundidade de consciência da mesma. No caso em questão, só teremos inteligência, quando o diretor resolver tomar alguma decisão com base no conhecimento adquirido. c) Incorreto: Como o relatório representa dados organizados ou tratados, não representará dados, pois estes devem sequências de fatos brutos que representam eventos que ocorrem nas organizações ou no ambiente físico, antes de terem sido organizados e arranjados, processados, avaliados ou interpretados de uma forma que as pessoas possam entender e usar. d) Correto: Como o diretor solicitou um conjunto de dados organizados, o relatório representa uma informação, que representa o dado trabalhado ou tratado, que possui valor significativo atribuído ou agregado a ele e com um sentido natural e lógico para quem usa a informação. Pode ser definida como algo útil com relevância e propósito. e) Incorreto: sabedoria é sinônimo de conhecimento. Gabarito: Letra D. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 6 de 51 www.exponencialconcursos.com.br 2- (CESPE – 2017 – TCE-PE – Analista de Controle Externo – Auditoria de Contas Públicas) Acerca dos conceitos de dado, informação e conhecimento, julgue o item a seguir. A informação caracteriza-se por ser frequentemente tácita, bem como por ser de estruturação e captura difíceis em máquinas. Resolução: O item refere-se ao conceito de Conhecimento ou Capital Intelectual e não ao de informação. Conhecimento (ou Capital Intelectual) é uma informação contextual, relevante e acionável, ou de outro modo, é a informação em ação. É uma informação valiosa da mente, inclui reflexão, síntese e contexto. É difícil de estruturar, difícil de capturar em computadores, normalmente é tácito (não explícito) e sua transparência é complexa. Gabarito: Errado. 3- (CESPE - 2016 - TCE-SC - Auditor Fiscal de Controle Externo – Informática) Julgue o item a seguir, acerca de dado, informação, conhecimento e inteligência. Define-se informação como significado, ou seja, como registros icônicos e simbólicos — fonéticos ou numéricos — e signos — linguísticos, lógicos ou matemáticos —, por meio dos quais se representam atos, conceitos ou instruções. Resolução: Neste item a banca tenta te induzir ao erro, pois embora o conceito de informação esteja relacionado a significado, o que vem depois de “ou seja” traz claramente o conceito de dado, pois está associado a registros primários ou fatos brutos sem qualquer tratamento. Pela definição, um dado pode ser um conjunto de letras, números ou dígitos que podem ser descritos, armazenados ou manipulados, mas se tomado isoladamente não transmite nenhum conhecimento, ou seja, não possui significado claro. Gabarito: Errado. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 7 de 51 www.exponencialconcursos.com.br 4- (CESPE - 2010 - DPU - Técnico em Assuntos Educacionais) Dados acerca de determinado assunto de interesse de uma ou mais pessoas, que possam ser interpretados ou tenham significado para o receptor, são considerados a) aprendizagem organizacional. b) conhecimento. c) capital intelectual. d) informação. e) sistema de gerenciamento. Resolução: Questão conceitual. A informação é gerada quando os dados são coletados, organizados ou categorizados, orientados, combinados ou interpretados de forma significativa, ou seja, são atribuídos significados e contexto. Gabarito: Letra D. 5- (CESPE - 2016 - TCE-SC - Auditor Fiscal de Controle Externo – Informática) Julgue o item a seguir, acerca de dado, informação, conhecimento e inteligência. O atributo de inteligência depende mais da qualidade da informação disponível do que da sua quantidade, tendo, portanto, natureza qualitativa. Resolução: A qualidade da informação representa a agregação de valor aos dados até que os mesmos proporcionem informação, conhecimento e inteligência para os indivíduos e suas organizações. O item pode ser facilmente resolvido com a pirâmide informacional, então lembre que a hierarquia de transformação aumenta com a qualidade. Gabarito: Certo. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 8 de 51 www.exponencialconcursos.com.br 6- (CESPE - 2016 - TCE-PA - Auditor de Controle Externo - Área Administrativa – Psicologia) No que se refere aos conceitos e às aplicações da gestão do conhecimento e da gestão por competências, julgue o próximo item. O conhecimento tácito é pessoal, específico ao contexto e de difícil formulação e comunicação; o conhecimento explícito, por sua vez,é transmitido em linguagem formal e sistemática, propiciando ao indivíduo a apreensão de fatos. Resolução: Item tranquilo!!! Basta você saber a diferença entre o conhecimento tácito e o explícito. O conhecimento tácito é altamente pessoal e difícil de formalizar, tornando-se de comunicação e compartilhamento dificultoso. Já o conhecimento explícito é formal, sistemático, codificado ou estruturado. Gabarito: Certo. 7- (CESPE - 2011 - MEC - Analista de Processos) Julgue o próximo item, relativo à gestão do conhecimento. Considere que, em uma organização, os profissionais capazes de criar maquetes de prédios mostrem a seus aprendizes que, por meio da observação e imitação, eles obterão o conhecimento do assunto. Nessa situação, o processo de construção de conhecimento é realizado do conhecimento tácito para o explícito. Resolução: A assertiva trata de socialização, ou seja, a conversão de conhecimento tácito em tácito, que ocorre de indivíduos para indivíduos e envolve a observação, imitação ou prática. No exemplo dado, há uma troca de conhecimento entre os profissionais e os aprendizes e, portanto, um compartilhamento e criação de conhecimento por meio da experiência. A transformação do conhecimento tácito para explícito, ou externalização, consiste na comunicação do conhecimento por meio da escrita ou estruturação. Gabarito: Errado. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 9 de 51 www.exponencialconcursos.com.br 8- (CESPE - 2018 - TCE-PB - Auditor de Contas Públicas) A respeito de dados estruturados, não estruturados e abertos, julgue o item subsequente. Com relação à dados estruturados e não estruturados, assinale a opção correta. a) Por padrão, dados não estruturados são organizados em blocos semânticos. b) A alta heterogeneidade facilita as consultas aos dados não estruturados, desde que estes estejam ligados por ponteiros. c) Dados não estruturados podem ser caracterizados por arquivos cujas estruturas não são descritas implicitamente. d) Por padrão, documentos do tipo XML (eXtensible Markup Language) são estruturados. e) Dados não estruturados de um mesmo grupo possuem as mesmas descrições e, consequente, os mesmos atributos. Resolução: Vamos analisar as alternativas: a) Incorreto: Por padrão, dados não estruturados estruturados são organizados em blocos semânticos. b) Incorreto: A alta heterogeneidade facilita dificulta as consultas aos dados não estruturados, desde que estes estejam ligados por ponteiros. c) Correto: Dados não estruturados podem ser caracterizados por arquivos cujas estruturas não são descritas implicitamente. Dados não estruturados não possuem estrutura pré-definida. A estrutura implícita ocorre nos dados semiestruturados. d) Incorreto: Por padrão, documentos do tipo XML (eXtensible Markup Language) são estruturados semi-estruturados. e) Incorreto: Dados não estruturados estruturados de um mesmo grupo possuem as mesmas descrições e, consequente, os mesmos atributos. Gabarito: Letra C. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 10 de 51 www.exponencialconcursos.com.br 9- (CESPE - 2016 - TCE-SC - Auditor Fiscal de Controle Externo – Informática) A respeito de dados estruturados, não estruturados e abertos, julgue o item subsequente. Em se tratando de dados estruturados, a informação de esquema está mesclada aos valores dos dados, e cada objeto de dados pode ter atributos diferentes, que não são conhecidos com antecedência. Essa característica os diferencia de dados não estruturados. Resolução: As características descritas na assertiva referem-se aos dados semiestruturados e não aos dados estruturados. Os dados semiestruturados são auto-descritivos, isto é, o esquema de representação está presente (de forma explícita ou implícita) juntamente com o dado. Além disso, este tipo de dados apresenta como característica a estrutura parcial, que significa que nem todos dados estão organizados em uma estrutura. Os dados estruturados, por sua vez, possuem um esquema rígido e previamente planejado e, portanto, os objetos de dados são conhecidos com antecedência. A informação do esquema é separada dos dados. Gabarito: Errado. 10- (CESPE - 2013 - TRT - 17ª Região (ES) - Analista Judiciário – Arquivologia) Em relação aos metadados, julgue o próximo item. Os dados estruturados que descrevem e permitem encontrar, gerenciar, compreender e (ou) preservar documentos arquivísticos ao longo do tempo são conhecidos como metadados. Resolução: Os metadados são os dados estruturados que descrevem os dados, permitindo sua identificação, localização, explicação, gerenciamento e, portanto, facilitam a recuperação, uso e gestão dos dados. Gabarito: Certo. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 11 de 51 www.exponencialconcursos.com.br 11- (CESPE - 2016 - TCE-SC - Auditor Fiscal de Controle Externo – Informática) A respeito de dados estruturados, não estruturados e abertos, julgue o item subsequente. Dados abertos são os dados de livre utilização, reutilização e redistribuição, exigindo-se, no máximo, créditos à autoria e compartilhamento pela mesma licença. Resolução: Perfeita!!! Item trouxe uma definição de dados abertos bem alinhada àquela do Open Knowledge Internacional. Dados abertos são assim considerados quando qualquer pessoa pode livremente acessá-los, utilizá-los, modificá-los e compartilhá-los para qualquer finalidade, estando sujeito a, no máximo, a exigências que visem preservar sua proveniência e sua abertura. Gabarito: Certo. 12- (CESPE - 2018 - Polícia Federal - Escrivão de Polícia Federal) Julgue o item a seguir, a respeito da teoria da informação e de metadados de arquivos. O conhecimento é embasado na inteligência das informações que são coletadas e analisadas para uma organização. Resolução: Conhecimento (ou Capital Intelectual) é uma informação contextual, relevante e acionável, ou de outro modo, é a informação em ação. É uma informação valiosa da mente, inclui reflexão, síntese e contexto. É difícil de estruturar, difícil de capturar em computadores, normalmente é tácito (não explícito) e sua transparência é complexa. O Conhecimento é embasado em Informações e não em Inteligência. Pelo contrário, a Inteligência é que é baseada em Conhecimento. A hierarquia é formada na ordem: Dados -> informação -> conhecimento -> inteligência. Gabarito: Errado. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 12 de 51 www.exponencialconcursos.com.br 2. BANCOS DE DADOS RELACIONAIS 13- (CESPE - 2019 – SEFAZ-RS – Auditor Fiscal da Receita Estadual) As funções de um sistema de gerenciamento de banco de dados (SGBD) incluem a) gerenciar o becape e a recuperação de dados, bem como o escalonamento de processos no processador por meio do banco de dados. b) gerenciar o sistema de arquivos e a segurança do banco de dados. c) gerenciar a entrada e saída de dispositivos, linguagens de acesso ao banco de dados e interfaces de programação de aplicações. d) gerenciar a integridade de dados, o dicionário e o armazenamento de dados, bem como a memória do computador enquanto o SGBD estiver em execução. e) transformar e apresentar dados, controlar o acesso de multiusuário e prover interfaces de comunicação do banco de dados. Resolução: Um Sistema Gerenciador de Banco de Dados (SGBD) é uma coleção de programas que permite aos usuários criar e manter um banco de dados. O SGBD é um sistema de software de uso geral que facilita os seguintes processos: ▪ Definição: especificação de tipos, estruturas e restrições de dados. ▪ Construção: armazenamento dos dados em algum meio controlado. ▪ Manipulação: consulta, atualização e geração de relatórios. ▪ Compartilhamento: acesso simultâneo porusuários e sistemas. ▪ Proteção: proteção do sistema contra defeitos e proteção de segurança contra acesso não autorizado ou malicioso. ▪ Manutenção: evolução do sistema ao longo do tempo. Agora vamos aos itens: a) Incorreto: escalonamento de processos não é função do SGBD. b) Incorreto: gerenciar o sistema de arquivos não é função do SGBD. c) Incorreto: gerenciar dispositivos de entrada e saída não é função do SGBD. d) Incorreto: gerenciar a memória do computador não é função do SGBD. e) Correto: todas são funções do SGBD. As funções destacadas nos itens de a) a d) são do sistema operacional. Gabarito: Letra E. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 13 de 51 www.exponencialconcursos.com.br 14- (CESPE - 2018 - IPHAN - Analista I - Área 7) Acerca da abordagem relacional, da normalização e do SGBD, entre outros conceitos relativos a banco de dados, julgue o item a seguir. Padrões a serem impostos e requisitos contraditórios a serem equilibrados são considerados como desvantagens da abordagem de banco de dados. Resolução: Padrões a serem impostos e requisitos contraditórios a serem equilibrados são considerados como vantagens da abordagem de banco de dados. Conhecendo os requisitos globais da empresa, em oposição aos requisitos de usuários individuais, o DBA (Administrador de Banco de Dados), mais uma vez sob a orientação do administrador de dados, pode estruturar o sistema de modo a oferecer um serviço global que seja o melhor para empresa. Gabarito: Errado. 15- (CESPE - 2017 - TRF - 1ª REGIÃO - Analista Judiciário - Informática) A respeito dos conceitos de banco de dados, normalização, controle de concorrência e modelagem, julgue o item subsecutivo. Atomicidade é a propriedade que garante que as transações não sejam afetadas pelo funcionamento umas das outras nem tenham acesso aos resultados parciais entre si. Resolução: O conceito apresentado foi o de ISOLAMENTO. Gabarito: Errado. A to m ic id a d e Conceito: unidade de processament o atômica. A transação deve ser realizada em sua totalidade ou não deve ser realizada de forma alguma. Responsável Subsistema de recuperação. C o n s is tê n c ia Conceito: Uma transação deve levar o banco de dados de um estado consistente para outro. Responsável Programador ou módulo de restrições de integridade. I s o la m e n to Conceito: uma transação deve parecer executar isolada das demais. Responsável Subsistema de controle de concorrência. D u ra b il id a d e Conceito: as mudanças realizadas pela transação confirmada devem ser persistidas no banco de dados. Responsável Subsistema de recuperação. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 14 de 51 www.exponencialconcursos.com.br 16- (CESPE - 2018 - STM - Técnico Judiciário - Programação de Sistemas) Acerca dos conceitos de normalização de dados e dos modelos de dados, julgue o item subsequente. O modelo conceitual, que reflete uma estrutura simplificada do banco de dados, é responsável por registrar como os dados estão armazenados no sistema de gerenciamento de banco de dados (SGBD). Resolução: O modelo conceitual não trata COMO os dados estão armazenados, mas somente QUAIS dados serão armazenados. Gabarito: Errado. 17- (CESPE - 2018 - SEFAZ-RS - Técnico Tributário da Receita Estadual - Prova 1) O modelo de dados que possui métodos e capacidade de encapsulamento é o a) semiestruturado. b) baseado em objetos c) entidade-relacionamento. d) relacional. e) distribuído. Resolução: Um Modelo de dados de objeto define um banco de dados em termos de objetos, suas propriedades e operações. Os objetos com a mesma estrutura e comportamento pertencem a uma classe, e as classes são organizadas em hierarquias. As operações de cada classe são especificadas com procedimentos predefinidos, chamados métodos. Gabarito: Letra B. C o n c e it u a l Facilmente comprendido por usuários. Registra os dados. Independente de hardware e software. Elaborados na Modelagem Conceitual. Ex.: Modelo Entidade Relacionamento. L ó g ic o Compreensão intermediária. Representação específica de um modelo interno, utilizando as estruturas de BD Dependem do SGBD. Elaborados no Projeto Lógico. Ex.: Modelo Relacional. F ís ic o Difícil compreensão pelos usuários. Descrevem o armazenamento dos dados. Totalmente dependentes do SGBD. Elaborados no Projeto Físico. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 15 de 51 www.exponencialconcursos.com.br 18- (CESPE - 2019 – SEFAZ-RS – Auditor Fiscal da Receita Estadual) Uma das regras de Codd para o modelo relacional consiste a) na dependência de dados físicos (mudança na memória e no método de acesso). b) na independência de distribuição. c) na presença de uma linguagem de programação no SGBD que promova interface com o banco de dados, com a segurança e a atualização de dados. d) na subversão das regras de integridade ou restrições quando utilizada uma linguagem de baixo nível. e) no não tratamento das atualizações de visões de dados. Resolução: As Doze regras de Codd são um conjunto de treze regras (enumeradas de zero a doze) propostas por Edgar F. Codd, um contumaz do modelo relacional para banco de dados, designado para definir o que é necessário para que um sistema de gerenciamento de banco de dados para ser considerado relacional. A Regra 11 - Independência de Distribuição afirma que a distribuição de partes do SGBD em várias localidades deve ser transparente para os usuários do mesmo, isto é, os usuários não são afetados pela localização dos dados. Gabarito: Letra B. D o z e ( tr e z e ) re g ra s d e C o d d p a ra B a n c o s R e la c io n a is Regra 0 - Regra fundamental ou regra base Regra 1 - A regra da informação ou Princípio da Informação Regra 2 - A regra de acesso garantido Regra 3 - Tratamento sistemático de valores nulos Regra 4 - Catálogo on-line baseado no modelo relacional Regra 5 - Sublinguagem Ampla de Dados Regra 6 - Atualização de visões Regra 7 - Inserção, Atualização, e Exclusão de alto nível Regra 8 - Independência Física de dados Regra 9 - Independência Lógica de Dados Regra 10 - Independência de Integridade Regra 11 - Independência de Distribuição Regra 12 - A não-transposição das regras Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 16 de 51 www.exponencialconcursos.com.br 19- (CESPE - 2018 - Polícia Federal - Perito Criminal Federal) Acerca de banco de dados, julgue o seguinte item. Situação hipotética: Ao analisar um computador, Marcos encontrou inúmeros emails, vídeos e textos advindos, em sua maioria, de comentários em redes sociais. Descobriu também que havia relação entre vários vídeos e textos encontrados em um diretório específico. Assertiva: Nessa situação, tendo como referência somente essas informações, Marcos poderá inferir que se trata de um grande banco de dados relacional, visto que um diretório é equivalente a uma tabela e cada arquivo de texto é equivalente a uma tupla; além disso, como cada arquivo possui um código único, poderá deduzir que esse código é a chave primária que identifica o arquivo de forma unívoca. Resolução: Caros, um banco de dados relacional não é formado por documentos, mas sim por um conjunto de tabelas. O Princípio da Informação aborda justamente isso, afirmando que todos os dados devem ser organizados em tabelas (ainda que armazenados em estruturas diferentes) e, portanto, todo o conteúdo de informação do banco de dados é representado de um e somente um modo, ou seja, como valores explícitos em posições de colunas em linhas de tabelas. Assim, como esse banco não é percebido pelo usuário como um conjunto de tabelas, mas sim como um conjunto de documentos e outras mídias,não se trata de um banco relacional. Gabarito: Errado. 20- (CESPE - 2016 - TCE-SC - Auditor Fiscal de Controle Externo – Informática) Com relação aos bancos de dados relacionais, julgue os próximos itens. O catálogo de um sistema de gerenciamento de banco de dados relacional armazena a descrição da estrutura do banco de dados e contém informações a respeito de cada arquivo, do tipo e formato de armazenamento de cada item de dado e das restrições relativas aos dados. Resolução: Uma característica fundamental da abordagem de banco de dados é que seu sistema contém não apenas o próprio banco de dados, mas também uma definição ou descrição completa de sua estrutura e restrições, que fica armazenada no catálogo ou dicionário de dados do SGBD. Esse catálogo contém informações como a estrutura de cada arquivo, o tipo e o formato de armazenamento de cada item de dados e diversas restrições sobre os dados. A informação armazenada no catálogo é chamada de metadados, e descreve a estrutura do banco de dados. Gabarito: Certo. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 17 de 51 www.exponencialconcursos.com.br 21- (CESPE - 2017 - TCE-PE - Auditor de Controle Externo - Auditoria de Contas Públicas) Acerca de aspectos diversos referentes a banco de dados relacional, julgue os itens a seguir. Em uma relação, os nomes das colunas são únicos, as linhas são distintas entre si, e a ordem da disposição das linhas e colunas é irrelevante para o banco de dados. Resolução: Assertiva bastante interessante trazida pelo CESPE. A questão parece totalmente correta, no entanto, há um erro que pode passar aos olhos do candidato no momento da realização da prova. Vejamos: O item traz as seguintes informações que são corretas para o modelo relacional: ❖ Os nomes das colunas são únicos; ❖ As linhas são distintas entre si (ao menos um atributo deve ser diferente); ❖ A ordem da disposição das linhas é irrelevante; No entanto, afirma também que a ordem das colunas é irrelevante, o que não é verdade. Uma tupla é uma lista ordenada de valores, de modo que a ordem dos valores em uma tupla – e, portanto, dos atributos em um esquema de relação – é importante. Em resumo, ❖ A ordem das linhas não é relevante. ❖ A ordem das colunas é relevante, a não ser que a correspondência entre elas e seus valores seja mantida. Assim o item ficaria correto da seguinte forma: Em uma relação, os nomes das colunas são únicos, as linhas são distintas entre si, e a ordem da disposição das linhas e colunas é irrelevante para o banco de dados. Gabarito: Errado. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 18 de 51 www.exponencialconcursos.com.br 22- (CESPE - 2018 - FUB - Técnico de Tecnologia da Informação) Acerca dos conceitos de otimização de consultas SQL e técnicas de análise de desempenho, julgue o próximo item. Álgebra relacional é um conjunto de operações sobre relações, sendo gerada dessas operações uma relação de saída. Resolução: A álgebra relacional define um conjunto de operações nas relações, em paralelo com as operações algébricas usuais, como adição, subtração ou multiplicação, que operam em números. Assim como as operações algébricas nos números tomam um ou mais números como entrada e retornam um número como saída, as operações de álgebra relacional geralmente tomam uma ou duas relações como entrada e retornam uma relação como saída. As operações são esquematizadas no quadro a seguir. Operações da álgebra relacional Seleção (σ) Retorna as tuplas da relação que satisfazem um predicado. Projeção (П) Retorna os atributos especificados de todas as linhas da relação de entrada, removendo as tuplas duplicadas da saída. Junção ( ) Retorna pares de linhas das duas relações de entrada que têm o mesmo valor em todos os atributos que possuem o mesmo nome. Produto cartesiano (X) Retorna todos os pares de linhas das duas relações de entrada (independentemente de ter ou não os mesmos valores em atributos comuns). União (Ս) Retorna as tuplas que estão na primeira relação, na segunda relação, ou em ambas. Intersecção (Ո) Retorna as tuplas que aparecem tanto na primeira relação quanto na segunda. Diferença (-) Retorna tuplas que aparecem na primeira relação, mas não estão na segunda. Gabarito: Certo. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 19 de 51 www.exponencialconcursos.com.br 23- (CESPE - 2017 - TCE-PE - Analista de Controle Externo - Auditoria de Contas Públicas) A respeito de bancos de dados relacionais, julgue os itens subsequentes. Uma visão (view) é derivada de uma ou mais relações e armazena os dados em uma tabela física do banco de dados, visando tornar ágeis as consultas. Resolução: Uma visão é uma tabela virtual é não uma tabela física. Uma visão (ou view) é uma única tabela que é derivada de outras tabelas. Por não necessariamente existir em forma física é considerada uma tabela virtual. É importante destacar que certos sistemas de bancos de dados permitem que as visões sejam armazenadas. Essas visões armazenadas são chamadas de visões materializadas. Gabarito: Errado. 24- (CESPE - 2011 - Correios - Analista de Correios - Analista de Sistemas - Produção) Com relação a banco de dados, julgue os itens a seguir. No acesso aos dados de tabelas em um banco de dados, a utilização de índices melhora o desempenho de acesso do usuário final. Resolução: Os índices são usados justamente para melhorar a velocidade de acesso às informações. Os índices são estruturas de acesso auxiliares associados a tabelas, que são utilizados para agilizar a recuperação de registros em resposta a certas condições de pesquisa. Gabarito: Certo. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 20 de 51 www.exponencialconcursos.com.br 25- (CESPE - 2018 - FUB - Técnico de Tecnologia da Informação) Julgue o item seguinte, a respeito dos conceitos de modelagem de dados e níveis de abstração. Na cardinalidade de mapeamento entre o conjunto de entidades X e Y de uma associação um-para-um, uma entidade em X é associada, no máximo, a uma entidade em Y, e uma entidade em Y é associada, no máximo, a uma entidade em X. Resolução: No relacionamento de cardinalidade 1:1, cada elemento de uma tabela se relaciona a um único elemento de outra tabela. Uma das tabelas possui uma chave estrangeira que se liga logicamente a chave primária da outra tabela. Este relacionamento é pouco comum nos modelos de bancos de dados relacionais. Gabarito: Certo. R e la c io a n m e n to s (a s s o c ia ç ã o e n tr e a s t a b e la s ) (e x is te m a p e n a s l o g ic a m e n te , m a s n ã o f is ic a m e n te ) Um para Um (1:1) Cada elemento de uma tabela se relaciona a um único elemento de outra tabela. Em bancos relacionais, uma das tabelas possui a chave estrangeira. Pode-se, porém, mesclar as entidades em uma única tabela ou criar uma terceira tabela para cruzar as chaves primárias destas. Um para Muitos (1:N) Cada elemento de uma tabela r1 pode ser relacionar com mais de um elemento da tabela r2, no entanto cada elemento da tabela r2 está relacionado a apenas um elemento de r1. Em bancos de dados relacionais, a tabela do lado N da relação possui a chave estrangeira. Muitos para Muitos (N:M) Para cada valor do campo de uma tabela, pode haver N valores no campo da outra tabela e vice-versa. Os dados estão diretamente relacionados ao fato (ou ao relacionamento), e não as entidades (ou tabelas). Em bancos de dados relacionais, esta relação consuma-se através de uma tabela de ligação. Esta tabela pode possuir atributos próprios. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 21 de 51 www.exponencialconcursos.com.br 26- (CESPE- 2019 – SEFAZ-RS – Auditor Fiscal da Receita Estadual) No modelo relacional, a afirmação “Duas tuplas distintas, em qualquer estado da relação, não podem ter valores idênticos para os atributos na chave” é a) falsa. b) uma restrição de domínio do modelo. c) uma propriedade exclusiva do modelo objeto-relacional. d) uma condição que deverá estar explícita na representação dos atributos de uma tupla. e) uma propriedade de chave do modelo. Resolução: Uma chave é um conjunto de um ou mais atributos que, coletivamente, nos permitem identificar de forma exclusiva uma tupla na relação, sendo que a remoção de qualquer dos seus atributos a faz deixar de identificar unicamente a tupla na relação. Em resumo, uma chave apresenta duas propriedades: ❖ Duas tuplas distintas na relação não podem ter valores idênticos para os atributos na chave; ❖ É uma superchave mínima, ou seja, uma superchave da qual não podemos remover nenhum atributo sem acabar com a restrição de exclusividade. Gabarito: Letra E. 27- (CESPE - 2018 - Polícia Federal - Perito Criminal Federal - Área 3) Acerca de banco de dados, julgue o item seguinte. Em um banco de dados relacional, os dados são armazenados em tabelas; e as tabelas, organizadas em colunas. Resolução: A tabela é a estrutura chave do banco de dados relacional, servindo para representar os dados e relacionamentos entre esses dados. Uma tabela é organizada em colunas, que servem para ajudar a interpretar o significado dos valores em cada linha. Formalmente, um cabeçalho da coluna é chamado de atributo. O número de colunas de uma relação representa o grau (ou aridade) desta relação. Gabarito: Certo. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 22 de 51 www.exponencialconcursos.com.br 28- (CESPE - 2018 - TCE-MG - Analista de Controle Externo - Ciência da Computação) De acordo com a normalização de entidades em bancos de dados relacionais, a entidade cujos atributos não chave independem de outro atributo não chave está na a) quinta forma normal (5FN). b) primeira forma normal (1FN). c) segunda forma normal (2FN). d) terceira forma normal (3FN). e) quarta forma normal (4FN). Resolução: A descrição trazida na questão se refere a 3FN. Uma relação está na 3FN se estiver na 2FN e cada atributo não chave não possuir dependência transitiva, para cada chave candidata. Todos os atributos dessa tabela devem ser independentes uns dos outros, ao mesmo tempo que devem ser dependentes exclusivamente da chave primária da tabela. Gabarito: Letra D. 1FN •Todos os atributos são atômicos. •Não possui atributos multivalorados nem compostos. 2FN •Está na 1FN. •Cada atributo não-chave é dependente da chave primária (ou candidata) inteira. (Dependência funcional total) •Cada atributo não-chave não pode ser dependente de apenas parte da chave. 3FN •Está na 2FN. •Cada atributo não chave não possui dependência transitiva, para cada chave candidata. •Todos os atributos dependem exclusivamente da chave primária da tabela. BCFN •Está na 3FN (variação forte da 3FN). •Todo determinante é chave candidata. •Não há dependências entre atributos não chave. 4FN •Está na 3FN. •Não possui dependência multivalorada. 5FN •Está na 4FN. •Não possui dependência de junção. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 23 de 51 www.exponencialconcursos.com.br 29- (CESPE - 2018 - SEFAZ-RS - Técnico Tributário da Receita Estadual - Prova 1) Na elaboração de um projeto de banco de dados, é função da normalização evitar a) a repetição de informações. b) a criação de pequenas tabelas. c) o armazenamento de dados pessoais d) o procedimento de relacionar dados de diferentes fontes. e) a extrapolação do tamanho máximo dos campos das tabelas. Resolução: A normalização de dados pode ser considerada um processo de analisar os esquemas de relação dados com base em suas dependências funcionais e chaves primárias para conseguir as propriedades desejadas e a (1) minimização de redundância e (2) a minimização de anomalias de inserção, exclusão e atualização. Assim, evitar a redundância (repetição) de informações é uma das principais funções da normalização. Gabarito: Letra A. 30- (CESPE - 2018 - IPHAN - Analista I - Área 7) Acerca da abordagem relacional, da normalização e do SGBD, entre outros conceitos relativos a banco de dados, julgue o item a seguir. Uma relação está na quarta forma normal (4FN) quando o conteúdo do registro não pode ser mais reconstruído (efetuar join) a partir de outros registros menores extraídos desse registro considerado. Resolução: Uma relação está na quinta forma normal 5FN, quando o seu conteúdo do registro não puder ser reconstruído (junção) a partir de outros registros menores, extraídos do registro principal. Ou seja, se ao particionar um registro, e sua junção posterior não conseguir recuperar as informações contidas no registro original, então este registro está na 5FN. Gabarito: Errado. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 24 de 51 www.exponencialconcursos.com.br 3. BUSINESS INTELLIGENCE 31- (CESPE - 2019 - SEFAZ-RS - Auditor Fiscal da Receita Estadual - Bloco I) A respeito do BI (business intelligence), assinale a opção correta. a) O BI consiste na transformação metódica e consciente das informações exclusivamente prestadas pelos tomadores de decisão em novas formas de conhecimento, para evolução dos negócios e dos resultados organizacionais. b) ETL é o processo de análise de dados previsto pela arquitetura de BI. c) As técnicas do BI objetivam definir regras para a formatação adequada dos dados, com vista a sua transformação em depósitos estruturados de informações, sem considerar a sua origem. d) O repositório de dados analíticos de BI é representado pelas diversas bases de dados relacionais e por repositórios de dados que utilizem modelagens relacionais. e) A camada de apresentação de uma arquitetura de BI é aquela em que as informações são organizadas e centralizadas. Resolução: Vamos comentar os itens: a) Incorreto: as informações tratadas pelo BI não são exclusivamente prestadas pelos tomadores de decisão, mas sim provenientes de diversas fontes. b) Incorreto: ETL é o processo de Extração, Transformação e Carga dos dados para o ambiente de BI. Para análise são usadas outras ferramentas, como OLAP e Data Mining. c) Correto: A pedra angular do BI é o Data Warehouse, que centraliza dados de diversas fontes em uma estrutura multidimensional (tabelas fato e tabelas dimensão). d) Incorreto: O repositório no ambiente de BI é o Data Warehouse, que utiliza o modelo multidimensional e não o modelo relacional. e) Incorreto: A camada de apresentação é a utilizada para fornecer a visualização de dados para os gestores. Como exemplos dessas ferramentas, temos: Dashboards (painéis); Portais corporativos, cockpits e outras ferramentas de visualização; Sistemas de Informações Geográficas (SIG). Os dados são organizados e centralizados a partir do uso de ETL. Gabarito: Letra C. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 25 de 51 www.exponencialconcursos.com.br 32- (CESPE - 2019 - SEFAZ-RS - Auditor Fiscal da Receita Estadual - Bloco I) O data warehouse diferencia-se dos bancos de dados transacionais porque a) trabalha com dados atuais, mas não com dados históricos. b) faz uso intenso de operações diárias e de processamento de transações continuamente. c) possui milhares de usuários de diferentes níveis hierárquicos dentro da organização. d) tem dimensionalidade genérica e níveis de agregação ilimitados. e) utiliza ferramentas de prospecção e consulta de dados baseadas em OLTP (on-line transaction processing). Resolução: Vamos analisar os itens: a) Incorreto: trabalham com dados atuaise históricos. b) Incorreto: o foco não é nas transações, mas na consulta de dados. c) Incorreto: os bancos transacionais também podem ter vários usuários. d) Correto: dimensionalidade genérica diz respeito a capacidade de tratar informações em qualquer quantidade de dimensões. Devido às várias dimensões existentes, deve haver vários níveis de agregação dos dados. e) Incorreto: utilizam ferramentas OLAP e não OLTP. Gabarito: Letra D. 33- (CESPE - 2010 - TRE-MT - Programador de computador - ADAPTADA) Com relação aos conceitos de modelagem dimensional, assinale a opção correta. a) Na abordagem utilizada por Kimball, todos os dados de uma empresa são reunidos em um repositório central, caracterizado por um projeto dimensional, e que pode ser consultado diretamente. b) A abordagem de Inmon consolida todas as informações de uma empresa em um repositório central chamado data warehouse corporativo. Essa abordagem é caracterizada por um projeto na terceira forma normal, no qual os dados são consultados diretamente por aplicativos de data warehouse. c) Na abordagem de Kimball, os data marts são adaptados às necessidades e pontos de vista de um grupo de negócios específico, suportando a modelagem dimensional, e são consultados por aplicativos de data warehouse. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 26 de 51 www.exponencialconcursos.com.br d) A abordagem de data marts autônomos tem foco empresarial e atende às necessidades dentro de uma área de assunto. Seu desenvolvimento necessita explorar o uso de elementos de dados comuns em toda a empresa. Resolução: Questão que requer o conhecimento das diferenças entre as duas abordagens para o desenvolvimento de banco de dados: a de Inmon e a de Kimball. Vamos a análise dos itens: a) Correto: Kimball adota uma abordagem que inicia pela construção de data marts que são agregados ou reunidos em um data warehouse. Dessa forma, o que fica disponível para ser acessado é o DW que é um grande repositório sobre todas as informações da organização. b) Incorreto: Na abordagem de Inmon, constrói-se inicialmente o DW com todos os dados da organização que alimenta os DMs departamentais. As ferramentas de consultas operam sobre os DMs e não sobre o DW. c) Incorreto: Conforme discutido no item A, na abordagem de Kimball, o que é acessado é o DW e não os data marts. d) Incorreto: Os data marts têm foco departamental ou setorial e não empresarial, além disso, os elementos de dados comuns são considerados no data warehouse e não nos data marts individuais. Gabarito: Letra A. 34- (CESPE - 2011 - MEC - Analista de Sistemas) Com relação à arquitetura OLAP, julgue o item seguinte. Um cubo, ou hipercubo, é um array multidimensional no qual um grupo de células de dados é organizado segundo as dimensões dos dados. Resolução: Assertiva de acordo com a definição do cubo de dados utilizado no modelo dimensional ou multidimensional. Segundo Navathe, os modelos multidimensionais tiram proveito dos relacionamentos inerentes nos dados para preencher os dados em matrizes multidimensionais, chamadas de cubos de dados. Nestes cubos, o desempenho da consulta pode ser muito melhor do que no modelo de dados relacional e os dados podem ser consultados diretamente a partir de qualquer combinação de suas dimensões. Os cubos que possuem mais de três dimensões são chamados de hipercubos, mas não são facilmente apresentados de maneira gráfica. Gabarito: Certo. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 27 de 51 www.exponencialconcursos.com.br 35- (CESPE - 2018 - CGM de João Pessoa - PB - Auditor Municipal de Controle Interno - Desenvolvimento de Sistemas) A respeito de business intelligence, julgue o próximo item. Na modelagem multidimensional utilizada em data warehouses para se prover melhor desempenho, a tabela fato central deve relacionar-se às suas dimensões por meio da chave primária oriunda da fonte de dados original. O valor dessa chave deve ser idêntico ao da fonte, para que tenha valor semântico e garanta que o histórico das transações seja mantido. Resolução: A relação entre a tabela fato é as tabelas dimensões é através das chaves primárias das próprias dimensões e não das fontes de dados originais. Todas as tabelas de fatos têm duas ou mais chaves estrangeiras, que se conecta às chaves primárias das tabelas de dimensões. Por exemplo, a chave do produto na tabela de fatos sempre combinará uma chave de produto específica na tabela de dimensão do produto. A tabela de fatos é acessada através das tabelas de dimensões relacionadas a ela. Gabarito: Errado. 36- (CESPE - 2018 - FUB - Técnico de Tecnologia da Informação) Acerca de bases de dados multidimensionais, julgue o item seguinte. O modelo em estrela de um banco de dados multidimensional tem como objetivo representar e manipular dados complexos, visando tornar aqueles dados mais representativos em semântica e construções de modelagens por meio de nós e suas ligações. Resolução: O modelo em estrela de um banco de dados multidimensional objeto relacional tem como objetivo representar e manipular dados complexos, visando tornar aqueles dados mais representativos em semântica e construções de modelagens por meio de nós e suas ligações. O esquema estrela (star schema) consiste em uma tabela de fatos com uma única tabela para cada dimensão. Neste esquema, existe uma tabela fato central conectada a várias tabelas dimensão. Gabarito: Errado. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 28 de 51 www.exponencialconcursos.com.br 37- (CESPE - 2010 - TRT - 21ª Região (RN) - Analista Judiciário - Tecnologia da Informação) Acerca de sistemas de suporte a decisão e data warehousing, julgue os itens a seguir. Em um data warehouse, cada linha em uma tabela fato corresponde a uma medida, representada por um valor aditivo, em que necessariamente essas medidas não compartilham a mesma granularidade. Resolução: As medidas de uma tabela fato podem ser aditivas, semi-aditivas ou não aditivas. Além disso uma das 10 regras de Kimball para a modelagem dimensional prevê que é necessário se certificar de que todos os fatos em uma única tabela fato estão na mesma granularidade ou nível de detalhe. Gabarito: Errado. 38- (CESPE - 2014 - ANATEL - Técnico em Regulação - Telecomunicações) Julgue o item seguinte, com relação à disponibilização de informações de apoio a decisões estratégicas e gerenciais. As ferramentas de business inteligence são consideradas ferramentas do tipo OLTP (online transaction processing). Resolução: O item relaciona erroneamente as ferramentas de BI com as OLTP. Na verdade são as ferramentas OLAP é que são utilizadas em ambientes de BI, sendo as OLTP utilizadas em ambientes transacionais. Gabarito: Errado. OLTP •Realizar funções comerciais cotidianas •Bancos de dados transacionais •Inclusão, alteração, exclusão e consulta •Relatórios de rotina, periódicos e estreitamente focados •Execução mais rápida •Atualização contínua • Recursos dos bancos de dados relacionais. OLAP •Suportar análise de decisões •DWs ou DMs •Carga e consulta. •Relatórios e consultas Ad hoc, multidimensionais, amplamente focados •Execução mais lenta •Atualização em lote •Recursos de computação distribuída, multiprocesamento e bancos especializados. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 29 de 51 www.exponencialconcursos.com.br 39- (CESPE - 2015 - MEC – Administrador de Dados) No que se refere a bancos de dados transacionais (OLTP) e a banco de dados analíticos (OLAP), julgue o item que se segue. OLAP é uma interface com o usuário que pode se utilizar de diversos modelos de armazenamento para apresentar as informações. As diversas formas de armazenamento e acessoa dados permitem classificar OLAP em diferentes categorias, como por exemplo, o ROLAP, em que os dados são armazenados de forma relacional, e o MOLAP, em que os dados são armazenados em estruturas multidimensionais. Resolução: Item que cobra a diferença entre MOLAP e ROLAP, que reside principalmente nas estruturas de armazenamento utilizadas. As ferramentas MOLAP (Processamento Analítico Multidimensional On- Line) requerem pré-computação e o armazenamento de informações no cubo de dados, isto é, um pré-processamento. As ferramentas ROLAP (Processamento Analítico Relacional On-line) não requerem pré-computação e armazenamento de informações, pois acessam os dados em um banco de dados relacional e geram consultas SQL para consultar informações em um nível apropriado solicitado pelo usuário. Gabarito: Certo. 40- (CESPE - 2018 - FUB - Técnico de Tecnologia da Informação) Acerca de bases de dados multidimensionais, julgue o item seguinte. O operador drill-down relaciona-se ao processo de apresentar dados do nível mais baixo da hierarquia de dados de um esquema para níveis mais altos. Resolução: O operador drill-down drill-up relaciona-se ao processo de apresentar dados do nível mais baixo da hierarquia de dados de um esquema para níveis mais altos. A operação Drill down fornece uma visão mais detalhada, desagregando unidades menores ao longo da dimensão. Assim, há sai de níveis mais altos para níveis mais baixos na hierarquia. Gabarito: Errado. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 30 de 51 www.exponencialconcursos.com.br 41- (CESPE - 2018 - CGM de João Pessoa - PB - Auditor Municipal de Controle Interno - Desenvolvimento de Sistemas) A respeito de business intelligence, julgue o próximo item. Uma ferramenta de ETL deve ser capaz de extrair dados de fontes heterogêneas, copiá-los para uma área de transição, onde possam ser convertidos conforme o padrão estabelecido, e, ainda, realizar limpeza e correção nesses dados, de acordo com regras preestabelecidas. Resolução: O processo ETL consiste na extração (leitura de dados de uma ou mais bases de dados), transformação (conversão dos dados extraídos de sua forma anterior para a forma em que precisa estar para que possa ser colocado em um data warehouse ou simplesmente outro banco de dados), e carga (colocar os dados no data warehouse). As ferramentas ETL também transportam dados entre fontes e destinos, documentam como os elementos de dados mudam à medida que se movem entre fonte e destino, trocam metadados com outras aplicações conforme necessário e administram todos os processos e operações de execução (por exemplo, agendamento, gerenciamento de erros, logs de auditoria, estatísticas). O ETL é extremamente importante para a integração de dados, bem como para data warehousing. O objetivo do processo ETL é carregar o armazém com dados integrados e limpos. Gabarito: Certo. 42- (CESPE - 2018 - IPHAN - Analista I - Área 7) Julgue o item que se segue, a respeito de tecnologias de sistemas de informação. O data warehouse é integrado, não volátil e orientado a assuntos, contudo, embora lide com dados e os armazene para a tomada de decisões gerenciadas, não é considerado um banco de dados, pois é variável em relação ao tempo. Resolução: O Data Warehouse é considerado um banco de dados. Gabarito: Errado. Data Warehouse Orientados a assunto Integrados Variante no tempo Não voláteis Repositório de dados atuais e históricos de potencial interesse para gestores de toda a organização. Conjunto de dados produzidos para apoiar a tomada de decisão. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 31 de 51 www.exponencialconcursos.com.br 43- (CESPE - 2019 - SEFAZ-RS - Auditor Fiscal da Receita Estadual - Bloco I) Com relação aos modelos de dados multidimensionais, assinale a opção correta. a) A principal característica da tabela de fatos é a ausência de dados redundantes, o que melhora o desempenho nas consultas. b) Esses modelos são cubos de dados, sendo cada cubo representado por uma única tupla com vários atributos. c) Esses modelos proporcionam visões hierárquicas, ou seja, exibição roll-up ou drill-down. d) Os modelos de dados multidimensionais dão ênfase à coleta e às transações de dados. e) Esses modelos não utilizam processos de transferência de dados, mas sim acessos nativos do próprio SGBD utilizado. Resolução: Vamos analisar os itens: a) Incorreto: a tabela fato não é normalizada, portanto, não podemos falar que não temos dados redundantes. Essa tabela representa as medidas de negócio. b) Incorreto: os cubos são formados por várias dimensões. c) Correto: as operações de drill-up (roll-ul) e drill-down permitem navegar por entre a hierarquia do modelo multidimensional. d) Incorreto: a ênfase dos modelos multidimensionais é na análise dos dados e não nas transações. e) Incorreto: o acesso não é realizado no SGBD, mas há transferência de dados para o DW e, depois, acesso aos dados nesse ambiente. Gabarito: Letra C. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 32 de 51 www.exponencialconcursos.com.br 44- (CESPE - 2018 - IPHAN - Analista I - Área 7) Julgue o item que se segue, a respeito de tecnologias de sistemas de informação. Na modelagem estrela, o desenvolvimento de um data warehouse permite que todas as métricas sejam sumarizadas em relação a todas as suas dimensões, visto que as chaves primárias da tabela fato são uma composição de chaves estrangeiras de todas as dimensões. Resolução: A chave primária da tabela fato é única, embora formada pelas várias chaves estrangeiras das tabelas dimensões associadas. Todas as tabelas de fatos têm duas ou mais chaves estrangeiras, que se conecta às chaves primárias das tabelas de dimensões. Por exemplo, a chave do produto na tabela de fatos sempre combinará uma chave de produto específica na tabela de dimensão do produto. A tabela de fatos é acessada através das tabelas de dimensões relacionadas a ela. Gabarito: Errado. 45- (CESPE - 2018 - EBSERH - Analista de Tecnologia da Informação) Julgue o item que se segue, a respeito de arquitetura e tecnologias de sistemas de informação. Usualmente, os data warehouses dão apoio a análises de série temporal e de tendências, as quais requerem maior volume de dados históricos do que os que geralmente são mantidos em bancos de dados transacionais. Resolução: Para Inmon, um Data Warehouse é uma coleção de dados orientada a assunto, integrada, não volátil, variável no tempo para suporte às decisões da gerência. Um DW é variante no tempo, pois mantém os dados históricos, permitindo a detecção de tendências, desvios e relações de longo prazo para previsões e comparações. Gabarito: Certo. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 33 de 51 www.exponencialconcursos.com.br 46- (CESPE - 2018 - TCM-BA - Auditor Estadual de Controle Externo) Acerca de modelagem dimensional, assinale a opção correta. a) As granularidades fundamentais para classificar todas as tabelas fato de um modelo dimensional são: transacional, snapshot periódico e snapshot acumulado. b) Os fatos e dimensões não são tabelas do banco de dados, pois, no modelo dimensional, são componentes do cubo de um data warehouse. c) No modelo estrela, as dimensões são normalizadas para tornar mais ágeis as consultas analíticas. d) O modelo floco de neve (SnowFlake) aumenta o espaço de armazenamento dos dados dimensionais, pois acrescenta várias tabelas ao modelo, todavia torna mais simples a navegação por software que utilizarão o banco de dados. e) Os códigos e as descrições associadas, usadas como nomes de colunas em relatórios e como filtros em consultas, não devem ser gravados em tabelas dimensionais.Resolução: Vamos analisar cada um dos itens: a) Correto: As granularidades fundamentais para classificar todas as tabelas fato de um modelo dimensional são: transacional, snapshot periódico e snapshot acumulado. Além dessas, temos: fato agregada, consolidada e fato sem fato. b) Incorreto: Os fatos e dimensões são tabelas do banco de dados integrantes do cubo de dados. c) Incorreto: No modelo estrela, as dimensões não são normalizadas. d) Incorreto: O modelo floco de neve (SnowFlake) aumenta o espaço de armazenamento dos dados dimensionais, pois acrescenta várias tabelas ao modelo, todavia torna mais simples complexa a navegação por software que utilizarão o banco de dados. e) Incorreto: as tabelas de dimensão devem conter os códigos e descrições associados aos nomes das colunas usados em relatórios e filtros de consultas. Gabarito: Letra A. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 34 de 51 www.exponencialconcursos.com.br 47- (CESPE - 2018 - STM - Técnico Judiciário - Programação de Sistemas) A respeito de ETL, julgue o item a seguir. O ambiente ETL permite a visualização dos dados para análise de maneira multidimensional. Resolução: O ambiente ETL OLAP permite a visualização dos dados para análise de maneira multidimensional. O OLAP é uma abordagem para responder rapidamente questões ad hoc através da execução de consultas analíticas multidimensionais em repositórios de dados organizacionais. O processo ETL consiste na extração (leitura de dados de uma ou mais bases de dados), transformação (conversão dos dados extraídos de sua forma anterior para a forma em que precisa estar), e carga (colocar os dados no data warehouse). Gabarito: Errado. 48- (CESPE - 2018 - CGM de João Pessoa - PB - Auditor Municipal de Controle Interno - Desenvolvimento de Sistemas) A respeito de business intelligence, julgue o próximo item. Business intelligence pode ser definido como um processo inteligente de coleta, organização, análise, compartilhamento e monitoração de dados que, depois de processados, geram informações para o suporte e para a tomada de decisões no ambiente de negócios. Resolução: O termo Business Intelligence (BI) é um conceito guarda-chuva que combina arquitetura, ferramentas, bancos de dados, ferramentas analíticas, aplicações e metodologias com os objetivos de habilitar o acesso interativo aos dados, habilitar a manipulação desses dados e prover aos gerentes de negócios e analistas a habilidade de conduzir análises apropriadas. Gabarito: Certo. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 35 de 51 www.exponencialconcursos.com.br 49- (CESPE - 2018 - CGM de João Pessoa - PB - Auditor Municipal de Controle Interno - Desenvolvimento de Sistemas) A respeito de business intelligence, julgue o próximo item. O modelo snowflake acrescenta graus de normalização às tabelas de dimensões, eliminando redundâncias; em termos de eficiência na obtenção de informações, seu desempenho é melhor que o do modelo estrela, o qual, apesar de possuir um único fato, possui tamanho maior que o do snowflake, considerando-se a desnormalização das tabelas de dimensões. Resolução: O desempenho do modelo snowflake é pior que o estrela justamente devido as normalizações. Para realizar as consultas devem ser feitas junções nas tabelas. Gabarito: Errado. 50- (CESPE - 2017 - TCE-PE - Auditor de Controle Externo - Auditoria de Contas Públicas) Julgue o próximo item, relativo à modelagem dimensional. Todas as tabelas de um modelo apresentam um elemento de tempo como parte da estrutura de chave. Resolução: Um elemento de tempo é uma dimensão que deve fazer parte da chave da tabela fato, mas não precisa, necessariamente, fazer parte de todas as tabelas dimensão do modelo. A chave primária de uma tabela fato é sempre composta ou concatenada e possui ao menos um elemento associado a uma dimensão de tempo. Dessa forma, somente um atributo da tabela de fatos e a dimensão tempo devem, obrigatoriamente, possuir um elemento de tempo na sua estrutura. Gabarito: Errado. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 36 de 51 www.exponencialconcursos.com.br 4. DATA MINING 51- (CESPE - 2018 - Polícia Federal - Perito Criminal Federal - Conhecimentos Básicos - Todas as Áreas) Acerca de banco de dados, julgue o seguinte item. Descobrir conexões escondidas e prever tendências futuras é um dos objetivos da mineração de dados, que utiliza a estatística, a inteligência artificial e os algoritmos de aprendizagem de máquina. Resolução: A mineração de dados (data mining) refere-se à mineração ou descoberta de novas informações em termos de padrões ou regras com base em grandes quantidades de dados. Dito de outro modo, o termo mineração de dados foi originalmente usado para descrever o processo pelo qual os padrões anteriormente desconhecidos em dados são descobertos. Tecnicamente falando, a mineração de dados é um processo que utiliza técnicas de estatística, matemática e inteligência artificial para extrair e identificar informações úteis e subsequentes conhecimentos (ou padrões) em grandes conjuntos de dados. Gabarito: Certo. 52- (CESPE - 2016 - TCE-SC - Auditor Fiscal de Controle Externo - Informática) Julgue o item subsecutivo, acerca de mineração de dados. Para a realização de prognósticos por meio de técnicas de mineração de dados, parte-se de uma série de valores existentes obtidos de dados históricos bem como de suposições controladas a respeito das condições futuras, para prever outros valores e situações que ocorrerão e, assim, planejar e preparar as ações organizacionais. Resolução: O prognóstico ou previsão pode ser realizado com o uso do data mining. Navathe destaca a previsão como um dos quatro objetivos da mineração de dados, sendo os outros a identificação, a classificação e a otimização. Para ser mais assertivo, o prognóstico deve ser realizado com base na lógica de negócios, baseando-se nos dados históricos para avaliar o comportamento passado da organização em determinadas situações e realizando suposições de como a organização irá se comportar em situações futuras semelhantes ou com variações. Gabarito: Certo. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 37 de 51 www.exponencialconcursos.com.br 53- (CESPE - 2018 - TCM-BA - Auditor Estadual de Controle Externo) Assinale a opção correta a respeito do CRISP-DM. a) CRISP-DM é uma suíte de ferramentas proprietárias que vem se tornando um padrão da indústria para mineração de dados, uma vez que fornece um plano completo e tecnologias para a realização de um projeto de mineração de dados. b) A verificação da qualidade dos dados é uma atividade da fase de entendimento dos dados. c) Durante a fase de preparação dos dados, é realizado um inventário de requisitos, suposições e restrições de recursos. d) Na fase de avaliação dos dados, são realizadas as atividades de identificar valores especiais dos dados e catalogar seu significado. e) Na fase de preparação dos dados, são realizadas as atividades de analisar o potencial de implantação de cada resultado e estimar o potencial de melhoria do processo atual. Resolução: Vamos analisar cada um dos itens: a) Incorreto: O modelo de referência CRISP-DM é provavelmente o mais popular e foi proposto por um consórcio de empresas europeu para servir como metodologia padrão não proprietária para a mineração de dados. b) Correto: A fase de entendimento dos dados começa com uma coleta inicial de dados e prossegue com atividades para se familiarizar com os dados, identificar problemas de qualidade de dados, descobrir novos insights sobre os dados ou detectar subconjuntos interessantes para formar hipóteses para informações ocultas. c) Incorreto: Durantea fase de preparação dos dados entendimento do negócio, é realizado um inventário de requisitos, suposições e restrições de recursos. d) Incorreto: Na fase de avaliação dos dados modelagem, são realizadas as atividades de identificar valores especiais dos dados e catalogar seu significado. e) Incorreto: Na fase de preparação dos dados teste e avaliação, são realizadas as atividades de analisar o potencial de implantação de cada resultado e estimar o potencial de melhoria do processo atual. Gabarito: Letra B. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 38 de 51 www.exponencialconcursos.com.br 54- (CESPE - 2018 - TCM-BA - Auditor Estadual de Controle Externo) A respeito das técnicas e(ou) métodos de mineração de dados, assinale a opção correta. a) O agrupamento (ou clustering) realiza identificação de grupos de dados que apresentam coocorrência. b) A classificação realiza o aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais. c) A regressão ou predição promove o aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes discretas definidas previamente, bem como encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados. d) As regras de associação identificam grupos de dados, em que os dados têm características semelhantes aos do mesmo grupo e os grupos têm características diferentes entre si. e) Os métodos de classificação supervisionada podem ser embasados em separabilidade (entropia), utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM (support vector machines). Resolução: Vamos analisar cada um dos itens: a) Incorreto: O agrupamento (ou clustering) As regras de associação realizam identificação de grupos de dados que apresentam coocorrência. b) Incorreto: A classificação regressão realiza o aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais. c) Incorreto: A regressão ou predição classificação promove o aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes discretas definidas previamente, bem como encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados. d) Incorreto: As regras de associação A clusterização identificam grupos de dados, em que os dados têm características semelhantes aos do mesmo grupo e os grupos têm características diferentes entre si. e) Correto: Os métodos de classificação supervisionada podem ser embasados em separabilidade (entropia), utilizando árvores de decisão e variantes, e em particionamento, utilizando SVM (support vector machines). Gabarito: Letra E. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 39 de 51 www.exponencialconcursos.com.br 55- (CESPE - 2018 - TCE-MG - Analista de Controle Externo - Ciência da Computação) Na técnica de árvore de decisão em data mining, é empregada a abordagem denominada a) análise de volumetria. b) combinação de variáveis. c) estratificação. d) avaliação de dados. e) percepção. Resolução: As árvores de decisão classificam os dados em um número finito de classes com base nos valores das variáveis de entrada. As árvores de decisão são essencialmente uma hierarquia de declarações se-então e, portanto, são significativamente mais rápidas do que as redes neurais. Elas são mais apropriadas para dados categorizados e intervalos de dados. Portanto, incorporar variáveis contínuas em uma estrutura de árvore de decisão requer discretização; ou seja, converter variáveis numéricas de valor contínuo em intervalos e categorias. Estratificar significa separar em níveis. Logo, a árvore de decisão auxilia nesse processo, separando as classes com base nos valores de entrada. Gabarito: Letra C. 56- (CESPE - 2018 - FUB - Técnico de Tecnologia da Informação) Julgue o item a seguir, a respeito de data mining e OLAP. No data mining, uma regra de associação relaciona a presença de um conjunto de itens com outra faixa de valores de um outro conjunto de variáveis. Resolução: As regras de associação são uma técnica popular para descobrir relacionamentos interessantes entre variáveis em grandes bancos de dados. Graças a tecnologias automatizadas de coleta de dados, o uso de regras de associação para descobrir os relacionamentos entre os produtos em transações de larga escala registradas nos sistemas de ponto de venda nos supermercados tornou-se uma tarefa comum de descoberta de conhecimento no ramo varejista, em que é chamada de análise de cesta de mercado. Gabarito: Certo. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 40 de 51 www.exponencialconcursos.com.br 57- (CESPE - 2017 - TCE-PE - Analista de Controle Externo - Auditoria de Contas Públicas) Em relação à análise de agrupamentos (clusterização) em mineração de dados, julgue o item seguinte. O método de clustering k-means objetiva particionar ‘n’ observações entre ‘k’ grupos; cada observação pertence ao grupo mais próximo da média. Resolução: A análise de clusters pode ser baseada em métodos estatísticos como o k- means (media), k-modes (moda), k-medoids (mediana), etc. O K-means (k média) é o algoritmo que atribui cada ponto de dados (cliente, evento, objeto, etc.) ao cluster cujo centro (também chamado centróide) é o mais próximo. O centro é calculado como a média de todos os pontos no cluster; ou seja, suas coordenadas são a média aritmética para cada dimensão separadamente em todos os pontos do cluster. Gabarito: Certo. 58- (CESPE - 2012 - TRE-RJ - Técnico Judiciário - Programação de Sistemas) Com referência a conceitos de banco de dados textual, julgue os itens seguintes. Text mining é o processo que utiliza métodos para navegar, organizar, encontrar e descobrir informações em bases textuais escritas em linguagem natural. Com text mining é possível manipular mais facilmente informações não estruturadas, tais como notícias, textos em websites, blogs e documentos em geral. Resolução: A mineração de texto (também conhecida como mineração de dados de texto ou descoberta de conhecimento em bancos de dados textuais) é o processo semiautomático de extração de padrões (informações úteis e conhecimento) de grandes quantidades de fontes de dados não estruturadas. A mineração de texto é semelhante a mineração de dados, na medida em que tem o mesmo propósito e usa os mesmos processos; mas com a mineração de texto, a entrada para o processo é uma coleção de arquivos de dados não estruturados ou semiestruturados, como documentos do Word, arquivos PDF, trechos de texto, arquivos XML e assim por diante. Gabarito: Certo. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 41 de 51 www.exponencialconcursos.com.br 59- (CESPE - 2018 - Polícia Federal - Perito Criminal Federal - Conhecimentos Básicos - Todas as Áreas) Acerca de banco de dados, julgue o seguinte item. A mineração de dados se caracteriza especialmente pela busca de informações em grandes volumes de dados, tanto estruturados quanto não estruturados, alicerçados no conceito dos 4V’s: volume de mineração, variedade de algoritmos, velocidade de aprendizado e veracidade dos padrões. Resolução: A questão está relacionada a Big Data e não a Mineração de Dados. O Big Data foi inicialmente conceituado com base em três premissas básicas, também conhecidas como 3Vs: volume, velocidade e variedade. Além dessas premissas precursoras do conceito de Big Data, outras premissas (ou Vs) complementam o conceito e têm sido discutidas quando se trata do tema. Gabarito: Errado. 60- (CESPE - 2018 - Polícia Federal - Agente de Polícia Federal) Julgue o item que segue, relativo a noções demineração de dados, big data e aprendizado de máquina. Pode-se definir mineração de dados como o processo de identificar, em dados, padrões válidos, novos, potencialmente úteis e, ao final, compreensíveis. Resolução: A mineração de dados (data mining) refere-se à mineração ou descoberta de novas informações em termos de padrões ou regras com base em grandes quantidades de dados. Dito de outro modo, o termo mineração de dados foi originalmente usado para descrever o processo pelo qual os padrões anteriormente desconhecidos em dados são descobertos. Tecnicamente falando, a mineração de dados é um processo que utiliza técnicas de estatística, matemática e inteligência artificial para extrair e identificar informações úteis e subsequentes conhecimentos (ou padrões) em grandes conjuntos de dados. Em outro conceito, a mineração de dados é entendida como o processo não trivial de identificar padrões válidos, novos, potencialmente úteis e, em última instância, compreensíveis em dados armazenados em bancos de dados estruturados. Gabarito: Certo. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 42 de 51 www.exponencialconcursos.com.br 61- (CESPE - 2018 - IPHAN - Analista I - Área 7) Julgue o item que se segue, a respeito de tecnologias de sistemas de informação. Na busca de padrões no data mining, é comum a utilização do aprendizado não supervisionado, em que um agente externo apresenta ao algoritmo alguns conjuntos de padrões de entrada e seus correspondentes padrões de saída, comparando-se a resposta fornecida pelo algoritmo com a resposta esperada. Resolução: A questão descreve a aprendizagem supervisionada. A classificação é o processo de aprender um modelo que descreve diferentes classes de dados. As classes são predefinidas e, portanto, esse tipo de atividade é também chamado de aprendizado supervisionado. Já na clusterização, o objetivo é classificar casos (por exemplo, pessoas, coisas, eventos) em grupos ou clusters, de modo que o grau de associação seja forte entre os membros do mesmo cluster e fraco entre os membros de diferentes clusters. Contudo, as classes não são previamente definidas, logo falamos em aprendizado não supervisionado. Gabarito: Errado. 62- (CESPE - 2018 - STJ - Técnico Judiciário - Desenvolvimento de Sistemas) Julgue o item que se segue, acerca de data mining e data warehouse. O processo de mineração de dados está intrinsecamente ligado às dimensões e a fato, tendo em vista que, para a obtenção de padrões úteis e relevantes, é necessário que esse processo seja executado dentro dos data warehouses. Resolução: É importante destacar que a mineração de dados pode ser utilizada junto com um data warehouse para ajudar com certos tipos de decisões. Porém, não está restrita a um DW, podendo ser aplicada também a bancos de dados operacionais com transações individuais. Alguns recursos de mineração são fornecidos por SGBDs relacionais, mas de forma limitada. Gabarito: Errado. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 43 de 51 www.exponencialconcursos.com.br 63- (CESPE - 2017 - TCE-PE - Auditor de Controle Externo - Auditoria de Contas Públicas) Julgue o seguinte item, que se refere a CRISP-DM (Cross-Industry Standard Process of Data Mining). Durante a fase de entendimento do negócio, busca-se descrever claramente o problema, fazer a identificação dos dados e verificar se as variáveis relevantes para o projeto não são interdependentes. Resolução: Há um equívoco quanto a fase descrita no item. O item descreve a fase de entendimento dos dados e não a de entendimento do negócio. A fase de entendimento do negócio objetiva o entendimento das necessidades gerenciais e das especificações de objetivos de negócio. Um plano de projeto para busca de conhecimento é desenvolvido de modo a especificar as pessoas responsáveis por coletar, analisar e reportar dados. Um orçamento de alto nível pode ser estabelecido. Na fase de entendimento de dados, busca-se a identificação dos dados relevantes das diferentes fontes de dados. O analista deve considerar a tarefa de data mining a ser realizada e construir um conhecimento acerca das bases de dados e variáveis. Gabarito: Errado. 64- (CESPE - 2017 - SEDF - Analista de Gestão Educacional - Tecnologia da Informação) Com relação a data mining e data warehouse, julgue o item que se segue. Agrupar registros em grupos, de modo que os registros em um grupo sejam semelhantes entre si e diferentes dos registros em outros grupos é uma maneira de descrever conhecimento descoberto durante processos de mineração de dados. Resolução: Assertiva refere-se a tarefa ou técnica de clusterização ou agrupamento. A análise de cluster é uma ferramenta de análise exploratória de dados para resolver problemas de classificação. O objetivo é classificar casos (por exemplo, pessoas, coisas, eventos) em grupos ou clusters, de modo que o grau de associação seja forte entre os membros do mesmo cluster e fraco entre os membros de diferentes clusters. Gabarito: Certo. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 44 de 51 www.exponencialconcursos.com.br 65- (CESPE - 2017 - TRE-BA - Analista Judiciário – Análise de Sistemas) O agrupamento de dados no processo de data mining procura, em uma massa de dados que caracterizam uma população de indivíduos, grupos semelhantes e diferentes. O algoritmo baseado na teoria dos grafos e que dispensa a definição de protótipos utilizado para segmentar a base de dados em diferentes grupos é denominado a) K média. b) K medoides. c) Apriori. d) DBSCAN. e) Árvore geradora mínima. Resolução: Questão que define árvore geradora mínima, portanto o Gabarito é letra E. Vejamos os conceitos dos demais algoritmos: a) K média (K-means): o algoritmo atribui cada ponto de dados (cliente, evento, objeto, etc.) ao cluster cujo centro (também chamado centróide) é o mais próximo. O centro é calculado como a média de todos os pontos no cluster; ou seja, suas coordenadas são a média aritmética para cada dimensão separadamente em todos os pontos do cluster. b) K medoides (K-medoids): o elemento que melhor representa o cluster, é definido de acordo com seus atributos sem que haja muita influência dos valores próximos aos limites do cluster. c) Apriori: dado um conjunto de itens, o algoritmo tenta encontrar subconjuntos que são comuns a, pelo menos, um número mínimo de conjuntos. d) DBSCAN: dado um conjunto de pontos em algum espaço, agrupa pontos que estão intimamente empacotados (pontos com muitos vizinhos próximos), marcando como pontos atípicos que ficam sozinhos em regiões de baixa densidade (cujos vizinhos mais próximos estão muito distantes). Gabarito: Letra E. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 45 de 51 www.exponencialconcursos.com.br 5. BIG DATA 66- (CESPE - 2018 - Polícia Federal - Papiloscopista Policial Federal) Julgue o item seguinte, a respeito de big data e tecnologias relacionadas a esse conceito. De maneira geral, big data não se refere apenas aos dados, mas também às soluções tecnológicas criadas para lidar com dados em volume, variedade e velocidade significativos. Resolução: O Big Data tanto pode ser encarado como o grande volume de dados estruturados e não estruturados que são gerados a cada segundo ou também como as tecnologias que são utilizadas para lidar com este grande volume de dados. Esta segunda acepção é, por vezes, chamada de Big Data Analytics. Gabarito: Certo. 67- (CESPE - 2018 - TCE-MG - Analista de Controle Externo - Ciência da Computação) Uma empresa, ao implementar técnicas e softwares de big data, deu enfoque diferenciado à análise que tem como objetivo mostrar as consequências de determinado evento. Essa análise é do tipoa) preemptiva. b) perceptiva. c) prescritiva. d) preditiva. e) evolutiva. Resolução: A análise prescritiva traça as possíveis consequências de cada ação. É uma forma de definir qual escolha será mais efetiva em determinada situação. O valor dessa análise se dá pela capacidade de numerar determinados padrões e filtrá-los por especificidades, obtendo um cenário bastante fiel da situação e como cada intervenção responderá. Gabarito: Letra C. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 46 de 51 www.exponencialconcursos.com.br 68- (CESPE - 2015 - TRE-GO - Técnico Judiciário - Área Administrativa) Julgue o item subsecutivo, acerca de procedimentos de segurança e educação a distância (EAD). A Big Data pode ser utilizada na EAD para se entender as preferências e necessidades de aprendizagem dos alunos e, assim, contribuir para soluções mais eficientes de educação mediada por tecnologia. Resolução: O objetivo do Big Data é propiciar dados e informações que possam ser analisados visando subsidiar tomadas de decisão. Assim, em um contexto de Educação à Distância, é perfeitamente possível analisar as preferências e necessidades dos alunos para, com base na tomada de decisão, melhorar as soluções para a aprendizagem destes alunos. Educadores armados com uma visão orientada a dados podem ter um impacto significativo sobre os sistemas escolares, estudantes e currículos. Analisando big data, eles podem identificar alunos em risco, assegurar que os estudantes estão progredindo de forma adequada, e podem implementar um sistema melhor de avaliação e apoio aos professores e diretores. Gabarito: Certo. 69- (CESPE - 2014 - TJ-SE - Analista Judiciário - Banco de Dados) Julgue os itens que se seguem, no que se refere a Big Data. O processamento de consultas ad hoc em Big Data, devido às características de armazenamento dos dados, utiliza técnicas semelhantes àquelas empregadas em consultas do mesmo tipo em bancos de dados tradicionais. Resolução: Os bancos de dados tradicionais realizam consultas em dados estruturados. O processamento de consultas ad hoc no big data traz desafios diferentes daqueles incorridos ao realizar consultas ad hoc em dados estruturados pelo fato de as fontes e formatos dos dados não serem fixos e exigirem mecanismos diferentes para recuperá-los e processá-los. Gabarito: Errado. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 47 de 51 www.exponencialconcursos.com.br 70- (CESPE - 2015 - TCU - Auditor Federal de Controle Externo) No que concerne a data mining (mineração de dados) e big data, julgue o seguinte item. Devido à quantidade de informações manipuladas, a (cloud computing) computação em nuvem torna-se inviável para soluções de big data. Resolução: Muito pelo contrário. A grande vantagem de associar big data à cloud computing é reduzir os custos de uma infraestrutura de TI para armazenar e processar os dados. Big Data em relação à nuvem representa um desafio tecnológico pois demanda atenção à infraestrutura e tecnologias analíticas. Processamento de massivos volumes de dados pode ser facilitado pelo modelo de computação em nuvem, desde que, é claro, que este imenso volume não seja transmitido repetidamente via Internet. Gabarito: Errado. 71- (CESPE - 2018 - Polícia Federal - Escrivão de Polícia Federal) Em um big data, alimentado com os dados de um sítio de comércio eletrônico, são armazenadas informações diversificadas, que consideram a navegação dos usuários, os produtos comprados e outras preferências que o usuário demonstre nos seus acessos. Tendo como referência as informações apresentadas, julgue o item seguinte. O big data consiste de um grande depósito de dados estruturados, ao passo que os dados não estruturados são considerados data files. Resolução: O Big Data possui tanto dados estruturados como não estruturados, além dos semiestruturados. o Big Data tanto pode ser encarado como o grande volume de dados estruturados e não estruturados que são gerados a cada segundo ou também como as tecnologias que são utilizadas para lidar com este grande volume de dados. Gabarito: Errado. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 48 de 51 www.exponencialconcursos.com.br 72- (CESPE - 2018 - TCE-PB - Auditor de Contas Públicas) Com referência a big data, assinale a opção correta. a) A definição mais ampla de big data restringe o termo a duas partes — o volume absoluto e a velocidade —, o que facilita a extração das informações e dos insights de negócios. b) O sistema de arquivos distribuído Hadoop implementa o algoritmo Dijkstra modificado para busca irrestrita de dados em árvores aglomeradas em clusters com criptografia. c) Em big data, o sistema de arquivos HDFS é usado para armazenar arquivos muito grandes de forma distribuída, tendo como princípio o write-many, read- once. d) Para armazenar e recuperar grande volume de dados, o big data utiliza bancos SQL nativos, que são bancos de dados que podem estar configurados em quatro tipos diferentes de armazenamentos: valor chave, colunar, gráfico ou documento. e) O MapReduce é considerado um modelo de programação que permite o processamento de dados massivos em um algoritmo paralelo e distribuído. Resolução: Vamos analisar item a item: a) Incorreto: A definição mais ampla de big data restringe o termo a duas partes -, o volume absoluto e a velocidade-, o que facilita a extração das informações e dos insights de negócios. O Big Data foi inicialmente conceituado com base em três premissas básicas, também conhecidas como 3Vs. ❖ Volume: o Big Data deve possibilitar a análise de grandes volumes de dados. Além disso, a tecnologia do Big Data serve exatamente para lidar com esse volume de dados, guardando-os em diferentes localidades e juntando-os através de software. ❖ Velocidade: o Big Data deve fornecer as repostas com velocidade e em tempo hábil. O Big Data serve para analisar os dados no instante em que são criados, sem ter de armazená-los em bancos de dados. ❖ Variedade: o Big Data deve ser capaz de lidar com diferentes formatos de informação. Os dados podem estar em fontes estruturadas, semi-estruturadas e a grande maioria em fontes não estruturadas. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 49 de 51 www.exponencialconcursos.com.br b) Incorreto: O sistema de arquivos distribuído Hadoop implementa o algoritmo Dijkstra modificado para busca irrestrita de dados em árvores aglomeradas em clusters com criptografia. ▪ Não é possível afirmar a busca ocorre de maneira irrestrita, principalmente se os dados estiverem criptografados (protegidos). A proteção pode restringir o acesso ao conteúdo dos dados. c) Incorreto: Em big data, o sistema de arquivos HDFS é usado para armazenar arquivos muito grandes de forma distribuída, tendo como princípio o write- many, read-once write-once, read-many-times. ▪ O HDFS é um sistema de arquivos criado para armazenar arquivos muito grandes de forma distribuída. O conceito sobre o qual o HDFS foi construído é o chamado write-once, read-many-times, ou seja, escreva uma vez, leia muitas vezes. Esse tipo de construção é essencial para o Big Data, uma vez que os dados serão processados inúmeras vezes, dependendo da aplicação, embora, normalmente, sejam escritos apenas uma vez. Esse tipo de construção faz com que seja desaconselhável a modificação de arquivos, pois acaba gerando muita sobrecarga. d) Incorreto: Para armazenar e recuperar grande volume de dados, o big data utiliza bancos SQL nativos, que são bancos de dados que podem estar configurados em quatro tipos diferentes de armazenamentos: valor chave, colunar, gráfico ou documento. De fato, na definição da Amazon, “bancos de dados NoSQL usam diversosmodelos de dados, incluindo documentos, gráficos e chave-valor e colunares. Justamente por este motivo, a assertiva está errada ao afirmar que big data utiliza bancos SQL nativos, pois pode utilizar bases de dados não relativas a modelos relacionais. e) Correto: O MapReduce é considerado um modelo de programação que permite o processamento de dados massivos em um algoritmo paralelo e distribuído. MapReduce é um modelo de programação, e framework introduzido pelo Google para suportar computações paralelas em grandes coleções de dados em clusters de computadores. Agora MapReduce é considerado um novo modelo computacional distribuído, inspirado pelas funções map e reduce usadas comumente em programação funcional. Gabarito: Letra E. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 50 de 51 www.exponencialconcursos.com.br 73- (CESPE - 2018 - Polícia Federal - Agente de Polícia Federal) Julgue o item que segue, relativo a noções de mineração de dados, big data e aprendizado de máquina. Big data refere-se a uma nova geração de tecnologias e arquiteturas projetadas para processar volumes muito grandes e com grande variedade de dados, permitindo alta velocidade de captura, descoberta e análise. Resolução: Big Data é um termo amplamente utilizado na atualidade para nomear conjuntos de dados muito grandes ou complexos, que os aplicativos de processamento de dados tradicionais ainda não conseguem lidar. Os desafios desta área incluem: análise, captura, curadoria de dados, pesquisa, compartilhamento, armazenamento, transferência, visualização e informações sobre privacidade dos dados. Este termo muitas vezes se refere ao uso de análise preditiva e de alguns outros métodos avançados para extrair valor de dados. Maior precisão nos dados pode levar à tomada de decisões com mais confiança. Além disso, melhores decisões podem significar maior eficiência operacional, redução de risco e redução de custos. Gabarito: Certo. 74- (CESPE - 2018 - EBSERH - Analista de Tecnologia da Informação) Com relação a banco de dados, julgue o item seguinte. As soluções de big data focalizam dados que já existem, descartam dados não estruturados e disponibilizam os dados estruturados. Resolução: O Big Data possui tanto dados estruturados como não estruturados, além dos semiestruturados. o Big Data tanto pode ser encarado como o grande volume de dados estruturados e não estruturados que são gerados a cada segundo ou também como as tecnologias que são utilizadas para lidar com este grande volume de dados. Gabarito: Errado. Questões comentadas Prof. Ramon Souza Prof. Ramon Souza 51 de 51 www.exponencialconcursos.com.br 75- (CESPE - 2017 - TCE-PE - Analista de Controle Externo - Auditoria de Contas Públicas) No que se refere a Big Data, julgue o item subsecutivo. O termo Big Data Analytics refere-se aos poderosos softwares que tratam dados estruturados e não estruturados para transformá-los em informações úteis às organizações, permitindo-lhes analisar dados, como registros de call center, postagens de redes sociais, de blogs, dados de CRM e demonstrativos de resultados. Resolução: O Big Data Analytics pode ser entendido com um desdobramento de Big Data e se refere às ferramentas de alto desempenho utilizadas para realizar o trabalho analítico dos grandes volumes de dados. Trata-se do cruzamento de uma infinidade de dados do ambiente interno e externo, gerando uma espécie de “bússola gerencial” para tomadores de decisão. Gabarito: Certo.