TI 75 QUESTOES ELLM

ESTÁCIO

emmanuel lisboa

em 30/09/2020

Conteúdos escolhidos para você

71 pág.

2022-01-06-13-28-46-64087875-nocoes-de-mineracao-de-dados

UNAMA

235 pág.

APOSTILA ANÁLISE EXPLORATÓRIA NOVA(1)

110 pág.

Perguntas dessa disciplina

Texto 01: Texto 02: Entender cada tipo de dado disponível para o processo Big Data é ponto primordial para entender quais tipos de dados a empresa uti

Fio cruz

Texto 01: Fonte: AWS Amazon. Bancos de dados SQL (relacional) vs. NoSQL (não relacional). Disponível em: https://aws.amazon.com/pt/nosql/#:~:text=Em%2

UAM

Em organizações que lidam com grande volume de informações, a estruturação e o acesso eficiente aos dados são fatores importantes para a tomada de dec

UNIVESP

De acordo com as sentenças relacione-as em V para verdadeiras ou F para falsas. ( ) A utilização da DQL proporciona aos usuários a capacidade de formu

O texto "Alfabetização em Dados", de Carol Andrade, propõe uma redefinição do que significa estar preparado para a "Era dos Dados", utilizando metáfor

Material

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Conteúdos escolhidos para você

71 pág.

2022-01-06-13-28-46-64087875-nocoes-de-mineracao-de-dados

UNAMA

235 pág.

APOSTILA ANÁLISE EXPLORATÓRIA NOVA(1)

110 pág.

Perguntas dessa disciplina

Texto 01: Texto 02: Entender cada tipo de dado disponível para o processo Big Data é ponto primordial para entender quais tipos de dados a empresa uti

Fio cruz

Texto 01: Fonte: AWS Amazon. Bancos de dados SQL (relacional) vs. NoSQL (não relacional). Disponível em: https://aws.amazon.com/pt/nosql/#:~:text=Em%2

UAM

Em organizações que lidam com grande volume de informações, a estruturação e o acesso eficiente aos dados são fatores importantes para a tomada de dec

UNIVESP

De acordo com as sentenças relacione-as em V para verdadeiras ou F para falsas. ( ) A utilização da DQL proporciona aos usuários a capacidade de formu

O texto "Alfabetização em Dados", de Carol Andrade, propõe uma redefinição do que significa estar preparado para a "Era dos Dados", utilizando metáfor

Prévia do material em texto

Aula 00
Curso: Informática – Teoria e Questões
comentadas p/ TRF
Professor: Gustavo Cavalcante Informática/Análise de Informações
75 Questões para ISS Aracaju
Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 3 de 51
www.exponencialconcursos.com.br

Fala pessoal, tudo tranquilo?
Trago para vocês 75 Questões Comentadas de Análise de Informações
para a Prefeitura de Aracaju (ISS-Aracaju).

Neste material, busquei trazer as questões mais recentes da banca
CESPE. Você pode usar este material para avaliar como a banca cobra os
principais assuntos do seu edital ou ainda como um simulado.

Aproveito para te indicar nossas transmissões no Youtube, em que você
pode acompanhar nossa discussão a respeito de cada um dos tópicos do edital
ao vivo ou mesmo nos vídeos gravados. Veja, por exemplo, nosso primeiro
encontro de Análise de Informações:
https://www.youtube.com/watch?v=3h5520GvCk8

Playlist completa em:
https://www.youtube.com/watch?v=3h5520GvCk8&list=PLva2C7MtgiEeKtPsG
M4kw-eJ487MmsFOz

75 Questões Comentadas de Análise de Informações (ISS Aracaju)
Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 4 de 51
www.exponencialconcursos.com.br
Caso tenha interesse em nosso curso completo para este concurso, deixo
o link a seguir https://bit.ly/324FSUF

Ah, e pode usar meu cupom de desconto ramon10 para obter 10% de
desconto nos cursos do site.

As questões foram organizadas da seguinte forma:
ASSUNTOS PÁGINA
1. CONCEITOS BÁSICOS ................................................................... 5
2. BANCOS DE DADOS RELACIONAIS................................................ 12
3. BUSINESS INTELLIGENCE ........................................................... 24
4. DATA MINING ............................................................................ 36
5. BIG DATA ................................................................................. 45

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 5 de 51
www.exponencialconcursos.com.br
1. CONCEITOS BÁSICOS

1- (CESPE - 2018 - TCM-BA - Auditor Estadual de
Controle Externo) O diretor de uma montadora de veículos necessita tomar
uma decisão acerca da continuidade ou não de um dos produtos vendidos no
Brasil. Para tanto, solicitou um relatório sobre as vendas de carros da marca do
último trimestre de 2018, por faixa de preço, região, modelo e cor. Nessa
situação, no contexto de análise da informação, o relatório representa
a) conhecimento.
b) inteligência.
c) dados.
d) informação.
e) sabedoria.
Resolução:
Meus caros, talvez este seja o tipo de questão mais difícil que pode aparecer na
prova sobre o tema dado, informação, conhecimento e inteligência, pois requer
que você não só conheça os conceitos, mas também consiga identificar o
conceito mais adequado para uma dada situação. Vamos então aos itens:
a) Incorreto: conhecimento é uma informação valiosa da mente
humana, não podendo ser facilmente estruturada. Portanto, um relatório
não representa um conhecimento, mas será utilizado pelo diretor para gerar
conhecimento.
b) Incorreto: inteligência é o conhecimento sintetizado e aplicado a
determinada situação para ganhar maior profundidade de consciência da
mesma. No caso em questão, só teremos inteligência, quando o diretor resolver
tomar alguma decisão com base no conhecimento adquirido.
c) Incorreto: Como o relatório representa dados organizados ou tratados, não
representará dados, pois estes devem sequências de fatos brutos que
representam eventos que ocorrem nas organizações ou no ambiente físico,
antes de terem sido organizados e arranjados, processados, avaliados
ou interpretados de uma forma que as pessoas possam entender e usar.
d) Correto: Como o diretor solicitou um conjunto de dados organizados, o
relatório representa uma informação, que representa o dado trabalhado ou
tratado, que possui valor significativo atribuído ou agregado a ele e com um
sentido natural e lógico para quem usa a informação. Pode ser definida como
algo útil com relevância e propósito.
e) Incorreto: sabedoria é sinônimo de conhecimento.
Gabarito: Letra D.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 6 de 51
www.exponencialconcursos.com.br
2- (CESPE – 2017 – TCE-PE – Analista de Controle
Externo – Auditoria de Contas Públicas) Acerca dos conceitos de dado,
informação e conhecimento, julgue o item a seguir.
A informação caracteriza-se por ser frequentemente tácita, bem como por ser
de estruturação e captura difíceis em máquinas.
Resolução:
O item refere-se ao conceito de Conhecimento ou Capital Intelectual e não ao
de informação.
Conhecimento (ou Capital Intelectual) é uma informação contextual,
relevante e acionável, ou de outro modo, é a informação em ação. É uma
informação valiosa da mente, inclui reflexão, síntese e contexto. É difícil de
estruturar, difícil de capturar em computadores, normalmente é tácito
(não explícito) e sua transparência é complexa.
Gabarito: Errado.

3- (CESPE - 2016 - TCE-SC - Auditor Fiscal de Controle
Externo – Informática) Julgue o item a seguir, acerca de dado, informação,
conhecimento e inteligência.
Define-se informação como significado, ou seja, como registros icônicos e
simbólicos — fonéticos ou numéricos — e signos — linguísticos, lógicos ou
matemáticos —, por meio dos quais se representam atos, conceitos ou
instruções.
Resolução:
Neste item a banca tenta te induzir ao erro, pois embora o conceito de
informação esteja relacionado a significado, o que vem depois de “ou seja” traz
claramente o conceito de dado, pois está associado a registros primários ou
fatos brutos sem qualquer tratamento.
Pela definição, um dado pode ser um conjunto de letras, números ou dígitos
que podem ser descritos, armazenados ou manipulados, mas se tomado
isoladamente não transmite nenhum conhecimento, ou seja, não possui
significado claro.
Gabarito: Errado.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 7 de 51
www.exponencialconcursos.com.br
4- (CESPE - 2010 - DPU - Técnico em Assuntos
Educacionais) Dados acerca de determinado assunto de interesse de uma ou
mais pessoas, que possam ser interpretados ou tenham significado para o
receptor, são considerados
a) aprendizagem organizacional.
b) conhecimento.
c) capital intelectual.
d) informação.
e) sistema de gerenciamento.
Resolução:
Questão conceitual. A informação é gerada quando os dados são coletados,
organizados ou categorizados, orientados, combinados ou interpretados de
forma significativa, ou seja, são atribuídos significados e contexto.
Gabarito: Letra D.

5- (CESPE - 2016 - TCE-SC - Auditor Fiscal de Controle
Externo – Informática) Julgue o item a seguir, acerca de dado, informação,
conhecimento e inteligência.
O atributo de inteligência depende mais da qualidade da informação disponível
do que da sua quantidade, tendo, portanto, natureza qualitativa.
Resolução:
A qualidade da informação representa a agregação de valor aos dados até
que os mesmos proporcionem informação, conhecimento e inteligência para os
indivíduos e suas organizações.
O item pode ser facilmente resolvido com a pirâmide informacional, então
lembre que a hierarquia de transformação aumenta com a qualidade.

Gabarito: Certo.
Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 8 de 51
www.exponencialconcursos.com.br
6- (CESPE - 2016 - TCE-PA - Auditor de Controle
Externo - Área Administrativa – Psicologia) No que se refere aos conceitos
e às aplicações da gestão do conhecimento e da gestão por competências,
julgue o próximo item.
O conhecimento tácito é pessoal, específico ao contexto e de difícil formulação
e comunicação; o conhecimento explícito, por sua vez,é transmitido em
linguagem formal e sistemática, propiciando ao indivíduo a apreensão de fatos.
Resolução:
Item tranquilo!!! Basta você saber a diferença entre o conhecimento tácito e o
explícito.
O conhecimento tácito é altamente pessoal e difícil de formalizar,
tornando-se de comunicação e compartilhamento dificultoso. Já o
conhecimento explícito é formal, sistemático, codificado ou
estruturado.
Gabarito: Certo.

7- (CESPE - 2011 - MEC - Analista de Processos) Julgue
o próximo item, relativo à gestão do conhecimento.
Considere que, em uma organização, os profissionais capazes de criar maquetes
de prédios mostrem a seus aprendizes que, por meio da observação e imitação,
eles obterão o conhecimento do assunto. Nessa situação, o processo de
construção de conhecimento é realizado do conhecimento tácito para o explícito.
Resolução:
A assertiva trata de socialização, ou seja, a conversão de conhecimento tácito
em tácito, que ocorre de indivíduos para indivíduos e envolve a observação,
imitação ou prática. No exemplo dado, há uma troca de conhecimento entre
os profissionais e os aprendizes e, portanto, um compartilhamento e criação
de conhecimento por meio da experiência.
A transformação do conhecimento tácito para explícito, ou externalização,
consiste na comunicação do conhecimento por meio da escrita ou estruturação.
Gabarito: Errado.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 9 de 51
www.exponencialconcursos.com.br
8- (CESPE - 2018 - TCE-PB - Auditor de Contas
Públicas) A respeito de dados estruturados, não estruturados e abertos, julgue
o item subsequente.
Com relação à dados estruturados e não estruturados, assinale a opção correta.
a) Por padrão, dados não estruturados são organizados em blocos semânticos.
b) A alta heterogeneidade facilita as consultas aos dados não estruturados,
desde que estes estejam ligados por ponteiros.
c) Dados não estruturados podem ser caracterizados por arquivos cujas
estruturas não são descritas implicitamente.
d) Por padrão, documentos do tipo XML (eXtensible Markup Language) são
estruturados.
e) Dados não estruturados de um mesmo grupo possuem as mesmas descrições
e, consequente, os mesmos atributos.
Resolução:
Vamos analisar as alternativas:
a) Incorreto: Por padrão, dados não estruturados estruturados são
organizados em blocos semânticos.
b) Incorreto: A alta heterogeneidade facilita dificulta as consultas aos dados
não estruturados, desde que estes estejam ligados por ponteiros.
c) Correto: Dados não estruturados podem ser caracterizados por arquivos
cujas estruturas não são descritas implicitamente.
Dados não estruturados não possuem estrutura pré-definida. A estrutura
implícita ocorre nos dados semiestruturados.
d) Incorreto: Por padrão, documentos do tipo XML (eXtensible Markup
Language) são estruturados semi-estruturados.
e) Incorreto: Dados não estruturados estruturados de um mesmo grupo
possuem as mesmas descrições e, consequente, os mesmos atributos.
Gabarito: Letra C.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 10 de 51
www.exponencialconcursos.com.br
9- (CESPE - 2016 - TCE-SC - Auditor Fiscal de
Controle Externo – Informática) A respeito de dados estruturados, não
estruturados e abertos, julgue o item subsequente.
Em se tratando de dados estruturados, a informação de esquema está mesclada
aos valores dos dados, e cada objeto de dados pode ter atributos diferentes,
que não são conhecidos com antecedência. Essa característica os diferencia de
dados não estruturados.
Resolução:
As características descritas na assertiva referem-se aos dados semiestruturados
e não aos dados estruturados.
Os dados semiestruturados são auto-descritivos, isto é, o esquema de
representação está presente (de forma explícita ou implícita) juntamente com
o dado. Além disso, este tipo de dados apresenta como característica a
estrutura parcial, que significa que nem todos dados estão organizados em
uma estrutura.
Os dados estruturados, por sua vez, possuem um esquema rígido e
previamente planejado e, portanto, os objetos de dados são conhecidos com
antecedência. A informação do esquema é separada dos dados.
Gabarito: Errado.

10- (CESPE - 2013 - TRT - 17ª Região (ES) - Analista
Judiciário – Arquivologia) Em relação aos metadados, julgue o próximo item.
Os dados estruturados que descrevem e permitem encontrar, gerenciar,
compreender e (ou) preservar documentos arquivísticos ao longo do tempo são
conhecidos como metadados.
Resolução:
Os metadados são os dados estruturados que descrevem os dados, permitindo
sua identificação, localização, explicação, gerenciamento e, portanto, facilitam
a recuperação, uso e gestão dos dados.
Gabarito: Certo.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 11 de 51
www.exponencialconcursos.com.br
11- (CESPE - 2016 - TCE-SC - Auditor Fiscal de
Controle Externo – Informática) A respeito de dados estruturados, não
estruturados e abertos, julgue o item subsequente.
Dados abertos são os dados de livre utilização, reutilização e redistribuição,
exigindo-se, no máximo, créditos à autoria e compartilhamento pela mesma
licença.
Resolução:
Perfeita!!! Item trouxe uma definição de dados abertos bem alinhada àquela do
Open Knowledge Internacional.
Dados abertos são assim considerados quando qualquer pessoa pode
livremente acessá-los, utilizá-los, modificá-los e compartilhá-los para
qualquer finalidade, estando sujeito a, no máximo, a exigências que visem
preservar sua proveniência e sua abertura.
Gabarito: Certo.

12- (CESPE - 2018 - Polícia Federal - Escrivão de Polícia
Federal) Julgue o item a seguir, a respeito da teoria da informação e de
metadados de arquivos.
O conhecimento é embasado na inteligência das informações que são coletadas
e analisadas para uma organização.
Resolução:
Conhecimento (ou Capital Intelectual) é uma informação contextual,
relevante e acionável, ou de outro modo, é a informação em ação. É uma
informação valiosa da mente, inclui reflexão, síntese e contexto. É difícil de
estruturar, difícil de capturar em computadores, normalmente é tácito
(não explícito) e sua transparência é complexa.
O Conhecimento é embasado em Informações e não em Inteligência. Pelo
contrário, a Inteligência é que é baseada em Conhecimento. A hierarquia é
formada na ordem: Dados -> informação -> conhecimento -> inteligência.
Gabarito: Errado.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 12 de 51
www.exponencialconcursos.com.br
2. BANCOS DE DADOS RELACIONAIS
13- (CESPE - 2019 – SEFAZ-RS – Auditor Fiscal da
Receita Estadual) As funções de um sistema de gerenciamento de banco de
dados (SGBD) incluem
a) gerenciar o becape e a recuperação de dados, bem como o escalonamento
de processos no processador por meio do banco de dados.
b) gerenciar o sistema de arquivos e a segurança do banco de dados.
c) gerenciar a entrada e saída de dispositivos, linguagens de acesso ao banco
de dados e interfaces de programação de aplicações.
d) gerenciar a integridade de dados, o dicionário e o armazenamento de dados,
bem como a memória do computador enquanto o SGBD estiver em execução.
e) transformar e apresentar dados, controlar o acesso de multiusuário e prover
interfaces de comunicação do banco de dados.
Resolução:
Um Sistema Gerenciador de Banco de Dados (SGBD) é uma coleção de
programas que permite aos usuários criar e manter um banco de dados. O
SGBD é um sistema de software de uso geral que facilita os seguintes processos:
▪ Definição: especificação de tipos, estruturas e restrições de dados.
▪ Construção: armazenamento dos dados em algum meio controlado.
▪ Manipulação: consulta, atualização e geração de relatórios.
▪ Compartilhamento: acesso simultâneo porusuários e sistemas.
▪ Proteção: proteção do sistema contra defeitos e proteção de
segurança contra acesso não autorizado ou malicioso.
▪ Manutenção: evolução do sistema ao longo do tempo.
Agora vamos aos itens:
a) Incorreto: escalonamento de processos não é função do SGBD.
b) Incorreto: gerenciar o sistema de arquivos não é função do SGBD.
c) Incorreto: gerenciar dispositivos de entrada e saída não é função do
SGBD.
d) Incorreto: gerenciar a memória do computador não é função do SGBD.
e) Correto: todas são funções do SGBD.
As funções destacadas nos itens de a) a d) são do sistema operacional.
Gabarito: Letra E.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 13 de 51
www.exponencialconcursos.com.br
14- (CESPE - 2018 - IPHAN - Analista I - Área 7) Acerca
da abordagem relacional, da normalização e do SGBD, entre outros conceitos
relativos a banco de dados, julgue o item a seguir.
Padrões a serem impostos e requisitos contraditórios a serem equilibrados são
considerados como desvantagens da abordagem de banco de dados.
Resolução:
Padrões a serem impostos e requisitos contraditórios a serem equilibrados são
considerados como vantagens da abordagem de banco de dados.
Conhecendo os requisitos globais da empresa, em oposição aos requisitos de
usuários individuais, o DBA (Administrador de Banco de Dados), mais uma vez
sob a orientação do administrador de dados, pode estruturar o sistema de modo
a oferecer um serviço global que seja o melhor para empresa.
Gabarito: Errado.

15- (CESPE - 2017 - TRF - 1ª REGIÃO - Analista
Judiciário - Informática) A respeito dos conceitos de banco de dados,
normalização, controle de concorrência e modelagem, julgue o item
subsecutivo.
Atomicidade é a propriedade que garante que as transações não sejam afetadas
pelo funcionamento umas das outras nem tenham acesso aos resultados
parciais entre si.
Resolução:
O conceito apresentado foi o de ISOLAMENTO.

Gabarito: Errado.

A
to
m
ic
id
a
d
e
Conceito:
unidade de
processament
o atômica. A
transação deve
ser realizada em
sua totalidade
ou não deve ser
realizada de
forma alguma.
Responsável
Subsistema de
recuperação.
C
o
n
s
is
tê
n
c
ia
Conceito:
Uma transação
deve levar o
banco de dados
de um estado
consistente
para outro.
Responsável
Programador
ou módulo de
restrições de
integridade.
I
s
o
la
m
e
n
to
Conceito: uma
transação deve
parecer
executar
isolada das
demais.
Responsável
Subsistema de
controle de
concorrência.
D
u
ra
b
il
id
a
d
e
Conceito:
as mudanças
realizadas pela
transação
confirmada
devem ser
persistidas no
banco de
dados.
Responsável
Subsistema de
recuperação.
Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 14 de 51
www.exponencialconcursos.com.br
16- (CESPE - 2018 - STM - Técnico Judiciário -
Programação de Sistemas) Acerca dos conceitos de normalização de dados
e dos modelos de dados, julgue o item subsequente.
O modelo conceitual, que reflete uma estrutura simplificada do banco de dados,
é responsável por registrar como os dados estão armazenados no sistema de
gerenciamento de banco de dados (SGBD).
Resolução:
O modelo conceitual não trata COMO os dados estão armazenados, mas
somente QUAIS dados serão armazenados.

Gabarito: Errado.

17- (CESPE - 2018 - SEFAZ-RS - Técnico Tributário da
Receita Estadual - Prova 1) O modelo de dados que possui métodos e
capacidade de encapsulamento é o
a) semiestruturado.
b) baseado em objetos
c) entidade-relacionamento.
d) relacional.
e) distribuído.
Resolução:
Um Modelo de dados de objeto define um banco de dados em termos de
objetos, suas propriedades e operações. Os objetos com a mesma estrutura
e comportamento pertencem a uma classe, e as classes são organizadas em
hierarquias. As operações de cada classe são especificadas com procedimentos
predefinidos, chamados métodos.
Gabarito: Letra B.
C
o
n
c
e
it
u
a
l Facilmente
comprendido por
usuários.
Registra os dados.
Independente de
hardware e software.
Elaborados na
Modelagem Conceitual.
Ex.: Modelo Entidade
Relacionamento.
L
ó
g
ic
o
Compreensão
intermediária.
Representação específica
de um modelo interno,
utilizando as estruturas
de BD
Dependem do SGBD.
Elaborados no Projeto
Lógico.
Ex.: Modelo Relacional.
F
ís
ic
o
Difícil compreensão
pelos usuários.
Descrevem o
armazenamento dos
dados.
Totalmente
dependentes do SGBD.
Elaborados no Projeto
Físico.
Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 15 de 51
www.exponencialconcursos.com.br
18- (CESPE - 2019 – SEFAZ-RS – Auditor Fiscal da
Receita Estadual) Uma das regras de Codd para o modelo relacional consiste
a) na dependência de dados físicos (mudança na memória e no método de
acesso).
b) na independência de distribuição.
c) na presença de uma linguagem de programação no SGBD que promova
interface com o banco de dados, com a segurança e a atualização de dados.
d) na subversão das regras de integridade ou restrições quando utilizada uma
linguagem de baixo nível.
e) no não tratamento das atualizações de visões de dados.
Resolução:
As Doze regras de Codd são um conjunto de treze regras (enumeradas de zero
a doze) propostas por Edgar F. Codd, um contumaz do modelo relacional para
banco de dados, designado para definir o que é necessário para que um sistema
de gerenciamento de banco de dados para ser considerado relacional.

A Regra 11 - Independência de Distribuição afirma que a distribuição de
partes do SGBD em várias localidades deve ser transparente para os usuários
do mesmo, isto é, os usuários não são afetados pela localização dos
dados.
Gabarito: Letra B.
D
o
z
e
(
tr
e
z
e
)
re
g
ra
s
d
e
C
o
d
d
p
a
ra
B
a
n
c
o
s
R
e
la
c
io
n
a
is
Regra 0 - Regra fundamental ou regra base
Regra 1 - A regra da informação ou Princípio da Informação
Regra 2 - A regra de acesso garantido
Regra 3 - Tratamento sistemático de valores nulos
Regra 4 - Catálogo on-line baseado no modelo relacional
Regra 5 - Sublinguagem Ampla de Dados
Regra 6 - Atualização de visões
Regra 7 - Inserção, Atualização, e Exclusão de alto nível
Regra 8 - Independência Física de dados
Regra 9 - Independência Lógica de Dados
Regra 10 - Independência de Integridade
Regra 11 - Independência de Distribuição
Regra 12 - A não-transposição das regras
Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 16 de 51
www.exponencialconcursos.com.br
19- (CESPE - 2018 - Polícia Federal - Perito Criminal
Federal) Acerca de banco de dados, julgue o seguinte item.
Situação hipotética: Ao analisar um computador, Marcos encontrou inúmeros
emails, vídeos e textos advindos, em sua maioria, de comentários em redes
sociais. Descobriu também que havia relação entre vários vídeos e textos
encontrados em um diretório específico. Assertiva: Nessa situação, tendo como
referência somente essas informações, Marcos poderá inferir que se trata de um
grande banco de dados relacional, visto que um diretório é equivalente a uma
tabela e cada arquivo de texto é equivalente a uma tupla; além disso, como
cada arquivo possui um código único, poderá deduzir que esse código é a chave
primária que identifica o arquivo de forma unívoca.
Resolução:
Caros, um banco de dados relacional não é formado por documentos, mas sim
por um conjunto de tabelas. O Princípio da Informação aborda justamente
isso, afirmando que todos os dados devem ser organizados em tabelas (ainda
que armazenados em estruturas diferentes) e, portanto, todo o conteúdo de
informação do banco de dados é representado de um e somente um modo, ou
seja, como valores explícitos em posições de colunas em linhas de
tabelas. Assim, como esse banco não é percebido pelo usuário como um
conjunto de tabelas, mas sim como um conjunto de documentos e outras
mídias,não se trata de um banco relacional.
Gabarito: Errado.

20- (CESPE - 2016 - TCE-SC - Auditor Fiscal de Controle
Externo – Informática) Com relação aos bancos de dados relacionais, julgue
os próximos itens. O catálogo de um sistema de gerenciamento de banco de
dados relacional armazena a descrição da estrutura do banco de dados e contém
informações a respeito de cada arquivo, do tipo e formato de armazenamento
de cada item de dado e das restrições relativas aos dados.
Resolução:
Uma característica fundamental da abordagem de banco de dados é que seu
sistema contém não apenas o próprio banco de dados, mas também uma
definição ou descrição completa de sua estrutura e restrições, que fica
armazenada no catálogo ou dicionário de dados do SGBD. Esse catálogo
contém informações como a estrutura de cada arquivo, o tipo e o formato
de armazenamento de cada item de dados e diversas restrições sobre os
dados. A informação armazenada no catálogo é chamada de metadados, e
descreve a estrutura do banco de dados.
Gabarito: Certo.
Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 17 de 51
www.exponencialconcursos.com.br
21- (CESPE - 2017 - TCE-PE - Auditor de Controle
Externo - Auditoria de Contas Públicas) Acerca de aspectos diversos
referentes a banco de dados relacional, julgue os itens a seguir.
Em uma relação, os nomes das colunas são únicos, as linhas são distintas entre
si, e a ordem da disposição das linhas e colunas é irrelevante para o banco de
dados.
Resolução:
Assertiva bastante interessante trazida pelo CESPE. A questão parece
totalmente correta, no entanto, há um erro que pode passar aos olhos do
candidato no momento da realização da prova. Vejamos:
O item traz as seguintes informações que são corretas para o modelo relacional:
❖ Os nomes das colunas são únicos;
❖ As linhas são distintas entre si (ao menos um atributo deve ser diferente);
❖ A ordem da disposição das linhas é irrelevante;
No entanto, afirma também que a ordem das colunas é irrelevante, o que não
é verdade. Uma tupla é uma lista ordenada de valores, de modo que a ordem
dos valores em uma tupla – e, portanto, dos atributos em um esquema de
relação – é importante.
Em resumo,
❖ A ordem das linhas não é relevante.
❖ A ordem das colunas é relevante, a não ser que a correspondência entre
elas e seus valores seja mantida.
Assim o item ficaria correto da seguinte forma:
Em uma relação, os nomes das colunas são únicos, as linhas são distintas entre
si, e a ordem da disposição das linhas e colunas é irrelevante para o banco de
dados.
Gabarito: Errado.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 18 de 51
www.exponencialconcursos.com.br
22- (CESPE - 2018 - FUB - Técnico de Tecnologia da
Informação) Acerca dos conceitos de otimização de consultas SQL e técnicas
de análise de desempenho, julgue o próximo item.
Álgebra relacional é um conjunto de operações sobre relações, sendo gerada
dessas operações uma relação de saída.
Resolução:
A álgebra relacional define um conjunto de operações nas relações, em
paralelo com as operações algébricas usuais, como adição, subtração ou
multiplicação, que operam em números. Assim como as operações algébricas
nos números tomam um ou mais números como entrada e retornam um número
como saída, as operações de álgebra relacional geralmente tomam uma
ou duas relações como entrada e retornam uma relação como saída.
As operações são esquematizadas no quadro a seguir.
Operações da álgebra relacional
Seleção (σ) Retorna as tuplas da relação que satisfazem um predicado.
Projeção (П)
Retorna os atributos especificados de todas as linhas da
relação de entrada, removendo as tuplas duplicadas da saída.
Junção ( )
Retorna pares de linhas das duas relações de entrada que têm
o mesmo valor em todos os atributos que possuem o mesmo
nome.
Produto
cartesiano (X)
Retorna todos os pares de linhas das duas relações de entrada
(independentemente de ter ou não os mesmos valores em atributos
comuns).
União (Ս)
Retorna as tuplas que estão na primeira relação, na segunda
relação, ou em ambas.
Intersecção (Ո)
Retorna as tuplas que aparecem tanto na primeira relação
quanto na segunda.
Diferença (-)
Retorna tuplas que aparecem na primeira relação, mas não
estão na segunda.
Gabarito: Certo.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 19 de 51
www.exponencialconcursos.com.br
23- (CESPE - 2017 - TCE-PE - Analista de Controle
Externo - Auditoria de Contas Públicas) A respeito de bancos de dados
relacionais, julgue os itens subsequentes.
Uma visão (view) é derivada de uma ou mais relações e armazena os dados em
uma tabela física do banco de dados, visando tornar ágeis as consultas.
Resolução:
Uma visão é uma tabela virtual é não uma tabela física.
Uma visão (ou view) é uma única tabela que é derivada de outras tabelas.
Por não necessariamente existir em forma física é considerada uma tabela
virtual.
É importante destacar que certos sistemas de bancos de dados permitem que
as visões sejam armazenadas. Essas visões armazenadas são chamadas de
visões materializadas.
Gabarito: Errado.

24- (CESPE - 2011 - Correios - Analista de Correios -
Analista de Sistemas - Produção) Com relação a banco de dados, julgue os
itens a seguir.
No acesso aos dados de tabelas em um banco de dados, a utilização de índices
melhora o desempenho de acesso do usuário final.
Resolução:
Os índices são usados justamente para melhorar a velocidade de acesso às
informações.
Os índices são estruturas de acesso auxiliares associados a tabelas, que
são utilizados para agilizar a recuperação de registros em resposta a certas
condições de pesquisa.
Gabarito: Certo.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 20 de 51
www.exponencialconcursos.com.br
25- (CESPE - 2018 - FUB - Técnico de Tecnologia da
Informação) Julgue o item seguinte, a respeito dos conceitos de modelagem
de dados e níveis de abstração.
Na cardinalidade de mapeamento entre o conjunto de entidades X e Y de uma
associação um-para-um, uma entidade em X é associada, no máximo, a uma
entidade em Y, e uma entidade em Y é associada, no máximo, a uma entidade
em X.
Resolução:
No relacionamento de cardinalidade 1:1, cada elemento de uma tabela
se relaciona a um único elemento de outra tabela. Uma das tabelas possui
uma chave estrangeira que se liga logicamente a chave primária da outra tabela.
Este relacionamento é pouco comum nos modelos de bancos de dados
relacionais.

Gabarito: Certo.
R
e
la
c
io
a
n
m
e
n
to
s
(a
s
s
o
c
ia
ç
ã
o
e
n
tr
e
a
s
t
a
b
e
la
s
)
(e
x
is
te
m
a
p
e
n
a
s
l
o
g
ic
a
m
e
n
te
,
m
a
s
n
ã
o
f
is
ic
a
m
e
n
te
)
Um para Um
(1:1)
Cada elemento de uma tabela se relaciona a um
único elemento de outra tabela.
Em bancos relacionais, uma das tabelas possui a
chave estrangeira. Pode-se, porém, mesclar as
entidades em uma única tabela ou criar uma terceira
tabela para cruzar as chaves primárias destas.
Um para
Muitos
(1:N)
Cada elemento de uma tabela r1 pode ser
relacionar com mais de um elemento da tabela r2,
no entanto cada elemento da tabela r2 está
relacionado a apenas um elemento de r1.
Em bancos de dados relacionais, a tabela do lado N
da relação possui a chave estrangeira.
Muitos para
Muitos
(N:M)
Para cada valor do campo de uma tabela, pode haver
N valores no campo da outra tabela e vice-versa.
Os dados estão diretamente relacionados ao fato
(ou ao relacionamento), e não as entidades (ou
tabelas).
Em bancos de dados relacionais, esta relação
consuma-se através de uma tabela de ligação. Esta
tabela pode possuir atributos próprios.
Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 21 de 51
www.exponencialconcursos.com.br
26- (CESPE- 2019 – SEFAZ-RS – Auditor Fiscal da
Receita Estadual) No modelo relacional, a afirmação “Duas tuplas distintas,
em qualquer estado da relação, não podem ter valores idênticos para os
atributos na chave” é
a) falsa.
b) uma restrição de domínio do modelo.
c) uma propriedade exclusiva do modelo objeto-relacional.
d) uma condição que deverá estar explícita na representação dos atributos de
uma tupla.
e) uma propriedade de chave do modelo.
Resolução:
Uma chave é um conjunto de um ou mais atributos que, coletivamente, nos
permitem identificar de forma exclusiva uma tupla na relação, sendo que a
remoção de qualquer dos seus atributos a faz deixar de identificar unicamente
a tupla na relação.
Em resumo, uma chave apresenta duas propriedades:
❖ Duas tuplas distintas na relação não podem ter valores idênticos para
os atributos na chave;
❖ É uma superchave mínima, ou seja, uma superchave da qual não
podemos remover nenhum atributo sem acabar com a restrição de
exclusividade.
Gabarito: Letra E.

27- (CESPE - 2018 - Polícia Federal - Perito Criminal
Federal - Área 3) Acerca de banco de dados, julgue o item seguinte.
Em um banco de dados relacional, os dados são armazenados em tabelas; e as
tabelas, organizadas em colunas.
Resolução:
A tabela é a estrutura chave do banco de dados relacional, servindo para
representar os dados e relacionamentos entre esses dados.
Uma tabela é organizada em colunas, que servem para ajudar a interpretar
o significado dos valores em cada linha. Formalmente, um cabeçalho da
coluna é chamado de atributo. O número de colunas de uma relação
representa o grau (ou aridade) desta relação.
Gabarito: Certo.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 22 de 51
www.exponencialconcursos.com.br
28- (CESPE - 2018 - TCE-MG - Analista de Controle
Externo - Ciência da Computação) De acordo com a normalização de
entidades em bancos de dados relacionais, a entidade cujos atributos não chave
independem de outro atributo não chave está na
a) quinta forma normal (5FN).
b) primeira forma normal (1FN).
c) segunda forma normal (2FN).
d) terceira forma normal (3FN).
e) quarta forma normal (4FN).
Resolução:
A descrição trazida na questão se refere a 3FN. Uma relação está na 3FN se estiver
na 2FN e cada atributo não chave não possuir dependência transitiva, para
cada chave candidata. Todos os atributos dessa tabela devem ser independentes
uns dos outros, ao mesmo tempo que devem ser dependentes exclusivamente
da chave primária da tabela.

Gabarito: Letra D.

1FN
•Todos os atributos são atômicos.
•Não possui atributos multivalorados nem compostos.
2FN
•Está na 1FN.
•Cada atributo não-chave é dependente da chave primária (ou candidata) inteira. (Dependência
funcional total)
•Cada atributo não-chave não pode ser dependente de apenas parte da chave.
3FN
•Está na 2FN.
•Cada atributo não chave não possui dependência transitiva, para cada chave candidata.
•Todos os atributos dependem exclusivamente da chave primária da tabela.
BCFN
•Está na 3FN (variação forte da 3FN).
•Todo determinante é chave candidata.
•Não há dependências entre atributos não chave.
4FN
•Está na 3FN.
•Não possui dependência multivalorada.
5FN
•Está na 4FN.
•Não possui dependência de junção.
Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 23 de 51
www.exponencialconcursos.com.br
29- (CESPE - 2018 - SEFAZ-RS - Técnico Tributário da
Receita Estadual - Prova 1) Na elaboração de um projeto de banco de dados,
é função da normalização evitar
a) a repetição de informações.
b) a criação de pequenas tabelas.
c) o armazenamento de dados pessoais
d) o procedimento de relacionar dados de diferentes fontes.
e) a extrapolação do tamanho máximo dos campos das tabelas.
Resolução:
A normalização de dados pode ser considerada um processo de analisar os
esquemas de relação dados com base em suas dependências funcionais e
chaves primárias para conseguir as propriedades desejadas e a (1)
minimização de redundância e (2) a minimização de anomalias de
inserção, exclusão e atualização.
Assim, evitar a redundância (repetição) de informações é uma das
principais funções da normalização.
Gabarito: Letra A.

30- (CESPE - 2018 - IPHAN - Analista I - Área 7) Acerca
da abordagem relacional, da normalização e do SGBD, entre outros conceitos
relativos a banco de dados, julgue o item a seguir.
Uma relação está na quarta forma normal (4FN) quando o conteúdo do registro
não pode ser mais reconstruído (efetuar join) a partir de outros registros
menores extraídos desse registro considerado.
Resolução:
Uma relação está na quinta forma normal 5FN, quando o seu conteúdo do
registro não puder ser reconstruído (junção) a partir de outros registros
menores, extraídos do registro principal. Ou seja, se ao particionar um registro,
e sua junção posterior não conseguir recuperar as informações contidas no
registro original, então este registro está na 5FN.
Gabarito: Errado.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 24 de 51
www.exponencialconcursos.com.br
3. BUSINESS INTELLIGENCE
31- (CESPE - 2019 - SEFAZ-RS - Auditor Fiscal da
Receita Estadual - Bloco I) A respeito do BI (business intelligence), assinale
a opção correta.
a) O BI consiste na transformação metódica e consciente das informações
exclusivamente prestadas pelos tomadores de decisão em novas formas de
conhecimento, para evolução dos negócios e dos resultados organizacionais.
b) ETL é o processo de análise de dados previsto pela arquitetura de BI.
c) As técnicas do BI objetivam definir regras para a formatação adequada dos
dados, com vista a sua transformação em depósitos estruturados de
informações, sem considerar a sua origem.
d) O repositório de dados analíticos de BI é representado pelas diversas bases
de dados relacionais e por repositórios de dados que utilizem modelagens
relacionais.
e) A camada de apresentação de uma arquitetura de BI é aquela em que as
informações são organizadas e centralizadas.
Resolução:
Vamos comentar os itens:
a) Incorreto: as informações tratadas pelo BI não são exclusivamente
prestadas pelos tomadores de decisão, mas sim provenientes de diversas
fontes.
b) Incorreto: ETL é o processo de Extração, Transformação e Carga dos dados
para o ambiente de BI. Para análise são usadas outras ferramentas, como OLAP
e Data Mining.
c) Correto: A pedra angular do BI é o Data Warehouse, que centraliza dados
de diversas fontes em uma estrutura multidimensional (tabelas fato e tabelas
dimensão).
d) Incorreto: O repositório no ambiente de BI é o Data Warehouse, que utiliza
o modelo multidimensional e não o modelo relacional.
e) Incorreto: A camada de apresentação é a utilizada para fornecer a
visualização de dados para os gestores. Como exemplos dessas ferramentas,
temos: Dashboards (painéis); Portais corporativos, cockpits e outras
ferramentas de visualização; Sistemas de Informações Geográficas (SIG). Os
dados são organizados e centralizados a partir do uso de ETL.
Gabarito: Letra C.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 25 de 51
www.exponencialconcursos.com.br
32- (CESPE - 2019 - SEFAZ-RS - Auditor Fiscal da
Receita Estadual - Bloco I) O data warehouse diferencia-se dos bancos de
dados transacionais porque
a) trabalha com dados atuais, mas não com dados históricos.
b) faz uso intenso de operações diárias e de processamento de transações
continuamente.
c) possui milhares de usuários de diferentes níveis hierárquicos dentro da
organização.
d) tem dimensionalidade genérica e níveis de agregação ilimitados.
e) utiliza ferramentas de prospecção e consulta de dados baseadas em OLTP
(on-line transaction processing).
Resolução:
Vamos analisar os itens:
a) Incorreto: trabalham com dados atuaise históricos.
b) Incorreto: o foco não é nas transações, mas na consulta de dados.
c) Incorreto: os bancos transacionais também podem ter vários usuários.
d) Correto: dimensionalidade genérica diz respeito a capacidade de tratar
informações em qualquer quantidade de dimensões. Devido às várias dimensões
existentes, deve haver vários níveis de agregação dos dados.
e) Incorreto: utilizam ferramentas OLAP e não OLTP.
Gabarito: Letra D.

33- (CESPE - 2010 - TRE-MT - Programador de
computador - ADAPTADA) Com relação aos conceitos de modelagem
dimensional, assinale a opção correta.
a) Na abordagem utilizada por Kimball, todos os dados de uma empresa são
reunidos em um repositório central, caracterizado por um projeto dimensional,
e que pode ser consultado diretamente.
b) A abordagem de Inmon consolida todas as informações de uma empresa em
um repositório central chamado data warehouse corporativo. Essa abordagem
é caracterizada por um projeto na terceira forma normal, no qual os dados são
consultados diretamente por aplicativos de data warehouse.
c) Na abordagem de Kimball, os data marts são adaptados às necessidades e
pontos de vista de um grupo de negócios específico, suportando a modelagem
dimensional, e são consultados por aplicativos de data warehouse.
Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 26 de 51
www.exponencialconcursos.com.br
d) A abordagem de data marts autônomos tem foco empresarial e atende às
necessidades dentro de uma área de assunto. Seu desenvolvimento necessita
explorar o uso de elementos de dados comuns em toda a empresa.
Resolução:
Questão que requer o conhecimento das diferenças entre as duas abordagens
para o desenvolvimento de banco de dados: a de Inmon e a de Kimball.
Vamos a análise dos itens:
a) Correto: Kimball adota uma abordagem que inicia pela construção de data
marts que são agregados ou reunidos em um data warehouse. Dessa forma, o
que fica disponível para ser acessado é o DW que é um grande repositório sobre
todas as informações da organização.
b) Incorreto: Na abordagem de Inmon, constrói-se inicialmente o DW com
todos os dados da organização que alimenta os DMs departamentais. As
ferramentas de consultas operam sobre os DMs e não sobre o DW.
c) Incorreto: Conforme discutido no item A, na abordagem de Kimball, o que
é acessado é o DW e não os data marts.
d) Incorreto: Os data marts têm foco departamental ou setorial e não
empresarial, além disso, os elementos de dados comuns são considerados no
data warehouse e não nos data marts individuais.
Gabarito: Letra A.

34- (CESPE - 2011 - MEC - Analista de Sistemas) Com
relação à arquitetura OLAP, julgue o item seguinte.
Um cubo, ou hipercubo, é um array multidimensional no qual um grupo de
células de dados é organizado segundo as dimensões dos dados.
Resolução:
Assertiva de acordo com a definição do cubo de dados utilizado no modelo
dimensional ou multidimensional.
Segundo Navathe, os modelos multidimensionais tiram proveito dos
relacionamentos inerentes nos dados para preencher os dados em matrizes
multidimensionais, chamadas de cubos de dados. Nestes cubos, o
desempenho da consulta pode ser muito melhor do que no modelo de
dados relacional e os dados podem ser consultados diretamente a partir
de qualquer combinação de suas dimensões. Os cubos que possuem mais
de três dimensões são chamados de hipercubos, mas não são facilmente
apresentados de maneira gráfica.
Gabarito: Certo.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 27 de 51
www.exponencialconcursos.com.br
35- (CESPE - 2018 - CGM de João Pessoa - PB - Auditor
Municipal de Controle Interno - Desenvolvimento de Sistemas) A
respeito de business intelligence, julgue o próximo item.
Na modelagem multidimensional utilizada em data warehouses para se prover
melhor desempenho, a tabela fato central deve relacionar-se às suas dimensões
por meio da chave primária oriunda da fonte de dados original. O valor dessa
chave deve ser idêntico ao da fonte, para que tenha valor semântico e garanta
que o histórico das transações seja mantido.
Resolução:
A relação entre a tabela fato é as tabelas dimensões é através das chaves
primárias das próprias dimensões e não das fontes de dados originais.
Todas as tabelas de fatos têm duas ou mais chaves estrangeiras, que se
conecta às chaves primárias das tabelas de dimensões. Por exemplo, a chave
do produto na tabela de fatos sempre combinará uma chave de produto
específica na tabela de dimensão do produto. A tabela de fatos é acessada
através das tabelas de dimensões relacionadas a ela.
Gabarito: Errado.

36- (CESPE - 2018 - FUB - Técnico de Tecnologia da
Informação) Acerca de bases de dados multidimensionais, julgue o item
seguinte.
O modelo em estrela de um banco de dados multidimensional tem como objetivo
representar e manipular dados complexos, visando tornar aqueles dados mais
representativos em semântica e construções de modelagens por meio de nós e
suas ligações.
Resolução:
O modelo em estrela de um banco de dados multidimensional objeto
relacional tem como objetivo representar e manipular dados complexos,
visando tornar aqueles dados mais representativos em semântica e construções
de modelagens por meio de nós e suas ligações.
O esquema estrela (star schema) consiste em uma tabela de fatos com
uma única tabela para cada dimensão. Neste esquema, existe uma tabela
fato central conectada a várias tabelas dimensão.
Gabarito: Errado.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 28 de 51
www.exponencialconcursos.com.br
37- (CESPE - 2010 - TRT - 21ª Região (RN) - Analista
Judiciário - Tecnologia da Informação) Acerca de sistemas de suporte a
decisão e data warehousing, julgue os itens a seguir.
Em um data warehouse, cada linha em uma tabela fato corresponde a uma
medida, representada por um valor aditivo, em que necessariamente essas
medidas não compartilham a mesma granularidade.
Resolução:
As medidas de uma tabela fato podem ser aditivas, semi-aditivas ou não
aditivas. Além disso uma das 10 regras de Kimball para a modelagem
dimensional prevê que é necessário se certificar de que todos os fatos em
uma única tabela fato estão na mesma granularidade ou nível de
detalhe.
Gabarito: Errado.

38- (CESPE - 2014 - ANATEL - Técnico em Regulação -
Telecomunicações) Julgue o item seguinte, com relação à disponibilização de
informações de apoio a decisões estratégicas e gerenciais.
As ferramentas de business inteligence são consideradas ferramentas do tipo
OLTP (online transaction processing).
Resolução:
O item relaciona erroneamente as ferramentas de BI com as OLTP. Na verdade
são as ferramentas OLAP é que são utilizadas em ambientes de BI, sendo as
OLTP utilizadas em ambientes transacionais.

Gabarito: Errado.

OLTP
•Realizar funções comerciais cotidianas
•Bancos de dados transacionais
•Inclusão, alteração, exclusão e consulta
•Relatórios de rotina, periódicos e
estreitamente focados
•Execução mais rápida
•Atualização contínua
• Recursos dos bancos de dados relacionais.
OLAP
•Suportar análise de decisões
•DWs ou DMs
•Carga e consulta.
•Relatórios e consultas Ad hoc,
multidimensionais, amplamente focados
•Execução mais lenta
•Atualização em lote
•Recursos de computação distribuída,
multiprocesamento e bancos
especializados.
Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 29 de 51
www.exponencialconcursos.com.br
39- (CESPE - 2015 - MEC – Administrador de Dados) No
que se refere a bancos de dados transacionais (OLTP) e a banco de dados
analíticos (OLAP), julgue o item que se segue.
OLAP é uma interface com o usuário que pode se utilizar de diversos modelos
de armazenamento para apresentar as informações. As diversas formas de
armazenamento e acessoa dados permitem classificar OLAP em diferentes
categorias, como por exemplo, o ROLAP, em que os dados são armazenados de
forma relacional, e o MOLAP, em que os dados são armazenados em estruturas
multidimensionais.
Resolução:
Item que cobra a diferença entre MOLAP e ROLAP, que reside principalmente
nas estruturas de armazenamento utilizadas.
As ferramentas MOLAP (Processamento Analítico Multidimensional On-
Line) requerem pré-computação e o armazenamento de informações no
cubo de dados, isto é, um pré-processamento.
As ferramentas ROLAP (Processamento Analítico Relacional On-line)
não requerem pré-computação e armazenamento de informações, pois
acessam os dados em um banco de dados relacional e geram consultas
SQL para consultar informações em um nível apropriado solicitado pelo usuário.
Gabarito: Certo.

40- (CESPE - 2018 - FUB - Técnico de Tecnologia da
Informação) Acerca de bases de dados multidimensionais, julgue o item
seguinte.
O operador drill-down relaciona-se ao processo de apresentar dados do nível
mais baixo da hierarquia de dados de um esquema para níveis mais altos.
Resolução:
O operador drill-down drill-up relaciona-se ao processo de apresentar dados
do nível mais baixo da hierarquia de dados de um esquema para níveis mais
altos.
A operação Drill down fornece uma visão mais detalhada, desagregando
unidades menores ao longo da dimensão. Assim, há sai de níveis mais altos
para níveis mais baixos na hierarquia.
Gabarito: Errado.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 30 de 51
www.exponencialconcursos.com.br
41- (CESPE - 2018 - CGM de João Pessoa - PB - Auditor
Municipal de Controle Interno - Desenvolvimento de Sistemas) A
respeito de business intelligence, julgue o próximo item.
Uma ferramenta de ETL deve ser capaz de extrair dados de fontes heterogêneas,
copiá-los para uma área de transição, onde possam ser convertidos conforme o
padrão estabelecido, e, ainda, realizar limpeza e correção nesses dados, de
acordo com regras preestabelecidas.
Resolução:
O processo ETL consiste na extração (leitura de dados de uma ou mais bases
de dados), transformação (conversão dos dados extraídos de sua forma
anterior para a forma em que precisa estar para que possa ser colocado em um
data warehouse ou simplesmente outro banco de dados), e carga (colocar os
dados no data warehouse). As ferramentas ETL também transportam dados
entre fontes e destinos, documentam como os elementos de dados mudam à
medida que se movem entre fonte e destino, trocam metadados com outras
aplicações conforme necessário e administram todos os processos e operações
de execução (por exemplo, agendamento, gerenciamento de erros, logs de
auditoria, estatísticas). O ETL é extremamente importante para a
integração de dados, bem como para data warehousing. O objetivo do
processo ETL é carregar o armazém com dados integrados e limpos.
Gabarito: Certo.

42- (CESPE - 2018 - IPHAN - Analista I - Área 7) Julgue
o item que se segue, a respeito de tecnologias de sistemas de informação.
O data warehouse é integrado, não volátil e orientado a assuntos, contudo,
embora lide com dados e os armazene para a tomada de decisões gerenciadas,
não é considerado um banco de dados, pois é variável em relação ao tempo.
Resolução:
O Data Warehouse é considerado um banco de dados.

Gabarito: Errado.

Data
Warehouse
Orientados a
assunto
Integrados
Variante no
tempo
Não voláteis
Repositório de dados atuais e
históricos de potencial interesse
para gestores de toda a organização.
Conjunto de dados
produzidos para apoiar a
tomada de decisão.
Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 31 de 51
www.exponencialconcursos.com.br
43- (CESPE - 2019 - SEFAZ-RS - Auditor Fiscal da
Receita Estadual - Bloco I) Com relação aos modelos de dados
multidimensionais, assinale a opção correta.
a) A principal característica da tabela de fatos é a ausência de dados
redundantes, o que melhora o desempenho nas consultas.
b) Esses modelos são cubos de dados, sendo cada cubo representado por uma
única tupla com vários atributos.
c) Esses modelos proporcionam visões hierárquicas, ou seja, exibição roll-up ou
drill-down.
d) Os modelos de dados multidimensionais dão ênfase à coleta e às transações
de dados.
e) Esses modelos não utilizam processos de transferência de dados, mas sim
acessos nativos do próprio SGBD utilizado.
Resolução:
Vamos analisar os itens:
a) Incorreto: a tabela fato não é normalizada, portanto, não podemos falar
que não temos dados redundantes. Essa tabela representa as medidas de
negócio.
b) Incorreto: os cubos são formados por várias dimensões.
c) Correto: as operações de drill-up (roll-ul) e drill-down permitem navegar por
entre a hierarquia do modelo multidimensional.
d) Incorreto: a ênfase dos modelos multidimensionais é na análise dos dados
e não nas transações.
e) Incorreto: o acesso não é realizado no SGBD, mas há transferência de dados
para o DW e, depois, acesso aos dados nesse ambiente.
Gabarito: Letra C.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 32 de 51
www.exponencialconcursos.com.br
44- (CESPE - 2018 - IPHAN - Analista I - Área 7) Julgue
o item que se segue, a respeito de tecnologias de sistemas de informação.
Na modelagem estrela, o desenvolvimento de um data warehouse permite que
todas as métricas sejam sumarizadas em relação a todas as suas dimensões,
visto que as chaves primárias da tabela fato são uma composição de chaves
estrangeiras de todas as dimensões.
Resolução:
A chave primária da tabela fato é única, embora formada pelas várias chaves
estrangeiras das tabelas dimensões associadas.
Todas as tabelas de fatos têm duas ou mais chaves estrangeiras, que se
conecta às chaves primárias das tabelas de dimensões. Por exemplo, a chave
do produto na tabela de fatos sempre combinará uma chave de produto
específica na tabela de dimensão do produto. A tabela de fatos é acessada
através das tabelas de dimensões relacionadas a ela.
Gabarito: Errado.

45- (CESPE - 2018 - EBSERH - Analista de Tecnologia da
Informação) Julgue o item que se segue, a respeito de arquitetura e
tecnologias de sistemas de informação.
Usualmente, os data warehouses dão apoio a análises de série temporal e de
tendências, as quais requerem maior volume de dados históricos do que os que
geralmente são mantidos em bancos de dados transacionais.
Resolução:
Para Inmon, um Data Warehouse é uma coleção de dados orientada a
assunto, integrada, não volátil, variável no tempo para suporte às
decisões da gerência.
Um DW é variante no tempo, pois mantém os dados históricos, permitindo a
detecção de tendências, desvios e relações de longo prazo para previsões e
comparações.
Gabarito: Certo.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 33 de 51
www.exponencialconcursos.com.br
46- (CESPE - 2018 - TCM-BA - Auditor Estadual de
Controle Externo) Acerca de modelagem dimensional, assinale a opção
correta.
a) As granularidades fundamentais para classificar todas as tabelas fato de um
modelo dimensional são: transacional, snapshot periódico e snapshot
acumulado.
b) Os fatos e dimensões não são tabelas do banco de dados, pois, no modelo
dimensional, são componentes do cubo de um data warehouse.
c) No modelo estrela, as dimensões são normalizadas para tornar mais ágeis as
consultas analíticas.
d) O modelo floco de neve (SnowFlake) aumenta o espaço de armazenamento
dos dados dimensionais, pois acrescenta várias tabelas ao modelo, todavia torna
mais simples a navegação por software que utilizarão o banco de dados.
e) Os códigos e as descrições associadas, usadas como nomes de colunas em
relatórios e como filtros em consultas, não devem ser gravados em tabelas
dimensionais.Resolução:
Vamos analisar cada um dos itens:
a) Correto: As granularidades fundamentais para classificar todas as tabelas
fato de um modelo dimensional são: transacional, snapshot periódico e
snapshot acumulado. Além dessas, temos: fato agregada, consolidada e fato
sem fato.
b) Incorreto: Os fatos e dimensões são tabelas do banco de dados integrantes
do cubo de dados.
c) Incorreto: No modelo estrela, as dimensões não são normalizadas.
d) Incorreto: O modelo floco de neve (SnowFlake) aumenta o espaço de
armazenamento dos dados dimensionais, pois acrescenta várias tabelas ao
modelo, todavia torna mais simples complexa a navegação por software que
utilizarão o banco de dados.
e) Incorreto: as tabelas de dimensão devem conter os códigos e descrições
associados aos nomes das colunas usados em relatórios e filtros de consultas.
Gabarito: Letra A.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 34 de 51
www.exponencialconcursos.com.br
47- (CESPE - 2018 - STM - Técnico Judiciário -
Programação de Sistemas) A respeito de ETL, julgue o item a seguir.
O ambiente ETL permite a visualização dos dados para análise de maneira
multidimensional.
Resolução:
O ambiente ETL OLAP permite a visualização dos dados para análise de maneira
multidimensional. O OLAP é uma abordagem para responder rapidamente
questões ad hoc através da execução de consultas analíticas
multidimensionais em repositórios de dados organizacionais.
O processo ETL consiste na extração (leitura de dados de uma ou mais bases
de dados), transformação (conversão dos dados extraídos de sua forma
anterior para a forma em que precisa estar), e carga (colocar os dados no data
warehouse).
Gabarito: Errado.

48- (CESPE - 2018 - CGM de João Pessoa - PB - Auditor
Municipal de Controle Interno - Desenvolvimento de Sistemas) A
respeito de business intelligence, julgue o próximo item.
Business intelligence pode ser definido como um processo inteligente de coleta,
organização, análise, compartilhamento e monitoração de dados que, depois de
processados, geram informações para o suporte e para a tomada de decisões
no ambiente de negócios.
Resolução:
O termo Business Intelligence (BI) é um conceito guarda-chuva que combina
arquitetura, ferramentas, bancos de dados, ferramentas analíticas,
aplicações e metodologias com os objetivos de habilitar o acesso
interativo aos dados, habilitar a manipulação desses dados e prover aos
gerentes de negócios e analistas a habilidade de conduzir análises
apropriadas.
Gabarito: Certo.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 35 de 51
www.exponencialconcursos.com.br
49- (CESPE - 2018 - CGM de João Pessoa - PB - Auditor
Municipal de Controle Interno - Desenvolvimento de Sistemas) A
respeito de business intelligence, julgue o próximo item.
O modelo snowflake acrescenta graus de normalização às tabelas de dimensões,
eliminando redundâncias; em termos de eficiência na obtenção de informações,
seu desempenho é melhor que o do modelo estrela, o qual, apesar de possuir
um único fato, possui tamanho maior que o do snowflake, considerando-se a
desnormalização das tabelas de dimensões.
Resolução:
O desempenho do modelo snowflake é pior que o estrela justamente devido as
normalizações. Para realizar as consultas devem ser feitas junções nas tabelas.
Gabarito: Errado.

50- (CESPE - 2017 - TCE-PE - Auditor de Controle
Externo - Auditoria de Contas Públicas) Julgue o próximo item, relativo à
modelagem dimensional.
Todas as tabelas de um modelo apresentam um elemento de tempo como parte
da estrutura de chave.
Resolução:
Um elemento de tempo é uma dimensão que deve fazer parte da chave da
tabela fato, mas não precisa, necessariamente, fazer parte de todas as
tabelas dimensão do modelo.
A chave primária de uma tabela fato é sempre composta ou concatenada e
possui ao menos um elemento associado a uma dimensão de tempo. Dessa
forma, somente um atributo da tabela de fatos e a dimensão tempo
devem, obrigatoriamente, possuir um elemento de tempo na sua estrutura.
Gabarito: Errado.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 36 de 51
www.exponencialconcursos.com.br
4. DATA MINING
51- (CESPE - 2018 - Polícia Federal - Perito Criminal
Federal - Conhecimentos Básicos - Todas as Áreas) Acerca de banco de
dados, julgue o seguinte item.
Descobrir conexões escondidas e prever tendências futuras é um dos objetivos
da mineração de dados, que utiliza a estatística, a inteligência artificial e os
algoritmos de aprendizagem de máquina.
Resolução:
A mineração de dados (data mining) refere-se à mineração ou
descoberta de novas informações em termos de padrões ou regras com
base em grandes quantidades de dados. Dito de outro modo, o termo
mineração de dados foi originalmente usado para descrever o processo pelo
qual os padrões anteriormente desconhecidos em dados são
descobertos.
Tecnicamente falando, a mineração de dados é um processo que utiliza
técnicas de estatística, matemática e inteligência artificial para extrair
e identificar informações úteis e subsequentes conhecimentos (ou
padrões) em grandes conjuntos de dados.
Gabarito: Certo.

52- (CESPE - 2016 - TCE-SC - Auditor Fiscal de Controle
Externo - Informática) Julgue o item subsecutivo, acerca de mineração de
dados. Para a realização de prognósticos por meio de técnicas de mineração de
dados, parte-se de uma série de valores existentes obtidos de dados históricos
bem como de suposições controladas a respeito das condições futuras, para
prever outros valores e situações que ocorrerão e, assim, planejar e preparar
as ações organizacionais.
Resolução:
O prognóstico ou previsão pode ser realizado com o uso do data mining.
Navathe destaca a previsão como um dos quatro objetivos da mineração de
dados, sendo os outros a identificação, a classificação e a otimização.
Para ser mais assertivo, o prognóstico deve ser realizado com base na lógica
de negócios, baseando-se nos dados históricos para avaliar o comportamento
passado da organização em determinadas situações e realizando suposições de
como a organização irá se comportar em situações futuras semelhantes ou com
variações.
Gabarito: Certo.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 37 de 51
www.exponencialconcursos.com.br
53- (CESPE - 2018 - TCM-BA - Auditor Estadual de
Controle Externo) Assinale a opção correta a respeito do CRISP-DM.
a) CRISP-DM é uma suíte de ferramentas proprietárias que vem se tornando
um padrão da indústria para mineração de dados, uma vez que fornece um
plano completo e tecnologias para a realização de um projeto de mineração de
dados.
b) A verificação da qualidade dos dados é uma atividade da fase de
entendimento dos dados.
c) Durante a fase de preparação dos dados, é realizado um inventário de
requisitos, suposições e restrições de recursos.
d) Na fase de avaliação dos dados, são realizadas as atividades de identificar
valores especiais dos dados e catalogar seu significado.
e) Na fase de preparação dos dados, são realizadas as atividades de analisar o
potencial de implantação de cada resultado e estimar o potencial de melhoria
do processo atual.
Resolução:
Vamos analisar cada um dos itens:
a) Incorreto: O modelo de referência CRISP-DM é provavelmente o mais
popular e foi proposto por um consórcio de empresas europeu para servir
como metodologia padrão não proprietária para a mineração de dados.
b) Correto: A fase de entendimento dos dados começa com uma coleta
inicial de dados e prossegue com atividades para se familiarizar com os
dados, identificar problemas de qualidade de dados, descobrir novos
insights sobre os dados ou detectar subconjuntos interessantes para
formar hipóteses para informações ocultas.
c) Incorreto: Durantea fase de preparação dos dados entendimento do
negócio, é realizado um inventário de requisitos, suposições e restrições de
recursos.
d) Incorreto: Na fase de avaliação dos dados modelagem, são realizadas as
atividades de identificar valores especiais dos dados e catalogar seu
significado.
e) Incorreto: Na fase de preparação dos dados teste e avaliação, são
realizadas as atividades de analisar o potencial de implantação de cada
resultado e estimar o potencial de melhoria do processo atual.
Gabarito: Letra B.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 38 de 51
www.exponencialconcursos.com.br
54- (CESPE - 2018 - TCM-BA - Auditor Estadual de
Controle Externo) A respeito das técnicas e(ou) métodos de mineração de
dados, assinale a opção correta.
a) O agrupamento (ou clustering) realiza identificação de grupos de dados que
apresentam coocorrência.
b) A classificação realiza o aprendizado de uma função que pode ser usada
para mapear os valores associados aos dados em um ou mais valores reais.
c) A regressão ou predição promove o aprendizado de uma função que pode
ser usada para mapear dados em uma de várias classes discretas definidas
previamente, bem como encontrar tendências que possam ser usadas para
entender e explorar padrões de comportamento dos dados.
d) As regras de associação identificam grupos de dados, em que os dados têm
características semelhantes aos do mesmo grupo e os grupos têm
características diferentes entre si.
e) Os métodos de classificação supervisionada podem ser embasados em
separabilidade (entropia), utilizando árvores de decisão e variantes, e em
particionamento, utilizando SVM (support vector machines).
Resolução:
Vamos analisar cada um dos itens:
a) Incorreto: O agrupamento (ou clustering) As regras de associação
realizam identificação de grupos de dados que apresentam coocorrência.
b) Incorreto: A classificação regressão realiza o aprendizado de uma função
que pode ser usada para mapear os valores associados aos dados em um ou
mais valores reais.
c) Incorreto: A regressão ou predição classificação promove o aprendizado
de uma função que pode ser usada para mapear dados em uma de várias
classes discretas definidas previamente, bem como encontrar tendências que
possam ser usadas para entender e explorar padrões de comportamento dos
dados.
d) Incorreto: As regras de associação A clusterização identificam grupos de
dados, em que os dados têm características semelhantes aos do mesmo grupo
e os grupos têm características diferentes entre si.
e) Correto: Os métodos de classificação supervisionada podem ser
embasados em separabilidade (entropia), utilizando árvores de decisão e
variantes, e em particionamento, utilizando SVM (support vector machines).
Gabarito: Letra E.
Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 39 de 51
www.exponencialconcursos.com.br
55- (CESPE - 2018 - TCE-MG - Analista de Controle
Externo - Ciência da Computação) Na técnica de árvore de decisão em data
mining, é empregada a abordagem denominada
a) análise de volumetria.
b) combinação de variáveis.
c) estratificação.
d) avaliação de dados.
e) percepção.
Resolução:
As árvores de decisão classificam os dados em um número finito de
classes com base nos valores das variáveis de entrada. As árvores de
decisão são essencialmente uma hierarquia de declarações se-então e,
portanto, são significativamente mais rápidas do que as redes neurais. Elas
são mais apropriadas para dados categorizados e intervalos de dados.
Portanto, incorporar variáveis contínuas em uma estrutura de árvore de
decisão requer discretização; ou seja, converter variáveis numéricas de valor
contínuo em intervalos e categorias.
Estratificar significa separar em níveis. Logo, a árvore de decisão auxilia
nesse processo, separando as classes com base nos valores de entrada.
Gabarito: Letra C.

56- (CESPE - 2018 - FUB - Técnico de Tecnologia da
Informação) Julgue o item a seguir, a respeito de data mining e OLAP.
No data mining, uma regra de associação relaciona a presença de um conjunto
de itens com outra faixa de valores de um outro conjunto de variáveis.
Resolução:
As regras de associação são uma técnica popular para descobrir
relacionamentos interessantes entre variáveis em grandes bancos de
dados. Graças a tecnologias automatizadas de coleta de dados, o uso de regras
de associação para descobrir os relacionamentos entre os produtos em
transações de larga escala registradas nos sistemas de ponto de venda nos
supermercados tornou-se uma tarefa comum de descoberta de conhecimento
no ramo varejista, em que é chamada de análise de cesta de mercado.
Gabarito: Certo.
Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 40 de 51
www.exponencialconcursos.com.br
57- (CESPE - 2017 - TCE-PE - Analista de Controle
Externo - Auditoria de Contas Públicas) Em relação à análise de
agrupamentos (clusterização) em mineração de dados, julgue o item seguinte.
O método de clustering k-means objetiva particionar ‘n’ observações entre ‘k’
grupos; cada observação pertence ao grupo mais próximo da média.
Resolução:
A análise de clusters pode ser baseada em métodos estatísticos como o k-
means (media), k-modes (moda), k-medoids (mediana), etc.
O K-means (k média) é o algoritmo que atribui cada ponto de dados
(cliente, evento, objeto, etc.) ao cluster cujo centro (também chamado
centróide) é o mais próximo. O centro é calculado como a média de
todos os pontos no cluster; ou seja, suas coordenadas são a média
aritmética para cada dimensão separadamente em todos os pontos do cluster.
Gabarito: Certo.

58- (CESPE - 2012 - TRE-RJ - Técnico Judiciário -
Programação de Sistemas) Com referência a conceitos de banco de dados
textual, julgue os itens seguintes.
Text mining é o processo que utiliza métodos para navegar, organizar,
encontrar e descobrir informações em bases textuais escritas em linguagem
natural. Com text mining é possível manipular mais facilmente informações
não estruturadas, tais como notícias, textos em websites, blogs e documentos
em geral.
Resolução:
A mineração de texto (também conhecida como mineração de dados de
texto ou descoberta de conhecimento em bancos de dados textuais) é
o processo semiautomático de extração de padrões (informações úteis
e conhecimento) de grandes quantidades de fontes de dados não
estruturadas.
A mineração de texto é semelhante a mineração de dados, na medida em que
tem o mesmo propósito e usa os mesmos processos; mas com a mineração de
texto, a entrada para o processo é uma coleção de arquivos de dados
não estruturados ou semiestruturados, como documentos do Word,
arquivos PDF, trechos de texto, arquivos XML e assim por diante.
Gabarito: Certo.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 41 de 51
www.exponencialconcursos.com.br
59- (CESPE - 2018 - Polícia Federal - Perito Criminal
Federal - Conhecimentos Básicos - Todas as Áreas) Acerca de banco de
dados, julgue o seguinte item.
A mineração de dados se caracteriza especialmente pela busca de informações
em grandes volumes de dados, tanto estruturados quanto não estruturados,
alicerçados no conceito dos 4V’s: volume de mineração, variedade de
algoritmos, velocidade de aprendizado e veracidade dos padrões.
Resolução:
A questão está relacionada a Big Data e não a Mineração de Dados.
O Big Data foi inicialmente conceituado com base em três premissas básicas,
também conhecidas como 3Vs: volume, velocidade e variedade. Além dessas
premissas precursoras do conceito de Big Data, outras premissas (ou Vs)
complementam o conceito e têm sido discutidas quando se trata do tema.
Gabarito: Errado.

60- (CESPE - 2018 - Polícia Federal - Agente de Polícia
Federal) Julgue o item que segue, relativo a noções demineração de dados,
big data e aprendizado de máquina.
Pode-se definir mineração de dados como o processo de identificar, em dados,
padrões válidos, novos, potencialmente úteis e, ao final, compreensíveis.
Resolução:
A mineração de dados (data mining) refere-se à mineração ou
descoberta de novas informações em termos de padrões ou regras com
base em grandes quantidades de dados. Dito de outro modo, o termo
mineração de dados foi originalmente usado para descrever o processo pelo
qual os padrões anteriormente desconhecidos em dados são
descobertos.
Tecnicamente falando, a mineração de dados é um processo que utiliza
técnicas de estatística, matemática e inteligência artificial para extrair
e identificar informações úteis e subsequentes conhecimentos (ou
padrões) em grandes conjuntos de dados.
Em outro conceito, a mineração de dados é entendida como o processo não
trivial de identificar padrões válidos, novos, potencialmente úteis e, em
última instância, compreensíveis em dados armazenados em bancos de dados
estruturados.
Gabarito: Certo.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 42 de 51
www.exponencialconcursos.com.br
61- (CESPE - 2018 - IPHAN - Analista I - Área 7) Julgue
o item que se segue, a respeito de tecnologias de sistemas de informação.
Na busca de padrões no data mining, é comum a utilização do aprendizado
não supervisionado, em que um agente externo apresenta ao algoritmo alguns
conjuntos de padrões de entrada e seus correspondentes padrões de saída,
comparando-se a resposta fornecida pelo algoritmo com a resposta esperada.
Resolução:
A questão descreve a aprendizagem supervisionada.
A classificação é o processo de aprender um modelo que descreve
diferentes classes de dados. As classes são predefinidas e, portanto, esse
tipo de atividade é também chamado de aprendizado supervisionado.
Já na clusterização, o objetivo é classificar casos (por exemplo, pessoas,
coisas, eventos) em grupos ou clusters, de modo que o grau de
associação seja forte entre os membros do mesmo cluster e fraco entre
os membros de diferentes clusters. Contudo, as classes não são
previamente definidas, logo falamos em aprendizado não supervisionado.
Gabarito: Errado.

62- (CESPE - 2018 - STJ - Técnico Judiciário -
Desenvolvimento de Sistemas) Julgue o item que se segue, acerca de data
mining e data warehouse.
O processo de mineração de dados está intrinsecamente ligado às dimensões
e a fato, tendo em vista que, para a obtenção de padrões úteis e relevantes, é
necessário que esse processo seja executado dentro dos data warehouses.
Resolução:
É importante destacar que a mineração de dados pode ser utilizada junto com
um data warehouse para ajudar com certos tipos de decisões. Porém, não está
restrita a um DW, podendo ser aplicada também a bancos de dados
operacionais com transações individuais. Alguns recursos de mineração são
fornecidos por SGBDs relacionais, mas de forma limitada.
Gabarito: Errado.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 43 de 51
www.exponencialconcursos.com.br
63- (CESPE - 2017 - TCE-PE - Auditor de Controle
Externo - Auditoria de Contas Públicas) Julgue o seguinte item, que se
refere a CRISP-DM (Cross-Industry Standard Process of Data Mining).
Durante a fase de entendimento do negócio, busca-se descrever claramente o
problema, fazer a identificação dos dados e verificar se as variáveis relevantes
para o projeto não são interdependentes.
Resolução:
Há um equívoco quanto a fase descrita no item. O item descreve a fase de
entendimento dos dados e não a de entendimento do negócio.
A fase de entendimento do negócio objetiva o entendimento das
necessidades gerenciais e das especificações de objetivos de negócio.
Um plano de projeto para busca de conhecimento é desenvolvido de
modo a especificar as pessoas responsáveis por coletar, analisar e reportar
dados. Um orçamento de alto nível pode ser estabelecido.
Na fase de entendimento de dados, busca-se a identificação dos dados
relevantes das diferentes fontes de dados. O analista deve considerar a
tarefa de data mining a ser realizada e construir um conhecimento acerca
das bases de dados e variáveis.
Gabarito: Errado.

64- (CESPE - 2017 - SEDF - Analista de Gestão
Educacional - Tecnologia da Informação) Com relação a data mining e data
warehouse, julgue o item que se segue.
Agrupar registros em grupos, de modo que os registros em um grupo sejam
semelhantes entre si e diferentes dos registros em outros grupos é uma
maneira de descrever conhecimento descoberto durante processos de
mineração de dados.
Resolução:
Assertiva refere-se a tarefa ou técnica de clusterização ou agrupamento.
A análise de cluster é uma ferramenta de análise exploratória de dados para
resolver problemas de classificação. O objetivo é classificar casos (por
exemplo, pessoas, coisas, eventos) em grupos ou clusters, de modo que o
grau de associação seja forte entre os membros do mesmo cluster e
fraco entre os membros de diferentes clusters.
Gabarito: Certo.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 44 de 51
www.exponencialconcursos.com.br
65- (CESPE - 2017 - TRE-BA - Analista Judiciário –
Análise de Sistemas) O agrupamento de dados no processo de data mining
procura, em uma massa de dados que caracterizam uma população de
indivíduos, grupos semelhantes e diferentes. O algoritmo baseado na teoria dos
grafos e que dispensa a definição de protótipos utilizado para segmentar a base
de dados em diferentes grupos é denominado
a) K média.
b) K medoides.
c) Apriori.
d) DBSCAN.
e) Árvore geradora mínima.
Resolução:
Questão que define árvore geradora mínima, portanto o Gabarito é letra E.
Vejamos os conceitos dos demais algoritmos:
a) K média (K-means): o algoritmo atribui cada ponto de dados (cliente,
evento, objeto, etc.) ao cluster cujo centro (também chamado centróide) é o
mais próximo. O centro é calculado como a média de todos os pontos no cluster;
ou seja, suas coordenadas são a média aritmética para cada dimensão
separadamente em todos os pontos do cluster.
b) K medoides (K-medoids): o elemento que melhor representa o cluster, é
definido de acordo com seus atributos sem que haja muita influência dos valores
próximos aos limites do cluster.
c) Apriori: dado um conjunto de itens, o algoritmo tenta encontrar
subconjuntos que são comuns a, pelo menos, um número mínimo de conjuntos.
d) DBSCAN: dado um conjunto de pontos em algum espaço, agrupa pontos que
estão intimamente empacotados (pontos com muitos vizinhos próximos),
marcando como pontos atípicos que ficam sozinhos em regiões de baixa
densidade (cujos vizinhos mais próximos estão muito distantes).
Gabarito: Letra E.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 45 de 51
www.exponencialconcursos.com.br
5. BIG DATA
66- (CESPE - 2018 - Polícia Federal - Papiloscopista
Policial Federal) Julgue o item seguinte, a respeito de big data e tecnologias
relacionadas a esse conceito.
De maneira geral, big data não se refere apenas aos dados, mas também às
soluções tecnológicas criadas para lidar com dados em volume, variedade e
velocidade significativos.
Resolução:
O Big Data tanto pode ser encarado como o grande volume de dados
estruturados e não estruturados que são gerados a cada segundo ou
também como as tecnologias que são utilizadas para lidar com este
grande volume de dados. Esta segunda acepção é, por vezes, chamada de
Big Data Analytics.
Gabarito: Certo.

67- (CESPE - 2018 - TCE-MG - Analista de Controle
Externo - Ciência da Computação) Uma empresa, ao implementar técnicas
e softwares de big data, deu enfoque diferenciado à análise que tem como
objetivo mostrar as consequências de determinado evento.
Essa análise é do tipoa) preemptiva.
b) perceptiva.
c) prescritiva.
d) preditiva.
e) evolutiva.
Resolução:
A análise prescritiva traça as possíveis consequências de cada ação. É
uma forma de definir qual escolha será mais efetiva em determinada situação.
O valor dessa análise se dá pela capacidade de numerar determinados padrões
e filtrá-los por especificidades, obtendo um cenário bastante fiel da situação e
como cada intervenção responderá.
Gabarito: Letra C.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 46 de 51
www.exponencialconcursos.com.br
68- (CESPE - 2015 - TRE-GO - Técnico Judiciário - Área
Administrativa) Julgue o item subsecutivo, acerca de procedimentos de
segurança e educação a distância (EAD).
A Big Data pode ser utilizada na EAD para se entender as preferências e
necessidades de aprendizagem dos alunos e, assim, contribuir para soluções
mais eficientes de educação mediada por tecnologia.
Resolução:
O objetivo do Big Data é propiciar dados e informações que possam ser
analisados visando subsidiar tomadas de decisão. Assim, em um contexto
de Educação à Distância, é perfeitamente possível analisar as preferências e
necessidades dos alunos para, com base na tomada de decisão, melhorar as
soluções para a aprendizagem destes alunos.
Educadores armados com uma visão orientada a dados podem ter um impacto
significativo sobre os sistemas escolares, estudantes e currículos. Analisando
big data, eles podem identificar alunos em risco, assegurar que os estudantes
estão progredindo de forma adequada, e podem implementar um sistema
melhor de avaliação e apoio aos professores e diretores.
Gabarito: Certo.

69- (CESPE - 2014 - TJ-SE - Analista Judiciário - Banco
de Dados) Julgue os itens que se seguem, no que se refere a Big Data.
O processamento de consultas ad hoc em Big Data, devido às características de
armazenamento dos dados, utiliza técnicas semelhantes àquelas empregadas
em consultas do mesmo tipo em bancos de dados tradicionais.
Resolução:
Os bancos de dados tradicionais realizam consultas em dados estruturados. O
processamento de consultas ad hoc no big data traz desafios diferentes
daqueles incorridos ao realizar consultas ad hoc em dados
estruturados pelo fato de as fontes e formatos dos dados não serem fixos e
exigirem mecanismos diferentes para recuperá-los e processá-los.
Gabarito: Errado.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 47 de 51
www.exponencialconcursos.com.br
70- (CESPE - 2015 - TCU - Auditor Federal de Controle
Externo) No que concerne a data mining (mineração de dados) e big data,
julgue o seguinte item.
Devido à quantidade de informações manipuladas, a (cloud computing)
computação em nuvem torna-se inviável para soluções de big data.
Resolução:
Muito pelo contrário. A grande vantagem de associar big data à cloud
computing é reduzir os custos de uma infraestrutura de TI para armazenar e
processar os dados.
Big Data em relação à nuvem representa um desafio tecnológico pois demanda
atenção à infraestrutura e tecnologias analíticas. Processamento de
massivos volumes de dados pode ser facilitado pelo modelo de
computação em nuvem, desde que, é claro, que este imenso volume não seja
transmitido repetidamente via Internet.
Gabarito: Errado.

71- (CESPE - 2018 - Polícia Federal - Escrivão de Polícia
Federal) Em um big data, alimentado com os dados de um sítio de comércio
eletrônico, são armazenadas informações diversificadas, que consideram a
navegação dos usuários, os produtos comprados e outras preferências que o
usuário demonstre nos seus acessos.
Tendo como referência as informações apresentadas, julgue o item seguinte.
O big data consiste de um grande depósito de dados estruturados, ao passo que
os dados não estruturados são considerados data files.
Resolução:
O Big Data possui tanto dados estruturados como não estruturados, além dos
semiestruturados.
o Big Data tanto pode ser encarado como o grande volume de dados
estruturados e não estruturados que são gerados a cada segundo ou
também como as tecnologias que são utilizadas para lidar com este
grande volume de dados.
Gabarito: Errado.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 48 de 51
www.exponencialconcursos.com.br
72- (CESPE - 2018 - TCE-PB - Auditor de Contas
Públicas) Com referência a big data, assinale a opção correta.
a) A definição mais ampla de big data restringe o termo a duas partes — o
volume absoluto e a velocidade —, o que facilita a extração das informações e
dos insights de negócios.
b) O sistema de arquivos distribuído Hadoop implementa o algoritmo Dijkstra
modificado para busca irrestrita de dados em árvores aglomeradas em clusters
com criptografia.
c) Em big data, o sistema de arquivos HDFS é usado para armazenar arquivos
muito grandes de forma distribuída, tendo como princípio o write-many, read-
once.
d) Para armazenar e recuperar grande volume de dados, o big data utiliza
bancos SQL nativos, que são bancos de dados que podem estar configurados
em quatro tipos diferentes de armazenamentos: valor chave, colunar, gráfico
ou documento.
e) O MapReduce é considerado um modelo de programação que permite o
processamento de dados massivos em um algoritmo paralelo e distribuído.
Resolução:
Vamos analisar item a item:
a) Incorreto: A definição mais ampla de big data restringe o termo a duas
partes -, o volume absoluto e a velocidade-, o que facilita a extração das
informações e dos insights de negócios.
O Big Data foi inicialmente conceituado com base em três premissas básicas,
também conhecidas como 3Vs.
❖ Volume: o Big Data deve possibilitar a análise de grandes volumes
de dados. Além disso, a tecnologia do Big Data serve exatamente para
lidar com esse volume de dados, guardando-os em diferentes
localidades e juntando-os através de software.
❖ Velocidade: o Big Data deve fornecer as repostas com velocidade e
em tempo hábil. O Big Data serve para analisar os dados no instante
em que são criados, sem ter de armazená-los em bancos de
dados.
❖ Variedade: o Big Data deve ser capaz de lidar com diferentes
formatos de informação. Os dados podem estar em fontes
estruturadas, semi-estruturadas e a grande maioria em fontes não
estruturadas.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 49 de 51
www.exponencialconcursos.com.br
b) Incorreto: O sistema de arquivos distribuído Hadoop implementa o
algoritmo Dijkstra modificado para busca irrestrita de dados em árvores
aglomeradas em clusters com criptografia.
▪ Não é possível afirmar a busca ocorre de maneira irrestrita,
principalmente se os dados estiverem criptografados (protegidos). A
proteção pode restringir o acesso ao conteúdo dos dados.
c) Incorreto: Em big data, o sistema de arquivos HDFS é usado para armazenar
arquivos muito grandes de forma distribuída, tendo como princípio o write-
many, read-once write-once, read-many-times.
▪ O HDFS é um sistema de arquivos criado para armazenar arquivos muito
grandes de forma distribuída. O conceito sobre o qual o HDFS foi
construído é o chamado write-once, read-many-times, ou seja, escreva
uma vez, leia muitas vezes. Esse tipo de construção é essencial para o
Big Data, uma vez que os dados serão processados inúmeras vezes,
dependendo da aplicação, embora, normalmente, sejam escritos apenas
uma vez. Esse tipo de construção faz com que seja desaconselhável a
modificação de arquivos, pois acaba gerando muita sobrecarga.
d) Incorreto: Para armazenar e recuperar grande volume de dados, o big data
utiliza bancos SQL nativos, que são bancos de dados que podem estar
configurados em quatro tipos diferentes de armazenamentos: valor chave,
colunar, gráfico ou documento.
De fato, na definição da Amazon, “bancos de dados NoSQL usam diversosmodelos de dados, incluindo documentos, gráficos e chave-valor e colunares.
Justamente por este motivo, a assertiva está errada ao afirmar que big data
utiliza bancos SQL nativos, pois pode utilizar bases de dados não relativas a
modelos relacionais.
e) Correto: O MapReduce é considerado um modelo de programação que
permite o processamento de dados massivos em um algoritmo paralelo e
distribuído.
MapReduce é um modelo de programação, e framework introduzido pelo
Google para suportar computações paralelas em grandes coleções de dados em
clusters de computadores. Agora MapReduce é considerado um novo modelo
computacional distribuído, inspirado pelas funções map e reduce usadas
comumente em programação funcional.
Gabarito: Letra E.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 50 de 51
www.exponencialconcursos.com.br
73- (CESPE - 2018 - Polícia Federal - Agente de Polícia
Federal) Julgue o item que segue, relativo a noções de mineração de dados,
big data e aprendizado de máquina.
Big data refere-se a uma nova geração de tecnologias e arquiteturas projetadas
para processar volumes muito grandes e com grande variedade de dados,
permitindo alta velocidade de captura, descoberta e análise.
Resolução:
Big Data é um termo amplamente utilizado na atualidade para nomear
conjuntos de dados muito grandes ou complexos, que os aplicativos de
processamento de dados tradicionais ainda não conseguem lidar. Os
desafios desta área incluem: análise, captura, curadoria de dados, pesquisa,
compartilhamento, armazenamento, transferência, visualização e informações
sobre privacidade dos dados. Este termo muitas vezes se refere ao uso de
análise preditiva e de alguns outros métodos avançados para extrair
valor de dados. Maior precisão nos dados pode levar à tomada de decisões
com mais confiança. Além disso, melhores decisões podem significar maior
eficiência operacional, redução de risco e redução de custos.
Gabarito: Certo.

74- (CESPE - 2018 - EBSERH - Analista de Tecnologia da
Informação) Com relação a banco de dados, julgue o item seguinte.
As soluções de big data focalizam dados que já existem, descartam dados não
estruturados e disponibilizam os dados estruturados.
Resolução:
O Big Data possui tanto dados estruturados como não estruturados, além dos
semiestruturados.
o Big Data tanto pode ser encarado como o grande volume de dados
estruturados e não estruturados que são gerados a cada segundo ou
também como as tecnologias que são utilizadas para lidar com este
grande volume de dados.
Gabarito: Errado.

Questões comentadas
Prof. Ramon Souza

Prof. Ramon Souza 51 de 51
www.exponencialconcursos.com.br
75- (CESPE - 2017 - TCE-PE - Analista de Controle
Externo - Auditoria de Contas Públicas) No que se refere a Big Data, julgue
o item subsecutivo.
O termo Big Data Analytics refere-se aos poderosos softwares que tratam dados
estruturados e não estruturados para transformá-los em informações úteis às
organizações, permitindo-lhes analisar dados, como registros de call center,
postagens de redes sociais, de blogs, dados de CRM e demonstrativos de
resultados.
Resolução:
O Big Data Analytics pode ser entendido com um desdobramento de Big Data
e se refere às ferramentas de alto desempenho utilizadas para realizar o
trabalho analítico dos grandes volumes de dados. Trata-se do cruzamento
de uma infinidade de dados do ambiente interno e externo, gerando uma
espécie de “bússola gerencial” para tomadores de decisão.
Gabarito: Certo.

TI 75 QUESTOES ELLM

Tecnologia da Informação

ESTÁCIO

Ferramentas de estudo

Conteúdos escolhidos para você

2022-01-06-13-28-46-64087875-nocoes-de-mineracao-de-dados

APOSTILA ANÁLISE EXPLORATÓRIA NOVA(1)

Livro-Texto BANCO DE DADOS

Aula-05-v1

Gestão do Conhecimento - TSE

Perguntas dessa disciplina

Texto 01: Texto 02: Entender cada tipo de dado disponível para o processo Big Data é ponto primordial para entender quais tipos de dados a empresa uti

Texto 01: Fonte: AWS Amazon. Bancos de dados SQL (relacional) vs. NoSQL (não relacional). Disponível em: https://aws.amazon.com/pt/nosql/#:~:text=Em%2

Em organizações que lidam com grande volume de informações, a estruturação e o acesso eficiente aos dados são fatores importantes para a tomada de dec

De acordo com as sentenças relacione-as em V para verdadeiras ou F para falsas. ( ) A utilização da DQL proporciona aos usuários a capacidade de formu

O texto "Alfabetização em Dados", de Carol Andrade, propõe uma redefinição do que significa estar preparado para a "Era dos Dados", utilizando metáfor

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdossem pagar

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdossem pagar

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdossem pagar

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdossem pagar

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdossem pagar

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdossem pagar

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdossem pagar

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdossem pagar

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdossem pagar

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdossem pagar

Conteúdos escolhidos para você

2022-01-06-13-28-46-64087875-nocoes-de-mineracao-de-dados

APOSTILA ANÁLISE EXPLORATÓRIA NOVA(1)

Livro-Texto BANCO DE DADOS

Aula-05-v1

Gestão do Conhecimento - TSE

Perguntas dessa disciplina

Texto 01: Texto 02: Entender cada tipo de dado disponível para o processo Big Data é ponto primordial para entender quais tipos de dados a empresa uti

Texto 01: Fonte: AWS Amazon. Bancos de dados SQL (relacional) vs. NoSQL (não relacional). Disponível em: https://aws.amazon.com/pt/nosql/#:~:text=Em%2

Em organizações que lidam com grande volume de informações, a estruturação e o acesso eficiente aos dados são fatores importantes para a tomada de dec

De acordo com as sentenças relacione-as em V para verdadeiras ou F para falsas. ( ) A utilização da DQL proporciona aos usuários a capacidade de formu

O texto "Alfabetização em Dados", de Carol Andrade, propõe uma redefinição do que significa estar preparado para a "Era dos Dados", utilizando metáfor

Mais conteúdos dessa disciplina

Libere conteúdos
sem pagar

Libere conteúdos
sem pagar

Libere conteúdos
sem pagar

Libere conteúdos
sem pagar

Libere conteúdos
sem pagar

Libere conteúdos
sem pagar

Libere conteúdos
sem pagar

Libere conteúdos
sem pagar

Libere conteúdos
sem pagar

Libere conteúdos
sem pagar