Prova

•

ESTÁCIO

Jessyka Pupin

20/06/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 6 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatistica Av Ead Estacio

33 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1-Há uma tecnologia que é empregada sobre grandes volumes de dados para descobrir novas informações em função de regras e padrões neles existentes. Normalmente, tais informações não são obtidas simplesmente consultando-se os dados armazenados em bancos de dados. Por exemplo: uma das maiores redes de varejo dos Estados Unidos descobriu, em seu enorme banco de dados, por meio do uso dessa tecnologia, que o aumento das vendas de fraldas descartáveis, nas sextas-feiras, estava relacionado às vendas de cerveja, sendo que, geralmente, os compradores eram homens. Como oportunidade de negócio, a rede varejista colocou os produtos lado a lado, resultando em um aumento expressivo nas vendas de ambos. Para obter tais descobertas, essa tecnologia usa diversas técnicas, como associação, classificação e predição, entre outras. Nesse caso, essa tecnologia é chamada de:
R: Data mining.
2-Metadados são dados de mais alto nível, que descrevem dados de um nível inferior. Eles expressam significado sobre os dados. Devido à sua importância para um projeto de DW/DM o Metadados deve:
R: Ser criado ao longo do projeto de forma incremental.
3-R:Data Mart é um subconjunto de dados referentes a uma área específica, não normalizados e indexados para suportar pesquisas.
4-Kimball afirma que um bom planejamento e definição bem elaborada dos requisitos aumentam a probabilidade de sucesso de um projeto de Data Warehouse, pois:
R: Seu desenvolvimento é baseado nas necessidades dos usuários do negócio.
5-O levantamento de requisito produz artefatos que apoiam o desenvolvimento do projeto de Data Warehouse. São eles:
R: Especificação das necessidades do Negócio, documento das Perspectivas de Análises (Visões), documento das medidas que serão analisadas (Indicadores), documento de consultas predefinidas e o documento de apontamento das origens dos dados.
6-O mapeamento da fonte dos dados é uma verificação mais detalhada da origem dos dados mapeados durante o levantamento de requisitos. Sobre o mapeamento da fonte de dados é correto afirmar que:
R: É realizada a localização dos dados no sistema origem e são identificados: o nome da tabela que será acessada, o nome, o tamanho e o tipo de dado do campo.
7-Considerando a teoria da modelagem dimensional, composta por tabelas Dimensão e tabela Fato, utilizada em Data Warehouse:
R: Não há limitação quanto ao número de tabelas Dimensão.
8-Acerca de modelagem dimensional assinale a opção correta.
R: As granularidades fundamentais para classificar todas as tabelas Fato de um modelo dimensional são: transacional, snapshot periódico e snapshot acumulado.
9-O modelo Estrela (star schema) é a denominação comum para um modelo de dados dimensional. Nesse tipo de modelo:
R: Cada dimensão é representada por uma tabela.
10-A modelagem dimensional é amplamente aceita como uma técnica para expor dados analíticos, pois apresenta dados de maneira compreensível para usuários de negócio, bem como tem um desempenho rápido nas consultas. Nesse contexto, uma tabela de Dimensão:
R: Tem apenas uma coluna chave primária.
11-Quando o modelo de dados multidimensionais começa a ser definido, elementos básicos de representação precisam ter sido estabelecidos, de modo a criar-se um padrão de modelagem. Considere um modelo em que as dimensões e fatos são representados em tabelas, podendo haver múltiplas dimensões e múltiplas tabelas de Fatos.
Ao modelar cada tabela ...I... devem ser considerados os seguintes pontos:
- A chave primária é composta, sendo um elemento da chave para cada dimensão;
- Cada elemento chave para a dimensão deve ser representado e descrito na tabela ...II... correspondente (para efetuar a junção);
- A dimensão tempo é sempre representada como parte da chave primária.
Deve haver uma tabela ...III... para cada dimensão do modelo, contendo:
- Uma chave artificial (ou gerada) genérica;
- Uma coluna de descrição genérica para a dimensão;
- Colunas que permitam ...IV... ;
- Um indicador nível que indica o nível da hierarquia a que se refere a linha da tabela.
As lacunas são corretas, e respectivamente, preenchidas com:
R: De fatos - dimensão - dimensão - efetuar os filtros
12-Assinale a opção correta acerca de elementos básicos de data warehouse (presentation area, staging area, data source e data access) e de extract transformation load (ETL).
R: Define-se staging area como tudo o que existe entre a fonte de dados (data source) e a área de apresentação (presentation area).
13-A granularidade de dados é uma questão crítica no projeto de um Data Warehouse (DW), pois afeta o volume de dados que reside no DW e, ao mesmo tempo, afeta o tipo de consulta que pode ser atendida. Considere:
I. Quanto mais detalhes existirem, mais baixo será o nível de granularidade. Quanto menos detalhe existirem, mais alto será o nível de granularidade.
II. Quando há um nível de granularidade muito alto, o espaço em disco e o número de índices necessários se tornam bem menores, mas há uma correspondente diminuição da possibilidade de utilização dos dados para atender a consultas detalhadas.
É correto afirmar que a afirmativa I:
R: E a afirmativa II estão corretas e coerentes em relação ao nível de granularidade, espaço em disco e tipos de consultas em um DW.
14-Seja o modelo dimensional de dados a seguir representado, em que a tabela Venda é a tabela de Fatos, e as demais tabelas representam dimensões. Nesse esquema, os atributos das tabelas foram omitidos.
Nesse caso, qual o modelo multidimensional adotado?
R: Floco de Neve, especializando tabelas de Dimensão por decomposição hierárquica.
15- Considere o sistema de Data Warehouse para responder à questão.
Definições do sistema Data Warehouse:
. Tempo (hierarquia dada por semana, mês e ano).
. Item (hierarquia dada por produto, família de produtos, marca).
. Local (hierarquia dada por loja, cidade, estado, região).
Sejam as seguintes consultas OLAP pedidas pelo cliente:
I - Vendas semestrais de dois tipos de produtos específicos por região.
II - Vendas diárias de uma marca em uma cidade.
III - Vendas mensais por família de produtos por bairro.
IV - Vendas trimestrais por família de produtos de duas regiões diferentes.
De acordo com a hierarquia definida no sistema, são possíveis APENAS as consultas pedidas em:
R: I e IV
16-Atenção: Para responder à questão, considere a imagem a seguir.
O Processo, representado na imagem por um retângulo vertical, é um método de alimentação do Data Warehouse a partir de diversos dados da organização. Trata-se de:
R: ERP
17-O processo de ETL em um Data Warehouse possui várias fases. Em uma destas fases é efetuada a
R: Extração dos dados dos sistemas de origem.
18-No contexto de Data Warehouses, o processo de Extração, Transformação e Carga (ETC):
R: Apresenta, como algumas de suas tarefas, filtragem, integração, conversão, condensação e derivação dos dados de entrada, que podem ser originários de diversas fontes, inclusive externas aos sistemas OLTP da organização.
19-Para se transformar os dados conforme regras de negócio visando carregá-lo em um Data Warehouse, por exemplo, algumas fontes de dados podem requerer muita manipulação. Sendo assim, podem ser necessários um ou mais de um tipo de transformação, onde três deles são:
R: Transposição, Junção, Derivação
20-Sobre o processo de ETL aplicado a Data Warehouse é correto afirmar que:
R: A fase de transformação consiste em realizar modificações nos dados carregados, adequando seus valores ao modelo definido para o Data Warehouse.
21-Considere o fluxo de transformação do Pentaho Data Integration apresentado a seguir:
Os Passos S1, S2 e S3 realizam, respectivamente, operações de:
R: Leitura de Arquivo CSV, Split de Colunas e Calculadora de Valores.
22-Um dos modelos mais utilizados no projeto e implementação de um Data Warehouse é o modelo dimensional ou multidimensional. Em um modelo dimensional (composto por uma tabela Fato e várias tabelas Dimensão):
R: A tabela Fato deve conter atributos numéricos, visando proporcionar dados para uma análise de atividades da empresa.
23-SobreETL (Extract, TransformandLoad), é correto afirmar que:
R: É o processo para tratamento dos dados de uma ou mais bases de dados de origem, para uma ou mais bases de dados de destino.
24-Ao nível de sumarização dos elementos e de detalhes disponíveis nos dados em um DW dá-se o nome de:
R: Granularidade
25-No contexto de Business Intelligence, os sistemas OLAP e OLTP se diferenciam em diversas características. Na tabela a seguir, no que diz respeito às características, está INCORRETO:
R: Característica - Foco. /OLAP - Nível operacional da organização. Visa a execução operacional do negócio. / OLTP - Nível estratégico da organização. Visa a análise empresarial e tomada de decisão.
26-No Data Warehouse, a administração, a análise e a geração de relatórios sobre dados multidimensionais são realizadas por meio do modo de processamento:
R: OLAP
27-São regras de avaliação de produtos OLAP:
R: Visão conceitual multidimensional para formular consultas. Desempenho consistente na geração de relatórios. Dimensionalidade genérica. Manipulação intuitiva dos dados.
28-No Power BI é possível utilizar Funções M e DAX. A respeito dessas funções é possível afirmar que:
R: As funções M são utilizadas na preparação e transformação dos dados no editor de consultas do Power BI e as funções DAX são utilizadas para realizar tarefas analíticas, como cálculos.
29-As ferramentas OLAP permitem efetuar a exploração dos dados de um Data Warehouse (DW). Em relação a este tema é correto afirmar que:
R: Combinando as dimensões, o usuário tem uma visão dos dados de um DW, podendo efetuar operações básicas como slice and dice, drill down e roll up.
30-O Microsoft Power BI é um pacote de ferramentas de análise de negócios que proporciona variadas visualizações de indicadores, criados a partir de processos que simplificam a preparação dos dados provenientes de diferentes fontes de dados. A apresentação de relatórios e dashboards é personalizada e preparada para publicação, compartilhamento e análise por integrantes de uma empresa, por meio de navegador Web ou dispositivos móveis. É uma forma rápida para disponibilização de diferentes exibições, exclusivas e completas dos negócios da empresa, com garantia de escalabilidade, governança e segurança.
Com relação aos recursos e ferramentas disponíveis no Power BI, assinale a afirmativa CORRETA.
R: Quando duas ou mais tabelas são consultadas e carregadas ao mesmo tempo, o Power BI Desktop tenta localizar e criar relações, em que a cardinalidade, a direção e as propriedades de relação são definidas automaticamente. O Power BI Desktop procura por nomes de colunas que possam ser correspondentes, o que indica uma potencial relação. Se possível e desde que haja alto nível de confiança na existência da relação, essa é criada automaticamente. Caso contrário, a caixa de diálogo Gerenciar Relações ainda pode ser usada para criar ou editar relações.