Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

INTRODUÇÃO
Olá Estudante!
Seja bem-vindo ao início desta aula que nos traz o assunto sobre Arquitetura de Dados Corporativos, em
especi�co os tipos de dados utilizados pelas empresas, ou seja, a seleção destes dados que podem ser
recebidos por outras empresas (fornecedores e clientes) e na própria empresa (dados internos
departamentais). Todos estes dados são recebidos, armazenados e enviados aos departamentos pelos
arquitetos de dados que são responsáveis pelo gerenciamento do ciclo de vida destes dados que são
transformados em informações necessárias para a tomada de decisão de cada setor envolvidos nos processos
operacionais, táticos e analíticos desta empresa.
Esta aula está dividida em três blocos e um estudo de caso, o primeiro bloco está direcionada para os dados
estruturados que possuem um formato de�nido, rígido, no segundo bloco, os dados não estruturados ou
dados sem regras de�nidas para seu armazenamento, ao chegarmos no terceiro bloco, trataremos dos dados
semiestruturados ou estrutura heterogênea e �nalizaremos com nosso estudo de caso.
DADOS ESTRUTURADOS
Dados estruturados, segundo Somasundaram (2011, p. 26), são categorizados como quantitativos, possuem
estruturas �xas, com o mesmo formato para que todos seus registros possam ser recuperados e processados
com e�ciência. Vamos ao primeiro exemplo, onde mostraremos uma tabela como exemplo de dados
estruturados, analise a tabela 1:
Tabela 1 | Dados estruturados em formato de tabela
A B C D
1 Nome do Cliente CPF Endereço Contato/Celular
2 Mario de Souza 111.111.111-11 Rua X, bloco 1 111111111
Aula 1
ARQUITETURA DE DADOS CORPORATIVOS
Dados estruturados, segundo Somasundaram (2011, p. 26), são categorizados como quantitativos,
possuem estruturas �xas, com o mesmo formato para que todos seus registros possam ser recuperados
e processados com e�ciência.
15 minutos
3 Maria Pires 222.222.222-22 Rua Y, bloco 2 222222222
4 João da Silva 333.333.333-22 Rua Z, bloco 3 333333333
5 Joana Prado 444.444.444-22 Rua Force, bloco 4 444444444
Fonte: elaborada pelo autor.
Note que na Tabela 1, os dados em colunas e linhas, na visão de Somasundaram (2011), obedecem ou
possuem valores organizados (padronizados), sendo que cada coluna receberá um item especi�co, por
exemplo, a coluna A nos traz o armazenamento do “Nome do Cliente” as linhas de 2 a 5 para a coluna A, traz
somente os nomes dos clientes e assim para as outras linhas e colunas, resumindo, estão devidamente
estruturados.
Segundo Cury (2018), quando se armazena dados do tipo estruturado, por exemplo se for textual, não
carregará (importará) dados do tipo numérico, vamos a mais alguns exemplos de dados estruturados: 
•  Um SGBD ou Sistema de Gerenciamento de Banco de Dados: Conforme a necessidade do sistema, cria-se,
entidades e relacionamentos em forma de tabelas;
•  Os dados em uma tabela de uma mesma pessoa, ou seja, os dados desta pessoa estarão estruturados, se
houver relação entre si.
•  As informações (dados) de pessoas diferentes, terão seus valores diferentes, porém, utilizam uma estrutura
homogênea ou igual ao serem armazenados.
•  Planilhas de Excel.
•  Arquivos XML.
•  Arquivos do tipo CSV.
•  Arquivos do tipo JSON.
Vamos analisar mais um exemplo de dados estruturados, os arquivos do tipo JSON (JavaScript Object
Notation), que segundo Somasundaram (2011), é um tipo de formatação que estrutura dados do tipo texto e
faz a transmissão de um sistema para o outro, vamos ver um exemplo na prática dos dados estruturados do
tipo JSON:
Figura 1 | Fragmentos de linhas de códigos do tipo JSON
Fonte: elaborada pelo autor.
Note que, as linhas de códigos são armazenadas seguindo uma notação especi�ca, são organizados, conforme
os elementos: vírgula (,); colchetes [...], chaves ({  }) e por ultimo dois pontos (:).
Caro Aluno!
Chegamos ao �nal de nosso primeiro bloco da aula, onde pudemos visualizar o conceito e as características
dos tipos de dados estruturados, �ca o convite para você, nosso aluno, acessar o o próximo bloco
VIDEOAULA: DADOS ESTRUTURADOS
Neste vídeo, vamos visualizar e discutir sobre o primeiro bloco que tratou em especi�co sobre o tema: dados
estruturados, ou informações organizadas, rigorosamente, armazenadas em SGBD’s, �elmente gerenciadas
pela equipe de Tecnologia da Informação, responsável pelo recebimento externo, monitoramento e
disponibilização desta informação aos departamentos. Serão citados exemplos de arquivos do tipo
estruturado.
DADOS NÃO ESTRUTURADOS
Chegamos ao início do segundo bloco, com o intuito de lhe direcionar e ampliar sua vontade em pesquisa com
ênfase em dados não estruturados, ao contrário de dados estruturados, os arquivos do tipo não estruturados,
estão presentes em nova vida a todo momento, seja, contato de clientes que podem ser armazenados de
diversas formas e tipos, pode ser em notas autoadesivas, mensagens de e-mail entre outros tipos de arquivos,
que veremos logo a seguir, ainda neste bloco.
Cury et. al. (2018), são dados armazenados não estruturados, ou seja, não possuem organização de suas
estruturas bem de�nidas, compreendem aproximadamente de 70 a 80% dos dados que trafegam pelo
mundo, isto, devido ao grande avanço das tecnologias que dominam este tipo de dado, como: fotos, palavras
Videoaula: Dados estruturados
Para visualizar o objeto, acesse seu material digital.
de um texto (editor de texto Word), áudios, vídeos, entre outras que não é possível sua estruturação, vamos a
um exemplo, mostrado na Figura 2:
Figura 2 | Fragmento de um arquivo do editor de texto Word
Fonte: elaborada pelo autor.
Note na Figura 2 que se trata de um arquivo, desenvolvido em um editor de texto, é do tipo não estruturado
ou seja, não tem um limite prede�nido ou restrições, o autor do texto escreve o que der vontade, o mesmo
acontece com imagens que podem ser inseridas internamente neste próprio texto, ou externamente como os
websites, sms, chaves de acesso, na visão de Edelwess e Galante (2011), os dados não estruturados possuem
características desfavoráveis para os arquitetos de dados que manipulam estas informações no processo de
desenvolvimento e armazenamento de dados, vamos a elas:
•  Os dados �cam presentes na forma bruta devido as suas extensões.
•  Os sistemas gerenciadores de banco de dados, recebem estes dados de diversas fontes diferentes.
•  Os dados não estruturados são qualitativos, ou seja, informações coletadas na extensão texto.
Sob o olhar Pinto (2020), os pro�ssionais encontraram uma forma de rastrear e manipular os dados não
estruturados que é através do aprendizado de máquina ou machine learning que serve para os arquitetos de
dados poderem analisar e compreender por equações matemáticas, linguagens de programação e softwares
cada vez mais avançados que possam transformar as dúvidas em indicadores para compreender estes dados
de forma bruta.
Segundo Somasundaran e Shrivastava (2011), quando os SGBD’s conseguem por intermédio de softwares,
compreenderem e rastrear os dados não estruturados, levam-se vantagens no mundo competitivo para
tomada de decisões, pois estes dados, deixam de coadjuvantes (lixo eletrônico) para transforma-se em dados
estatísticos, Pinto (2020) conclui que se pode com isso, extrair dos dados não estruturados os seguintes
benefícios:
•  Avanço nos negócios ou Business intelligence: utiliza-se dados de fontes internas e externas para melhor
compreender e poder analisa-las, pode-se utilizar o Hotjar como suporte para compreender a satisfação dos
clientes no site, movidos em sua maioria a dados não estruturados.
•  Novos produtos de mercado: compreender, analisar e extrair dados não estruturados de seus clientes,
para atuar nos gargalos que podem atrapalhar os negócios da empresa.
Bons estudos!
VIDEOAULA: DADOS NÃO ESTRUTURADOS
Neste vídeo evidenciamos os “Dados não estruturados”, que tem como conceito seu armazenamento não
estruturado, suas características e exemplos destes tipos de dados, com o intuito de complementare sanar
algumas dúvidas que possam lhe ajudar a compreender melhor sobre o assunto.
DADOS PARCIALMENTE ESTRUTURADOS
Estamos no terceiro bloco, onde trataremos dos “Dados Parcialmente Estruturados”, ou seja, imaginemos uma
empresa que possua armazenamentos distintos, no primeiro caso, os dados que chegam de origens diversas
e são armazenados nos SGBD’s, de�nidos e interpretados por uma linguagem de programação como o SQL,
estamos falando dos dados estruturados. Já no segundo caso, outro setor desta empresa, recebe e armazena
dados que são difíceis de interpretá-los, como postagens em redes sociais, estamos falando dos Dados não
Estruturados”, agora para complementarmos este bloco, estaremos falando dos “Dados Semiestruturados”.
Segundo Edelwess e Galante (2011), Dados Semiestruturados, estão localizados entre os dois primeiros tipos
de dados, citados neste bloco, ou seja, entre os dados estruturados e os não estruturados. Cury et al (2018),
nos con�rma que este tipo de dado não é armazenado em um SGBD (Sistema Gerenciador de Banco de
Dados), porem, seus dados possuem propriedades organizadas (interna). Vamos a um exemplo do código
HTML, mostrado a seguir:
<! <!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<title>Dados Semiestruturados</title>
</head>
<body>
<img src="imagens/firefox-icon.png" alt="dados semiestruturados">
</body>
</html>
Videoaula: Dados não estruturados
Para visualizar o objeto, acesse seu material digital.
<body>
Neste fragmento de código HTML é possível evidenciar que não existe limite na quantidade de informação,
porém, necessita-se respeitar uma hierarquia semântica, por isso, é um exemplo de dado semiestruturado.
Na visão de Somasundaram e Shrivastava (2011), este tipo de dado por ser chamado de à posteriori, ou seja,
sua estrutura será de�nida após a presença dos dados, isto é feito, após serem os dados serem analisados,
conseguindo identi�car dados semelhantes e suas diferenças, por isso, são conhecidos como “auto
descritivos”, onde, o esquema, estará internamente inserido no meio destes dados implicitamente. Vamos a
mais um exemplo de dado semiestruturado, onde mostra uma imagem digital:
Figura 3 | representação de uma imagem digital
Fonte: Wikipedia Commons.
A imagem digital é um típico exemplo de dado semiestruturado, pois, possui atributos estruturais, porém, sua
estrutura não é prede�nida, pode ser obtida de fontes diferentes como um celular, utilizando todas as suas
estruturas para este aparelho que após armazenar estas informações, podem receber outras tags.
Para �nalizar este bloco, segundo Cury et. al. (2018), a Figura 4 nos mostra a comparação entre os tipos de
dados abordados nos blocos 1, 2 e 3 desta aula:
Figura 4 | Tipos de Dados
Fonte | elaborada pelo autor.
VIDEOAULA: DADOS PARCIALMENTE ESTRUTURADOS
Neste vídeo, será abordado o tema dados semiestruturados, ou seja, �cam entre estruturados e não
estruturados, recebem e armazenam dados, como o HTML que possuiu sua própria estrutura, mas recebe
diversos tipos de dados, totalmente diferentes uns dos outros, por isso são chamados de semiestruturados.
ESTUDO DE CASO
Um colaborar recém contratado de uma empresa que oferece como serviço o armazenamento em nuvem
para diversas empresas, não teve o treinamento especi�co sobre os processos e interatividade com os
softwares e armazenadores de dados, que são enviados por diversas empresas de segmentos bem diferentes,
distintos, que levaram este colaborar e levantar e questionar alguns colegas sobre os dados que estava
recebendo para armazenamento, em uma das reuniões o analista de sistema sênior, se deparou com o
colaborador, conversando com um colega de trabalho e lhe indagando sobre algumas questões. Este
colaborador começou a receber alguns dados de diferentes extensões, alguns como, planilhas de Excel e
tabelas de bancos de dados, outros como, fotos, áudios, vídeos e outros como, arquivos HTML. Seu objetivo
como Arquiteto de Dados é descobrir que tipos de dados são estes de acordo com os seguintes requisitos:
Videoaula: Dados parcialmente estruturados
Para visualizar o objeto, acesse seu material digital.
•  Pesquisar e discorrer sobre os dados estruturados, não estruturados e semiestruturados.
•  Identi�car e separar os dados de acordo com seu tipo e estrutura.
•  Discorra sobre estes tipos de dados.
RESOLUÇÃO DO ESTUDO DE CASO
Diante da discussão, você como analista, propõe que os colaboradores re�itam sobre os diversos tipos de
dados, Estruturados, Não estruturados e Semi estruturados e a partir daí percebam a necessidade de se
pesquisar sobre os conceitos, características e tipos de softwares armazenadores que tem a capacidade de
receber, armazenar e analisar os dados que chegam até os domínios da empresa, com isso, saberão lidar com
os desa�os impostos pelas empresas que con�am nos trabalhos de manipulação de dados de sua empresa.
•  Planilhas de Excel e tabelas de bancos de dados são dados estruturados.
•  Fotos, áudios, vídeos são dados não estruturados.
•  Arquivos HTML são dados semiestruturados.
 Saiba mais
Olá Estudante! 
Acesse o livro pela biblioteca digital!
SOMASUNDARAM, G.; SHRIVASTAVA, A.; SERVIÇOS, EMC. E. Armazenamento e Gerenciamento de
Informações. [Digite o Local da Editora]: Grupo A, 2011. 9788577807642. Disponível em:
https://integrada.minhabiblioteca.com.br/#/books/9788577807642/.
Acompanhe o material complementar conforme a Figura 5 a seguir:
Figura 5 | Tipos de Dados
https://integrada.minhabiblioteca.com.br/#/books/9788577807642/
Fonte: elaborada pelo autor.
Resolução do Estudo de Caso
Para visualizar o objeto, acesse seu material digital.
INTRODUÇÃO
Olá Estudante!
Seja bem-vindo a aula que evidencia “Construindo um Data Warehouse” ou “Armazém de Dados”, esta grande
ferramenta armazenadora de dados vem crescendo e se �rmando cada vez mais em empresas que utilizam
os dados recebidos, fazendo seu armazenamento para utilizar esses dados em prol de informações que serão
a base para estratégicas corporativas e tomadas de decisões.
Aula 2
CONSTRUINDO UM DATA WAREHOUSE
Olá Estudante! Vamos tratar da implantação e con�guração de um Data Warehouse, ferramenta esta que
surgiu com o intuito de armazenar uma grande quantidade de dados. Vivemos em um mundo
corporativo, onde as empresas investem alto em novas tecnologias, desde sua infraestrutura,
colaboradores capacitados e ferramentas virtuais que podem fazer a diferença no mundo dos negócios,
onde a palavra erro, tornou-se um pesadelo para muitos administradores.
16 minutos
Logo no primeiro bloco, será abordado sobre a implantação e con�guração de um Data Warehouse seus
conceitos básicos para implantação desta ferramenta nas empresas, em seguida como con�gurar o Data
Warehouse. No segundo bloco, que evidencia sobre “Metadados em Data Warehouse”, trata da origem dos
dados que foram coletados e armazenamentos, sua facilidade em de�nição de qualquer tipo de dados, para o
terceiro bloco: “Repositórios no uso do Data Warehouse que mostra ao usuário um conjunto de dados que
especi�ca diferentes tipos de tipos ou propriedades de visualização.
IMPLANTAÇÃO E CONFIGURAÇÃO DE UM DATA WAREHOUSE
Olá Estudante! Vamos tratar da implantação e con�guração de um Data Warehouse, ferramenta esta que
surgiu com o intuito de armazenar uma grande quantidade de dados. Vivemos em um mundo corporativo,
onde as empresas investem alto em novas tecnologias, desde sua infraestrutura, colaboradores capacitados e
ferramentas virtuais que podem fazer a diferença no mundo dos negócios, onde a palavra erro, tornou-se um
pesadelo para muitos administradores.
Na visão de Vida (2021, p. 14), O data warehouse permite que sejam realizadas consultas a �m de extrair
informações para a tomada de decisão. Os dados quando chegam no Data Warehouse já foram tratados pelos
recebedores, com isso, elimina-se as redundâncias, está sendo muito utilizada pelas empresas para o
armazenamento de dados, pode-se analisar e comparardados para tomadas de decisões. Segundo
Somasundaram e Shrivastava (2011), para se implantar, construir, os administradores de dados, sejam de
empresas terceirizadas ou da própria empresa, seguem alguns passos importantes para o êxito desta
implantação como mostra o Quadro 1:
Quadro 1 | Passos para construção de um Data Warehouse
1. Identi�car de onde vem
os dados (fontes)
Os dados chegam de diversas fontes, saber de onde elas vêm é um trunfo
importante para o repositório de dados da empresa, pois elimina-se dados
inseguros vindos de aplicativos, diversos tipos de mídias, entre outra
2. Criação do banco de
dados principal
Escolher uma boa ferramenta para modelar seus dados, e criar suas
entidades e objetos são premissas para a criação do banco principal.
3. Desenvolvimento da Area
de armazenamento
temporário (staging)
Combina os dados oriundos de diversas fontes, transforma-se os dados em
conjuntos de estrelas para distribuição dos dados antecedendo o
carregamento do Data Warehouse.
4. Criação interna dos
dados
Este item é de suma importância, pois ao criar seus dados internamente,
você não �cará refém de alguns arquitetos que criam os dados para si
próprios como estratégia para não perderem o vínculo. Compreensão e
treinamento da equipe interna é uma boa estratégia.
5. Dados não íntegros Isto acontece quando há diversas fontes indevidas, fazer a rastreabilidade
para compreensão, assim como registrá-los para possível entendimento e
tomada de decisão.
6. Tecnologia muito
complexa
A construção de seu Data Warehouse é muito importante para o
armazenamento e manipulação de seus dados, porém, a de�nição de seus
requisitos com antecedência, direciona a equipe a fazer as escolhas
assertivas para aquisição dos hardwares e softwares compatíveis para os
processos da empresa.
Fonte: adaptado de Vida (2021).
Os passos do Quadro 1, são necessários para o desenvolvimento de um DW (Data Warehouse), Vida (2021, p.
128), o DW tem uma grande validade quando é possível utilizar as informações para melhorar um
produto/serviço, de forma a antecipar decisões ou mesmo aprimorar os caminhos que já estão sendo
seguidos.
Um DW é con�gurado em diversos bancos de dados simultaneamente, devidamente organizados em tabelas
como SQL (Standard Query Language ou Linguagem de Consulta Padrão), onde se de�ne nas colunas, os tipos
e descrições dos dados que serão utilizados de acordo com a necessidade dos pro�ssionais envolvidos. As
tabelas podem ser armazenadas em pastas (VIDA, 2021). Estas são algumas informações relevantes sobre
Data Warehouse’s, não deixe de pesquisar e se preparar cada vez mais para este desa�o.
Bons Estudos! i
VIDEOAULA: IMPLANTAÇÃO E CONFIGURAÇÃO DE UM DATA WAREHOUSE
Este vídeo tem como objetivo, complementar algumas informações sobre Implantação e Con�guração de um
DW, os passos para construção desta ferramenta que tem a capacidade de não somente armazenar, mas
organizar os dados em tabelas e colunas, para se obter tomadas de decisões, consolidação dos dados,
analises históricas com qualidade e segurança.
 METADADOS EM DATA WAREHOUSE
Olá Estudante! Imagine a quantidade de dados que chegam de diversas origens, como, sites, outros
repositórios, blogs, clientes, fornecedores, uma in�nidade de dados que são armazenados no DW em tabelas,
especi�cados em colunas para que possam ser extraídos pelos usuários destes dados, mas o que vem a ser
estes metadados em DW?
Somasundaram e Shrivastava (2011), a�rmam que metadados especi�cam o que são os outros dados que
estão contidos nas colunas dos DW’s que fazem parte das pastas que armazenam os dados do DW. Vida
(2021, p. 28), nos conceitua que, os metadados são de�nidos como dados sobre dados, ou seja, são
informações que descrevem as informações que estão armazenadas. Vida (2021), con�rma que os metadados
podem ser classi�cados nas seguintes formas de acordo com o Quadro 2:
Videoaula: Implantação e con�guração de um Data Warehouse
Para visualizar o objeto, acesse seu material digital.
Quadro 2 | Classi�cação dos metadados
Metadados Recursos
Negócios Utilizam linguagens de negócios, seu signi�cado para direciona-las ao destino correto e
também se forem alteradas, atualizadas.
Técnicos Utilizam linguagens técnicas para descreverem internamente sobre o andamento dos dados
em uma aplicação do DW.
Fonte: adaptado de Vida (2021).
Com a colaboração de Vida (2021, p. 29), vamos analisar a Figura 1, que mostra a forma conceitual da
arquitetura de DW:
Figura 1 | Arquitetura conceitual de DW
Fonte: Vida (2021, p. 29).
Note que neste modelo conceitual segundo Vida (2021), pode ser dividido em diversos departamentos o Data
Mart’s, são monitorados e gerenciados por vários servidores sendo assim, multidimensionais. Um DW
segundo Alves (2014 apud Vida (2021), pode se dividir nas seguintes formas de acordo com Quadro 3:
Quadro 3 | Divisões de um DW
1. BD operacional e de
fontes externas
Trata-se os dados antes de envia-los ao DW.
2. Acesso aos Dados É a ponte entre as ferramentas que os usuários acessam e a informação
3. Transporte da
informação
Faz a gestão da transmissão da informação em rede.
4. Acesso a informação Interatividade entre usuários e informação.
5. Gestão dos processos Controla e gerencia as tarefas entre os processos.
6. Gestão de Replicação Tem a capacidade de seleciona, pode editar, faz resumos se necessário e
consegue combinar o carregamento de dados no DW.
Fonte: adaptado de Alves (2014 apud Vida (2021).
Podemos comparar DW com DM (Data Mart), segundo Victor (2017): um DW é corporativo, o DM é
departamental; no DW detalha-se os dados, em DM nível de granularidade alto; em DW sua estrutura possui
normas, já em DM, seu esquema é do tipo estrela; exporta as informações muito bem; os DM’s são ótimos
para consultas; entre outras muitas funcionalidades de Data Warehouse e Data Mart. Pode-se perceber que
estas ferramentas, tanto os DW’s quanto os DM’s possuem características que ajudam muito os usuários que
dependem destas ferramentas para conclusão de seus processos. Não deixe de acessar nossa biblioteca e
procurar por VIDA, E. S.; ALVES, N.SR; FERREIRA, R. GC; AL., Et. Armazém de dados. [Digite o Local da Editora]:
Grupo A, 2021. Sendo esta uma obra excelente para pesquisas complementares e continuidade no ensino
aprendizagem.
Bons estudos!
VIDEOAULA: METADADOS EM DATA WAREHOUSE
Este vídeo, mostra um complemento sobre “Metadados em DW, ou seja, conceitua a ideia de dados sobre
dados, identi�ca as informações que estão armazenadas nas tabelas, a classi�cação dos Metadados, assim
como sua arquitetura e divisões em um Data Warehouse. É o momento de discutirmos e exempli�carmos
cada item descrito.
REPOSITÓRIOS NO USO DO DATA WAREHOUSE
Olá Estudante, podemos começar com a seguinte indagação, o que são e até onde irão os repositórios? Com
certeza é o tipo de questionamento que todas as empresas em atividade discutem em suas reuniões em
pauta, sobre “O QUE, DE QUAL ORIGEM, COMO ARMAZERNAR UM GRANDE NUMERO DE DADOS. Estamos na
era do Big Data, Ciência de Dados, onde convive-se com bilhões ou mais de dados que chegam até as
empresas com o intuito de transformar-se em algum indicador, seja para o bem ou para o mal, o que importa
é pensar em investimentos em ferramentas, treinamentos e softwares cada vez mais convincentes.
Os repositórios ou armazenadores de um DW, são locais de grande capacidade de armazenamento de dados,
ou seja, não podemos compará-los a simples armazenadores como um pendrive ou locais em nuvem que
oferecem armazenamentos gratuitos como a ferramenta Dropbox da Google. A Figura 2, mostra os
componentes de armazenamento de um DW:
Videoaula: Metadados em Data Warehouse
Para visualizar o objeto, acesse seu material digital.
Figura 2 | Componentes de armazenamento de um DW
Fonte| Machado (2017, p.14).
Segundo Machado (2017), vamos começar pelas fontes A, B e C, pode vir de diversas origens, a área de
concentração conhecida como ETL (ExtractionTransformation Loading ou Extração e Transformação de Carga)
no caso os dados que chegam, é o local onde trata-se os dados antes de serem armazenados, ou seja, os
metadados que ao serem devidamente analisados seguem para os Data Mart que são sub departamentos do
Data Warehouse, assim, seguem para os Negócios na Rede (BI).
Complementa Machado (2017), os dados quando chegam ao estágio do ETL, começam a transforma-se em
informação, organizando-as em tabelas, que estarão dispostas em pastas para serem utilizadas pelos usuários
�nais, estas informações tornam-se relatórios, indicadores chave de desempenho. Machado (2017) nos
elucida que a Figura 2 pode ser resumida no Quadro 4 da seguinte forma:
Quadro 4 | Resumo dos componentes de armazenamento de um DW
1. Tratamento de
Dados
Extração e carga dos dados entre dois modelos, OLTP (Processamento de
transações online) e DW
2. Organização de
Dados
Modelo do tipo dimensional.
3. Software Especi�co Utiliza-se a ferramenta OLAP para acessar o DW.
4. Hardware
Especi�co
Utiliza-se um computador com processamento paralelo.
Fonte: adaptado de Machado (2017).
Ou seja, pode-se resumir que os repositórios de dados no uso do DW, conhecidos como grandes bibliotecas
de dados, capazes de converter-se em informações, possuem capacidade para receber, organizar e direcionar
os dados transformados em informações, prontamente para serem gerenciados pelos administradores de
dados que fazem destes dados, informações importantes para o desempenho de seus processos corporativos
diários.
VIDEOAULA: REPOSITÓRIOS NO USO DO DATA WAREHOUSE
Neste vídeo, estaremos compartilhando informações relevantes sobre os repositórios no uso do DW,
compreender como os dados chegam até o ETL, ao chegar neste estágio, compreender como são tratados e
dispostos para os Data Mart’s, subdepartamentos responsáveis por armazenarem e produzirem informações
que estarão dispostas para sua extração.
ESTUDO DE CASO
Um Arquiteto de Dados, que trabalha em uma das empresas que prestam serviços de armazenamento de
dados na nuvem, participou de uma reunião onde a discussão em pauta era sobre a qualidade e desempenho
no armazenamento de dados.
Enquanto um grupo defendia que o armazenamento atual era ultrapassado e que mesmo havendo
inconsistência como sobrecarga de dados, superaquecimento de hardware entre outros problemas, seria
preferível continuar com o atual armazenador de dados. Outros do setor eram a favor de mudanças
imediatas. O colaborador indagou: Quem de vocês garanti que a empresa não terá um colapso se continuar
com esse armazenador ultrapassado? Seu objetivo é escolher e implantar os passos para resolução dos
seguintes requisitos:
•  Descobrir de onde vem os dados.
•  Criar um banco de dados principal, um armazenamento temporário.
RESOLUÇÃO DO ESTUDO DE CASO
Diante da discussão, o grupo a favor de mudanças imediatas, propuseram a diretoria a construção de um
Data Warehouse desde seu início, com a ajuda de uma empresa especializada em armazenadores deste porte.
Com o aval para a implantação, veri�cou-se que:
1. A primeira ação foi Identi�car de onde vem os dados (fontes).
2. Criar um banco de dados principal.
3. Desenvolver uma Area de armazenamento temporário (staging) – ETL. 
4. Criar internamento os dados.
5. Rastrear e agir contra dados não íntegros.
6. Tomar cuidado ao escolher a tecnologia para que não haja complexidade na usabilidade do sistema.
 Saiba mais
Videoaula: Repositórios no uso do Data Warehouse
Para visualizar o objeto, acesse seu material digital.
SOMASUNDARAM, G.; SHRIVASTAVA, A.; SERVIÇOS, EMC. E. Armazenamento e Gerenciamento de
Informações. [Digite o Local da Editora]: Grupo A, 2011. 9788577807642. Disponível em:
https://integrada.minhabiblioteca.com.br/#/books/9788577807642/. Acesso em: 12 dez. 2021.
VIDA, E. S.; ALVES, N.SR; FERREIRA, R. GC; AL., Et. Armazém de dados. [Digite o Local da Editora]: Grupo A,
2021. 9786556901916. Disponível em:
https://integrada.minhabiblioteca.com.br/#/books/9786556901916/. Acesso em: 11 dez. 2021.
Olá Estudante!
Acompanhe a Figura 3:
Figura 3 | Resumo visual sobre construindo um Data Warehouse
Fonte: elaborada pelo autor.
Resolução do Estudo de Caso
Para visualizar o objeto, acesse seu material digital.
https://integrada.minhabiblioteca.com.br/#/books/9788577807642/
https://integrada.minhabiblioteca.com.br/#/books/9786556901916/
INTRODUÇÃO
Olá Estudante,
Estamos iniciando a aula sobre “Ingestão de Variedades de Dados”, continuação de conteúdo para a disciplina
Arquitetura de Dados, que evidencia o recebimento, armazenamento e distribuição de dados, qualquer que
seja sua fonte de dados como os DW’s, planilhas gerenciais, , armazenadores de documentos, seja físicos, ou
nuvem, a ingestão de dados tem como objetivo receber dados de diversas origens, armazená-los e poder
transferir estes dados transformados em informações para seus destinos especí�cos de acordo com a
necessidade de cada local que irá receber estas informações.
No primeiro bloco, é evidenciado a “Fonte de Origens de Dados”, ou seja, de onde vem os dados que serão
armazenados organizadamente, para o segundo bloco, focou-se em “Modelo de Loja de dados Operacionais-
ODS”, seu conceito e características e para �nalizar, “Modelagem de dados dimensionais – OLAP” que se
conceitua em de�nir as atividades de consulta por intermédio de um conjunto de técnicas para podermos
tratar os dados e enviá-los para diversos departamentos.
FONTE DE ORIGEM DE DADOS
Olá Estudante!
Seja bem-vindo a aula de “Arquitetura de Dados”, que evidencia neste primeiro bloco, “Fonte de Origem de
Dados”, ou seja, as empresas do mundo corporativo, são departamentais, e para que estes setores funcionem
corretamente, necessitam de algum tipo de informação, que foram originadas de uma fonte, que é
responsável por suprir estas empresas por dados que serão transformados por grandes computadores em
informações que serão uteis para o desenvolvimento desta empresa.
Segundo Campello e Caldeira (2007), fontes de origens dos dados, são centros armazenadores de dados que
serão transformados em informação e serão armazenados, organizados e manipulados para serem
encaminhados para seus destinos nos casos internos de determinada empresa, podendo ser seus
departamentos, ou externamente, clientes e fornecedores desta informação.
Aula 3
INGESTÃO DE VARIEDADES DE DADOS
Seja bem-vindo a aula de “Arquitetura de Dados”, que evidencia neste primeiro bloco, “Fonte de Origem
de Dados”, ou seja, as empresas do mundo corporativo, são departamentais, e para que estes setores
funcionem corretamente, necessitam de algum tipo de informação, que foram originadas de uma fonte,
que é responsável por suprir estas empresas por dados que serão transformados por grandes
computadores em informações que serão uteis para o desenvolvimento desta empresa.
17 minutos
Na visão de Favero (2017), temos alguns exemplos de fontes que originam os dados, entre eles: Bancos de
Dados físicos ou em nuvem, planilhas eletrônicas, arquivos com extensão: CSV, XML, editores de texto,
sistemas gerenciadores da informação (ERP’s, CRM’s, periódicos, tcc’s, artigos cientí�cos e tudo o que posso
trafegar pelos ambientes físicos e ou externamente, como por exemplo clientes e fornecedores.
As fontes de origens de dados tornaram-se assuntos de muita discussão entre as lideranças das empresas
corporativas, governamentais, entre outras, pois, vivemos na era da informação rápida, acessível por
intermédio de muitas ferramentas, com isso, as fontes, multiplicaram de maneira desordenada, junto com as
vantagens que isto traz, também recebemos desvantagens como fontes não con�áveis, desorganizadas que
fazem um estrago enorme nos bancos de dados das empresas. Beluzzo (2003) nos alerta sobre como
identi�car as fontes de informações, analise o Quadro 1 a seguir:
Quadro 1 | Tipos de fontes de origens de dados
1. Fontes
Primárias
Este tipo de fonte de informações não pode ser modi�cado:Teses de doutorado,
dissertações de mestrado, patentes requeridas, normas técnicas validadas, nomes de
empresas e suas marcas comerciais.
2. Fontes
secundárias
Este tipo de fonte de informações são os organizadores das fontes primarias e
direcionam os leitores para este tipo de informação, ou sejam, possuem documentos
primários, podem ser: as bases de dados, os diversos bancos de dados, dicionários,
feiras, livros, manuais.
3. Fontes
Terciárias
Este tipo de fonte de informações indica, direcionam os leitores para a pesquisarem as
informações primarias e secundarias, é um guia, são eles: Bibliogra�as, diretórios,
revisão de literatura.
Fonte: adaptado de Cunha (2001).
Sob a re�exão de Le Coadic (1996), as informações podem vir de fontes diferentes como mostra a Figura 1 a
seguir:
Figura 1 | Diversas fontes de dados
Fonte: elaborada pelo autor.
Note que na Figura 1 os dados que chegam até a área de concentração que chamamos de staging, onde os
dados �cam temporariamente e são transformados e entregues para os Data Warehouse’s, sendo
selecionados os dados que interessam aos BD’s, ou seja, armazenar o máximo de dados possíveis.
VIDEOAULA: FONTE DE ORIGEM DE DADOS
Olá Estudante!
Neste vídeo, vamos conceituar as fontes de origens dos dados, de onde surgem, para qual local esses dados
se concentram, no caso estamos falando da área de concentração que tem um papel decisivo no
armazenamento desses dados. 
MODELO DE LOJA DE DADOS OPERACIONAIS- ODS
Olá Estudante!
Seja bem-vindo a nosso segundo bloco, com ênfase em complementar o primeiro bloco com o assunto:
“Modelo de Loja de Dados Operacionais – do inglês Operational Data Store, este modelo vem ajudando as
empresas a armazenarem o maior número de dados possíveis, independentemente de seu tipo de origem,
oriundos de fontes diversas como citadas no primeiro bloco, ou seja, estamos na era do trafego de
informações por diversos meios eletrônicos, sendo eles, �xos em departamentos, ou dispositivos moveis
como notebooks e smartphones, além de outros canais que simpli�cam a rota dos dados, com isso, chegam
em grande volume de dados, o que é chamado de Big Data. Qual o conceito e como é a estrutura do ODS?
Videoaula: Fonte de origem de dados
Para visualizar o objeto, acesse seu material digital.
Segundo Favero (2017), um Modelo de Loja de Dados Operacionais – ODS, foi pensada e construída como
Base para recepção e integração de dados, voláteis (recebem e podem ser extraídos a qualquer momento).
Beluzzo (2001) nos alerta para a importância do processo deste estágio onde chegam os dados na sua forma
“bruta”, ou seja, podem ser estruturados que tem possuem forma e regras organizadas, não estruturados,
sendo o contrário dos dados estruturados, pois não possuem regras ou quantidades de dados ou
semiestruturados que �cam entre os dados estruturados e não estruturados, ou seja, possuem regras ou
semântica (arquivos XML) porem não determina-se a quantidade de dados que podem chegar até o ODS.
Vamos analisar a Figura 2, que nos mostra, na visão de Somasundaram e Shrivastava (2011), o
posicionamento estratégico do ODS:
Figura 2 | Posicionamento do ODS no trafego de Dados
Fonte: adaptado de Somasundaram e Shrivastava (2011).
Note que a Figura 2 no (s mostra o posicionamento estratégico do ODS entre os dados brutos enviados de
origens diversas, estes são extraídos pelo ODS e a área de “Staging – área de preparação dos dados”, ou seja,
é uma das área mais importantes como repositório dos dados de origem, pois, as empresas podem reter um
maior volume de dados para poderem analisar primeiramente antes de transformarem os dados no estágio
posterior (ETL – Extract, Transform e Load – Extrair, Transformar e Carregar), antecedendo a chegado destes
dados, transformados em informação até o Data Warehouse.
Le Coadic (1996), nos complementa sobre as características e importância do componente ODS, que além de
extrair os dados brutos, tem a capacidade de ser exercer diversas funções como: limpeza de dados (lixo
eletrônico), detecta dados redundantes e veri�ca sua integração aos negócios da empresa que está recebendo
estes dados, além de substituírem estes dados pelos que chegam, sendo seu armazenamento temporário
diferentemente do Data Warehouse onde as informações mantem-se em seu estado permanente.i
VIDEOAULA: MODELO DE LOJA DE DADOS OPERACIONAIS- ODS
Olá Estudante!
Neste vídeo vamos tratar do componente ODS, sua importância no ato do recebimento dos dados brutos,
oriundos de diversas fontes de dados, o tratamento e extração dos dados que interessam o próximo bloco
onde serão transformados e preparados para o armazenamento �nal.
Videoaula: Modelo de loja de dados Operacionais- ODS
Para visualizar o objeto, acesse seu material digital.
MODELAGEM DE DADOS DIMENSIONAIS - OLAP
Olá Estudante!
Estamos iniciando nosso terceiro e último bloco, da disciplina Arquitetura de Dados que evidencia o tema:
Modelagem de Dados Multidimensionais – OLAP do inglês Online Analytical Processing), chegamos ao termino
do ciclo que envolve o trafego de dados que tem como destino os super armazenadores, como por exemplo o
Data Warehouse que está em evidencia nestes três blocos, mostramos os dados que chegam até o
armazenador temporário, chamado de modelo de loja de dados operacionais ou ODS, passamos pelo
transformador de dados ou Extração, Transformação e Carregamento de dados – ETL até chegar ao Data
Warehouse, onde os dados permanecerão organizados e armazenados, neste bloco vamos evidenciar a
informação pós Data Warehouse, o Processamento Analítico Online desta informação.
Vida (2021, p. 173), nos a�rma que um Data Warehouse pode ser conceituado como um repositório analítico
capaz de oferecer um conjunto de consultas agregadas, sumarizadas e derivadas, de forma rápida e
compactada. Ao chegar neste estágio os dados que viraram informação serão tratados como: “conjuntos de
informações orientados por assunto, eles não são voláteis, estas informações são monitoradas, manipuladas
e representadas pelos arquitetos, engenheiros ou analistas de dados por dois tipos de dados:
•  Indicadores: monitora-se as medidas que são os processos armazenados do DW.
•  Informações de apoio aos indicadores: chamados de modelagem de dados analíticos, sua
representatividade e armazenamento.
Segundo Vida (2021), os dados podem ser armazenados, cruzando as linhas e colunas, chamado de
modelagem multidimensional, sendo um formato, conhecido por processamento analítico online ou OLAP.
Sua representação é realizada por intermédio de uma �gura geométrica o “Cubo de Dados”, são operações
complexas realizadas por consultas. Na visão de Vida (2021, p. 174), as medidas são representadas pelas
células desse cubo, os lados, pelas suas respectivas dimensões, o que costuma ser chamado de hipercubo.
Este cubo pode cruzar as informações, que serão disponibilizados nos lados do cubo, havendo mais um
indicador, por exemplo local, produto e tempo, neste caso são três indicadores, com isso, podemos dizer que
é um cubo tridimensional, vamos analisar a Figura 3, de Vida (2021, p. 175):
Figura 3 | Cubo Tridimensional
Fonte: Mannino (2008, apud Vida (2021, p. 175).
Note que a Figura 3 nos mostra a distribuição de três indicadores, local a esquerda, produto centralizado e o
tempo a direita do cubo, com isso, pode-se cruzar as informações e ou indicadores de acordo com a
necessidade da análise que cada fará ao realizar a leitura do cubo. Veja alguns exemplos de combinações
analíticas, de acordo com Vida (2021, p. 175), analisando o Quadro 3 a seguir:
Quadro 3 | Possíveis combinações realizada com o cubo tridimensional
Local Produto Tempo
Qual local vende mais determinado produto em determinado período de tempo?
Produto Local Tempo
Que produto foi o mais vendido para determinado local em determinado dia?
Produto Local Tempo
Qual o produto foi o menos vendido para determinado local em determinado período de tempo?
Fonte: adaptado de Vida (2021,p. 175).
Vida (2021), nos elucida que estes cruzamentos de dados permitem acesso rápido as informações que se
tornarão relevantes aos indicadores desejados pela gestão corporativa da empresa. Vida (2021, p. 176), trata-
se de repositórios não relacionais conhecidos como multidimensional database, os quais armazenam os
dados num formato de arrays dimensionais.
VIDEOAULA: MODELAGEM DE DADOS DIMENSIONAIS - OLAP
Olá Estudante!
Fechamos com ênfase em Modelagem de Dados Dimensionais – OLAP, completa-se um ciclo de informações
desde os dados brutos, passando pela extração e armazenamento de dados temporários, transformando e
carregando-os no Data Warehouse e por �m direciona-os para os operadores analíticos – OLAP, onde estes se
encarregam de cruzar as informações utilizando-se a técnica de cubos multidimensionais para levantamento
de indicadores.
ESTUDO DE CASO
Videoaula: Modelagem de dados dimensionais - OLAP
Para visualizar o objeto, acesse seu material digital.
Em uma empresa do segmento de vendas de smartphones, vende diversas marcas de telefonia móvel pela
internet e faz suas entregas via correio, em uma de suas reuniões rotineiras, de três supervisores, um deles,
questionou a quantidade de produtos vendidos dentro do estado de são em cidades próximas a empresa em
um raio de 300 kms, como poderíamos fazer esse cruzamento de dados? Outro supervisor respondeu dizendo
que seria perda de tempo �car levantando esses dados e que deixasse o departamento de vendas e entregas
fazerem suas atividades sem supervisão. Prontamente o terceiro supervisor sugeriu o cruzamento de dados
extraídos do Data Warehouse.
Os locais, produtos e quantidades vendidas, pedidas pelo primeiro supervisor eram:
•  Locais: Indaiatuba; Campinas; Jundiai; Bragança Paulista – a sede da empresa �ca em Valinhos.
•  Produtos: (A) Xiomi; (B) Zenfone; (C) Iphone; (D) Sansung;
O relatório extraído do Data Warehouse descreveu os seguintes itens e seus valores:
•  Para Indaiatuba vendeu-se, 250 unidades do produto A, 135 do produto B, 115 do produto C e 117 do
produto D.
•  Para Campinas vendeu-se, 850 unidades do produto A, 435 do produto B, 315 do produto C e 317 do
produto D.
•  Para Jundiai vendeu-se, 350 unidades do produto A, 235 do produto B, 215 do produto C e 417 do produto
D.
•  Para Bragança Paulista vendeu-se, 150 unidades do produto A, 135 do produto B, 85 do produto C e 37 do
produto D.
Como você cruzaria esses Dados, criando um novo indicador Total de Vendas, produtos por local?
RESOLUÇÃO DO ESTUDO DE CASO
Diante dessa discussão, o resultado foi realizar os cruzamentos dos dados por intermédio de uma
representação multidimensional, de fácil manipulação, mostradas no Quadro 4 a seguir:
Quadro 4 | Cruzamento de Dados / Estudo de Caso
Produtos
Local Xiaomi Zenfone Iphone Samsung Total de Vendas
Indaiatuba 255 135 115 117 622
Campinas 850 435 315 317 1917
Jundiai 350 235 215 417 1217
Bragança Paulista 150 135 85 37 407
Fonte: adaptado de Vida (2021, p. 176).
Note que ao fazermos um cruzamento multidimensional, os supervisores terão os indicadores sobre os locais,
os produtos e as quantidades vendidas, assim, poderão ter uma informação mais rápida, com isso, as
tomadas de decisões �uirão mais assertivas para cada item rastreado.
 Saiba mais
Para saber mais, sugere-se pesquisar, utilizando a seguinte bibliogra�a:
VIDA, E. S.; ALVES, Nicolli.SR; FERREIRA, R. GC; AL., Et. Armazém de dados. [Digite o Local da Editora]:
Grupo A, 2021. 9786556901916. Disponível em:
https://integrada.minhabiblioteca.com.br/#/books/9786556901916/.
Bons Estudos.
Para complementar nosso material, uma forma bem intuitiva de aprendizagem para resumir nosso material,
mostrado na Figura 4 a seguir:
Figura 4 | Ingestão de variedade de dados
Fonte: adaptada de Somasundaram e Shrivastava (2011)
Resolução do Estudo de Caso
Para visualizar o objeto, acesse seu material digital.
https://integrada.minhabiblioteca.com.br/#/books/9786556901916/
INTRODUÇÃO
Olá Estudante!
Nesta aula que trata do assunto: ODS (Operational Data Store – Armazenamento de Dados Operacional) para
Data Warehouse, consiste em discutirmos sobre como as empresas estão se preparando para os diversos
tipos de armazenamentos de dados, ou seja, que tipo de ferramenta, software e ou pro�ssional o mercado
oferece para comporem a equipe que faz a gestão empresarial, dinâmica e e�ciente.
No primeiro bloco, o tema envolve sobre como mover os dados de um ODS, ou como é operacionalização de
um ODS que possui como ação, receber dados para armazena-los em sua área de dados operacionais, sendo
a última captura de dados operacionais do tipo relacional. Em seu segundo bloco, como consultar dados por
intermédio da SQL (Standard Query Language – linguagem de consulta padrão), concluindo com o terceiro
bloco sobre como construir relatórios, utilizando armazenadores de dados.
MOVER DADOS DE UM ODS
Olá Estudante!
Chegamos ao nosso primeiro bloco, onde evidencia-se “Mover dados de um ODS”, ou seja, mover dados de
um armazenador de dados, fato este, comum entre as empresas pois estamos na era da informação, da big
data, ciência de dados, onde busca-se receber os dados de maneira rápida e consistente, atualizá-las se
necessário para que os lideres corporativos.
Segundo Sarkis (2001, p. 33), O Armazenamento de Dados Operacionais ODS (Operational Data Store),
constitui a base do processamento informacional operacional, e seu uso destina-se aos gerentes que
precisam tomar decisões instantâneas, ou seja, é um repositório onde estão armazenados, dados que podem
ser atualizados, devido a isso, os administradores possuem uma visão coletiva operacional desta informação.
Observe na Figura 1 o posicionamento estratégico do ODS relacionado ao trafego de dados:
Figura 1 | Armazenamento de Dados Operacionais – ODS
Aula 4
ODS PARA DATA WAREHOUSE
Chegamos ao nosso primeiro bloco, onde evidencia-se “Mover dados de um ODS”, ou seja, mover dados
de um armazenador de dados, fato este, comum entre as empresas pois estamos na era da informação,
da big data, ciência de dados, onde busca-se receber os dados de maneira rápida e consistente, atualizá-
las se necessário para que os lideres corporativos.
16 minutos
Fonte: adaptado de Vida (2017).
Note que a Figura 1 mostra o trafego dos dados que chegam por intermédio do processamento de transações
online – OLTP, chegam até a Staging Area (área de preparação dos dados), que antecedem o Armazenamento
de Dados Operacional – ODS, os dados ao chegarem no estágio do ODS, apesar de serem de diversas origens,
possibilita a integração destes dados, mantem-se o desempenho no momento de seu armazenamento,
mesmo fazendo uso da consulta, este desempenho mantem-se integro (SOMASUNDARAM E SHRIVASTAVA,
2011).
Na visão de Koball et al (2003), os tipos de usuários (consumidores) do ODS, pode-se citar dois tipos ou
categorias: Usuários Principais– este tipo de usuário conhece sobre o assunto que está procurando,
desenvolve trabalhos rotineiros setoriais e outro tipo de categorização são os Usuários Secundários ou tipos
de usuários que não sabem o que estão pesquisando, porem �cam atentos aos padrões e seus
relacionamentos não usuais.
Segundo Victor (2017), pode-se mover dados de um ODS para outros sistemas por intermédio de duas
situações: a primeira situação é pela pessoa ou administrador destes dados que consegue inseri-los
diretamente no SGBD ou Sistema de Gerenciamento de Banco de Dados, organizados. Já a segunda situação
que é pelo computador, ou por um sistema que move diretamente os dados sem o acompanhamento da
pessoa, estes dados podem chegar até o Banco de Dados, mal organizados, sendo necessário em alguns casos
a reformulação de alguns processos de dados pelo administrador ao se deparar com estes dados menos
organizados.
Na visão de Sarkis (2001), existem tipos de ODS, vamos analisa-los no Quadro 1 a seguir:
Quadro 1 | Tipos de ODS
1. ODS
classe 0
Pode-se copiar tabelas em uma determinadabase de dados, porém, não possui integração
de dados, seu ciclo de dados é curto.
2. ODS
classe I
Os dados são direcionados para o ODS em atacado, as transações são executadas no
ambiente operacional, depois segue para o ODS, também os dados não são integrados, nem
acertados para seguirem para o DW.
3. ODS
classe II ou
III
Os dados são integrados, porem ocorrem um certo atraso para chegarem até o ODS, de
difícil construção devido aos softwares de integração, como vantagem, os dados chegam
ajustados no DW.
4. ODS IV De fácil construir, desde que o DW esteja construído e preparado para receber os dados do
ODS IV, este ODS é suprido por dados analíticos extraídos do DW pelo analista para serem
inseridos neste ODS.
Fonte: adaptado de Sarkis (2001).
Estas categorizações ajudam aos analistas se combinadas as classes ao armazenamento de dados de forma
integrada e que resulta em processos e indicadores satisfatórios para o trafego de dados das empresas. 
VIDEOAULA: MOVER DADOS DE UM ODS
Olá Estudante!
Este vídeo trata do assunto mover dados de um armazenador de dados operacional, ou seja, qual o conceito
de um ODS, de onde vem os dados e como é direcionado estes dados para o Data Warehouse. Quais são os
tipos de usuários que direcionam dados para o ODS e como é movido estes dados para o DW.
CONSULTAS USANDO SQL
Olá Estudante
Neste segundo bloco, foi evidenciado sobre “Consultas usando SQL”, ou seja, o usuário de muitas empresas
de diversos segmentos que necessitem trabalhar com dados de uma forma segura e e�ciente, estruturada e
ágil em suas transações internas ou externas, por isso, que muitas, milhares destas empresas optam pela
linguagem SQL, por oferecer todos estes atributos.
Segundo Nield (2016), a sigla SQL (Structure Query Language ou Linguagem de Consulta Estruturada, é uma
linguagem para consulta de dados relacionais, nasceu por volta da década de 70, desenvolvida pela empresa
IBM, que tinha como conceito, mostrar a implementação do modelo entidade – relacionamento proposto até
então por E. F. Codd (matemático britânico).
A linguagem SQL, na visão de Taylor (2016), é utilizada para fazer buscas e extrações de dados de um
determinado SGBD, a �m de suprir o usuário de informações necessárias para conclusão de suas tarefas
rotineiras. Nield (2016), alerta para o momento de estar fazendo a busca destas informações, para não
Videoaula: Mover dados de um ODS
Para visualizar o objeto, acesse seu material digital.
comprometer ou mudar algum comando que mudaria os dados relacionais do banco de dados.
Segundo Nield (2016), o comando SELECT é um dos mais importantes quando se utiliza a linguagem SQL, em
se tratando de consultar algum tipo de dado ou extrair algumas informações, vamos acompanhar no Quadro
2 a seguir algumas funcionalidades que acompanham o comando SELECT:
Quadro 2 | Funcionalidades do Comando SELECT
1. SELECT simples Recupera dados de um objeto do BD, como por exemplo uma tabela.
2. Comando Where Sua funcionalidade é permitir condições de �ltragem de dados.
3. Comando Order Utiliza o comando ORDER BY para ordenação de dados.
4. Junção de Tabelas Sua funcionalidade é permitir que duas ou mais tabelas sejam unidas.
5. Comando Join Pode-se unir tabelas com este comando, porem deve-se utilizar a palavra
reservada JOIN
6. Comando FULL OUTER
JOIN
Pode-se combinar INNER e OUTER.
7. UNION Segunda forma de junção de tabelas com este comando.
8. AGRUPAMENTO Utiliza-se o parâmetro GROUP BY, retorna informações que estavam
agrupadas.
9. HAVING Pode-se aplicar o �ltro na funcionalidade GROUP BY.
Fonte: adaptado de Nield (2016).
Segundo Nield (2016), pode-se aplicar na consulta de dados uma in�nidade de recursos para tornar sua
consulta as informações, mais e�cientes, dinâmicas para satisfazer as necessidades de cada empresa. Vamos
a alguns exemplos de consultas a informações aplicando alguns comandos do Quadro 2:
1 | SELECT CODIGO, NOME FROM FORNECEDOR
2 | SELECT * FROM FORNECEDORES // Um Detalhe sobre este pequeno código é o asterisco que é a
representatividade de todos os campos envolvidos na produção deste pequeno código.
Vamos a um segundo exemplo, utilizando a função WHERE:
1| SELECT CODIGO, NOME FROM FORNECEDORES
2| WHERE CODIGO = 05
3| SELECT CODIGO, NOME FROM FORNECEDORES
4| WHERE UF = ‘PR’
5| SELECT CODIGO, NOME FROM FORNECEDORES
6| WHERE CODIGO >= 50 AND CODIGO <= 250
7| SELECT CODIGO, NOME FROM FORNECEDORES
8| WHERE UF = ‘SC’ OR UF = ‘RS’
Estes são exemplos de consultas usando alguns comandos SQL, sabendo que existem muitos destes
comandos disponíveis para serem utilizados. Fica o convite para você acessar e se aprofundar um pouco mais
sobre este assunto.
Bons estudos!
VIDEOAULA: CONSULTAS USANDO SQL
Olá Estudante!
Neste vídeo aborda-se o assunto “Consultas usando SQL”, começamos com o conceito, seu surgimento e o
responsável pelo surgimento por esta linguagem de consulta estruturada. Entender o porquê de ser uma das
linguagens mais utilizadas no mundo, seus principais comandos de consultas.
CONSTRUIR RELATÓRIOS
Olá Estudante!
Estamos concluindo mais uma aula, sobre “ODS para Data Warehouse”, com ênfase neste terceiro bloco,
“Construir Relatórios”, se observarmos o peso que tem essas palavras, “Construir” e “Relatórios, ambas são
muito importantes para o cotidiano das empresas, seja governamental ou privada, a construção de relatórios
tornou-se um fator indispensável pelas empresas, pois, a competitividade de mercado, exige tomadas de
decisões corretas, assertivas, para que os supervisores, gerentes ou diretores possam ter esse suporte nos
momentos mais difíceis de sua caminhada empresarial.
Segundo Damas (2007), o usuário pode criar diversos tipos de relatórios gerados de uma base de dados, seja
ela, uma planilha simples ou complexa, assim como um banco de dado mais simples como o Microsoft Access
ou nomes conhecidos do mercado pela sua robustez e capacidade de armazenamento, importação e
exportação de dados como o Oracle, SQL Server, MySQL, PostgreSQL, MongoDB. Independente da marca ou
valor de mercado, o que importa é proporcionar as empresas, armazenamentos con�áveis, facilidade em sua
usabilidade, assim como importação e exportação de dados para que se possa gerar relatórios condizentes
com as necessidades dessa empresa.
Na visão de Cardoso (2009), estas ferramentas citadas os BD’s em especi�co a linguagem SQL (assunto de
nosso segundo bloco) se transformam em grandes gerados de relatórios, com o intuito de proporcionar ao
usuário departamental, dados que se transformam em indicadores oriundos de relatórios que especi�cam
Videoaula: Consultas usando SQL
Para visualizar o objeto, acesse seu material digital.
Imprimir
detalhes, números, nomes, códigos que são a base para os gestores em sua tomada de decisão. Damas (2007)
nos mostra algumas vantagens, com relação aos relatórios gerados de bancos de dados como o SQL, analise o
Quadro 3 a seguir:
Quadro 3 | Vantagens de relatórios gerados de BD’s
1. Visão decisiva dos
projetos
Um BD pode armazenar desde a planta (layout) até os itens de menor e maior
relevância na gestão de um projeto.
2. Importação de
Dados
A importação de dados para relatórios não se restringe a ambientes de redes
internas, mas sim, pode-se utilizar as redes para importação de dados com
extensões diversi�cadas com XML, HTML, ferramentas como Power BI se
destacam nesta vantagem.
3. Sua empresa com
maior mobilidade e
�exibilidade 
Os grandes bancos de dados podem se comunicar entre empresas, matriz e
�lial, empresa – cliente; empresa fornecedores, a comunicação �ui com maior
integrada nas informações.
4. Dados Brutos em
Dados Analíticos
Os BD’s conseguem em sua performance, receber dados brutos, oriundos de
diversas origens, estes dados tornam-se organizados, para depois, gerarem
informações analíticas que serão preponderantes para tomada de decisões
departamentais e corporativas.
5. Segurança e
controle na geração de
dados
As novas versõesde banco de dados como SQL, buscam soluções e atualizações
constantemente contra invasores indesejados que põem em risco a integridade
dos dados.
Fonte: adaptado de Damas (2007).
Vamos a um exemplo prático da interface um Banco de Dados SQL, analise a Figura 2 a seguir:
Figura 2 | Interface de um BD SQL
Fonte: Wikipedia Commons.
A Figura 2 mostra uma interface do Banco de Dados SQL, observe a quantidade de tabelas que possibilitam ao
usuário uma imensidão de relatórios, assim como os comandos que acompanham estas tabelas.
VIDEOAULA: CONSTRUIR RELATÓRIOS
Olá Estudante!
Este vídeo nos direciona a complementarmos algum ponto do material escrito que evidencia, “Construir
relatórios”, onde evidenciou-se o conceito e as vantagens de se gerar relatórios de banco de dados,
independentemente de sua marca ou valor, o importante é que seja consistente e integro no armazenamento,
gerenciamento e capacidade de se gerar relatórios importantes para tomada de decisões corporativas.
ESTUDO DE CASO
Em uma empresa transportadora de diversos tipos de cargas, começou como toda empresa familiar, ou seja,
seus fundadores, pés do chão, porém, muito restritos a atualizações, mudanças e investimentos ferramentais.
Em uma das reuniões foram detectados diversos itens departamentais abaixo do esperado, a ferramenta
geradora de relatórios é o Microsoft Excel, que apesar de possuir muitos recursos, deixava a desejar aos
novos investimentos. Um dos colaboradores, perguntou, os itens de seu departamento estão muito ruins de
compreender, outro colaborador, teve um insight e proporcionou uma resposta ao colega. Além de quase
obsoleto, você não teve treinamento na tarefa.
Seu objetivo como Arquiteto de Dados, poderia produzir uma melhoria no armazenamento, importação e
exportação de dados neste caso, seguindo os seguintes requisitos:
•  Sanar os problemas de abrangência de dados.
•  Monitorar as melhorias que acresceram nos últimos dias.
•  Veri�car a necessidade de novos indicadores.
RESOLUÇÃO DO ESTUDO DE CASO
Depois de analisarem muito as propostas das empresas, um consultor, levou até essa empresa a melhor
solução, a implantação de um Banco de Dados SQL, depois de implantada e os colaboradores devidamente
treinados na tarefa, vamos as vantagens da empresa com a nova ferramenta:
•  Aumentou a abrangência no trafego da informação.
•  Permitiu uma maior importação e exportação de dados.
•  Melhorou a mobilidade e �exibilidade.
•  Surgiram os indicadores analíticos.
Videoaula: Construir relatórios
Para visualizar o objeto, acesse seu material digital.
•  Pode-se gerar relatórios com maior con�ança.
 Saiba mais
Olá Estudante!
Este vídeo nos traz um complemento sobre ODS e Data Warehouse:
Disponível em: https://www.youtube.com/watch?v=xLlCKS8IRMA&ab_channel=TIFLIX.
Quer saber mais sobre SQL e relatórios:
TAYLOR, A. G. SQL Para Leigos. Brasil, Alta Books Editora, 2016.
VIDA, E. S.; ALVES, N.SR; FERREIRA, R. GC; AL., Et. Armazém de dados. [Digite o Local da Editora]: Grupo A,
2021. 9786556901916. Disponível em:
https://integrada.minhabiblioteca.com.br/#/books/9786556901916/. Acesso em: 11 dez. 2021.
Olá Estudante!
Acompanhe o material complementar para a disciplina ODS para Data Warehouse, conforme a Figura 3 a
seguir:
Figura 3 | ODS para Data Warehouse
https://www.youtube.com/watch?v=xLlCKS8IRMA&ab_channel=TIFLIX
https://integrada.minhabiblioteca.com.br/#/books/9786556901916/
Fonte: ellaborada pelo autor.
Resolução do Estudo de Caso
Para visualizar o objeto, acesse seu material digital.
Aula 1
CURY, T. E.; BARRETO, J. S.; SARAIVA, M. O.; AL., Et. Estrutura de Dados. [Digite o Local da Editora]: Grupo A,
2018. 9788595024328. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9788595024328/.
Acesso em: 14 de nov. 2021.
EDELWEISS, N.; GALANTE, R. Estruturas de Dados - V18 - UFRGS. [Digite o Local da Editora]: Grupo A, 2011.
9788577804504. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9788577804504/. Acesso
em: 15 dez. 2021.
REFERÊNCIAS
8 minutos
https://integrada.minhabiblioteca.com.br/#/books/9788595024328/
https://integrada.minhabiblioteca.com.br/#/books/9788577804504/
PINTO, R, A. et al. Estrutura de dados. Disponível em: Minha Biblioteca, Grupo A, 2020.
SOMASUNDARAM, G.; SHRIVASTAVA, A.; SERVIÇOS, EMC. E. Armazenamento e Gerenciamento de Informações.
[Digite o Local da Editora]: Grupo A, 2011. 9788577807642. Disponível em:
https://integrada.minhabiblioteca.com.br/#/books/9788577807642/. Acesso em: 14 de nov. 2021.
Aula 2
ALVES, W. P. Banco de dados. São Paulo: Erica, 2014.
KOBALL, A. et al. Informática na Educação Baseado em Data Warehouse com Aplicação na Gestão Ambiental.
Anais do V Encontro de Estudantes de Informática do Tocantins. Palmas, TO. outubro, 2003. pp. 131-138.
MACHADO, A. L. Administração do Big Data. Editora Senac São Paulo. 2017.
SOMASUNDARAM, G.; SHRIVASTAVA, A.; SERVIÇOS, EMC. E. Armazenamento e Gerenciamento de Informações.
[Digite o Local da Editora]: Grupo A, 2011. 9788577807642. Disponível em:
https://integrada.minhabiblioteca.com.br/#/books/9788577807642/. Acesso em: 12 dez. 2021.
VIDA, E. S.; ALVES, N.SR; FERREIRA, R. GC; AL., Et. Armazém de dados. [Digite o Local da Editora]: Grupo A, 2021.
9786556901916. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9786556901916/. Acesso
em: 11 dez. 2021.
VICTOR, D. Tecnologia da Informação com ênfase em BI. Gestão Tributária. 2017.
Aula 3
BELUZZO, C. R. B. Novas condutas de gestão de serviços de informação. São Paulo: USP/SINi, 2003.
CAMPELLO, B.; CALDEIRA, P. T. Introdução às fontes de informação. [Digite o Local da Editora]: Grupo
Autêntica, 2007. 9788582179611. Disponível em:
https://integrada.minhabiblioteca.com.br/#/books/9788582179611/. Acesso em: 20 dez. 2022.
CUNHA, M. B. Para saber Mais: fontes de informação em ciência e tecnologia. Brasília: Briquet de Lemos, 2001.
FAVERO, L. P. Manual de Análise de Dados - Estatística e Modelagem Multivariada com Excel®, SPSS® e
Stata®. Editora : GEN LTC; 1ª edição. 2017.
LE COADIC, Y. A ciência da informação. Brasília: Briquet de Lemos, 1996.
SOMASUNDARAM, G.; SHRIVASTAVA, 9A.; SERVIÇOS, EMC. E. Armazenamento e Gerenciamento de
Informações. [Digite o Local da Editora]: Grupo A, 2011. 9788577807642. Disponível em:
https://integrada.minhabiblioteca.com.br/#/books/9788577807642/. Acesso em: 01 jan. 2022.
VIDA, E. S.; ALVES, Nicolli.SR; FERREIRA, R. GC; AL., Et. Armazém de dados. [Digite o Local da Editora]: Grupo A,
2021. 9786556901916. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9786556901916/.
Acesso em: 01 jan. 2022.
https://integrada.minhabiblioteca.com.br/#/books/9788577807642/
https://integrada.minhabiblioteca.com.br/#/books/9788577807642/
https://integrada.minhabiblioteca.com.br/#/books/9786556901916/
https://integrada.minhabiblioteca.com.br/#/books/9788582179611/
https://integrada.minhabiblioteca.com.br/#/books/9788577807642/
https://integrada.minhabiblioteca.com.br/#/books/9786556901916/
Aula 4
ALVES, W. P. Banco de dados. São Paulo: Erica, 2014.
CARDOSO, V. Linguagem SQL, fundamentos e práticas - 1ª edição . [Digite o Local da Editora]: Editora Saraiva,
2009. 9788502200463. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9788502200463/.
Acesso em: 03 dez. 2022.
DAMAS, L. SQL - Structured Query Language, 6ª edição. [Digite o Local da Editora]: Grupo GEN, 2007.
9788521632450. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9788521632450/. Acesso
em: 03 dez. 2022.
KOBALL, A. et al. Informática na Educação Baseado em Data Warehouse com Aplicação na Gestão Ambiental.
Anais do V Encontro de Estudantes de Informática do Tocantins. Palmas, TO. outubro, 2003. pp. 131-138.
NIELD, T. Introdução à Linguagem SQL: Abordagem prática para iniciantes. (2016). Brasil: Novatec Editora.
MACHADO, A. L. Administração do Big Data. Editora Senac São Paulo. 2017.
SARKIS, L. C. Data Warehouse: o Processo de Migração de Dados.Dissertação (Mestrado em Ciência da
Computação – Universidade Federal de Santa Catarina. Santa Catarina, p. 142. 2001.
SOMASUNDARAM, G.; SHRIVASTAVA, A.; SERVIÇOS, EMC. E. Armazenamento e Gerenciamento de Informações.
[Digite o Local da Editora]: Grupo A, 2011. 9788577807642. Disponível em:
https://integrada.minhabiblioteca.com.br/#/books/9788577807642/. Acesso em: 12 dez. 2021.
TAYLOR, A. G. SQL Para Leigos. Brasil, Alta Books Editora, 2016.
VIDA, E. S.; ALVES, N.SR; FERREIRA, R. GC; AL., Et. Armazém de dados. [Digite o Local da Editora]: Grupo A, 2021.
9786556901916. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9786556901916/. Acesso
em: 11 dez. 2021.
VICTOR, D. Tecnologia da Informação com ênfase em BI. Gestão Tributária. 2017.
WIKILIVROS. SQL/Linguagem de consulta de dados. Disponível em:<
https://pt.wikibooks.org/wiki/SQL/Linguagem_de_consulta_de_dados>. Acesso em: 12 de dez. 2013.
https://integrada.minhabiblioteca.com.br/#/books/9788502200463/
https://integrada.minhabiblioteca.com.br/#/books/9788521632450/
https://integrada.minhabiblioteca.com.br/#/books/9788577807642/
https://integrada.minhabiblioteca.com.br/#/books/9786556901916/
https://pt.wikibooks.org/wiki/SQL/Linguagem_de_consulta_de_dados

Mais conteúdos dessa disciplina