BANCO DE DADOS DISTRIBUÍDOS

•

NEWTON PAIVA

william Fernan

30/05/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Banco de Dados Distribuidos

123 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

BANCO DE DADOS DISTRIBUIDOS
1

SUMÁRIO

NOSSA HISTÓRIA .......................................................................................... 2
Descrição de Bancos de Dados Centralizados ................................................ 3
Descrição de Bancos de Dados Distribuídos ................................................... 4
banco de dados distribuído .............................................................................. 5
IMPLEMENTAÇÃO .......................................................................................... 8
Processamento de consultas distribuídas ....................................................... 9
Requisitos Funcionais de um Banco de Dados Distribuído Ideal................... 11
Arquitetura de Referência para um Banco de Dados Distribuído .................. 13
Projeto de Banco de Dados Distribuído ......................................................... 14
Projeto de Fragmentação de Dados .............................................................. 15
Projeto de Replicação de Dados ................................................................... 16
Projeto de Alocação de Dados ...................................................................... 17
CONTROLE E MONITORAMENTO .............................................................. 18
PAPEL ESTRATÉGICO DAS APLICAÇÕES DE TI ...................................... 19
Organização e Tarefas da Equipe de Administração ..................................... 20
Problemas que Afetam a Administração ........................................................ 21
REFERENCIAS ............................................................................................. 22

NOSSA HISTÓRIA

A nossa história inicia com a realização do sonho de um grupo de empresários,
em atender à crescente demanda de alunos para cursos de Graduação e Pós-
Graduação. Com isso foi criado a nossa instituição, como entidade oferecendo
serviços educacionais em nível superior.
A instituição tem por objetivo formar diplomados nas diferentes áreas de
conhecimento, aptos para a inserção em setores profissionais e para a participação
no desenvolvimento da sociedade brasileira, e colaborar na sua formação contínua.
Além de promover a divulgação de conhecimentos culturais, científicos e técnicos que
constituem patrimônio da humanidade e comunicar o saber através do ensino, de
publicação ou outras normas de comunicação.
A nossa missão é oferecer qualidade em conhecimento e cultura de forma
confiável e eficiente para que o aluno tenha oportunidade de construir uma base
profissional e ética. Dessa forma, conquistando o espaço de uma das instituições
modelo no país na oferta de cursos, primando sempre pela inovação tecnológica,
excelência no atendimento e valor do serviço oferecido.

DESCRIÇÃO DE BANCOS DE DADOS CENTRALIZADOS

A descrição de um banco de dados centralizado usualmente está dividida em
três níveis: conceitual ou lógico, interno ou físico e externo. A descrição a nível lógico
forma o esquema conceitual do banco de dados. O esquema conceitual deve
apresentar uma visão de alto nível do banco, independente da forma de
armazenamento refletindo apenas a semântica do empreendimento que está sendo
modelado.
O esquema conceitual consiste de um conjunto de estruturas de dados
descrevendo como os dados estão organizados do ponto de vista lógico, além de um
conjunto de restrições de integridade indicando que conjuntos de dados corretamente
refletem situações do mundo real. A classe de estruturas de dados e restrições de
integridade permitidas são determinadas pelo modelo de dados escolhido.
Ao nível interno ou físico, obtém-se uma representação eficiente do esquema
conceitual em termos dos métodos de acesso e estruturas de arquivos oferecidas
pelo sistema de gerência de banco de dados. O resultado é chamado de esquema
interno do banco. A existência de um esquema interno separado do esquema
conceitual é bastante importante pois os detalhes de armazenamento do banco
devem ser transparentes (ou mesmo irrelevantes) ao desenvolvimento de programas
de aplicação.
O esquema interno não deve ser visível aos usuários ou analistas de aplicação,
sendo responsabilidade do administrador do banco definí-lo. Além disto, espera-se
de um bom sistema de gerência de banco de dados que permita mudar o esquema
interno do banco sem alterar os programas de aplicação. Ou seja, o SGBD deve
permitir alcançar o que chamamos de independência física de dados.
Finalmente, pode-se criar uma visão especializada do banco para cada grupo
de usuários, ainda do ponto de vista lógico, através da definição de um esquema
externo para cada grupo. Esquemas externos facilitam o desenvolvimento de
aplicações já que focalizam apenas a parte do banco que interessa à aplicação,
escondendo parte da complexidade do banco. Esquemas externos também são úteis
como uma forma de restringir o acesso a dados classificados por parte de grupos de
usuários.
4

DESCRIÇÃO DE BANCOS DE DADOS DISTRIBUÍDOS

A descrição de um banco de dados distribuído, refletindo os requisitos de que
a localização e replicação dos dados deve ser transparente aos usuários do BDD e
de que o sistemas locais devem manter sua autonomia. O requisito postulando que a
distribuição do BDD deve ser transparente ao usuário pode ser entendido como
indicando que, a nível lógico, um BDD deve ser visto como se fosse um banco de
dados centralizado. Desta forma, deve existir:
 Um esquema conceitual global descrevendo o BDD a nível lógico e
ignorando o fato deste ser distribuído e
 Vários esquemas externos globais descrevendo visões do BDD para
grupos de usuários.
Estes dois primeiros níveis são, portanto, idênticos para bancos de dados
centralizados e distribuídos. O esquema conceitual global não é mapeado
diretamente em esquemas internos nos diversos nós onde residirá o banco. Esta
alternativa aglutinaria em um único passo os problemas de se definir tanto o critério
de distribuição do banco como também a estratégia de armazenamento do banco em
cada nó. Para evitar este inconveniente, introduz-se para cada nó onde uma parte do
banco estará armazenada um esquema conceitual local descrevendo o banco de
dados local. O mapeamento do esquema conceitual global para os vários esquemas
conceituais locais define, então, o critério de distribuição usado.
A estratégia de armazenamento de cada banco de dados local é definida
mapeando-se o esquema conceitual local que o define em um esquema interno local.
Cada nó possui, portando, uma descrição completa, a nível lógico e físico, do banco
ali armazenado.
O conceito de um banco de dados local é mais facilmente justificado frente ao
requisito indicando que sistemas locais devem manter sua autonomia. Assim, faz
sentido introduzir também esquemas externos locais em cada nó descrevendo visões
do banco de dados local para cada grupo de usuários locais. A descrição de um banco
de dados distribuído é afetada pelo tipo de sistema da seguinte forma. Se o SGBD for
5

homogêneo, todos os esquemas a nível lógico utilizarão o mesmo modelo de dados.
Já no caso de sistemas heterogêneos, teremos a seguinte situação:
 Esquema conceitual global no modelo de dados pivot;
 Esquemas externos globais podem ser tanto no modelo de
dados pivot, para usuários globais, ou em um modelo de dados
local, no caso de se desejar oferecer a um usuário local uma
visão do BDD no modelo que ele está acostumado;
 Esquemas conceituais locais no modelo de dados local;
 Esquemas externos locais no modelo de dados local.

BANCO DE DADOS DISTRIBUÍDO

Um sistema de banco de dados distribuído (BDD) consiste em um relação de
nós, cada qual podendo participar na execução de transações que acessam dados
em um ou mais nós. Emum sistema de banco de dados distribuído, o banco de dados
é armazenado em diversos computadores (nós). Os computadores, em um sistema
distribuído, comunicam-se uns com os outros por intermédio de vários meios de
comunicação, tais como: redes de alta velocidade, redes sem fio ou linhas telefônicas,
eles não compartilham a memoria principal e o relógio.
A diferença principal entre sistemas de banco de dados centralizados e
distribuídos é que no primeiro os dados estão localizados em um único lugar,
enquanto que no outro os dados residem em diversos locais. Esta distribuição de
dados é motivo de muitas preocupações e dificuldades.
Os processadores em um sistema distribuído podem variar em tamanho e
função, podendo incluir microcomputadores, estações de trabalho, minicomputadores
e sistemas de computadores de uso em geral. Estes processadores são geralmente
chamados de nós, dependendo do contexto no qual eles estejam mencionados. Usa-
se principalmente o termo nó (lugar, posição), a fim de enfatizar a distribuição física
destes sistemas. Veja o exemplo na Figura 1:
Figura 1: Figura demonstrando o sistema de banco de dados distribuído.
6

Banco de Dados (BD): Um banco de dados pode ser definido como uma
coleção computadorizada de dados operacionais armazenados que servem para
suprir as necessidades de múltiplos usuários dentro de uma ou mais organizações,
Sistema Gerenciador de Banco de Dados (SGBD) : De uma forma bastante simples
pode-se dizer que o SGBD é um conjunto de softwares responsável pelo controle e
gerenciamento dos recursos de banco de dados.
Banco de Dados Distribuído (BDD): Um banco de dados distribuído é uma
coleção de dados pertencentes logicamente ao mesmo sistema, mas distribuídos
sobre vários sítios de uma rede de computadores, Para Christian J. Date “Um sistema
de banco de dados distribuído consiste de uma coleção de sítios, conectados através
de redes de comunicação, no qual cada sítio é um sistema de banco de dados em
seu próprio direito, mas os sítios concordam em cooperar, de tal forma que um usuário
em qualquer sítio possa acessar qualquer dado na rede exatamente como se
estivesse armazenado no próprio sítio do usuário.”
Sobre Bancos de Dados Distribuídos, destacam-se o projeto de banco de
dados distribuído e os seus componentes: projeto de fragmentação, projeto de
replicação e projeto de alocação de dados. O principal enfoque na implementação do
sistema Controle da Frota de Veículos é o projeto de replicação, totalmente suportado
pelo SGBDD Oracle7. O projeto de fragmentação não é suportado pelo SGBDD
Oracle7. O projeto de alocação neste trabalho é constituído basicamente do
levantamento das tabelas, réplicas e índices destinados a cada sítio e pelos cálculos
efetuados para se chegar ao espaço em disco necessário para armazená-los.
7

Os Sistemas de Gerência de Banco de Dados Distribuídos são estudados
através de seus principais componentes : gerência de transação, concorrência e
recuperação. O método mais utilizado pelos SGBD’s comerciais para o controle de
concorrência é o Bloqueio. Para manter a integridade dos dados envolvidos em
transações distribuídas, a maioria dos SGBD’s utiliza o Protocolo Bifásico de
Confirmação (2PC). Para resolver os casos de deadlocks globais, o método
geralmente implementado é o Timeout.

ARMAZENAMENTO DISTRIBUÍDO DOS DADOS

Uma relação r (ou tabela) possui diversos enfoques para o armazenamento em
um banco de dados distribuído (BDD):
 Replicação: o sistema mantém réplicas idênticas da relação, onde cada
réplica é armazenada em sites diferentes, resultando na replicação dos
dados
 Fragmentação: a relação é particionada em vários fragmentos, onde
cada fragmento é armazenado em um site diferente
 Replicação e fragmentação: a relação é particionada em vários
segmentos, e o sistema mantém diversas réplicas de cada fragmento
Replicação de dados
A replicação de dados significa que um determinado objeto de dados logico
pode possuir diversos representantes armazenados, em nós. O grau de suporte para
a replicação é um pré-requisito para atingir o verdadeiro potencial de um sistema
distribuído.
Fragmentação de dados
Uma relação é dividida em fragmentos, onde cada fragmento contem
informação suficiente para permitir a reconstrução da relação original. Existem duas
formas de fazer a fragmentação:
8

 Fragmentação Horizontal: divide a relação separando as tuplas de r
em dois ou mais fragmentos.
 Fragmentação Vertical: divide a relação pela decomposição do
esquema R da relação r.
Fragmentação e Replicação de Dados
As técnicas de fragmentação e replicação podem ser aplicadas
sucessivamente a uma mesma relação. Um fragmento pode ser replicado, e as
réplicas podem ser fragmentadas novamente e assim por diante.
IMPLEMENTAÇÃO

Esta parte não representa uma função somente do planejamento, mas da
administração da empresa como um todo. Stoner e Freeman (1999) ressaltam que a
partir do momento em que a estratégia for escolhida deve ser implementada ou
inserida nas operações da organização. Os autores ainda ressaltam a importância
desta implementação iniciar-se a partir de um documento formal que pode ser um
plano.
Para ocorrer uma implementação adequada não bastam apenas as
informações fornecidas no processo de planejamento, Megginson et al (1998) destaca
que é fundamental a existência de recursos humanos, materiais e 24 financeiros
suficientes para que ocorra tal execução. Ainda assim, o mesmo destaca que para
colocar o planejamento em ação é fundamental alguém capaz de liderar e motivar os
envolvidos.
Megginson et al (1998) ainda afirma que em empresas muito grandes devese
tomar cuidados especiais quanto a sobreposição de planos ou até conflito entre
esses. Para evitar tais empecilhos, a criação de um setor central responsável pela
coordenação geral dos planos é essencial.
Bateman e Snell (1998) acrescentam que esta etapa torna-se mais eficaz e
eficiente quando os administrados e funcionários participam dos passos anteriores,
tornando assim os envolvidos mais informados, compromissados e motivados a
cumprir os objetivos estabelecidos. Mais além, ressalta-se também que o emprego
9

de programas de incentivos financeiros são uma grande maneira de incentivar uma
implementação bem sucedida.

PROCESSAMENTO DE CONSULTAS DISTRIBUÍDAS

A transparência para leitura é mais fácil de se conseguir e manter do que a
transparência para atualização. O maior problema para a atualização é garantir que
todas as réplicas e fragmentos sejam atualizados, após uma atualização em uma das
réplicas ou fragmentos. A atualização deve ser prolongada para todas as cópias
(réplicas e fragmentos) existentes no sistema.
Um dos fatores mais importantes no desempenho de uma consulta, em uma
base centralizada, é a quantidade de acesso a disco necessária para atingir o
resultado. Em um banco distribuído os problemas aumentam, pois existe também a
preocupação com a transmissão de dados na rede. Um fator interessante para a
consulta realizada em uma base distribuída é que para os diversos sites podem
processar partes da consulta em paralelo.
Na realização de uma consulta simples (trivial), como consultar todas as tuplas
da relação CONTA, pode caracterizar um processamento não tão trivial, pois CONTA
pode estar fragmentada, replicada ou ambas.
Transações
O acesso a diversos itens de dados em um sistema distribuído é normalmente
acompanhado de transações que têm de preservar as propriedades ACID:
 A: Atomicidade
 C: Consistência
 I: Isolamento
 D: Durabilidade
Características da ACID
 Atomicidade: Todas as operações da transação são refletidas
corretamente no BD ou nenhuma será.
10

 Consistência: A execução de uma transação isolada preserva a
consistência do banco de dados.
 Isolamento: Cadatransação não toma conhecimento de outras
transações concorrentes.
 Durabilidade: Depois da transação completar-se com sucesso, as
mudanças que ela faz no banco de dados persistem.
Tipos de transação
 Locais: mantem acesso e atualizam somente a base de dados local.
 Globais: mantem acesso e atualizam diversas bases de dados locais.
Funções adicionais
 Rastreamente de dados.
 Processamento de consultas distribuídas.
 Gerenciamento de transações distribuídas.
 Gerenciamento de dados replicados.
 Recuperação de banco de dados distribuído.
 Segurança.
 Gerenciamento do diretório distribuido
Vantagens
 Gerenciamento de dados distribuído com níveis diferentes de
transparência.
 Transparência de distribuição ou de rede.
 Transparência de replicação.
 Transparência de fragmentação.
 Melhoria da confiabilidade e na disponibilidade.
 Melhoria no desempenho.
 Expansão mais fácil.
Falhas
Em um sistema de banco de dados distribuído pode sofrer os mesmos tipos de
falhas que ocorrem em um sistema centralizado, porem existem falhas adicionais que
podem ocorrer em um (BDD), tais como: falha de comunicação entre eles, perda de
11

mensagens e o particionamento da rede, cada um desses problemas devem ser
considerados no projeto de recuperação de um BDD. Para um sistema ser robusto,
ele precisa detectar qualquer uma dessas falhas, reconfigurar-se enquanto a falha é
recuperada.

REQUISITOS FUNCIONAIS DE UM BANCO DE DADOS DISTRIBUÍDO
IDEAL

Segundo Christian J. Date um banco de dados distribuído ideal deve atender
os seguintes requisitos:
Autonomia Local: Os sítios, em um sistema distribuído, devem ser
autônomos, ou seja, os dados são acessados e gerenciados localmente, as
operações locais permanecem no mesmo sítio e nenhum sítio depende de outro para
se tomar operável. Não deve existir dicionário centralizado, controlador de atividades
centralizado ou detector de bloqueio mútuo centralizado.
Independência dos Sítios: Todos os sítios em um sistema distribuído devem
possuir o mesmo tratamento. As funções de gerenciamento de dicionário,
processamento de pesquisas, controle de concorrência e recuperação não devem
depender de um sítio central.
Operação Contínua: A entrada de um novo sítio, instalação de uma nova
versão do SCiBD são exemplos de operações que não devem alterar em nada o
funcionamento do sistema ou das aplicações. Cada sítio é uma unidade funcional
independente. Independência de Local : Os dados aparecem para os usuários como
se estivessem armazenados localmente. A movimentação de dados entre sítios não
deve alterar a forma do usuário ver os dados. O usuário deve consultar e atualizar
dados independente do sítio.
Independência de Fragmentação: Fragmentação é a divisão de uma relação
utilizando-se operações relacionais de restrições e projeções. Esta divisão pode
ocorrer de forma horizontal, envolvendo subconjuntos de linhas, de forma vertical,
envolvendo subconjuntos de colunas e de forma mista. A reconstrução da relação
original dos fragmentos é feita utilizando-se operadores de junção e de união da
12

Linguagem de Manipulação de Dados (SQL). A visão que um usuário possui de uma
relação fragmentada é a mesma que ele possui de uma relação centralizada.
Independência de Replicação: Um sistema de banco de dados distribuído
deve suportar replicação de dados, ou seja, deve permitir que uma relação (ou
fragmento) possua uma ou mais cópias em vários locais distintos da rede. As razões
básicas de uso de réplicas são a disponibilidade dos dados e o desempenho das
aplicações. A localização e manipulação das réplicas de dados devem ser
transparentes ao usuário.
Processamento de Consultas Distribuídas: A otimização de consultas em
um sistema distribuído deve- ser também distribuída, envolvendo normalmente uma
etapa de otimização global para minimizar o tráfego na rede, seguido das etapas
seguintes de otimização local em cada sítio envolvido.
Gerenciamento de Transações Distribuídas: Dois aspectos importantes no
gerenciamento de uma transação distribuída são o controle de concorrência e o
controle de recuperação. Em uma transação distribuída, a atomicidade da transação
deve ser obtida, da mesma forma como ocorre em um sistema centralizado. O método
geralmente utilizado para manter a integridade dos dados em uma transação
distribuída é conhecido como Protocolo Bifásico de Confirmação. Os SGBDs
comerciais, em sua maioria, utilizam o bloqueio de linha para atualizações e, para
detectar bloqueios mútuos globais, o mecanismo de expiração de tempo.
Independência de Máquina: Os SGBDD’s utilizados em um sistema de banco
de dados distribuídos devem suportar qualquer plataforma de hardware, ou seja, o
fato de rodar em uma ou outra máquina deve ser transparente ao sistema.
Independência do Sistema Operacional: O sistema operacional que
executará o SGBDD deve ser transparente ao Sistema de Banco de Dados
Distribuído.
Independência de Rede de Comunicação: Topologia da rede, protocolo,
método de acesso, etc, são tópicos transparentes ao sistema distribuído. O sistema
de banco de dados distribuído deve rodar em qualquer plataforma de rede.
Independência de SGBD: A independência de SGBDs em um sistema
homogêneo é muito fácil de ser alcançada. A interface de acesso padrão utilizada é
13

a lLiguagem SQL, padronizada pela ANSI (American National Standards Institute). Os
problemas se avolumam quando um banco de dados distribuído é implementado em
um sistema heterogêneo de SGBDs. Atualmente existem comercialmente SGBDs
hierárquicos, redes e relacionais. Rodar transações distribuídas envolvendo três
formas distintas de armazenamento e de estruturação

ARQUITETURA DE REFERÊNCIA PARA UM BANCO DE DADOS
DISTRIBUÍDO

Como é mostrado na fíg. 2, um banco de dados distribuído, ao ser definido,
deve possuir os seguintes componentes: Esquema Global, Esquema de
Fragmentação e Esquema de Alocação, No Esquema Global são descritas todas as
entidades de dados (relações) e seus relacionamentos. A definição dos dados, em
um banco de dados distribuído, é feita da mesma forma que em um banco de dados
centralizado.
O Esquema de Fragmentação fornece o mapeamento entre relações globais e
seus respectivos fragmentos. Determina como relações globais são divididas em
fragmentos verticais, horizontais ou mistos. Desta forma, a conectividade do
relacionamento entre relações globais e fragmentos é de 1:N. O Esquema de
Alocação define em que sítio cada fragmento irá residir. Determina de que forma os
fragmentos são mapeados para alocações físicas.
Fig. 2 - Representação da arquitetura de um Banco de dados distribuído.

PROJETO DE BANCO DE DADOS DISTRIBUÍDO

A arquitetura de um banco de dados distribuído é constituída de esquema
conceituai global, esquema de fragmentação, esquema de alocação e o projeto físico
do banco de dados em cada sítio. No tópico anterior descreveu-se o esquema global,
esquema de fragmentação e esquema de alocação. No projeto físico mapeia-se o
esquema conceituai global para áreas de armazenamento permanentes em cada
sítio.
Para definir o esquema de fragmentação e alocação deve-se levar em
consideração requisitos das-aplicações sobre os dados; sítio onde a aplicação é
usada; freqüência de ativação; número, tipo e distribuição estatística dos acessos
feitos para cada item de dado requisitado (tupla ou coluna).
O Projeto de Banco de Dados Distribuído deve ter como metas:
 Processamento Local : Deve-se reduzir acessos remotos e simplificar
os controles dos programas de aplicação.
 Disponibilidade e Confiabilidade dos Dados Distribuídos : A utilização
de cópias facilita o acesso em caso de indisponibilidade de um
determinado sítio e aumenta a confiabilidade do sistema em caso de
acidentes catastróficos na instalação. Distribuição da Carga de Trabalho : Aproveita a capacidade de cada
sítio (armazenamento e processamento) e maximiza o nível de
paralelismo de execução da aplicação.
 Custo de Armazenamento e disponibilidade : Deve ser analisado em
cada sítio para se estudar alternativas de alocação e fragmentação.
Em um projeto de banco de dados distribuído deve-se ter como um dos
principais objetivos a maximização do processamento local de cada sítio. Existem
basicamente duas propostas em um projeto de banco de dados distribuído:
 Top-Down: Geralmente utilizada em bancos de dados distribuídos
homogêneos. Inicia-se pelo desenho do esquema global, seguido pelo
esquema de fragmentação e alocação. Este modelo é complementado
com o projeto físico dos dados alocados em cada sítio.
15

 Bottom-Up: Agrega bancos de dados existentes, integrando existentes
esquemas de dados em um esquema global. Este modelo possui os
seguintes requisitos: seleção de um modelo comum de banco de dados
para escrever o esquema global; tradução de cada esquema local para
o modelo comum de dados; integração dos esquemas locais para o
esquema global e resolução de conflitos entre os bancos de dados
existentes.

PROJETO DE FRAGMENTAÇÃO DE DADOS

O Projeto de Fragmentação de dados é o primeiro problema que deve ser
resolvido no modelo Top down de distribuição de dados. Este projeto consiste em
identificar e agrupar tuplas (fragmentação horizontal) ou atributos (fragmentação
vertical) que tenham a mesma propriedade do ponto de vista de sua alocação.
 Fragmentação Horizontal: É o particionamento das tuplas de uma
relação global em subconjuntos disjuntos. A reconstituição da relação
global se dá através da união de todos os fragmentos. Determinar a
fragmentação horizontal significa determinar as propriedades lógicas
dos dados ( predicado de fragmentação) e propriedades estatísticas dos
dados (números de referências das aplicações para o fragmento).
 Fragmentação Horizontal Primária: Determinar a fragmentação
primária de uma relação global consiste na determinação de um
conjunto disjunto e completo de \predicados de seleçãoj O método para
realizar esse tipo de fragmentação consiste de 2 passos:
1) Considera-se um predicado simples pi que particiona as
tuplas de uma relação global R em 2 partes que são
referenciadas diferentemente por pelo menos 1 aplicação.
Seja P=pi, onde P é um conjunto de predicados simples.
2) Considera-se um novo predicado pi no qual particiona
pelo menos um fragmento de P em 2 partes que são
referenciadas em diferentes modos por pelo menos 1
16

aplicação. Seja P <= P upi. Elimina-se os predicados não
relevantes de P. Repete-se este passo até que o conjunto
de termos mínimos do fragmento P esteja completo.
 Fragmentação Horizontal Derivada: A fragmentação horizontal
derivada de uma relação global R não é baseada em propriedades de
seus próprios atributos, mas derivada da fragmentação horizontal de
uma outra relação.
 Fragmentação Vertical: É o agrupamento de atributos de uma relação
R. Cada atributo de R deve pertencer a pelo menos 1 fragmento e cada
fragmento deve incluir um identificador único de tupla ou chave primária.
A relação global pode ser obtida com a operação de junção dos diversos
fragmentos. As alternativas para se chegar aos atributos de
particionamento são:
a) Divisão: Consiste na divisão progressiva da relação
global em fragmentos.
b) Agrupamento: Agregam-se progressivamente os
atributos para se constituir os fragmentos.
 Fragmentação Mista: É o particionamento de uma relação global II
utilizando-se a fragmentação horizontal e vertical.

PROJETO DE REPLICAÇÃO DE DADOS

Em BDDs Relacionais, a realização de replicação de dados se dá.através_.de
cópias de dados feitas a partir de tabela(s) máster(s). O objetivo principal do uso de
réplicas é a melhoria de desempenho de acesso aos dados. Quando a cópia é
somente de leitura recebe o nome de extrato ou snapshot. Quando uma cópia possui
a característica de poder ser atualizada é denominada somente de réplica. As cópias
podem ser completas ou parciais. As parciais utilizam o log da tabela máster para
efetuar as atualizações.
As cópias extrato podem assumir os seguintes formatos:
- Simples: Não possui mecanismo automático de atualização da cópia. São
definidas a partir de comandos DDL ou DML.
17

-Timestamp: A renovação da imagem dos dados é efetuada a partir de
mecanismo de tempo definido no catálogo.
- Refreshed:
Periódico: Vinculada a períodos de tempo para a renovação parcial ou total
dos dados.
Imediato: Todas as cópias de uma tabela master são atualizadas no mesmo
instante da atualização desta.
As réplicas possuem os seguintes tipos:
- Periódica: Num primeiro momento é feita uma cópia completa ao sítio
destino. A partir daí as réplicas já podem sofrer atualizações. As atualizações
efetuadas nas réplicas são periodicamente transferidas para a tabela.
- Contínua: Depois de realizada uma cópia completa, esta passa a receber
atualizações. Cada alteração realizada em uma réplica é imediatamente repassada à
tabela máster.
No projeto de replicação de dados, incorporado pelo projeto físico do banco de
dados distribuído, define-se para cada sítio as réplicas que comporão o banco de
dados e a forma de atualização.

PROJETO DE ALOCAÇÃO DE DADOS

O Projeto de Alocação de dados tem por objetivo definir as alocações físicas
dos arquivos do banco de dados distribuído em cada sítio, levando-se em
consideração a máxima eficiência nas operações de consulta e atualizações dos
dados.
O problema de otimizar a alocação dos arquivos nos sítios em um banco de
dados distribuído tem sido arduamente estudado. Muitas das soluções são muito
genéricas e complexas para serem usadas em problemas práticos, porque o número
de parâmetros a ser considerado tende a atingir patamares proibitivos.
18

É estudada a questão de como alocar os dados nos diversos sítios de um
banco de dados distribuído de forma a tornar a consulta de uma transação o mais
eficiente possível. São apresentadas as condições básicas para distribuição de dados
nos aspectos qualitativo e quantitativo deste procedimento

CONTROLE E MONITORAMENTO

Assim como na etapa anterior, esta é também fundamental em qualquer
processo administrativo. Maximiano (2004) define os meios de controle como
informações utilizadas para avaliação do grau de cumprimento dos objetivos já
estabelecidos e da adequação dos cursos de ação escolhidos.
Mais além, Bateman e Snell (1998, p. 430) definem o controle como “qualquer
processo que orienta as atividades dos indivíduos na direção da realização das metas
organizacionais”. Este considera que sem o controle para indicar as atividades
corretas a ser desempenhadas pelos indivíduos pode ocasionar inconscientemente
ações capazes de prejudicar a organização.
Le Breton (1961) afirma que o planejador deve utilizar controles formais ou até
mesmo auditorias, principalmente em situações nas quais variações significativas não
podem ser facilmente identificadas. Além disso, o autor ainda ressalta que é
necessário gastar um tempo considerável, esforço e capital para a criação de um
sistema de feedback rápido e preciso que demonstre os resultados dos planos atuais.
Para Stoner e Freeman (1999) os controladores da empresa devem criar um
sistema capaz de responder se as estratégias estão sendo implementadas conforme
planejado e se está atingindo os resultados pretendidos. Somente dessa maneira será
possível verificar o progresso do plano.
Apesar de o controle ser muitas vezes ignorado é fundamental no processo
formal de planejamento que é considerado contínuo e repetitivo. Dessa maneira,
formalizar o controle facilita o monitoramento do desempenho das unidades de
trabalho de acordo com os objetivos determinadosno início do processo. Sendo
assim, é importante também se preocupar com a necessidade de realização de
19

ajustes ou ações corretivas que podem ser ocasionados por planos mal formulados
ou situações que mudaram (BATEMAN E SNELL, 1998)

PAPEL ESTRATÉGICO DAS APLICAÇÕES DE TI

A TI tem desempenhado um importante papel na estratégia de empresas
líderes nos mercados competitivos, em particular as aplicações de TI, as quais podem
ser utilizadas para obtenção de vantagem competitiva na cadeia de valor e aumento
das competências essenciais das organizações (LAURINDO, 2008). Contudo, deve-
se ter em mente que a importância estratégica da TI pode variar de uma indústria
para outra e também entre empresas de uma mesma indústria, cenário que pode ser
melhor compreendido por meio dos trabalhos de Porter e Millar (1985) e McFarlan
(1984).
De acordo com Porter e Millar (1985), o potencial que a TI tem de impactar a
cadeia e o sistema de valor de uma organização varia de acordo com a quantidade
de informação embutida ou requerida por seus processos e produtos, o que pode ser
visualizado por meio da “Matriz de Intensidade de Informação”. De acordo com essa
matriz, as aplicações de TI tendem a ser de grande importância para organizações
cujos produtos e processos contém muita informação, tais como bancos, jornais e
companhias aéreas.
Já o “Grid Estratégico” de McFarlan (1984) permite visualizar como a TI está
relacionada à estratégia e operação do negócio da empresa, focalizando a relação
entre estratégia de TI e carteira de aplicações. O grid dos impactos estratégicos da
TI definem quatro regiões principais:
a) Suporte: as aplicações de TI presentes e futuras possuem pouca
influência na estratégia da organização;
b) Fábrica: as aplicações de TI são importantes para o sucesso da
operação da empresa, mas não há nenhuma aplicação estratégica para
o futuro;
20

c) Transição: a TI está saindo de uma situação de baixa importância para
assumir um papel de importância estratégica na organização, em face
das aplicações de TI planejadas para o futuro;
d) Estratégico: a TI é muito importante na estratégia atual do negócio e
as novas aplicações planejadas manterão essa importância estratégica
no futuro.

ORGANIZAÇÃO E TAREFAS DA EQUIPE DE ADMINISTRAÇÃO

A organização da equipe de administração, no caso distribuído, deve
acompanhar a própria estratégia de descentralização. Controle centralizado de um
banco distribuído não faz sentido. Uma organização plausível seria criar uma equipe
local para cada nó onde o banco reside com autoridade para propor e implementar
mudanças em detalhe no banco local e nos esquemas externos locais. Haveria ainda
uma equipe central com autoridade para coordenar e vetar, se necessário, mudanças
no sistema (a serem implementadas pelas equipes locais).
As tarefas tradicionais da equipe de administração de um banco de dados
(centralizado) incluem o projeto lógico e físico do banco e sua documentação,
definição dos vários esquemas externos em consulta com os analistas de aplicação,
definição dos critérios de autorização, criação de rotinas de recuperação do banco,
monitoração da utilização do banco e reestruturação do banco. No caso de bancos
de dados distribuídos, deve-se acrescentar ainda a tarefa mais geral de garantir a
cooperação entre os usuários em prol de uma compartilhação efetiva dos dados.
Três facetas da administração de um BDD merecem especial atenção:
documentação do banco, administração dos recursos locais de cada sistema e
monitoração do sistema. (A tarefa básica de projeto lógico e físico do banco já foi
brevemente abordada na seção anterior).
A documentação do BDD deve tornar claro a todos os usuários o significado
dos ítens de dados armazenados pelo banco. Isto requer regras para sistematizar a
nomenclatura e a descrição informal dos ítens de dados, definição dos tipos de cada
ítem de dados e regras para traduzir um tipo utilizado em uma máquina para o tipo
equivalente de outra (e.g., representação e precisão de reais em máquinas
21

diferentes). A administração da carga imposta a cada sistema que compõe o BDD
exige, antes de mais nada, a definição de critérios de medição. Feito isto, é necessário
criar regras que assegurem a usuários remotos acesso a recursos locais e que
atinjam um balanceamento entre a carga local e a imposta por acessos remotos.
Administração da carga inclui, também, definir como será cobrado aos usuários
locais e remotos a utilização do sistema. Finalmente, uma vez estabelecidas regras
para administração do banco, a equipe deverá auditar periodicamente o sistema para
assegurar a aderência a tais regras. A carga, tempo de resposta e utilização do
sistema deverá ser constantemente monitorada, prevendo-se reestruturação do
banco ou mudanças nas regras de administração para corrigir desequilíbrios.

PROBLEMAS QUE AFETAM A ADMINISTRAÇÃO

Os problemas a serem enfrentados pela equipe de administração para atingir
os seus objetivos podem ser compreendidos considerando-se três cenários básicos
para um banco de dados distribuído.
Se o BDD resultou da interligação de sistemas existentes então certamente
aparecerão problemas devidos a: heterogeneidade do sistema global, introdução de
padrões globais sem que seja comprometida a autonomia local, critérios de alocação
de custos tendo em vista acessos locais e remotos, além do balanceamento do tempo
de resposta de acessos locais e remotos.
Se o cenário admite a criação de novos bancos locais de forma semi-
autônoma, aparecerão problemas relativos a: definição de regras e responsabilidades
locais, descrição da semântica dos dados definidos localmente, grau de cooperação
entre os núcleos locais, principalmente no que se refere à alocação de recursos para
processamento de acessos remotos.
Finalmente, em um cenário onde o BDD foi criado pela distribuição em nós
homogêneos de um sistema centralizado, haverá o problema fundamental de definir
uma estratégia de distribuição que otimize o tempo de resposta global, sem penalizar
demasiadamente grupos de usuários.
22

REFERENCIAS

ADMINISTRATION oracle7 with distributed option. Belmont,USA : Oracle
Corporation, 1995.

DB2 family solutions. San José : IBM Corporation, 1994

DB2 for mvs/esa. San José,USA : IBM Corporation, 1994.

BELL, David ; GRIMSOM, Jane. Distributed database systems.
Workingham,England : Addison-Wesley, 1992. 410 p.

CASANOVA, Marco Antonio. Princípios de sistemas de gerência de banco de
dados distribuídos. Rio de Janeiro : Campus, 1985. 355 p.

CERI, Stefano ; PELAGATTI, Giusepper. Distributed databases : principles &
systems. New York : McGraw-Hill, 1992. 410 p.

CERICOLA, Osvaldo Vicente. Banco de dados relacionais e distribuído. Rio de
Janeiro : Livros Técnicos e Científicos, 1991. p 213-243.

COMITÊ de gestão empresarial. (COGE). Processamento distribuído em
multiplataforma. Rio de Janeiro : [sn], 1995.

CONGRESSO nacional de novas tecnologias e aplicações em banco de dados.
7. : 1996 : São Paulo. Pág. 107

DATE, C. J. Introdução a sistemas de banco de dados. Rio de Janeiro : Campos,
1989. 513 p.

DISTRIBUTED relacional database architecture. San José,USA : IBM
Corporation, 1995. 477 p.

HOPPER, Teresa (Editor). Distributed relacional database architecture :
connectivity guide. San José ,USA : IBM Corporation, 1995. 477 p.

MARTIN, James. Strategic data planning methodologies. Savant Research
Studies,USA, 1980. 275 p.

ORACLE7 for mvs system administration guide. Belmont,USA : Oracle
Corporation, 1996.

Materiais relacionados

53 pág.

Bancos de dados distribuídos

Unileya

Leandro Bonato

1 pág.

Mapa Mental - Banco de Dados Distribuído

Tony S Silva

70 pág.

BANCO DE DADOS II unidade04

Cris Mercês

1 pág.

Mapa Mental - Data Mining

Tony S Silva

Perguntas relacionadas

Nos bancos de dados centralizados, a transparência é apenas da unidade lógica e física dos dados. Entretanto, para banco de dados distribuídos, out...

Daniela Dani

Os fatores de transparência no banco de dados distribuídos visam também garantir outros aspectos de desempenho e confiabilidade. A partir dessas in...

Daniela Dani

Analisando a sentença a seguir: “Uma coleção de múltiplos bancos de dados logicamente inter-relacionados, distribuídos por uma rede de computadores...

Desafios para Aprender

Aqui está o texto extraído da imagem da pergunta: "Ao realizarmos a comparação entre as soluções de banco de dados centralizados e banco de dados ...

Pedro Morgado

BANCO DE DADOS DISTRIBUÍDOS

NEWTON PAIVA

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Banco de Dados Distribuidos

Continue navegando

Materiais relacionados

Perguntas relacionadas

Nos bancos de dados centralizados, a transparência é apenas da unidade lógica e física dos dados. Entretanto, para banco de dados distribuídos, out...

Os fatores de transparência no banco de dados distribuídos visam também garantir outros aspectos de desempenho e confiabilidade. A partir dessas in...

Analisando a sentença a seguir: “Uma coleção de múltiplos bancos de dados logicamente inter-relacionados, distribuídos por uma rede de computadores...

Aqui está o texto extraído da imagem da pergunta: "Ao realizarmos a comparação entre as soluções de banco de dados centralizados e banco de dados ...

Outros materiais