Baixe o app para aproveitar ainda mais
Prévia do material em texto
Bancos de Dados Temporais: Teoria e Prática Nina Edelweiss Instituto de Informática Universidade Federal do Rio Grande do Sul E-mail: nina@inf.ufrgs.br Resumo Bancos de Dados Temporais permitem armazenar todos os estados de uma aplicação (presentes, passados e futuros), registrando sua evolução com o passar do tempo. Informações temporais são associadas aos dados armazenados (tempo de transação e/ou tempo de validade) para identificá- los ao longo do tempo. Modelos de dados temporais são também utilizados nos processos de modelagem de aplicações, devido ao seu poder de representar não somente os aspectos estáticos da aplicação, mas também seus aspectos dinâmicos e sua evolução temporal. Neste curso serão apresentados conceitos básicos de modelagem temporal e de bancos de dados temporais, aspectos relativos a consultas sobre bancos de dados temporais, análise da evolução de esquemas conceituais quando forem utilizados bancos de dados temporais, diferentes formas de implementação e algumas aplicações onde dados temporais são fundamentais. Abstract The whole temporal evolution of an application, including all the assumed states (past, present and future), can be available when Temporal Databases are used. The identification of data along time is made associating temporal information to stored data (transaction and/or valid time). Temporal data models are also used in application modeling processes, due to their ability of representing not only the static aspects, but also the dynamic ones and the evolution of the application with time. The issues presented in this course include basic concepts of temporal modeling and temporal databases, temporal queries, and considerations about schema evolution in temporal databases, different implementation forms, and some applications that require temporal data. 1 Introdução A maior parte das aplicações atuais têm necessidade de manipular, de alguma maneira, informações históricas – dados relativos a estados passados da aplicação. Os SGBD convencionais, no entanto, não proporcionam suporte a estas informações. A necessidade de suprir esta lacuna fez com que nos últimos 20 anos muitas pesquisas tenham sido realizadas na área de Bancos de Dados Temporais, com o objetivo de definir conceitos e estratégias para tratar de informações históricas. As publicações destas pesquisas foram reunidas em diversas coletâneas de bibliografias [Bolour 82, McKenzie 86, Stam 88, Soo 91, Kline 93, Tsotras 96, Wu 97]. Bancos de Dados Temporais permitem armazenar todos os estados de uma aplicação (presentes, passados e futuros), registrando sua evolução com o passar do tempo [Clifford 95, Edelweiss 94, Jensen 97, Özsoyoglu 95, Tansel 93, Zaniolo 97]. Para que isto seja possível, informações temporais são associadas aos dados armazenados, identificando quando a informação foi definida ou o tempo de sua validade. A noção de tempo, como datas, períodos, duração de validade de informações, intervalos temporais, surge em diferentes níveis: (i) na modelagem de dados, (ii) na linguagem de recuperação e manipulação de dados, e (iii) no nível de implementação do SGBD. No presente curso serão abordados diversos aspectos relativos a Bancos de Dados Temporais. No capítulo 2 será feita uma breve apresentação de conceitos relativos a representação de informações temporais, sendo os diferentes tipos de Bancos de Dados Temporais apresentados no capítulo 3. O capítulo 4 apresenta algumas considerações a respeito de consultas realizadas sobre Bancos de Dados Temporais. Diferentes enfoques para modelos de dados temporais, base ados em modelos relacionais, E-R e orientados a objetos serão vistos no capítulo 5. A evolução do esquema conceitual com o passar do tempo é outro aspecto importante, necessário para a representação da evolução da aplicação que está sendo modelada. As implicações desta evolução quando se trabalha com Bancos de Dados Temporais são abordadas no capítulo 6. Alguns aspectos de implementação de BD Temporais são analisados no capítulo 7 e, para concluir, no capítulo 8 são analisadas algumas áreas de aplicação nas quais a utilização deste tipo de bancos de dados é importante. 2 Conceitos de Representação Temporal Este capítulo tem por finalidade introduzir o leitor nos principais conceitos relativos à representação de aspectos temporais em bancos de dados. A forma de representação escolhida se reflete em interpretações diferentes dos conceitos temporais. As definições completas dos conceitos aqui apresentados podem ser encontradas em [Jensen 94], num glossário consensual de termos relativos a Bancos de Dados Temporais elaborado pela comunidade desta área através de uma discussão realizada através de correio eletrônico. 2.1 Dimensão Temporal Os modelos de dados tradicionais apresentam duas dimensões, representando (1) as instâncias dos dados (linhas de uma tabela), e (2) os atributos de cada instância (colunas desta tabela). Cada atributo de uma instância apresenta um só valor. Se for feita uma alteração deste valor, o anterior é perdido. Por exemplo, se o atributo representa o salário de um funcionário, o banco de dados somente armazena o último valor. Os modelos temporais acrescentam mais uma dimensão aos modelos tradicionais – a dimensão temporal. Esta dimensão associa alguma informação temporal a cada valor. Caso o valor de um atributo seja alterado, o valor anterior não é removido do banco de dados – o novo valor é acrescentado, associado a alguma informação que define, por exemplo, seu tempo inicial de validade. Todos os valores definidos ficam armazenados no banco de dados. No exemplo anterior, todos os valores do salário do funcionário ficam armazenados, cada um associado ao seu tempo de validade. Deste modo é possível acessar toda a história dos atributos, sendo possível analisar sua evolução temporal. 2.2 Ordem no Tempo A dimensão temporal é composta por uma seqüência de pontos consecutivos no tempo, que recebe o nome de eixo temporal. A definição de uma ordem a ser seguida no tempo é fundamental quando utilizada alguma representação temporal. O mais comum é que se assuma que o tempo flui linearmente; isto implica em uma total ordenação entre quaisquer dois pontos no tempo. Em alguns casos pode ser considerado tempo ramificado ("branching time"). Para estes a restrição linear é abandonada permitindo a possibilidade de dois pontos diferentes serem sucessores (ramificação no futuro) ou antecessores (ramificação no passado) imediatos de um mesmo ponto. Uma ramificação no futuro implica que podem ser considerados múltiplos possíveis desenvolvimentos futuros do domínio (por ex., diferentes hipóteses da história futura), enquanto que uma ramificação no passado admite múltiplas histórias passadas do domínio em questão. A combinação "passado linear, futuro ramificado" trabalha com uma só história passada e admite múltiplas histórias futuras, representando desta maneira a realidade atual de uma forma bastante fiel. Uma última opção de ordenação temporal é considerar o tempo circular. Esta forma pode ser utilizada para modelar eventos e processos recorrentes. 2.2.1 Tempo Totalmente Ordenado A maior parte dos modelos temporais se baseia no tempo linearmente ordenado. A ordenação total do tempo pode ser definida com mais precisão através da teoria dos conjuntos, conforme mostrado a seguir [Antunes 97]. Seja T o conjunto não vazio de todos os pontos do tempo. Por definição, T é um conjunto totalmente ordenado pela relação BEFORE (ANTES ), a qual satisfaz à seguinte condição: " ta, tb : ta, tb Î T Ù ta ¹ tb ® (ta BEFORE tb Ú tb BEFORE ta) Para que a relação BEFORE seja uma relação de ordem estrita total é necessário que possua as seguintes propriedades: Irreflexibilidade: " t : t Î T ® Ø(t BEFORE t) Transitividade: " ta, tb, tc : ta, tb, tc Î T Ù ta BEFORE tb Ù tb BEFORE tc ® ta BEFOREtc Assimetrias: " ta, tb : ta, tb Î T Ù ta BEFORE tb ® Ø(tb BEFORE ta) A relação BEFORE é equivalente à relação “ < ” utilizada no âmbito dos números inteiros, sendo este operador muitas vezes utilizado para representar a ordem temporal. 2.3 Tempo Absoluto e Tempo Relativo Outro conceito importante é o que diferencia tempo absoluto de relativo. Tempo absoluto consiste de uma informação temporal que define um tempo específico, definido com uma granularidade determinada, associado a um fato. Exemplo: Flávio nasceu no dia 30/08/73. Um tempo é relativo quando sua validade é relacionada à validade de outro fato, ou ao momento atual. Exemplo: o salário aumentou ontem; a loja abriu dois meses depois da abertura do Shopping. 2.4 Variação Temporal Duas formas basicamente diferentes de variação temporal podem ser consideradas: tempo contínuo e tempo discreto. Supõe -se que o tempo é contínuo por natureza. Entretanto, sem grande perda de generalidade, o tempo pode ser considerado como discreto. Esta segunda forma de representação simplifica consideravelmente a implementação de modelos de dados. Modelos de dados que suportam uma noção discreta de variação temporal são baseados em uma linha de tempo composta de uma seqüência de intervalos temporais consecutivos, que não podem ser decompostos, de idêntica duração. Estes intervalos são denominados chronons. A duração particular de um chronon não é necessariamente fixada no modelo de dados, podendo ser definida em implementações particulares do modelo de dados. Considerando variação temporal discreta, a definição de informações ao longo do tempo, sob ponto de vista de sua validade, pode ser feita das seguintes formas (Figura 2.1): · variação ponto a ponto – o valor definido vale somente no ponto temporal onde foi definido. Não existe valor válido nos pontos para os quais não foram definidos valores; · variação por escada – o valor fica constante desde o ponto em que foi definido até o instante em que outro valor seja definido. Corresponde, geralmente, à definição de valores em conseqüência da ocorrência de eventos (variação por eventos); · variação temporal definida por uma função – existe uma função que define os valores e que permite a interpolação para obter os valores nos pontos não definidos. Esta função de interpolação pode ser definida pelo usuário ou incluída na modelagem conceitual. chronon t v PONTO A PONTO t v DEFINIDA POR UMA FUNÇÃO t v EM ESCADA Figura 2.1: Formas de variação temporal discreta 2.5 Granularidade Temporal A granularidade temporal de um sistema consiste na duração de um chronon. Entretanto, dependendo da aplicação considerada, às vezes é necessário considerar simultaneamente diferentes granularidades (minutos, dias, anos) para permitir uma melhor representação da realidade. Por exemplo, em um determinado segmento modelado, a granularidade pode ser diária (o chronon equivale a um dia), enquanto que em outro segmento a granularidade pode ser mensal. Embora o chronon do sistema seja único, é possível manipular estas diferentes granularidades através de funções e operações disponíveis nos sistemas gerenciadores do banco de dados que implementam o mode lo. 2.6 Elementos Primitivos de Representação Temporal 2.6.1 Instante no Tempo O conceito de instante, representando um particular ponto no tempo, depende da forma de variação temporal considerada. Quando é considerado tempo contínuo, um instante é um ponto no tempo de duração infinitesimal. Neste caso os instantes são isomórficos com os números reais, o que significa que entre dois pontos do tempo sempre existe um outro ponto no tempo. Quando, no entanto, é considerada a variação temporal discreta, um instante é representado por um dos chronons da linha de tempo suportada pelo modelo. Na variação discreta, os instantes são isomórficos aos números inteiros ou a um subconjunto destes. Assim, entre dois pontos do tempo consecutivos não existe outro ponto do tempo. Diz-se que um evento ocorre no tempo t se ocorre em qualquer tempo durante o chronon representado por t. Um chronon, que é a menor duração de tempo suportada por um SGBD temporal, pertence à representação discreta de tempo. Considerando a ordem de variação temporal linear, temos a existência de um instante especial, correspondente ao instante atual (now), o qual se move constantemente ao longo do eixo do tempo. Este ponto define o que é considerado como passado (qualquer ponto anterior a este) e como futuro (qualquer ponto posterior a ele). 2.6.2 Intervalo Temporal Um intervalo temporal é caracterizado pelo tempo decorrido entre dois instantes – um subconjunto de pontos do eixo temporal. Depende também da forma de representação temporal definida no modelo. Quando é considerado tempo contínuo, o intervalo consiste de infinitos instantes de tempo. Na variação discreta um intervalo é representado por um conjunto finito de chronons consecutivos. É representado pelos dois instantes que o delimitam. Dependendo da pertinência ou não dos instantes limites ao intervalo este pode ser aberto (os limites não pertencem ao intervalo), semiaberto (um dos limites pertence ao intervalo) ou fechado (ambos os limites pertencem ao intervalo). Quando um dos limites é representado pelo instante atual (now) temos a representação de um intervalo particular cujo tamanho varia com a passagem do tempo. Um intervalo temporal é representado por [t1, t2], onde t1 é o primeiro ponto do intervalo (limite inferior) e t2 é o último (limite inferior). O próprio eixo temporal T pode ser considerado um intervalo de tempo, identificado pela expressão [«, »], onde o símbolo « o instante temporal de início da contagem de tempo e o símbolo » representa o final. Para qualquer intervalo temporal, uma das duas fórmulas a seguir deve ser verdadeira: t1 < t2 ou t1 = t2. A segunda representa um intervalo cuja duração é exatamente um chronon. Um intervalo temporal também é totalmente ordenado pela relação BEFORE, sendo possível, através dos operadores first e last [Clifford 88], extrair-lhe o primeiro e o último ponto de tempo. É o que se passa a demonstrar. Seja I, um intervalo de tempo e I Í T, então: first ( I ) é o elemento t Î I tal que, " t' Î I : t BEFORE t' Ú t = t' last ( I ) é o elemento t Î I tal que, " t' Î I : t' BEFORE t Ú t' = t Para que um conjunto de pontos do tempo seja realmente considerado um intervalo, é necessário que sejam consecutivos, isto é, não pode haver qualquer lacuna entre eles. Esta condição é formalmente representada pela expressão abaixo: Seja I Í T um intervalo, então " ta Î I : ta ¹ last ( I ) ® $ tb Î I : ( ta BEFORE tb Ù Ø$ tc Î T : ta BEFORE tc Ù tc BEFORE tb ) 2.6.3 Elemento Temporal Elemento temporal é uma união finita de intervalos de tempo. Estes intervalos podem ser disjuntos, o que realmente o diferencia dos demais e enriquece o seu poder de expressão – por exemplo, um possível elemento temporal seria a união dos intervalos [25, 40] e [51, 70]. O elemento temporal é fechado para as operações de união, interseção e complemento da teoria dos conjuntos, isto é, qualquer destas operações sobre um elemento temporal produz um novo elemento temporal. Como estas operações encontram contrapartida nos operadores booleanos or, and e not, isto produz uma substancial simplificação na habilidade do usuário de expressar consultas temporais. Tendo em vista que todos os intervalos temporais são subconjuntos do eixo temporal T, um elemento temporal, sendo composto por diversos intervalos temporais, também o é. Tanto um intervalo temporal como um instante temporal ([t, t]) são elementos temporais. Em termos de modelagem, o elemento temporal se mostra superior ao uso da primitiva intervalo de tempo pois, quando os intervalos são usados como rótulos temporais, osobjetos são fragmentados em várias tuplas, uma para cada intervalo. Outro aspecto importante desta primitiva temporal é que possibilita a representação da “reencarnação” de objetos com facilidade. Um exemplo da necessidade deste aspecto seria uma pessoa ser funcionário de uma empresa durante o intervalo [1992, 1995], tendo saído da empresa em 1995 e sendo readmitida dois anos depois (1997). A validade da existência desta pessoa na empresa seria a união dos intervalos [1992, 1995] U [1997, »]. 2.6.4 Duração Temporal A representação de um duração temporal pode também ser considerada como primitiva. Durações temporais podem ser basicamente de dois tipos, dependendo do contexto em que são definidas: fixas e variáveis. Uma duração fixa independe do contexto de sua definição. Um exemplo típico de uma duração fixa é uma hora que tem sempre, independentemente do contexto de sua utilização, a duração de 60 minutos. Já a duração variável depende do contexto, sendo um exemplo típico a duração de um mês, que pode ser de 28, 29, 30 ou 31 dias. 2.7 Limites do Tempo O conceito de limites no tempo pode variar dependendo da representação temporal utilizada. Quando considerados somente pontos no tempo, os limites do tempo se referem a considerar ou não o tempo como infinito. O conceito de tempo infinito consiste em considerar que todo ponto no tempo apresente sempre um sucessor e um antecessor. Em modelos orientados a objetos este conceito fica limitado, por exemplo, ao tempo de vida de um objeto. No caso das teorias baseadas em intervalos, os limites do tempo se referem geralmente à pertinência ou não dos pontos limites ao intervalo, definindo se os intervalos são abertos ou fechados em um ou em ambas as extremidades. 2.8 Representação Temporal Expl ícita e Implícita A definição de tempo pode ser feita de forma explícita, através por exemplo da associação de um valor temporal a uma informação na forma de um rótulo temporal (timestamping), ou de forma implícita através da utilização de uma linguagem de lógica temporal. A associação explícita de tempo às informações consiste em associar a cada valor atribuído a um atributo, o valor que corresponde à sua primitiva temporal. A representação temporal implícita é feita através da manipulação de conhecimentos sobre a ocorrência de eventos ou do relacionamento de intervalos de tempo como, por exemplo: a aula de lógica temporal ocorreu ontem. 2.9 Tempo de Transação e Tempo Válido Três diferentes conceitos temporais podem ser identificados em aplicações de bancos de dados [Snodgrass 85]: (i) tempo de transação, tempo no qual o fato é registrado no banco de dados; (ii) tempo de validade, tempo em que o valor é válido na realidade modelada; e (iii) tempo definido pelo usuário, consistindo de propriedades temporais definidas explicitamente pelos usuários em um domínio temporal e manipuladas pelos programas de aplicação. Estes tempos são ortogonais, podendo ser tratados separadamente ou em conjunto. O tempo de transação é suprido automaticamente pelo sistema gerenciador de banco de dados, enquanto que o tempo de validade é fornecido pelo usuário. O tempo de validade pode ser representado de formas distintas, dependendo do elemento temporal básico utilizado no modelo. Quando for utilizado o elemento temporal ponto no tempo, o tempo de validade pode ser representado: (i) através de um ponto no tempo indicando o início da validade, permanecendo o valor válido até que inicie o tempo de validade de outro valor; ou (ii) através de dois pontos no tempo, o primeiro indicando o início da validade e segundo, o final da validade. Nos modelos que utilizam o intervalo temporal como elemento temporal básico, o tempo de validade é definido através do intervalo de validade do valor. 3 Bancos de Dados Temporais Um banco de dados temporal é aquele que apresenta alguma forma implícita de representação de informações temporais. Podem ser utilizados o tempo de transação e/ou o de validade para representar esta informação temporal. Conforme a forma utilizada, os bancos de dados podem ser classificados em quatro tipos diferentes: bancos de dados instantâneos, de tempo de transação, de tempo de validade e bitemporais. 3.1 Bancos de Dados Instantâneos Corresponde aos bancos de dados convencionais, onde são armazenados somente os valores presentes. A cada modificação no valor de uma propriedade, o valor anteriormente armazenado é destruído e somente o último valor está disponível. A figura 3.1 apresenta algumas atualizações feitas em momentos diferentes em um banco de dados instantâneo. Cada estado do banco de dados corresponde a um instantâneo (snapshot). A manutenção de informações temporais neste tipo de banco de dados somente pode ser realizada explicitamente, pela inclusão de atributos definidos sobre o domínio tempo, e pela sua manipulação através dos programas de aplicação. Estados Passados Estado Atual João Silva, 01/jan/92, 800,00 Mara Dias, 01/mar/91, 1.200,00 Figura 3.1: Banco de Dados Instantâneo 3.2 Bancos de Dados de Tempo de Transação Uma alternativa para armazenamento de informações temporais é associar a cada valor definido o tempo de transação, sob forma de um rótulo temporal (timestamp). Este tempo é fornecido automaticamente pelo SGBD, sendo esta operação transparente ao usuário. A alteração do valor de uma propriedade não destrói o valor anteriormente definido, ficando todos os valores armazenados no banco de dados. O estado atual do BD é composto pelos últimos valores definidos para cada uma das propriedades. Bancos de dados deste tipo são denominados de bancos de dados de tempo de transação. Na figura 3.2 estão representadas atualizações do salário de um funcionário. t1 t2 t3 tpresente 01/jan/92 01/jun/92 01/jan/93 Momento Atual 900 1000 800 História do salário de João Tempo Figura 3.2: Banco de Dados de Tempo de Transação Caso o dia em que é procedida a atualização do salário não coincida com o dia em que começa a sua validade, a data de início de validade pode ser armazenada como um atributo explícito, como mostrado na figura 3.3. t1 t2 t3 tpresente 03/jan/92 25/mai/92 10/jan/93 Momento Atual (900, 01/jun/92) (1000, 01/jan/93) (800, 01/jan/92) História do salário de João Tempo Figura 3.3: Banco de Dados de Tempo de Transação 3.3 Bancos de Dados de Tempo de Validade Um terceiro tipo de banco de dados, denominado banco de dados de tempo de validade, associa a cada informação somente o tempo de sua validade no mundo real. Este pode representar o início de sua validade (ponto no tempo, variação por degraus), a validade somente naquele ponto no tempo (variação discreta), ou seu intervalo de validade. O tempo de validade deve sempre ser fornecido pelo usuário. Em bancos de dados de tempo de validade não se tem acesso ao tempo em que a informação foi definida, sendo armazenado somente o tempo em que a mesma é válida. A figura 3.4 apresenta um exemplo deste tipo de banco de dados, também atualizando o salário de um funcionário. t1 t2 t3 tpresente 800 900 1000 01/jun/92 01/jan/92 01/jan/93 Tempo História do salário de João Momento Atual Figura 3.4: Banco de Dados de Tempo de Validade Este tipo de banco de dados permite se sejam corrigidas informações do passado - se alguma das informações tiver sido registrada incorretamente, é feita uma nova definição com a data de validade correspondente, sendo que somente a versão atual dos dados é a disponível. 3.4 Bancos de Dados Bitemporais A forma mais completa de armazenar informações temporais são os bancos de dados bitemporais, nos quais os tempos de transação e de validade são associados a cada informação. Toda a história do banco de dados fica armazenada. É possível ter acesso a todos os estados passados do banco de dados - tanto a história das transações realizadas, como a história da validade dos dados. O estado atual do banco de dados éconstituído pelos valores atualmente válidos. Valores futuros podem ser definidos através do tempo de validade, sendo possível recuperar o momento em que estes valores foram definidos para eventuais alterações. Como exemplo deste tipo de banco de dados apresentamos, na figura 3.5, toda a história da atualização do salário do funcionário João. Pode -se saber não somente o valor atual do salário, como o valor que era válido em qualquer data passada e ainda aqueles valores que se acreditava como válidos mas que em datas posteriores foram modificados. História das transações do salário de João História da validade do salário de João 01/jan/92 800 800 900 900 1000 1000 03/jan/92 25/mai/92 10/jan/93 01/jun/92 01/jan/93 Tempo de Transação Momento Atual Tempo de Validade Figura 3.5: Banco de Dados Bitemporal 4 Consultas a Bancos de Dados Temporais Quando é utilizado um banco de dados temporal, é importante que também esteja disponível uma linguagem de consulta temporal. Esta linguagem deve possibilitar a recuperação de todas as informações armazenadas no banco de dados (temporais ou não), de modo a que seja tirado real proveito do acréscimo da dimensão temporal. Consulta temporais permitem: · fornecer valores de propriedade s cujo domínio é temporal. Exemplo: fornecer o valor da propriedade que armazena a data de nascimento de uma pessoa; · se referir a um determinado instante ou intervalo temporal. Exemplo: qual o valor do salário no dia 01/01/94; · recuperar valores com base em restrições temporais. Exemplo: recuperar todos os valores do salário antes do dia 01/01/94; · fornecer informações temporais (datas, intervalos). Exemplo: qual a data em que foi alterado o salário de um funcionário. Para que isto seja possível, as linguage ns de consultas temporais devem ser enriquecidas para manipular a dimensão temporal, e ter capacidade de dedução sobre tempo com base nas informações temporais armazenadas. Isto é possibilitado através da utilização de lógica temporal, a qual permite inferências de valores não explicitamente armazenados. 4.1 Problemas no Processamento de Consultas Temporais O processamento de consultas temporais apresenta diversos problemas além daqueles usualmente enfrentados. Entre eles podemos citar: · o grande volume de dados armazenado em um banco de dados temporal implica na necessidade de novos métodos de indexação (estruturas e algoritmos de busca); · métodos tradicionais de indexação só podem ser utilizados para valores com algum tipo de ordenação completa, com estruturas de acesso para intervalos; · manipulação de informações incompletas, devido a valores incompletos ou inexistentes, a partir dos quais devem ser inferidas informações. Podem ser devido (i) à incerteza quanto à existência do objeto em certos pontos no tempo, ou (ii) à indeterminação temporal, causada por eventos cujo tempo de ocorrência não é conhecido 4.2 Tipos de Bancos de Dados e Diferentes Histórias As consultas temporais que podem ser formuladas a um banco de dados temporal dependem do tipo de banco de dados e da história considerada. Os bancos de dados instantâneos não apresentam suporte para informações temporais, não permitindo portanto consultas temporais. Nos bancos de dados de tempo de transação podem ser feitas consultas a (i) valores atuais das informações armazenadas, (ii) valores definidos em tempos passados. O tempo de transação associado implicitamente à informação identifica o instante para o qual se quer a informação. A validade das informações somente pode ser armazenada através de atributos explícitos, e sua recuperação seria através destes atributos. Exemplo: recuperar o salário de um funcionário no dia (tempo de transação) 01/01/97. Nos bancos de dados de tempo de validade podem ser recuperadas informações válidas em momentos presentes e passado s, além de valores armazenados sob forma de previsão para o futuro, de acordo com a atual percepção da história dos dados. Exemplo: recuperar o salário válido de um funcionário no dia 01/01/98. Os bancos de dados bitemporais permitem que sejam feitas consultas a respeito de valores atuais, passados e futuros, considerando o tempo de transação e o de validade. Qualquer estado do banco de dados pode ser consultado (atual, passado, ou previsto para o futuro). Quando considerado o estado atual do banco de dados, a recuperação é sobre a atual percepção dos dados. Os estados passados representam valores que se acreditava válidos em datas passadas e que, posteriormente, foram redefinidos. O conjunto de todos estes estados (passados, atual e futuros) de um banco de dados caracteriza a sua história. Um banco de dados bitemporal permite que se tenha registro de todas as histórias passadas. A história presente corresponde ao conhecimento presente a respeito do presente, a respeito do passado e a respeito do futuro. Uma história passada corresponde ao conhecimento que existia naquele momento a respeito do presente, do passado e do futuro, sendo definida por um tempo de transação – informações definidas após este tempo não devem ser consideradas, uma vez que não eram conhecidas. A consulta deve definir, através de alguma cláusula que define o tempo de transação que deve ser considerado como limite, o instante correspondente à história considerada. 4.3 Consultas Temporais Vamos analisar, a seguir, as diferentes formas que podem apresentar as consultas quando utilizados bancos de dados temporais. Para maior generalidade serão considerados somente bancos de dados bitemporais, os quais englobam os outros tipos de bancos de dados. Uma consulta apresenta dois componentes ortogonais: um componente de seleção e um de saída (projeção). O componente de seleção geralmente é representado através de uma condição lógica. Quando a condição envolve valores temporais é utilizada lógica temporal. Diversos operadores para tratar valores temporais são necessários, tais como operadores booleanos (antes, depois, durante) e operadores que retornam valores temporais (depois, agora, início_de_intervalo, distância_temporal). As condições podem envolver valores de dados e valores temporais associados aos dados (tempo de transação e/ou de validade). Conforme o componente de seleção, as consultas ser classificadas em: (1) consultas de seleção sobre dados - quando as condições são estabelecidas somente sobre valores de dados. Exemplo: selecionar o salário do funcionário de nome Carlos. É importante ressaltar que quando forem utilizados tipos de dados temporais, tais como datas e horas, a utilização destes na condição de seleção representa uma seleção sobre dados e não uma seleção temporal. Exemplo deste último caso: selecionar o nome dos empregados que apresentam data de nascimento posterior a 01/01/1980; (2) consultas de seleção temporal - são as consultas nas quais somente informações temporais associadas aos dados (tempo de transação e/ou tempo de validade) são analisadas pela condição de seleção. Exemplo: selecionar todos os empregados da empresa durante o período de 01/01/96 a 01/01/97. (3) consultas de seleção mista - a condição de seleção atua não somente nos dados mas também nas informações temporais associadas a eles. Exemplo: selecionar todos os empregados do departamento denominado entregas que estavam habilitados para dirigir automóveis durante o período de 01/01/95 a 01/07/95. Analisando agora o componente de saída, na consulta podem ser solicitados valores de dados e/ou valores relativos às informações temporais associadas aos dados. Podemos ter, portanto: (1) consultas de saídas de dados - nas quais as informações selecionadas correspondem exclusivamente a valores de dados. Exemplo: selecionar o nome dos funcionários do departamento entregas”; (2) consultas de saídas temporal - recuperam informações abstraídas das informações temporais associadas aos dados. Deste modo podem ser recuperados pontos notempo, intervalos temporais e durações temporais. Exemplo: selecionar todos os períodos nos quais qualquer empregado do departamento de entregas estava habilitado a dirigir automóveis; (3) consultas de saída mista - recuperam simultaneamente valores de dados e valores temporais associados a estes dados. Exemplo: selecionar os valores de salário com os respectivos tempos de validade para o empregado chamado João entre 01/01/95 e 01/01/96”. Analisando as possíveis combinações entre os componentes de seleção e de saída de uma consulta observamos que a única combinação que não pode ser utilizada é a de seleção temporal com saída temporal - devemos ter algum dado envolvido em pelo menos um dos componentes. A recuperação de valores de uma determinada história do banco de dados depende da condição estabelecida no componente de seleção. Por exemplo, para recuperar informações relativas a dados de um determinado dia do passado é necessário que o componente de seleção apresente alguma seleção temporal - a seleção do instante passado considerado. Para recuperar dados referentes a uma história passada o componente de seleção deve definir a data-base desta história (algo como conforme se acreditava em 01/01/60). Na recuperação de dados históricos podem ser considerados valores válidos (considerando o tempo de validade associado ao valor) ou instantes em que os valores foram definidos (ao considerar o tempo de transação. Pode-se, por exemplo, consultar o valor válido para o salário de um funcionário em um determinado dia, e a data em que este valor foi definido. 4.4 Consultas e o Paradigma de Orientação a Objetos Modelos de dados orientados a objetos requerem propriedades especiais para a recuperação de informações. Os objetos apresentam atributos (propriedades) cujos valores são definidos em domínios específicos. Os domínios podem ser simples (como, por exemplo, inteiros e reais) ou complexos, representados por nomes de classes, listas e conjuntos. Os valores assumidos por estas propriedades são instâncias das classes especificadas como domínios. Assim, o valor de uma propriedade cujo domínio é uma classe será uma instância desta classe – um objeto. Várias soluções podem ser adotadas para a recuperação de valores de propriedades cujos domínios são classes, como por exemplo: (i) devolver o identificador do objeto recuperado, embora este identificador seja usualmente interno ao sistema e, portanto, não acessível ao usuário; (ii) listar os valores de todas as propriedades do objeto, identificando os objetos referentes às propriedades recursivamente até que todas as propriedades sejam definidas em domíni os simples; (iii) listar somente os valores referentes a propriedades simples do objeto identificado; ou (iv) fornecer o(s) valor(es) de alguma(s) propriedade(s) identificada(s) pelo modelo como especial para esta finalidade. As propriedades cujo domínio são listas ou conjuntos também podem apresentar objetos (instâncias de classes). A recuperação de informações para estes casos requer que todos os objetos sejam devolvidos pela linguagem de consulta. Outro problema envolvido na recuperação de informações em um modelo de dados orientado a objetos consiste na possível hierarquia de classes existente. Uma classe pode apresentar um conjunto de subclasses e um conjunto de superclasses. Quando o domínio de uma propriedade for uma classe, todas as subclasses desta (diretas ou indiretas) são também possíveis domínios desta propriedade. A recuperação de informações deve navegar através de toda a hierarquia para fornecer todos os valores definidos. Informações temporais são geralmente associadas aos objetos (representando a vida do objeto – tempo de criação, eventuais intervalos de suspensão e tempo em que sua existência terminou) e aos atributos (representando os tempos de definição de seus valores). Nos dois casos podem ser utilizados tempos de transação e/ou de validade. A linguagem de consulta deve permitir a recuperação de valores temporais de objetos e de seus atributos, os quais devem ser analisados em conjunto com a solução adotada para a recuperação de informações de domínios complexos. 4.5 Linguagens de Consulta Textuais e Visuais A maioria dos modelos de dados temporais apresentam linguagens de consulta textuais, geralmente derivadas do SQL. Dentre estas, a mais conhecida é TSQL2, a ser apresentada na seção 5.1.2 deste texto. A linguagem textual de consulta exige que o usuário conheça sua sintaxe, esteja bastante familiarizado com o esquema do banco de dados e saiba quais os objetos que podem mudar de valor ao longo do tempo. Uma linguagem visual de consulta permite a recuperação de informações sem que o usuário conheça a sintaxe da linguagem de consulta. A consulta pode ser realizada de uma forma amigável, através da utilização de símbolos visuais (ícones, diagramas, sinais) e um conjunto de regras para utilização dos mesmos na recuperação de informações. A representação visual dos objetos do banco de dados e de seus relacionamentos, possibilita ao usuário uma melhor percepção da realidade, o que não acontece com o uso de linguagens de consulta textual, como SQL. Algumas propostas de linguagens visuais de consulta pa ra bancos de dados temporais têm sido publicadas recentemente [Carvalho 97, Kouramajian 95, Oberweis 94]. No Visual Query System TF-ORM [Carvalho 97] a consulta é realizada através de um interface gráfico, formado por diversas janelas. Uma destas apresenta uma representação gráfica do esquema conceitual (Figura 4.1) no modelo TF-ORM [Edelweiss 93]. O usuário realiza a consulta navegando sobre este esquema gráfico e selecionando os elementos de interesse para elaboração da consulta. Os elementos selecionados vão sendo apresentados em outra janela, onde aparece somente a parte do esquema conceitual envolvida na consulta, e sobre a qual se definem as condições impostas à consulta. Figura 4.1: Esquema conceitual TF-ORM gráfico Além destas duas janelas, o sistema possui um conjunto de janelas para serem utilizados no complemento da consulta - definição de restrições, temporais ou não, sobre os elementos selecionados no esquema conceitual gráfico ou sobre a consulta como um todo (Figuras 4.2). Figura 4.2: Janela onde é definido o tempo de consulta 5 Modelos de Dados Temporais A representação dos aspectos temporais na especificação de um sistema de informação é importante por mais de um motivo: (i) o sistema pode apresentar informações temporais a serem introduzidas no banco de dados que o representa, sob forma de informação propriamente dita; (ii) processos a serem executados podem apresentar interações temporais, interações estas que devem também ser representadas; (iii) determinadas tarefas podem apresentar pré-condições à sua execução, as quais podem ser representadas através de restrições temporais; e (iv) condições de integridade temporal do banco de dados podem ser necessárias. Para que isto tudo seja possível, é necessário que seja utilizado um modelo de dados temporal adequado. Um modelo de dados deve apresentar uma estrutura de objetos que podem ser manipulados por esta linguagem, uma linguagem para atualizar estes objetos (update), uma linguagem de consulta, e algum mecanismo para expressar restrições de integridade. Os modelos de dados temporais também devem apresentar estas características, acrescentando a possibilidade de representar informações temporais, efetuar consultas temporais, e permitir a definição de restrições de integridade temporal. Para este último aspecto geralmente é utilizada lógica temporal de primeira ordem. Os seguintes aspectos devem ser considerados ao ser analisado um modelo de dados temporal: · identificar o tipo de rótulo temporal utilizado pelo modelo (ponto no tempo, intervalo temporal, elemento temporal, duração); · analisar a forma de variação temporal dos atributos (podem ou não variar com o tempo,todos ou alguns); · verificar se os rótulos temporais são explícitos ou implícitos; · homogeneidade temporal; · apresentação e funcionalidades da linguagem de consulta. Em lugar de definir novos modelos para tratar dos aspectos temporais, diversos modelos de dados tradicionais foram estendidos para possibilitar a representação de aspectos temporais. 5.1 Extensões do Modelo Relacional Os modelos relacionais se baseiam na representação de relacionamentos entre elementos. Ao ser utilizado um modelo temporal, estes relacionamentos devem ser representados ao longo do tempo. Informações adicionais a serem acrescentadas: · tempo de início do relacionamento; · variação do relacionamento com o tempo; · término do relacionamento; · reincarnação de relacionamentos; · restrições de integridade referencial com respeito à dimensão temporal. Um banco de dados relacional apresenta um conjunto de relações, sendo que cada relação é composta por um conjunto de tuplas. Uma instância deste banco de dados é definida pelo conjunto de relações e de todas suas tuplas. Ao ser feita a extensão temporal para um banco de dados relacional, três formas podem ser utilizadas para representar a temporização, dependendo do nível ao qual o tempo é associado: (1) ao banco de dados como um todo – neste caso, cada estado do banco de dados é armazenado completo, com o rótulo temporal. Alterações elementares do BD criam um novo estado; (2) às relações – cada relação é temporizada. Para cada estado, todas as tuplas desta relação devem ser armazenadas, com o rótulo temporal correspondente. Informações globais sobre existência da relação podem ser armazenadas desta maneira; (3) às tuplas – cada tupla é temporizada. Uma alteração elementar de valores de uma relação definem uma nova tupla, e somente esta precisa ser armazenada. Como importantes extensões do modelo relacional podem ser citados os modelos HRDM (Historical Relational Data Model) [Clifford 87, 93], IXRM (Interval-extended Relational Model) [Lorentzos 93] e TRM (Temporal Relational Model) [Navathe 88, 93]. 5.1.1 TSQL2 – Temporal Structured Query Language As pesquisas em bancos de dados temporais vêm sendo desenvolvidas já há 15 anos, resultando na proposta de diversos modelos e linguagens de consulta temporais. A consolidação destas propostas está sendo buscada pela comunidade que pesquisa a área, através da definição de uma linguagem de consulta temporal de consenso. A construção desta linguagem foi feita através de uma discussão via correio eletrônico, que teve início em 1993. Foram envolvidos na discussão pesquisadores de 8 países, abrangendo 4 continentes. A linguagem resultante foi denominada TSQL2 [Snodgrass 95]. A linguagem se baseia em SQL por ser esta a linguagem de consulta mais utilizada atualmente. As seguintes característica foram buscadas na definição do TSQL2: · suporte a períodos de tempo. Em SQL somente date, time, timestamp, interval; · suporte a múltiplas granularidades. Em SQL somente year, month, day, hour, minute, second. Incluir: semestre - semana - estações do ano - ...; · suporte a múltiplas representações. Exemplo: terceira semana de 1999. Em SQL: dia/mes/ano; · suporte a múltiplas linguagens. Exemplo: 29 de setembro de 1997; · suporte a múltiplos calendários (lunar – acadêmico – fiscal - eras geográficas); · suporte a tempo indeterminado. Exemplo: entre 1 e 15 de julho; · suporte a tempo histórico. A linguagem TSQL2 [Snodgrass 95] foi definida para o modelo temporal relacional BCDM – Bitemporal Conceptual Data Model. O Modelo BCDM Trata-se de um modelo conceitual muito simples, que captura a semântica essencial das variações temporais das relações. O modelo foi definido sem levar em consideração problemas de capacidade de armazenamento, que sem dúvida, estão presentes em implementações de bancos de dados temporais. No modelo BCDM o tempo é considerado linear e discreto. É feito suporte a ambos os tempos – de transação e de validade, implementando, portanto, um BD bitemporal. São utilizados rótulos que representam elementos bitemporais. A associação temporal é implícita, sendo o rótulo temporal associado às tuplas, na forma abaixo: X = ( a1, a2, … , an / t ) onde ai são os valores dos atributos da tupla, e t representa o rótulo bitemporal. A cada tupla é associado um subconjunto arbitrário do domínio dos tempos válidos – um fato é válido na realidade modelada durante cada um dos chronons deste subconjunto. Por sua vez, a cada chronon de tempo de validade é associado um subconjunto dos tempos de transação – o fato é válido durante este particular chronon, ou seja, está presente na relação durante cada um dos chronons de tempo de transação do subconjunto. Este o conceito de elemento bitemporal. O exemplo a seguir mostra este tipo de rótulo temporal. Considere a seguinte relação com tuplas definidas (UC: until changed): Empregado Depto T João compras { (5,10),…, (5,15),…, (9,10),…, (9,15), (10,5),…, (10,20),…, (14,5),…, (14,20), (15,10),…,(15,15),…,(19,10),…,(19,15) } João vendas { (UC,10),…,(UC,15) } A primeira tupla associa João ao departamento de compras, durante diversos intervalos temporais. A segunda associa este mesmo funcionário ao departamento de vendas. A interpretação dos rótulos temporais está apresentada nas figuras 5.2 e 5.3. 0 5 10 15 20 25 30 0 5 10 15 TT TV 0 5 10 15 20 25 30 0 5 10 15 TT TV 0 5 10 15 20 25 30 0 5 10 15 TT TV 0 5 10 15 20 25 30 0 5 10 15 TT TV (João, compras) (João, compras) (João, compras) (João, vendas) (João, compras) Figura 5.1: Interpretação do elemento bitemporal 0 5 10 15 20 25 TT 0 5 10 15 20 TV Emp Dept Ts Te Vs Ve João compras 5 9 10 15 João compras 10 14 5 20 João compras 15 19 10 15 João vendas 20 UC 10 15 elemento bitemporal particionado pelo tempo de transação Figura 5.2 – Interpretação do elemento bitemporal – tempo de transação A Linguagem de consulta TSQL2 Na linguagem TSQL2 a seleção e a projeção são feitas sobre o rótulo temporal, envolvendo, portanto, tempo de transação e de validade. Foram definidos diversos operadores de seleção: · extratores – que têm por objetivo extrair alguma informação temporal do rótulo. Por exemplo, o operador BEGIN extrai o início de validade de uma atributo; · construtores – constróem elementos temporais a partir de elementos temporais. Por exemplo, INTERSECT retorna o conjunto de intervalos temporais resultante da interseção de dois intervalos considerados; · de comparação – operadores lógicos que comparam intervalos temporais. Por exemplo, OVERLAPS verifica se dois intervalos têm intervalos temporais em comum. Exemplos de consultas em TSQL2 “Listar o nome dos funcionários que estiveram empregados em janeiro de 1992” SELECT Name FROM Employee WHERE VALID (Employee) OVERLAPS PERIOD ‘[01/01/1992, 01/31/1992]’ “Listar o nome dos funcionários que foram registrados como empregados em janeiro de 1992” SELECT Name FROM Employee WHERE TRANSACTION(Employee) OVERLAPS PERIOD ‘[01.01.92, 31.01.92]’ “Listar o nome de todos os empregados que trabalharam na empresa ao mesmo tempo em que João esteve no departamento de brinquedos” SELECT E1.Name FROM Employee E1, Employee E2 WHERE E2.Name = João AND E2.Dept = “Brinquedos” AND VALID(E1) OVERLAPS VALID(E2) Suporte à indeterminação temporal no TSQL2 Na linguagem de consulta TSQL2 foi providenciado suporte à indeterminação temporal, pois esta está presente na maioria das aplicações. A linguagem permite consultas tais como: · recuperar valores válidos durante um determinado dia; · um fato registrado para ocorrer daqui a 6 meses; · um fato que ocorreu a mais de 5 anos. Para que isto possa ser possível, os atributos sobre os quaisse pode fazer consultas incompletas devem ser identificados como tal durante a definição do esquema. Por exemplo: CREATE TABLE Employee (Birthdate INDETERMINATE DATE) Pode, também, ser definida a faixa de credibilidade que se quer na resposta solicitada, como no exemplo abaixo: SELECT Warehouse, Lot#, Part# VALID R FROM Receive AS R, InProduction AS IP WITH CREDIBILITY 0 WHERE MODEL = ‘ABC’ AND R OVERLAPS IP WITH PLAUSIBILITY 65 5.2 Extensões do Modelo E-R Os seguinte requisitos foram identificados como necessários a um modelo ER temporal [Antunes 97]: · a dimensão temporal deve estar “embutida” no modelo. Desta forma, enquanto que no modelo ER convencional os conjuntos de entidades apresentam apenas duas dimensões, a das tuplas e a dos atributos, no modelo ER temporal passam a apresentar três: a das tuplas, a dos atributos e a do tempo; · deve oferecer uma notação especial para diferenciar entidades temporizadas (que estão associadas ao tempo) de entidades não temporizados (que não estão associadas com o tempo); · deve permitir que uma entidade temporizada se associe com uma entidade não temporizada; · deve permitir que um relacionamento entre entidades possa ser definido como temporizado ou como não temporizado, não importando qual seja a classificação temporal destas entidades; · deve permitir que em uma mesma entidade possam conviver atributos temporizados e atributos não temporizados; · a restrição de cardinalidade que define o grau de participação de uma entidade em um conjunto de relacionamentos temporizados deve considerar os pontos do tempo. Por outro lado, em se tratando de conjunto de relacionamentos não temporizados, a cardinalidade não deve levar em conta os pontos do tempo, mantendo a mesma semântica do modelo ER convencional. Várias extensões à abordagem entidade -relacionamento original têm sido propostas com o objetivo de incorporar a possibilidade de modelar propriedades temporais, entre as quais se destacam: a abordagem ERT (Entity Relationship Time Model) [Loucopoulos 91], a abordagem TER (Temporal Entity-Relationship Model) [Tauzovich 91], a abordagem TEER (Temporal Enhanced Entity-Relationship Model) [Elmasri 93] e a abordagem TempER [Antunes 97]. 5.2.1 O Modelo TempER Este modelo foi desenvolvido com o objetivo de atender a todos os requisitos colocados no início da seção 5.2. O modelo foi concebido com base, principalmente, no modelo ERT. As principais diferenças entre as abordagens situam-se na simbologia e na primitiva temporal adotada - o elemento temporal em lugar do intervalo de tempo. Em uma visão geral, as principais características do modelo de dados TempER são as seguintes: · oferece uma simbologia que diferencia elementos temporizados de elementos não temporizados, semelhante à do modelo ERT; · permite que se associe em um mesmo diagrama entidades temporalizadas com não temporalizadas. As entidades não temporalizadas passam a ser denominadas de “perenes”, sendo assumido que estas também apresentam uma dimensão temporal implícita, igual a todo o conjunto de pontos do eixo temporal. As entidades temporalizadas passam a ser denominadas de “transitórias”; · qualquer que seja a classificação das entidades em relação ao tempo, sejam elas perenes ou transitórias, ortogonalmente sempre apresentam duas perspectivas: uma não temporal e uma temporal. Quando se focaliza os conjuntos de entidades pela perspectiva não temporal estes apresentam apenas duas dimensões (tuplas x atributos não temporais). Por outro lado, quando se focaliza estes mesmos conjuntos pela perspectiva temporal, eles apresentam três dimensões (tupla x atributos temporais x eixo temporal); · no tocante aos relacionamentos, ou as entidades se associam entre si na perspectiva temporal (relacionamentos temporais) ou na perspectiva não temporal (relacionamentos não temporais); · possibilita que as restrições de cardinalidade levem em consideração os momentos do tempo de validade de um relacionamento temporal; · faz uso de um dicionário de dados para descrever os atributos, evitando que estes sejam explicitados graficamente. Isto contribui para tornar os diagramas mais administráveis visualmente. As figuras 5.3 e 5.4 apresentam, respectivamente, um esquema TempER e seu correspondente ER convencional, e um exemplo de povoamento de entidades e de relacionamentos para este esquema. Modelo ER convencional entidade EMPREGADO atributos: ( cod: NATURAL ; nome: STRING ; sal: REALP; datAdmissão: DATE ; datDemissão: DATE ) identificador: (cod ) entidade DEPTO atributos: ( sigdep: STRING ; nomdep: STRING ; datCriação: DATE ; datFecham: DATE ) identificador: (sigdep) relacionamento LOTAÇÃO atributos: ( datinicLot: DATE ; datfimLot: DATE ) Modelo ER temporal - TempER Empregado Lotação Depto( 1, 1 ) ( 0, N ) Tr T entidade EMPREGADO atributos: ( cod: NATURAL, Intemporal; nome: STRING, Intemporal; at-sal: REALP, Temporal ) identificador: (cod ) relacionamento LOTAÇÃO atributos: ( - ) entidade DEPTO atributos: ( sigdep: STRING, Intemporal; nomdep: STRING, Intemporal ) identificador: (sigdep) Empregado Lotação Depto( 1, N ) ( 0, N ) Tr Figura 5.3 – Exemplo de esquema TempER e o correspondente ER 5.3 Extensões de Modelos Orientados a Objetos O tratamento de tempo em modelos de dados orientados a objetos está presente em diversos modelos recentemente apresentados [Cheng 93, Su 91, Wuda 92, Wuu 93]. Entretanto, a representação de aspectos temporais em bancos de dados orientados a objetos tem sido feita nestes modelos de uma forma bastante limitada. Em sua grande maioria os aspectos temporais são tratados da mesma forma como o foram nos modelos relacionais, não sendo levada em consideração a natureza da orientação a objetos e dos problemas que podem advir da utilização deste paradigma. [ 3,10 ] U 1001 e1 Gadia 180 [ 3, 6 ] [ 20, » ] 220 [ 7, 10] U [ 20, 25] 250 [ 26, » ] [ 7, 35 ] 1002 e2 Segev 110 [ 7, 20] 180 [ 21, 35] [ 2, 20 ] U 1003 e3 Clifford 200 [ 2, 20] U [ 30, 35] [ 30, » ] 250 [ 36, » ] [ 25, » ] 1004 e6 Snodgrass 100 [ 25, 30 ] 130 [ 31, » ] [ 5, 25 ] 1005 e8 Jajodia 100 [ 5, 25 ] [ 10, » ] 1006 e4 Tansel 170 [ 10, 20] 190 [ 21, » ] O I D cod nome at-salExistência Entidade Empregado O I D EMPREGADO O I D DEPTO Validade Temporal [ 3, 10 ] U 1001 9011 [ 20, 30 ] [ 31, » ] 1001 9013 [ 7, 20 ] 1002 9011 [ 21, 35 ] 1002 9014 [ 2, 10 ] U 1003 9011 [ 15, 18] U [ 30, 35 ] [ 11,14 ] U 1003 9012 [ 19, 20 ] [ 36, » ] 1003 9014 [ 25, » ] 1004 9014 [ 5, 15 ] 1005 9012 [ 16, 25 ] 1005 9013 [ 10, 20 ] 1006 9012 [ 21, » ] 1006 9014 Relacionamento Lotação Entidade Depto O I D sigdep nomdepExistência [ 1, » ] 9011 defin financeiro [ 3, 20 ] 9012 desis sistemas [ 10, » ] 9013 depro produção [ 21, » ] 9014 deinf informática [ 7, 30 ] 9015 demat materiais Figura 5.4 – Exemplo de povoamento de entidades e relacionamentos em TempER A utilização de um modelo temporal orientado a objetos tem por finalidade a representação de todos os estados assumidos pelo objeto durante sua existência. Para que isto seja possível é necessário que o modelo permita a representação do comportamento que o objeto deve apresentar durante sua evolução. Os seguintes aspectos devem ser considerados nestes modelos: · a forma utilizada para a representação temporal - a temporização pode ser efetuada em dois níveis diferentes: (1) nos objetos, representando a evolução do objeto como um todo, sendo registrados o instante em que o objeto é criado, suas eventuais suspensões de atividade, o final de sua existência, e possíveis ressurreições; e (2) nos atributos, representando a variação temporal do valor de um atributo de um objeto; · como se dará a alteração durante a evolução, tantono nível de classes como no de objetos das classes – de forma contínua, discreta ou por degraus; e · a possibilidade de migração de objetos entre classes; e · a eventual evolução dos esquemas conceituais (criação de novas classes, alterações nas hierarquias de generalização/agregação, alteração de atributos, etc.). Deste aspectos acima citados, o mais complexo é a possibilidade de migração de objetos entre classes. Quando permitido, geralmente é restrito à migração entre classes / subclasses. A migração genérica entre quaisquer duas classes apresenta restrições semânticas muito fortes. Mesmo nos casos de migração entre classes / subclasses, diversas restrições e mecanismos são impostos a esta migração. Entre elas: (1) quando a migração é por especialização com herança simples, novas propriedades são acrescentadas ao objetos, devendo seus valores ser definidos pelo usuário ou considerados nulos; (2) quando for por especialização com herança múltipla, todas as propriedades das novas superclasses devem ser adicionadas ao objeto, sendo seus valores também definidos pelo usuário ou considerados nulos; (3) quando for por generalização por herança simples, todas as propriedades específicas das subclasses devem ser removidas do objetos; e (4) quando for por generalização por herança múltipla, além das propriedades específicas das subclasses, todas aquelas que foram herdadas de outras subclasses devem também ser removidas. 5.3.1 TF-ORM TF-ORM (Temporal Functionality in Objects With Roles Model) [Edelweiss 93, 94a] é um modelo de dados orientado a objetos que utiliza o conceito de papéis para representar os diferentes comportamentos dos objetos. Neste modelo é considerada a representação temporal dada por rótulos bitemporais, sendo o elemento temporal primitivo o ponto no tempo. A variação temporal é discreta, por escada, e a menor granularidade o minuto. O modelo TF-ORM apresenta três diferentes tipos de classes: (i) recurso - define a estrutura de um recurso (dado ou documento) em termos dos papéis que este recurso pode apresentar durante seu ciclo de vida, com propriedades, mensagens permitidas e estados; (ii) agente - nas quais pode ser representada a parcela de trabalho não estruturado dos sistemas de informação, que é o poder decisão humana; (iii) processo - integram as classes de recursos e agentes, permitindo a descrição do trabalho realizado. Cada classe é definida por um nome, um papel básico e um conjunto de outros papéis. A utilização do conceito de papéis tem por objetivo separar a representação dos aspectos estáticos de um objeto dos seus aspectos dinâmicos. Através da utilização deste conceito são evitados problemas de migração entre classes - um mesmo objeto pode desempenhar simultaneamente mais de uma papel, pode mudar de papel dinamicamente (mudar seu comportamento) e pode, ai nda, desempenhar mais de uma instância de uma mesmo papel no mesmo momento. Um papel básico descreve as características iniciais de uma instância e as propriedades globais que controlam sua evolução. As propriedades do papel básico se aplicam a todos os demais papéis e ao contrário dos outros papéis que podem ser instanciados mais de uma vez, somente pode apresentar uma instância. Cada papel é definido por: (i) um nome; (ii) um conjunto de propriedades; (iii) um conjunto de estados, que o objeto neste papel pode apresentar; (iv) um conjunto de mensagens que o papel pode receber ou enviar; (v) um conjunto de regras de transição de estado e regras de integridade. Através das regras de transição de estados são definidos os diferentes comportamentos possíveis quando desempenhando um determinado papel. A figura 5.5 apresenta um exemplo de modelagem, expresso na linguagem de definição TF-ORM. É feita a definição de uma classe de agente PERSON (pessoa), que apresenta três papéis além do papel básico: employee (empregado), teacher (professor) e student (estudante). Cada um destes papéis apresenta propriedades próprias, e regras que definem seu comportamento. O tempo é acrescentado tanto ao nível de objetos (para definir criação, suspensões, término das instâncias) como ao nível das propriedades. As propriedades podem ser estáticas (tem o mesmo valor durante todo o ciclo de vida da instância) ou dinâmicas (a propriedade pode assumir diferentes valores com o passar do tempo). As propriedades dinâmicas possuem um rótulo bitemporal - tempo de transação e um tempo de validade - associados. Uma informação é considerada válida quando o tempo de validade é atingido e continuará neste estado até o início da validade de outro valor. Para definição das propriedades, o modelo apresenta um conjunto de classes pré-definidas para serem usadas como domínio, chamadas tipos de dados. O modelo apresenta ainda um conjunto de propriedades pré -definidas como oId, rId, class_instance e class_end, destinadas a armazenar respectivamente o identificador da classe, o identificador do papel, o início de vida da instância da classe e o momento em que ela deixa de existir. A linguagem de consulta [EDE 94b] apresenta a seguinte estrutura: SELECT <cláusula de especificação> FROM <cláusula de identificação> WHERE/WHEN <cláusula de busca> [ ON <cláusula de instante temporal>] agent class ( PERSON, < base_role, static properties = {(person_id, integer)}, dynamic properties = { (name, string), (address, string)}, rules = { ... } >, < employee, dynamic properties = {(department, string), (salary, real), (hired, date), (holidays, interval(closed, date), … }, states = {hired, in_holidays, fired}, messages = { new_salary(Oid, Value) from Control.Salaries, ask_vacations(oid, Period) to Control.Holidays, … }, decisions = { get_vacations( Period), … }, rules = { init: add_role Þ state( hired ), holidays: state(hired), decision(get_vacancies( Period) Þ msg(ask_vacancies(oid, Period), state (hired), salary: state(hired), msg(new_salary(oid, Value) Þ sate(hired); (Value > salary), … } > < teacher, dynamic properties = { (gratification, real), (start, date), … }, … > < student, static properties = { (student_number, integer) }, dynamic properties = { (courses, string), (start, date), … }, … > ) Figura 5.5 – Exemplo de modelagem TF-ORM A cláusula de especificação SELECT, define as saídas da consulta. Três tipos de saídas são identificadas: saída de dados, saída temporal e saída mista. A saída de dados é obtida quando são especificadas as partes do objeto que devem ser mostradas pela consulta. Para obter uma saída de dados a cláusula de especificação pode ser composta: (i) pelo nome de uma ou mais propriedades; (ii) pelo símbolo especial "*", quando forem solicitados os valores de todas as propriedades do(s) objeto(s) identificado(s). Para obter a saída temporal, as seguintes palavras especiais podem ser utilizadas na cláusula de especificação: DATE (quando solicitada uma data de validade), TRANSACTION_DATE (data de transação), PERIOD (intervalo limitado por datas de validade). A saída mista é obtida quando os elementos da saída de dados e da saída temporal forem combinados na cláusula de especificação. A cláusula FROM é utilizada para identificar as classes e papéis participantes da consulta. A qualificação do papel através do nome da classe a que corresponde não se faz necessária quando o esquema sobre o qual está sendo definida a consulta apresentar todos os papéis com nomes únicos. A cláusula WHERE é utilizada para buscar informações correspondentes ao instante de tempo considerado (snapshot do banco de dados). A utilização da cláusula WHEN aumenta o universo de busca, incluindo dados passados e futuros, além dos atuais. O acréscimo da cláusula AS ON fixa uma história anterior à história atual do banco de dados, de acordo com a qual os valores devem ser recuperados.Todas as informações que foram inseridas no banco de dados após a data especificada na cláusula AS ON são desconsideradas na consulta. 6 Evolução de Esquemas em Bancos de Dados Temporais O esquema conceitual de um banco de dados representa os requisitos de dados da aplicação. Durante a existência de um sistema de banco de dados seu esquema conceitual pode mudar (evoluir) devido a modificações ocorridas, por exemplo, na legislação vigente, nos requisitos dos usuários e nos requisitos dos dados. As modificações de um esquema com o passar do tempo são uma regra e não uma exceção na vida de um banco de dados. A maioria dos sistemas cedo ou tarde apresenta a necessidade de alterar sua representação (caracterizada pelo esquema), para adaptar-se a situações tais como [Moreira 97]: · ocorrência de mudanças na parte da realidade que é relevante ao sistema; · alterações nos requisitos ou erros ocorridos durante as fases de análise e projeto do sistema; · aumento do domínio do sistema; · necessidade de melhoria no desempenho do sistema. Três são as possíveis modificações feitas em um esquema durante sua evolução: adicionar novas informações (por ex., definir um novo atributo), remover informações do esquema (por ex., remover um atributo), e modificar informações existentes (por ex., modificar o tipo de um atributo). A modificação do esquema conceitual pode afetar o sistema de diversas formas. Dois problemas fundamentais devem ser considerados [Goralwalla 97]: · semântica da alterações efetuadas no esquema – efeitos das alterações no esquema na representação da aplicação, podendo ser perdidas informações importantes. O enfoque tradicional para solucionar este problema é definir um conjunto de invariantes do esquema que devem ser preservadas nas modificações efetuadas (por ex., atributos que não podem mudar). Sempre que uma nova versão do esquema é definida, deve ser feita uma verificação da integridade deste esquema, analisando as invariantes do esquema. As invariantes geralmente são representadas através de condições que devem ser sempre satisfeitas, representando as restrições de integridade estrutural do modelo de dados. A nova versão do esquema somente deve ser aceita se as invariantes forem satisfeitas; · propagação das alterações – consiste nos efeitos da alteração na consistência da base de dados já existente. Este problema é tradicionalmente resolvido através de adaptação da base dados existente ao novo esquema - no instante de tempo em que uma nova versão de um esquema se torna válida, algumas adaptações se fazem necessárias na extensão do banco de dados, para que os valores válidos naquele momento, definidos de acordo com o esquema anterior, possam corresponder à nova versão do esquema. Esta adaptação não deve destruir os dados passados, como era feito nos bancos de dados estáticos. Como exemplo de adaptação, quando na nova versão do esquema é removido um atributo temporal, todos os valores definidos para este atributo devem ter sua validade temporal terminada. A evolução do esquema pode também afetar a implementação de métodos e dos programas de aplicação. Vários estudos sobre a evolução de esquemas foram desenvolvidos considerando modelos relacionais, entidade -relacionamento e orientados a objetos. Entretanto, a maioria destes estudos não trata de bancos de dados temporais - somente uma versão do esquema pode existir a cada instante, devendo toda extensão do banco de dados ser adaptada para esta versão. Recentemente tem sido analisada a possibilidade de tratar da evolução de esquemas quando utilizados bancos de dados temporais na extensão do BD [Ariav 91, Kim 95, McKenzie 90, Roddick 92] e também para armazenar as diferentes versões de esquemas [DeCastro 95-97, Goralwalla 97, Edelweiss 95-97, Roddick 94, Zaniolo 97]. 6.1 Modificação, Evolução e Versionamento de Esquemas Estes três termos têm sido utilizados como sinônimos. No glossário de conceitos de bancos de dados temporais [Jensen 94] são apresentadas as três definições a seguir. · Modificação de Esquemas – uma modificação de esquema ocorre quando o SGBD permite modificações na definição do esquema de uma base de dados populada; · Evolução de Esquemas – ocorre quando o SGBD permite modificações da definição do esquema de uma base de dados populada sem causar perda de informações. Estas alterações devem ser propagadas de modo a garantir a consistência e a integridade dos dados armazenados; · Versionamento de Esquemas – acontece quando o SGBD permite a visualização de todos os dados, tanto retrospectivamente quanto prospectivamente, através das várias versões de esquemas definidas pelo usuário. Pode ser parcial, quando são permitidas somente alterações sobre o esquema corrente, ou total, quando as alterações podem ser efetuadas sobre qualquer versão do esquema. Como alguns dos aspectos relativos a versionamento de esquemas total ainda estão em aberto, somente o versionamento parcial é considerado na maioria dos trabalhos sobre este assunto, assim como neste texto – portanto, somente o esquema atual pode ser modificado. 6.2 Como Tratar Evolução de Esquemas em Bancos de Dados Temporais Sistemas de bancos de dados não temporais apresentam um esquema estático e uma correspondente base de dados também estática. Para manipular a evolução de esquemas, o enfoque tradicional tem sido o de modificar o esquema conceitual e fazer as alterações necessárias na extensão do banco de dados, de modo a adaptá-la ao novo esquema. Desta forma, somente o último esquema (atual) fica armazenado. Quando é utilizado um banco de dados temporal, a utilização desta forma de manipulação da evolução do esquema implica em eventual perda ou alteração das informações passadas – os dados passados continuam disponíveis, mas precisam ser adaptados ao novo esquema, para que possam ser consultados de acordo com o esquema atual. Como o princípio que rege o conceito de bancos de dados temporais é o de não perder informações passadas, a evolução do esqu ema conceitual deveria permitir a recuperação de informações passadas de acordo com o esquema vigente naquele momento. Uma melhor representação da realidade requer que, quando ocorrer a evolução do esquema conceitual, todas as versões deste esquema (a atual e as passadas) estejam disponíveis. As seguintes formas podem ser utilizadas para armazenar os dados e os esquemas em bancos de dados temporais: · múltiplos repositórios – esta solução requer a criação de tantos repositórios quantas forem as versões do esquema. Neste caso, cada repositório é formado de acordo com a versão do esquema correspondente. Quando um novo repositório é inicializado, as tuplas são copiadas do repositório antigo de acordo com as mudanças aplicadas ao esquema; · repositório único com esquema global – é utilizado um repositório único para os dados da extensão, armazenados de acordo com um esquema global que inclui todos os atributos introduzidos pelas sucessivas mudanças do esquema. Se algum atributo for excluído ou tiver seu domínio restringido, a mudança não será executada fisicamente, mas será gravada em um catálogo, já que nenhum dado pode ser descartado do repositório, sob pena de jamais poder ser recuperado novamente. Se, ao contrário, a mudança propuser a adição de um novo atributo ou a extensão de um domínio, todo o repositório vai ter de ser convertido para o novo formato. Se a mudança para o novo domínio produzir um novo domínio incompatível com o antigo, dois atributos deverão ser mantidos com o mesmo nome às vistas do usuário, correspondendo a domínios diferentes e pertencendo a diferentes versões do esquema; · repositório único com múltiplos esquemas – é também utilizado um repositório único, mas todas as diferentes versões do esquema ficam disponíveis. As diversas versões do esquema ficam armazenadas em um (meta-) banco de dados, também temporal. A recuperação de informações é feita deacordo com o esquema válido no momento considerado, possibilitando desta maneira uma representação mais fiel da realidade. Existe, evidentemente, um aumento do tempo despendido para avaliar as consultas, uma vez que o esquema adequado deve ser selecionado - é possível que uma mesma consulta utilize mais de uma versão do esquema conceitual. A este caso denominamos banco de dados temporal generalizado, e será detalhado mais adiante. Um conceito importante na utilização de bancos de dados temporais é o de vacuuming (gerar vácuo) [Snodgrass 95]. Neste caso é permitida a eliminação física de dados temporais não relevantes, para os quais o custo de armazenamento é significativo. O mesmo conceito pode ser estendido para o armazenamento de esquemas – eliminar versões antigas do esquema, principalmente aquelas às quais não correspondem dados armazenados na extensão. 6.3 Banco de Dados Temporal Generalizado Um novo tipo de sistema de banco de dados temporal, ao qual denominamos banco de dados temporal generalizado [Edelweiss 95], mais geral do que os sistemas temporais convencionais, deveria ser utilizado para permitir a evolução de esquemas em bancos de dados tempor ais. Trata-se de um sistema de banco de dados que apresenta um esquema temporal. Cada versão do esquema constitui um novo esquema, ao qual é associada alguma informação temporal (tempo de transação e/ou validade do esquema). Um esquema temporal é estruturado como uma ou duas (no caso bitemporal) seqüências de esquemas. "meta-esquema" caracterizado pelas invariantes do esquema seqüência de esquemas que constitui o “ esquema dinâmico” conjunto de esquemas corretos conjunto de estados do BD válidos para o esquema inicial A conjunto de estados do BD válidos para o esquema B conjunto de estados do BD válidos para o esquema C seqüência de estados do BD Temporal A B C * * * a1 a2 a3 a4 b1 b2 b3 c1 c2 c3 Figura 6.1: Parte da vida de um sistema de banco de dados temporal “generalizado”. Na figura 6.1 é apresentada uma idéia geral do comportamento de um banco de dados temporal generalizado. Quando um banco de dados temporal generalizado é criado, apresenta um esquema inicial (esquema A da figura 6.1) e um correspondente estado inicial da extensão do banco de dados (a1). Durante o tempo em que este esquema é válido são feitas atualizações no banco de dados, criando novos estados do banco de dados (a2, a3 e a4), todos pertencendo ao mesmo universo de bancos de dados estáticos que satisfazem o esquema A. Os estados a1, a2, a3 e a4 compõem o banco de dados dinâmico do esquema. Uma modificação no esquema gera um novo esquema (B), e um novo estado do banco de dados (b1), correspondendo a este novo esquema, deve ser construído. Este novo estado do banco de dados deve pertencer ao universo de bancos de dados estáticos aceitos pelo esquema B. Quando a construção do novo estado do banco de dados (b1) é feita adequadamente, os dois estados a4 e b1 apresentam os mesmos conteúdos de informações - qualquer informação que um usuário possa obter de a4 também pode ser obtida de b1, e vice-versa. Entretanto, sendo os dois esquemas correspondentes a estes estados diferentes, a sintaxe da consulta a ser construída para obter a informação em a4 possivelmente será diferente da sintaxe da consulta de b1. Também a apresentação das respostas nos dois casos pode ser diferente. O importante é que a “essência”, a informação que está sendo recuperada, seja a mesma. Neste tipo de banco de dados os esquemas e as correspondentes extensões do banco de dados podem variar com o passar do tempo, sendo que todas as diferentes situações que existiram no passado são sempre acessíveis. Consultas temporais podem ser feitas neste tipo de banco de dados, e para avaliar estas consultas devem ser considerados tanto a evolução do esquema conceitual como a evolução da extensão do banco de dados. A existência de diversas versões do esquema deve ser levada em consideração nas operações de recuperação de informações passadas, quando deve ser utilizado o esquema válido naquele momento. Caberá ao sistema gerenciador do ba nco de dados a tarefa de identificar os dados através de sua correspondente versão de esquema. Esta necessidade aumenta a complexidade do sistema como um todo, uma vez que requer o armazenamento de múltiplas versões do esquema conceitual. 6.4 Formas de Armazenar Múltiplos Esquemas Uma forma de armazenar as diferentes versões dos esquemas é através da utilização de um (meta-) banco de dados temporal. Deste modo, a evolução de esquemas pode ser tratada de modo similar à evolução da extensão do banco de dados. Informações temporais devem ser acrescentadas às diferentes modificações efetuadas no esquema, representando o tempo de transação e/ou tempo de validade de cada modificação. A forma utilizada para representar estas informações temporais define o tipo do (meta-) banco de dados temporal que armazena a evolução do esquema conceitual. Considerando os quatro tipos de bancos de dados temporais vistos anteriormente, o esquema conceitual pode ser representado por um banco de dados instantâneo (caso normal), de tempo de transação, de tempo de validade ou bitemporal. Esquemas Instantâneos O esquema visto como um meta-banco de dados instantâneo tem, em qualquer instante de tempo considerado, somente uma instância ou uma versão. A transição de uma versão de um esquema pa ra outra versão deve obedecer às invariantes do esquema, associadas ao modelo de dados utilizado para representar o esquema. Nenhuma informação temporal é associada às modificações do esquema, sendo que somente a última versão do esquema pode ser referenciada em uma consulta. A extensão de um banco de dados que utiliza um esquema instantâneo pode ser de qualquer dos tipos de bancos de dados vistos - instantâneo ou temporal. A definição de uma nova versão para o esquema conceitual implica na necessidade de adaptar as estruturas e os valores armazenados na extensão do banco de dados de modo a satisfazer o novo esquema conceitual. Quando na extensão são utilizados dados históricos, estes também devem ser adaptados ao novo esquema, pois será este a ser utilizado para recuperar estas informações. A figura 6.2 representa um esquema que evolui, apresentando modificações em três tempos diferentes (t1, t2 e t3). Em cada um destes instantes de tempo são efetuadas as necessárias modificações na extensão do banco de dados. Esquema Extensão t1 t3t2 transformação de ocorrências transformação de ocorrências transformação de ocorrências Figura 6.2: Esquema instantâneo Esquemas de Tempo de Transação Quando a evolução do esquema conceitual é representada através de um meta-banco de dados de tempo de transação as sucessivas versões do esquema conceitual são acessíveis, cada uma delas associada com o correspondente tempo de validade. Transformações elementares no esquema (como por exemplo, a definição de um novo atributo) geram uma nova versão do esquema. Como neste tipo de banco de dados não são utilizados tempos de validade, uma nova versão do esquema se torna válida no momento de sua definição, permanecendo válida até que nova versão seja definida. A cada vez que uma modificação elementar no esquema for efetuada, definindo uma nova versão do esquema, devem ser feitas as necessárias adaptações na extensão do banco de dados. Na figura 6.3 estão representadas três versões de um esquema conceitual, cada uma delas válidas a partir do instante de tempo de sua definição (t1, t2 e t3). As três versões ficam acessíveis para eventuais consultas. A extensão do banco de dados pode ser representada por qualquer um dos três tipos de bancos de dados temporais: de tempo de transação, de tempo de validade ou bitemporal. A utilização de um meta-banco de dados temporal para armazenar a evolução de um esquema não faz sentido quando utilizado um banco
Compartilhar