Baixe o app para aproveitar ainda mais
Prévia do material em texto
II Ciberética – Simpósio Internacional de Propriedade Intelectual, Informação e Ética; VIII Encontro Nacional de Informação e Documentação Jutídica/ENIDJ; XXII Painel Biblioteconomia em Santa Catarina. Florianópolis, SC, 12 a 14 de novembro de 2003 Metadados e Recuperação da Informação : padrões para bibliotecas digitais Marcia Rosetto Resumo A rede Internet, disponibilizada a todos cidadãos nos anos 90, intensificou o acesso geral e irrestrito às informações devido às facilidades proporcionadas pela infra-estrutura e conjunto de programas e protocolos. Dentre as implementações encontram-se os projetos para a edição de publicações eletrônicas, bibliotecas virtuais e digitais. Apesar das possibilidades existentes para o acesso a esses repositórios informacionais, tem sido necessário o desenvolvimento de novas especificações técnicas para a padronização dos dados, propiciando dessa forma uma recuperação eficiente e eficaz pelo usuário. Dentre as regras e normas elaboradas encontram-se os formatos de metadados, que subsidiam a organização de conteúdos em meio digital. O presente trabalho apresenta o conceito, as características e os objetivos de metadados, objetivando uma melhor compreensão sobre sua importância quando da estruturação de bases de dados e serviços de informação de conteúdos digitais. Abstract Metadata and Information Retrieval – Patterns for Digital Libraries Available for every citizen since the 90’s, Internet has improved general and open access to information due to the availability of IT infrastructure and a set of programs and protocols. Among the implementations, there are projects aimed to provide electronic publications edition, as well as virtual and digital libraries organization. Although it is not difficult to access these informational repositories, the development of new technical specifications has been necessary for data standardization to achieve efficient retrieval by the user. Among rules and standards, metadata formats to organize contents in digital support can be found. The present paper presents metadata concept, characteristics and objectives for a better understanding about their importance for the definition of databases structure and digital contents information services. 1 Introdução Nesse século é flagrante o surgimento da sociedade da informação. Em razão do papel crescente da informação, os seus insumos são de fundamental importância para o desenvolvimento econômico, social, cultural e político dos países em geral. Muitas tentativas à determinação de um conceito para a sociedade da informação são relativamente recentes, sendo foco de constantes estudos em muitos países e organizações internacionais, objetivando definições mais exatas à extensão e influência na sociedade (Moore, 1999). Essa preocupação, entretanto, fica mais evidente e intensiva nos anos 90, quando foi liberado o uso da rede Internet, criada em 1969, e utilizada apenas pelo meio acadêmico, e posteriormente estendida aos meios de comunicação de massa. A adoção dessa rede intensifica cada vez mais o acesso geral e irrestrito às informações devido às facilidades proporcionadas pela infra-estrutura e conjunto de programas e protocolos que permitem aos usuários utilizá-la sob diferentes maneiras. Ao longo da história da Internet surgem diversos tipos de ferramentas (Gopher, Ftp, Telnet , correio eletrônico, entre outros), e de serviços (Archie, Usenet, World Wide Web, entre outros). Dentre eles, o que mais se destaca a partir de sua concepção, em 1989, com o uso do protocolo http (Hypertext Transfer Protocol), é o World Wide Web (WWW), disponibilizando informação em forma de páginas hipermídia combinando textos, ilustrações e links (apontamentos) para acesso a recursos/documentos disponíveis pela própria rede. De acordo com Berners-Lee (Herring , 2002) , “a idéia sobre hipertexto1 é criar um espaço para intercâmbio de informação, no qual um grande número de pessoas e máquinas podem comunicar-se via links associados”. As inovações tecnológicas implementadas para uso da interface WWW, proporcionaram a grande expansão para a intermediação de serviços e produtos nas áreas acadêmica e comercial, e esse avanço transformou a Internet, em pouco tempo, num grande repositório universal do conhecimento humano nunca antes imaginado. A concepção de uma interface de uso padrão (WWW), independente do tipo de ambiente computacional utilizado, possibilitou aos usuários, pessoais e institucionais, tornarem-se também criadores de textos/informações, transformando a Web um meio de publicação e acessibilidade irrestritas. Esse universo sem fronteiras tem atraído a atenção de milhões de pessoas de todos os lugares do mundo, que atualmente executam tarefas por meio dessa rede. No entanto, apesar do sucesso alcançado, a Internet tem introduzido problemas para ela própria, e para os seus usuários. Diariamente, novas páginas Web são incluídas, conteúdos já existentes são alterados, e outras desaparecem. Essa mutação é constante e vertiginosa, tornando-a um ambiente complexo, heterogêneo e dinâmico, mas pouco uniforme e sem nenhum critério documental definido para a sua organização (Méndez Rodríguez & Merlo Vega, 2003 ). Apesar da disponibilidade desses recursos, o acesso aos repositórios não tem sido fácil; encontrar informações úteis, é freqüentemente tedioso e tarefa difícil. Quando da recuperação da informação necessária para resolver os seus problemas, o usuário deve “navegar” no espaço hipertextual (links Web) , que é vasto e quase sempre desconhecido, trazendo um grande desconforto durante a realização de pesquisas, muitas vezes ineficientes devido à recuperação não satisfatória. Vários serviços indexam essas informações, por meio de motores de busca, cujos resultados apresentam problemas, pois a falta de uma infra-estrutura sólida e estável quanto ao tratamento dos recursos ali dispostos tem feito da Web um sistema de informação não muito bem disciplinado. 1 Hipertexto é um texto que contem links associados a palavras ou expressões que permitem ao leitor se deslocar automaticamente para as partes por eles apontados (Sociedade da informação no Brasil: livro verde, 2000) Essa situação é ocasionada principalmente pela falta de uma padronização, em nível mundial, que oriente a estruturação da informação com base em identificadores de forma e de conteúdos dessas páginas, lembrado que, conforme a ISO (International Standard Organization) (ISO, 1999), padrões são acordos oficializados, contendo especificações técnicas ou outros critérios para serem utilizados, consistentemente, como regras, normas ou definições de características. Para encontrar soluções à essa questão, desde o início dos anos 90, várias iniciativas têm sido desenvolvidas pelas organizações responsáveis pelo gerenciamento como também por instituições de pesquisa e provedores de informação. Dentre os estudos existentes, encontra-se a questão da recuperação da informação, que tem como foco a forma de interatividade do usuário com os sistemas de informação e as interfaces de busca, sem esquecer dos instrumentos (softwares) desenvolvidos para o seu acesso, a criação de códigos para a localização de objetos na rede, de forma inequívoca e, finalmente, a questão da descrição da informação contida nesse ambiente. Essas questões envolvem o objetivo de identificar, localizar e recuperar a informação de forma única e não ambígua. Quanto a descrição dos vários tipos de conteúdos, verifica-se o desenvolvimento de conjuntos de metadados, também conhecidos por esquemasou formatos de metadados, e esses mecanismos técnicos estão sendo utilizados já há algum tempo pelas organizações que gerenciam conteúdos na Internet para conferir o suporte necessário à organização dessas informações, sendo que a construção conhecida por sintaxe (de estrutura e elementos de dados) de cada tipo de metadados varia dependendo das necessidades especificas de seus usuários (Vellucci, 2002) .Detalhamento sobre o assunto encontra-se no item 3. No momento, além da questão de gestão dos recursos na Web, verifica-se também a influência da Internet no ambiente da biblioteca e nas funções e serviços por ela desempenhados. De acordo com vários autores e especialmente por Lancaster & Sandore (1997), a Internet é o recurso eletrônico que tem provocado maior impacto nos serviços e operações de bibliotecas e nas atividades dos bibliotecários . Dessa maneira os processos tradicionais de organização e prestação de serviços se modificam dia a dia. Um dos pontos críticos que a comunidade bibliotecária enfrenta atualmente é como efetuar o controle e a descrição de milhões de itens disponíveis na rede, e incorporá-los nas coleções. Inúmeros estudos e experiências para compatibilizar procedimentos já existentes para o controle e acesso aos dados bibliográficos com o ambiente de novos suportes informacionais estão em andamento a fim de adaptar as práticas tradicionais para esses recursos. Entretanto, iniciativas por investigadores de outras áreas avançam, gerando novos conhecimentos para a organização e tratamento dos estoques de informação. Os resultados dessas pesquisas na área da Ciência da Informação, apontam que a influência dos vários tipos de padrões de metadados, empregados para a descrição de recursos Web e para as bases de dados, influenciam as metodologias utilizadas pelas bibliotecas no tratamento da informação (Lancaster & Sandore, 1997). Para isso, faz-se necessário conhecê-los para subsidiar a sua utilização ou adaptação, e a adoção de metadados, desde o momento da geração do recurso de informação irá oferecer condições necessárias para a sua recuperação e subsídios para o tratamento dos dados por parte das organizações responsáveis pelo controle bibliográfico nacional e universal. 2 Biblioteca digital Um número considerável de informações localizadas em Websites apontam atualmente para publicações eletrônicas ou para textos que estão armazenados em bibliotecas virtuais e digitais, e as tecnologias que propiciaram essas condições encontram-se agrupadas na computação (computadores e tecnologias de armazenamento), redes (terminais e aplicativos para distribuição), e nos conteúdos (texto, imagem, vídeos, sons). Esse último aspecto apresenta também mudanças significativas quanto ao aspecto das linguagens de marcação SGML, HTML, XML 2 (Fox, 2002), assim como nos formatos de apresentação para o usuário: ASCII (American Standard Code for Information Exchange); Bitmaps , formato de imagem que incluem o GIF (Graphic Interchange Format), JPEG (Joint Photographic Experts Group), PNG (Portable Network Graphics), BMP (bitmap OS/2 ou Windows), 2 SGML= Standard Generalized Markup Language; HTML= Hypertext Markup Language; XML= Extensible Markup Language . TIFF (Tagged Image File Format), entre outros; formato PDF (Portable Document Format); formato PostScript, formato Latex/Tex (Sabbatini, 1999). Todas essas implementações deram as condições necessárias para a consolidação das publicações eletrônicas, cujos projetos propiciaram as condições para a edição nesse suporte e estão resumidamente descritos no Quadro 1, e podem ser entendidas , segundo Sabbatini (1999), como “ qualquer tecnologia de distribuição de informação em uma forma que possa ser acessada e visualizada pelo computador e que utiliza recursos digitais para adquirir, armazenar e transmitir informação de um computador para outro”, estando disponíveis em formato físico como disquetes, CD-ROM, ou por acesso on-line, principalmente pela Internet, utilizando-se de recursos como correio eletrônico, File Transfer Protocol (FTP) e WWW. Quadro 1 – Projetos desenvolvidos para editar publicações científicas na Internet Ano de inicio do projeto Projeto 1991 - Core- Cornell Universty – Chemistry Online Retrieval Literature - TULIP – Elsevier Science, The University Licencing Program 1994 - e*pub, UNICAMP 1992 - Red Sage Project – University of California (San Francisco) - Physics Eprint Archive, Los Alamos National Laboratory 1995 - JSTOR – Fundação Andrew W. Mellon - Super Journal Project, Eletronic Libraries Program (eLib) - High Wire Press, Stanford Universty 1998 - SciElo, FAPESP/BIREME 1999 - Base de dados Tropical, Fundação André Tosello Fonte: Sabbatini (1999) Essas experiências consolidaram conhecimentos e proporcionaram subsídios para o desenvolvimento de bibliotecas digitais que, conforme Fox (1998), é uma das formas mais avançadas e complexas de sistemas de informação, pois freqüentemente envolve “suporte de forma colaborativa, preservação de documento digital, gerenciamento de base de dados distribuída, hipertexto, filtros de informação, recuperação de informação, módulos de instrução, gerenciamento de direitos autorais, serviços de informação multimídia, serviços de referência e respostas às questões enviadas, busca de recursos, e disseminação seletiva”. Muitos autores têm desenvolvido estudos objetivando a conceituação de uma biblioteca digital. Para Atkins (1998) “o conceito de biblioteca digital está na analogia com um lugar onde se encontra um repositório contendo uma coleção organizada de publicações (que possam ser impressos) e outros artefatos físicos, combinados com sistemas e serviços que facilitem o acesso físico, intelectual, e disponível por longo tempo” . Entretanto Fox (2002) considera que há diferentes conotações sobre biblioteca digital para diferentes grupos de profissionais. Para os de tecnologia da informação é um mecanismo poderoso para gerenciar bases de dados distribuídas; já para a comunidade de negócios ela representa um mercado novo, e quanto à comunidade da ciência da informação é uma nova forma para ampliar, distribuída e remotamente, o acesso a recursos de informação. A definição de biblioteca digital, baseando-se nos estudos realizados até o presente momento, demonstram que ainda está em construção, e em muitas situações confundem-se como bibliotecas virtuais ou eletrônicas. Sobre esse aspecto Blattmann (2001) proporciona, por meio de uma revisão bibliográfica sobre o assunto, um quadro com a evolução histórica e as características das bibliotecas em ambiente digital, e contribui para uma melhor compreensão sobre a atual conjuntura que passam as bibliotecas de modo geral. Apesar dessa situação quanto a redefinição das bibliotecas na sociedade da informação, a biblioteca digital tem, cada vez mais, um papel fundamental no planejamento estratégico dos novos serviços de informação com a finalidade de facilitar o acesso universal ao patrimônio científico e cultural ( Méndez Rodríquez,2002). Segundo a autora, “ se uma biblioteca é um conjunto organizado de documentos, uma biblioteca digital é um conjunto organizado de documentos eletrônicos , ou seja, um conjunto organizado de objetos digitais, onde os metadados são a chave para essa organização e formas de acesso à informação contidas nesse conjunto de dados “. Dessa forma, a criação de uma biblioteca digital implica conhecer todos os processos de tecnologia de informação ( hardware, software, armazenamento, protocolos, etc), e da biblioteca (definição do modelo de metadados, padrões a serem adotados, nível de detalhamento da descrição, metodologiaspara recuperar a informação organizada, entre outros requisitos), destacando-se os metadados (dados sobre os dados) que serão a chave fundamental para proporcionar uma recuperação eficiente, eficaz e fácil de informações/documentos úteis para o usuário. 3 Metadados e formatos de metadados para estruturar dados para recuperação A representação e mediação do conhecimento é o elemento-chave para acesso rápido e adequado à informação, e essa necessidade originou várias formas para organizá-la. O controle se manifesta em duas premissas: a descrição, que ao mesmo tempo é uma operação (catalogação) e um produto, e a classificação, que representa as relações existentes entre tópicos referentes a diversas áreas. O objetivo da descrição é fornecer uma representação da fonte, permitindo identificá-la, localizá-la e representá-la nos catálogos correspondentes. A adoção do catálogo propiciou o controle da informação, incluindo os vários instrumentos normativos de apoio à organização documental, extensivamente utilizados pela comunidade internacional das áreas de biblioteconomia e ciência da informação, e pelas disciplinas relacionadas, tais como museus, arquivos, gerenciadores de registros, documentos, resumos e indexação, tesauros, e sistemas de recuperação da informação (GILS, 2001). Recuperar a informação contida nas publicações sempre foi o principal objetivo dos instrumentos elaborados pelas bibliotecas e sistemas de informação. Segundo Rowley (2002) “a questão crucial é que o processo de recuperação depende muito das etapas de indexação e armazenamento, os quais determinam, em grande medida, a estratégia melhor possível para as buscas feitas num sistema de recuperação da informação”. Com o desenvolvimento de tecnologias de informação e comunicação, novas formas para estruturar e disponibilizar a informação são desenvolvidas para acesso por meios eletrônicos, como por exemplo os catálogos on-line, mais conhecidos pela sigla OPAC (On-line Public Access Catalog) e com acesso pela Internet. Assim, a estruturação e organização de conteúdos ( textos, gráficos, entre outros) devem estar categorizados e auxiliados por um sistema de navegação intuitivo e confiável (Peón Espantoso, 1999/2000). Além disso, o tratamento da informação, de acordo com padrões internacionais para o armazenamento em bases de dados e disponíveis em ambientes digitais, continua sendo imprescindível e importante para a recuperação adequada. Otimizar a recuperação de informações estocadas sempre foi um desafio para os organizadores de repositórios de informação. Atualmente, segundo Alvarenga (2001) “bibliotecários e especialistas da informação se esforçam para desenvolver métodos para a descrição, organização e recuperação de objetos digitais acessados remotamente (...) e eles não estão só nesse desafio, porque criadores, provedores e usuários de fontes eletrônicas nos meios acadêmicos, públicos e comerciais também se acham dedicados à pesquisa sobre esse vasto campo de informações. Cada grupo tem abordado o problema de organização e acesso, a partir de seus próprios esquemas de referência”. Dessa forma estudos realizados resultam no desenvolvimento de métodos e padrões para a organização de recursos de informação on-line, designados como esquemas de metadados, ou formatos de metadados. Metadados, genericamente, vem sendo definidos como dados sobre dados, ou informações sobre a descrição e a localização de informações existentes na Internet, com o objetivo de permitir a sua recuperação de forma mais adequada por meio dos Websites. Estudos e experiências disponíveis na literatura desde a década de 90 demonstram a importância do uso de elementos metadados para a estruturação de sistemas de informação, e relatam sobre propostas para o tratamento dos recursos de informação em meio digital, e nesses últimos anos tem sido foco de análise tanto pela comunidade de biblioteconomia e documentação como também por outras áreas responsáveis pela organização e gerenciamento de recursos de informação em geral. A origem do termo “metadados” se inicia nos anos 60, mas aparece com maior freqüência na literatura sobre sistemas de gerenciamento de bases de dados a partir dos anos 80, sendo empregado para identificar as informações auto-descritivas e de auto-controle dos dados contidos nas bases (Vellucci, 2002). Até há poucos anos somente alguns teóricos da área tinham conhecimento da palavra metadados, entretanto, o entendimento do conceito de metadados tem se tornado fundamental para os autores, produtores e usuários de serviços de informação ( Milstead & Feldman, 2001), e tem sido estudado por muitos especialistas, incluindo bibliotecários, e as conclusões levam à mesma essência que é constante e que tentam solucionar questões sobre o controle e descrição de recursos disponíveis na Internet (Lange & Wickler, 1997). A partir de pesquisa realizada com a finalidade de buscar uma compreensão sobre metadados, a fim subsidiar o entendimento sobre o papel e finalidade que eles exercem na gestão de recursos em meio digital, apresenta-se uma consolidação no Quadro 2 sobre o conceito, objetivos e características de metadados que são a chave do processo que objetivam gerenciar e assegurar a consolidação e a disponibilização desses recursos para uso futuro. Quadro 2 – Conceito, objetivos e características de metadados Conceito Metadados são um conjunto de dados-atributos, devidamente estruturados e codificados, com base em padrões internacionais, para representar informações de um recurso informacional em meio digital ou não – digital, contendo uma série de características e objetivos. Objetivos 1- Localizar, identificar e recuperar dados de um recurso informacional . 2- Propiciar controles de ordem gerencial e administrativo permitindo conexões e remissões (links) para pontos internos e externos. 3- Possibilitar a interoperabilidade entre sistemas de informação, dentro de padrões. 4- Informar sobre as condições de acesso e uso da informação. 5- Ser legível tanto pelo homem como pela máquina. 6- Possibilitar a elaboração de índices. Características * 1- Descrição, com pormenores, das condições físicas dos componentes com o fim de identificar e caracterizar o recurso de informação. 2- Observância de padrões internacionais para a sintaxe e semântica da especificação do recurso de informação, em meio digital ou não – digital. 3- Informam sobre armazenagem, preservação, acesso e uso dos dados. 4- Dispõem informações administrativas e gerenciais para a devida criação e definição de responsabilidades dos metadados 5- Possibilitam análises da qualidade, avaliações e formas de uso. 6- Auto-descrevem e criam documentação própria que subsidia o gerenciamento dos recursos informacionais. * Aqui as características representam os papéis que exercem na configuração dos metadados. Fonte: Rosetto (2003) Tendo como característica a observância a padrões internacionais para a descrição do conjunto de dados, os metadados devem estar alinhados com as regras previstas por padrões desenvolvidos por organizações de renome na área, e que são designados como formatos de metadados. Esses formatos, que servem a distintas necessidades e audiências, podem ser utilizados para descrever os mesmos recursos para múltiplos propósitos, tendo como função fornecer as definições que estabelecem a organização padronizada de conteúdos e condições para o intercâmbio por meio magnético (Hodge, 2001). Muitos formatos de metadados são especificações estabelecidas por consenso de determinadas comunidades que gerenciam recursosde informação em suporte digital, com o fim de atender necessidades de informação específicas. Entretanto, o trabalho desenvolvido nessa área ainda está longe de ter um aval que atenda de forma universal as necessidades e permita o gerenciamento de metadados de forma adequada. Nesse sentido, vários projetos estão sendo realizados para permitir o estabelecimento de um padrão geral de formatação de metadados com parâmetros em âmbito mundial. De um modo geral um formato deve ter sempre uma especificação formal da estrutura e da semântica; deve definir um conjunto coerente de atributos e das terminologias adotadas na descrição. Conforme Weibel (2002), o requisito formal significa que o formato é mantido por uma agência autorizada e responsável pelas especificações conferindo credibilidade ao esquema dos dados; o requisito estrutura possui características codificadas dos valores contidos; e o requisito semântica determina atributos cujo significado é compreendido pelo homem e pela máquina dentro de uma coerência indiscutível. Complementando, Watson (ALA, 2002) identifica que um formato de metadados deve permitir atingir o objetivo dos metadados, facilitando a identificação, localização, recuperação e uso da informação pelo usuário. Cada formato é construído sob um conjunto de especificações e necessidades, e elaborados por especialistas nas áreas em que foram implementados. Em estudo realizado por Dempsey & Heery (1997), foram identificados até aquele momento vinte e dois formatos de metadados 3. Os critérios utilizados para avaliar esses formatos foram estabelecidos em dois grandes focos, e que estão descritos no Quadro 3. Quadro 3 – Critérios para avaliar formatos de metadados 3 Formatos analisados: BibTex, CDWA, CIMI, Dublin Core, EAD, The EELS Metadata Format ,The EEVL Metadata Format, FGDC, GILS, IAFA/Whois++ Templates, ICPSR SGML Code book Iniative, LDAP Data Interchange Format (LDIF), MARC (General overview), USMARC, UKMARC, UNIMARC, PICA+, RFC 1807 da IETF, Summary Object Interchange Format (SOIF), Text Enconding Initiative (TEI), Independent Headers, Uniform Resource Characteristics Citations (URCs) , Warwick Framework. Foco Aspectos verificados Ambiente de uso Documentação, consistência de uso, facilidade de uso, progresso quanto ao uso de padronização internacional. Emissões do formato Designação, conteúdo, regras para a construção dos elementos, emissões multi-lingüísticas, designação, codificação, habilidade para representar relações entre objetos, completeza, emissão de protocolo, implementações. Fonte: Dempsey & Heery (1997) Elaboração:Rosetto (2003) A partir das características identificadas, foi possível criar uma tipologia com três categorias de formatos de metadados, conforme descrito no Quadro 4. Quadro 4 – Tipologia de formatos de metadados Banda um Banda dois Banda três Características do registro - Formatos simples - Formatos estruturados - Formatos altamente estruturados - Padrão proprietário - Padrões emergentes - Padrões internacionais - Todo texto indexado - Estrutura em campos - Estrutura por meio de etiquetas (tags) Formatos dos registros - Lycos, Alta Vista, Yahoo, etc - Dublin Core, Planilha IAFA, RFC 1807, SOIF, LDIF - MARC, TEI, CIMI, EAD, ICPSR Fonte: Dempsey & Heery (1997) Adaptação: Rosetto (2003) As informações consolidadas refletem o estágio em que se encontram os formatos de metadados, bem como suas características e funcionalidade para propiciar o controle dos recursos de informação em meio digital. De acordo com os autores, os formatos se classificam pelas características identificadas em uma das categorias abaixo especificadas: 1) Na banda um, encontram-se os formatos com dados não- estruturados, tipicamente extraídos em base automática dos recursos e indexados por motores de busca existentes na Internet; 2) Na banda dois, entram os formatos com dados básicos estruturados, contendo descrições suficientes que permitem ao usuário verificar a potencialidade de sua utilidade ou o interesse por um recurso sem ter que recuperá-lo ou conectá-lo; 3) Na banda três, encontram-se os formatos cujos registros são descritos mais formalmente , que podem ser usados tanto para a localização e recuperação como para documentar os objetos, ou muito freqüentemente as coleções de objetos. Para cada formato analisado, há informações completas sob os aspectos assinalados, sendo, portanto, uma fonte de informação importante para se conhecer melhor cada um dos formatos relacionados. A titulo de ilustração sobre o emprego de formatos de metadados, na Figura 1 encontram- se as telas utilizadas pelo sistema Connexion do OCLC (Online Computer Library Center), que propicia condições para a catalogação de recursos de informação recuperados na Web, podendo-se optar pelo formato MARC (Figura 1.1), ou formato Dublin Core (Figura 1.2). Já na Figura 2 há um exemplo de recurso de informação de uma Website, em HTML ,contendo a descrição dos metadados de acordo com as regras definidas pelo formato Dublin Core, e em estrutura XML/RDF 4. 4 XML – Extensible Markup Language RDF – Resource Description Framework Figura 1.1 - Planilha com etiquetas do Formato MARC para descrição de metadados de recursos informacionais eletrônicos e não- eletrônicos (Sistema Connexion do OCLC) Figura 1.2 - Planilha com etiquetas do Formato Dublin Core para descrição de metadados de recursos informacionais eletrônicos e não- eletrônicos (Sistema Connexion do OCLC) Figura 2– Exemplo de recurso informacional em Website, em HTML, utilizando o formato Dublin Core para descrição dos metadados Fonte: Mendez Rodriquez (2000) Adaptação: Rosetto (2003) Embora a adoção de formatos seja uma prática de longa data na área de ciência da informação, como é o caso do MARC, novas regras estão sendo elaboradas para estabelecer uma uniformização de dados visando a recuperação e o intercâmbio automatizado entre os sistemas. Pode-se citar, como exemplo, o formato Dublin Core que hoje é uma norma internacional, e cujas categorias encontram-se relacionadas no Quadro 5, e é utilizado como padrão em inúmeros projeto como o Prossiga, Biblioteca Digital de Teses do IBICT, entre Metadados Descritivo Etiquetas Dublin Core outros, diminuindo custos e esforços e, principalmente, melhorando os procedimentos para a consistência precisa das informações. Quadro 5– Categorias dos elementos de metadados do formato Dublin Core Coteúdo Propriedade Intelectual Características fisicas Titulo Criador Data Assunto Editor Tipo (de recurso) Descrição Contribuinte Formato (suporte físico) Fonte Direitos Identificação (local) Idioma Relação Cobertura (extensão) No desenvolvimento de bibliotecas digitais, a formatação de acordo com uma semântica da estrutura com regras bem definidas para a descrição dos componentes, e de uma sintaxe estabelecida para codificação e transferência de dados são condições para o estabelecimento de sistemas robustos de acesso a informação digital. Como exemplo pode- se citar a Biblioteca Digital de Teses da USP (Figura 3), que estabelece padrões para a descrição e estruturação de dados designados pelo DublinCore, e complementados com metadados locais. Figura 3 – Biblioteca Digital de Teses da USP – exemplo de alguns campos definidos conforme formato Dublin Core A partir das experiências já existentes, a “nova concepção de biblioteca”, substanciada em todos os tipos de bibliotecas emergentes, requererá dos profissionais da informação um alto grau de conhecimento das tecnologias e dos padrões necessários para sua estruturação e gestão. O desafio que as tecnologias da informação e comunicação estabelecem nesse novo século, e a forma como estarão sendo utilizadas é que irão proporcionar o diferencial das organizações responsáveis pelo controle bibliográfico nacional e universal. 4 Referências Bibliográficas ALA.Committe on Cataloging:Description and Access. Task Force on Metadata. Summary report,june 1999. [on-line].Disponível em http://www.ala.org/alcts/organization/ccs/ccda/tf- meta3.html Acesso em : 24 de dezembro de 2002. ALVARENGA, Lídia. A teoria do conceito revisitada em conexão com ontologias e metadados no contexto das bibliotecas tradicionais e digitais. DataGramaZero – Revista de Ciência da Informação, v. 2, n.6, dez. 2001,18p. [on-line]. Disponível em:<http://www.dgzero.org/Atual/Art_05.htm > Acesso em: 26 de dezembro de 2001 ATKINS, Dan. Vision for digital libraries. In: An International research agenda for digital libraries, p.11-14, outubro1998. BLATTMANN, Ursula. Modelo de gestão da informação digital online em bibliotecas acadêmicas na educação à distância: biblioteca virtual. Florianópolis, 2001. 187p. DEMPSEY, Lorcan; HEERY, Rachel. A review of metadata: a survey of current resource description formats – version 1.0 March 1997. [on-line]. Disponível em :<http://www.ukoln.ac.uk/metadata/desire/overview > Acesso em: 04 de outubro de 1997. FOX, Edward A.; MARCHIONINI, Gary. Toward a worldwide digital library. Communications of the ACM, v.41, n.4, p.29-32, abril 1998. FOX, Edward A.;URS, Shalini R. Digital libraries. Annual Review of Information Science and Technology, v.33, 2002. p.503-589. GILS:overview-ideas behind the GILS approach. [on-line]. Disponível em : <http://www.gils.net/overview.html > Acesso em: 26 de novembro de 2001. HERRING, Susan C. Computer-mediated communication on the Internet. Annual Review of Information Science and Technology, v.36, 2002. p.109-168. HODGE, Gail. Metadata made simpler: a guide for libraries, Bethesda, MD: National Information Standards Organizations, 2001. 15p ISO. International Standartization Organization. Introduction to ISO. s.l.p.,1999. s.p. LANCASTER, F. W.; SANDORE, Beth. Technology and management in library and information services. Champaign: University of Illinois, 1997. LANGE, Holly; WINKLER, B. Jean. Taming the internet: metadata, a work in progress. Advances in librarianship, v. 21, 1997, p.47-72. MÉNDEZ RODRÍGUES, Eva M. Reflexiones em torno a los metadatos: um nuevo reto para la organización de bibliotecas digitales. In: Videoconferência promovida pela Universidade de São Paulo e Universidad Carlos III, 10 de dezembro de 2002. MÉNDEZ RODRÍGUES, Eva M; MERLO VEGA, José A. Localización, identificación y descripción de recursos web: tentativas hacia la normalización, 1999. [on-line]. Disponível em: <http://rayela.uc3m.es/~mendez/ > Acesso em:15 de janeiro de 2003 MILSTEAD, Jéssica; FELDMAN, Susan. Metadata: cataloging by any other name... Online, jan. 1999, 20p. [on-line]. Disponível em < http://www.onlineinc.com/onlinemag/OL1999/milsteadl.html> Acesso em: 21 de fevereiro de 2001 MOORE,Nick. A sociedade da informação. In: A informação: tendências para o novo milênio. Brasilia: IBICT, 1999. p. 94-108. PEÓN ESPANTOSO, José Juan. O arquiteto da informação e o bibliotecário do futuro. Revista de Biblioteconomia de Brasília, v.23/24, n.2, p.135-146, especial 1999/2000. ROSETTO, Márcia Metadados e formatos de metadados em sistemas de informação: caracterização e definição.--São Paulo, 2003. 112 p. (Dissertação de mestrado apresentada ao Curso de Pós – Graduação da Escola e Comunicações e Artes da Universidade de São Paulo) ROWLEY, Jennifer. A biblioteca eletrônica. Brasília: Briquet de Lemos/Livros, 2002. 399p. SABATTINI, Marcelo. Publicações científicas eletrônicas na Internet: modelos, padrões, e tendências. São Bernardo do Campo, 1999. 256p. (Dissertação apresentada ao Curso de Pós-Graduação em Comunicação Social da Universidade Metodista de São Paulo) SOCIEDADE da informação no Brasil: livro verde. Brasília: Ministério da Ciência e Tecnologia, 2000. 203p. VELLUCCI, Sherry L. Metadata. Annual Review of Information Science and Technology, v.36, p. 503-389,2002. WEIBEL,Stuart; GODBY, Jean; MILLER, Eric. OCLC/NCSA metadata workshop report. [on-line]. Disponível em : < http://dublincore.org/ > Acesso em: 15 de outubro de 2002.
Compartilhar