Buscar

Metadados e Recuperação da Informação: padrões para bibliotecas digitais - Marcia Rosetto

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

II Ciberética – Simpósio Internacional de Propriedade Intelectual, 
Informação e Ética; VIII Encontro Nacional de Informação e Documentação 
Jutídica/ENIDJ; XXII Painel Biblioteconomia em Santa Catarina. 
Florianópolis, SC, 12 a 14 de novembro de 2003 
 
 
Metadados e Recuperação da Informação : 
 padrões para bibliotecas digitais 
 
 Marcia Rosetto 
 
Resumo 
 
A rede Internet, disponibilizada a todos cidadãos nos anos 90, intensificou o acesso geral e 
irrestrito às informações devido às facilidades proporcionadas pela infra-estrutura e conjunto de 
programas e protocolos. Dentre as implementações encontram-se os projetos para a edição de 
publicações eletrônicas, bibliotecas virtuais e digitais. Apesar das possibilidades existentes para 
o acesso a esses repositórios informacionais, tem sido necessário o desenvolvimento de novas 
especificações técnicas para a padronização dos dados, propiciando dessa forma uma 
recuperação eficiente e eficaz pelo usuário. Dentre as regras e normas elaboradas encontram-se 
os formatos de metadados, que subsidiam a organização de conteúdos em meio digital. O 
presente trabalho apresenta o conceito, as características e os objetivos de metadados, 
objetivando uma melhor compreensão sobre sua importância quando da estruturação de bases de 
dados e serviços de informação de conteúdos digitais. 
 
Abstract 
Metadata and Information Retrieval – Patterns for Digital Libraries 
 
Available for every citizen since the 90’s, Internet has improved general and open access to 
information due to the availability of IT infrastructure and a set of programs and protocols. 
Among the implementations, there are projects aimed to provide electronic publications edition, 
as well as virtual and digital libraries organization. Although it is not difficult to access these 
informational repositories, the development of new technical specifications has been necessary 
for data standardization to achieve efficient retrieval by the user. Among rules and standards, 
metadata formats to organize contents in digital support can be found. The present paper presents 
metadata concept, characteristics and objectives for a better understanding about their 
importance for the definition of databases structure and digital contents information services. 
 
 
1 Introdução 
Nesse século é flagrante o surgimento da sociedade da informação. Em razão do papel 
crescente da informação, os seus insumos são de fundamental importância para o 
desenvolvimento econômico, social, cultural e político dos países em geral. 
Muitas tentativas à determinação de um conceito para a sociedade da informação são 
relativamente recentes, sendo foco de constantes estudos em muitos países e organizações 
internacionais, objetivando definições mais exatas à extensão e influência na sociedade 
(Moore, 1999). 
Essa preocupação, entretanto, fica mais evidente e intensiva nos anos 90, quando foi 
liberado o uso da rede Internet, criada em 1969, e utilizada apenas pelo meio acadêmico, e 
posteriormente estendida aos meios de comunicação de massa. 
A adoção dessa rede intensifica cada vez mais o acesso geral e irrestrito às informações 
devido às facilidades proporcionadas pela infra-estrutura e conjunto de programas e 
protocolos que permitem aos usuários utilizá-la sob diferentes maneiras. Ao longo da 
história da Internet surgem diversos tipos de ferramentas (Gopher, Ftp, Telnet , correio 
eletrônico, entre outros), e de serviços (Archie, Usenet, World Wide Web, entre outros). 
 
Dentre eles, o que mais se destaca a partir de sua concepção, em 1989, com o uso do 
protocolo http (Hypertext Transfer Protocol), é o World Wide Web (WWW), 
disponibilizando informação em forma de páginas hipermídia combinando textos, 
ilustrações e links (apontamentos) para acesso a recursos/documentos disponíveis pela 
própria rede. De acordo com Berners-Lee (Herring , 2002) , “a idéia sobre hipertexto1 é 
criar um espaço para intercâmbio de informação, no qual um grande número de pessoas e 
máquinas podem comunicar-se via links associados”. 
As inovações tecnológicas implementadas para uso da interface WWW, proporcionaram a 
grande expansão para a intermediação de serviços e produtos nas áreas acadêmica e 
comercial, e esse avanço transformou a Internet, em pouco tempo, num grande repositório 
universal do conhecimento humano nunca antes imaginado. 
A concepção de uma interface de uso padrão (WWW), independente do tipo de ambiente 
computacional utilizado, possibilitou aos usuários, pessoais e institucionais, tornarem-se 
também criadores de textos/informações, transformando a Web um meio de publicação e 
acessibilidade irrestritas. 
Esse universo sem fronteiras tem atraído a atenção de milhões de pessoas de todos os 
lugares do mundo, que atualmente executam tarefas por meio dessa rede. No entanto, 
apesar do sucesso alcançado, a Internet tem introduzido problemas para ela própria, e para 
os seus usuários. Diariamente, novas páginas Web são incluídas, conteúdos já existentes 
são alterados, e outras desaparecem. Essa mutação é constante e vertiginosa, tornando-a 
um ambiente complexo, heterogêneo e dinâmico, mas pouco uniforme e sem nenhum 
critério documental definido para a sua organização (Méndez Rodríguez & Merlo Vega, 
2003 ). 
Apesar da disponibilidade desses recursos, o acesso aos repositórios não tem sido fácil; 
encontrar informações úteis, é freqüentemente tedioso e tarefa difícil. 
Quando da recuperação da informação necessária para resolver os seus problemas, o 
usuário deve “navegar” no espaço hipertextual (links Web) , que é vasto e quase sempre 
desconhecido, trazendo um grande desconforto durante a realização de pesquisas, muitas 
vezes ineficientes devido à recuperação não satisfatória. Vários serviços indexam essas 
informações, por meio de motores de busca, cujos resultados apresentam problemas, pois 
a falta de uma infra-estrutura sólida e estável quanto ao tratamento dos recursos ali 
dispostos tem feito da Web um sistema de informação não muito bem disciplinado. 
 
1
 Hipertexto é um texto que contem links associados a palavras ou expressões que permitem ao leitor se 
deslocar automaticamente para as partes por eles apontados (Sociedade da informação no Brasil: livro verde, 
2000) 
Essa situação é ocasionada principalmente pela falta de uma padronização, em nível 
mundial, que oriente a estruturação da informação com base em identificadores de forma e 
de conteúdos dessas páginas, lembrado que, conforme a ISO (International Standard 
Organization) (ISO, 1999), padrões são acordos oficializados, contendo especificações 
técnicas ou outros critérios para serem utilizados, consistentemente, como regras, normas 
ou definições de características. 
Para encontrar soluções à essa questão, desde o início dos anos 90, várias iniciativas têm 
sido desenvolvidas pelas organizações responsáveis pelo gerenciamento como também por 
instituições de pesquisa e provedores de informação. Dentre os estudos existentes, 
encontra-se a questão da recuperação da informação, que tem como foco a forma de 
interatividade do usuário com os sistemas de informação e as interfaces de busca, sem 
esquecer dos instrumentos (softwares) desenvolvidos para o seu acesso, a criação de 
códigos para a localização de objetos na rede, de forma inequívoca e, finalmente, a questão 
da descrição da informação contida nesse ambiente. 
Essas questões envolvem o objetivo de identificar, localizar e recuperar a informação de 
forma única e não ambígua. Quanto a descrição dos vários tipos de conteúdos, verifica-se o 
desenvolvimento de conjuntos de metadados, também conhecidos por esquemasou 
formatos de metadados, e esses mecanismos técnicos estão sendo utilizados já há algum 
tempo pelas organizações que gerenciam conteúdos na Internet para conferir o suporte 
necessário à organização dessas informações, sendo que a construção conhecida por 
sintaxe (de estrutura e elementos de dados) de cada tipo de metadados varia dependendo 
das necessidades especificas de seus usuários (Vellucci, 2002) .Detalhamento sobre o 
assunto encontra-se no item 3. 
No momento, além da questão de gestão dos recursos na Web, verifica-se também a 
influência da Internet no ambiente da biblioteca e nas funções e serviços por ela 
desempenhados. De acordo com vários autores e especialmente por Lancaster & Sandore 
(1997), a Internet é o recurso eletrônico que tem provocado maior impacto nos serviços e 
operações de bibliotecas e nas atividades dos bibliotecários . 
Dessa maneira os processos tradicionais de organização e prestação de serviços se 
modificam dia a dia. Um dos pontos críticos que a comunidade bibliotecária enfrenta 
atualmente é como efetuar o controle e a descrição de milhões de itens disponíveis na rede, 
e incorporá-los nas coleções. 
Inúmeros estudos e experiências para compatibilizar procedimentos já existentes para o 
controle e acesso aos dados bibliográficos com o ambiente de novos suportes 
informacionais estão em andamento a fim de adaptar as práticas tradicionais para esses 
recursos. Entretanto, iniciativas por investigadores de outras áreas avançam, gerando novos 
conhecimentos para a organização e tratamento dos estoques de informação. Os resultados 
dessas pesquisas na área da Ciência da Informação, apontam que a influência dos vários 
tipos de padrões de metadados, empregados para a descrição de recursos Web e para as 
bases de dados, influenciam as metodologias utilizadas pelas bibliotecas no tratamento da 
informação (Lancaster & Sandore, 1997). Para isso, faz-se necessário conhecê-los para 
subsidiar a sua utilização ou adaptação, e a adoção de metadados, desde o momento da 
geração do recurso de informação irá oferecer condições necessárias para a sua recuperação 
e subsídios para o tratamento dos dados por parte das organizações responsáveis pelo 
controle bibliográfico nacional e universal. 
 
2 Biblioteca digital 
 
Um número considerável de informações localizadas em Websites apontam atualmente 
para publicações eletrônicas ou para textos que estão armazenados em bibliotecas virtuais e 
digitais, e as tecnologias que propiciaram essas condições encontram-se agrupadas na 
computação (computadores e tecnologias de armazenamento), redes (terminais e aplicativos 
para distribuição), e nos conteúdos (texto, imagem, vídeos, sons). Esse último aspecto 
apresenta também mudanças significativas quanto ao aspecto das linguagens de marcação 
SGML, HTML, XML 2 (Fox, 2002), assim como nos formatos de apresentação para o 
usuário: ASCII (American Standard Code for Information Exchange); Bitmaps , formato 
de imagem que incluem o GIF (Graphic Interchange Format), JPEG (Joint Photographic 
Experts Group), PNG (Portable Network Graphics), BMP (bitmap OS/2 ou Windows), 
 
2
 SGML= Standard Generalized Markup Language; HTML= Hypertext Markup Language; XML= Extensible 
Markup Language . 
TIFF (Tagged Image File Format), entre outros; formato PDF (Portable Document 
Format); formato PostScript, formato Latex/Tex (Sabbatini, 1999). 
Todas essas implementações deram as condições necessárias para a consolidação das 
publicações eletrônicas, cujos projetos propiciaram as condições para a edição nesse 
suporte e estão resumidamente descritos no Quadro 1, e podem ser entendidas , segundo 
Sabbatini (1999), como “ qualquer tecnologia de distribuição de informação em uma forma 
que possa ser acessada e visualizada pelo computador e que utiliza recursos digitais para 
adquirir, armazenar e transmitir informação de um computador para outro”, estando 
disponíveis em formato físico como disquetes, CD-ROM, ou por acesso on-line, 
principalmente pela Internet, utilizando-se de recursos como correio eletrônico, File 
Transfer Protocol (FTP) e WWW. 
Quadro 1 – Projetos desenvolvidos para editar publicações científicas na Internet 
 
Ano de inicio do projeto Projeto 
1991 - Core- Cornell Universty – Chemistry 
Online Retrieval Literature 
- TULIP – Elsevier Science, The 
University Licencing Program 
1994 - e*pub, UNICAMP 
1992 - Red Sage Project – University of California 
(San Francisco) 
- Physics Eprint Archive, Los Alamos 
National Laboratory 
1995 - JSTOR – Fundação Andrew W. Mellon 
- Super Journal Project, Eletronic Libraries 
Program (eLib) 
- High Wire Press, Stanford Universty 
1998 - SciElo, FAPESP/BIREME 
1999 - Base de dados Tropical, Fundação André 
Tosello 
Fonte: Sabbatini (1999) 
 
Essas experiências consolidaram conhecimentos e proporcionaram subsídios para o 
desenvolvimento de bibliotecas digitais que, conforme Fox (1998), é uma das formas mais 
avançadas e complexas de sistemas de informação, pois freqüentemente envolve “suporte 
de forma colaborativa, preservação de documento digital, gerenciamento de base de dados 
distribuída, hipertexto, filtros de informação, recuperação de informação, módulos de 
instrução, gerenciamento de direitos autorais, serviços de informação multimídia, serviços 
de referência e respostas às questões enviadas, busca de recursos, e disseminação seletiva”. 
Muitos autores têm desenvolvido estudos objetivando a conceituação de uma biblioteca 
digital. Para Atkins (1998) “o conceito de biblioteca digital está na analogia com um 
lugar onde se encontra um repositório contendo uma coleção organizada de publicações 
(que possam ser impressos) e outros artefatos físicos, combinados com sistemas e serviços 
que facilitem o acesso físico, intelectual, e disponível por longo tempo” . Entretanto Fox 
(2002) considera que há diferentes conotações sobre biblioteca digital para diferentes 
grupos de profissionais. Para os de tecnologia da informação é um mecanismo poderoso 
para gerenciar bases de dados distribuídas; já para a comunidade de negócios ela 
representa um mercado novo, e quanto à comunidade da ciência da informação é uma 
nova forma para ampliar, distribuída e remotamente, o acesso a recursos de informação. 
A definição de biblioteca digital, baseando-se nos estudos realizados até o presente 
momento, demonstram que ainda está em construção, e em muitas situações confundem-se 
como bibliotecas virtuais ou eletrônicas. Sobre esse aspecto Blattmann (2001) proporciona, 
por meio de uma revisão bibliográfica sobre o assunto, um quadro com a evolução histórica 
e as características das bibliotecas em ambiente digital, e contribui para uma melhor 
compreensão sobre a atual conjuntura que passam as bibliotecas de modo geral. 
Apesar dessa situação quanto a redefinição das bibliotecas na sociedade da informação, a 
biblioteca digital tem, cada vez mais, um papel fundamental no planejamento estratégico 
dos novos serviços de informação com a finalidade de facilitar o acesso universal ao 
patrimônio científico e cultural ( Méndez Rodríquez,2002). Segundo a autora, “ se uma 
biblioteca é um conjunto organizado de documentos, uma biblioteca digital é um conjunto 
organizado de documentos eletrônicos , ou seja, um conjunto organizado de objetos 
digitais, onde os metadados são a chave para essa organização e formas de acesso à 
informação contidas nesse conjunto de dados “. Dessa forma, a criação de uma biblioteca 
digital implica conhecer todos os processos de tecnologia de informação ( hardware, 
software, armazenamento, protocolos, etc), e da biblioteca (definição do modelo de 
metadados, padrões a serem adotados, nível de detalhamento da descrição, metodologiaspara recuperar a informação organizada, entre outros requisitos), destacando-se os 
metadados (dados sobre os dados) que serão a chave fundamental para proporcionar uma 
recuperação eficiente, eficaz e fácil de informações/documentos úteis para o usuário. 
 
3 Metadados e formatos de metadados para estruturar dados para recuperação 
 
A representação e mediação do conhecimento é o elemento-chave para acesso rápido e 
adequado à informação, e essa necessidade originou várias formas para organizá-la. O 
controle se manifesta em duas premissas: a descrição, que ao mesmo tempo é uma operação 
(catalogação) e um produto, e a classificação, que representa as relações existentes entre 
tópicos referentes a diversas áreas. O objetivo da descrição é fornecer uma representação da 
fonte, permitindo identificá-la, localizá-la e representá-la nos catálogos correspondentes. 
A adoção do catálogo propiciou o controle da informação, incluindo os vários instrumentos 
normativos de apoio à organização documental, extensivamente utilizados pela 
comunidade internacional das áreas de biblioteconomia e ciência da informação, e pelas 
disciplinas relacionadas, tais como museus, arquivos, gerenciadores de registros, 
documentos, resumos e indexação, tesauros, e sistemas de recuperação da informação 
(GILS, 2001). 
Recuperar a informação contida nas publicações sempre foi o principal objetivo dos 
instrumentos elaborados pelas bibliotecas e sistemas de informação. Segundo Rowley 
(2002) “a questão crucial é que o processo de recuperação depende muito das etapas de 
indexação e armazenamento, os quais determinam, em grande medida, a estratégia melhor 
possível para as buscas feitas num sistema de recuperação da informação”. Com o 
desenvolvimento de tecnologias de informação e comunicação, novas formas para 
estruturar e disponibilizar a informação são desenvolvidas para acesso por meios 
eletrônicos, como por exemplo os catálogos on-line, mais conhecidos pela sigla OPAC 
(On-line Public Access Catalog) e com acesso pela Internet. 
Assim, a estruturação e organização de conteúdos ( textos, gráficos, entre outros) devem 
estar categorizados e auxiliados por um sistema de navegação intuitivo e confiável (Peón 
Espantoso, 1999/2000). Além disso, o tratamento da informação, de acordo com padrões 
internacionais para o armazenamento em bases de dados e disponíveis em ambientes 
digitais, continua sendo imprescindível e importante para a recuperação adequada. 
Otimizar a recuperação de informações estocadas sempre foi um desafio para os 
organizadores de repositórios de informação. Atualmente, segundo Alvarenga (2001) 
“bibliotecários e especialistas da informação se esforçam para desenvolver métodos para a 
descrição, organização e recuperação de objetos digitais acessados remotamente (...) e eles 
não estão só nesse desafio, porque criadores, provedores e usuários de fontes eletrônicas 
nos meios acadêmicos, públicos e comerciais também se acham dedicados à pesquisa sobre 
esse vasto campo de informações. Cada grupo tem abordado o problema de organização e 
acesso, a partir de seus próprios esquemas de referência”. 
Dessa forma estudos realizados resultam no desenvolvimento de métodos e padrões para a 
organização de recursos de informação on-line, designados como esquemas de metadados, 
ou formatos de metadados. Metadados, genericamente, vem sendo definidos como dados 
sobre dados, ou informações sobre a descrição e a localização de informações existentes na 
Internet, com o objetivo de permitir a sua recuperação de forma mais adequada por meio 
dos Websites. 
Estudos e experiências disponíveis na literatura desde a década de 90 demonstram a 
importância do uso de elementos metadados para a estruturação de sistemas de informação, 
e relatam sobre propostas para o tratamento dos recursos de informação em meio digital, e 
nesses últimos anos tem sido foco de análise tanto pela comunidade de biblioteconomia e 
documentação como também por outras áreas responsáveis pela organização e 
gerenciamento de recursos de informação em geral. 
A origem do termo “metadados” se inicia nos anos 60, mas aparece com maior freqüência 
na literatura sobre sistemas de gerenciamento de bases de dados a partir dos anos 80, sendo 
empregado para identificar as informações auto-descritivas e de auto-controle dos dados 
contidos nas bases (Vellucci, 2002). Até há poucos anos somente alguns teóricos da área 
tinham conhecimento da palavra metadados, entretanto, o entendimento do conceito de 
metadados tem se tornado fundamental para os autores, produtores e usuários de 
serviços de informação ( Milstead & Feldman, 2001), e tem sido estudado por muitos 
especialistas, incluindo bibliotecários, e as conclusões levam à mesma essência que é 
constante e que tentam solucionar questões sobre o controle e descrição de recursos 
disponíveis na Internet (Lange & Wickler, 1997). 
A partir de pesquisa realizada com a finalidade de buscar uma compreensão sobre 
metadados, a fim subsidiar o entendimento sobre o papel e finalidade que eles exercem na 
gestão de recursos em meio digital, apresenta-se uma consolidação no Quadro 2 sobre o 
conceito, objetivos e características de metadados que são a chave do processo que 
objetivam gerenciar e assegurar a consolidação e a disponibilização desses recursos para 
uso futuro. 
 
Quadro 2 – Conceito, objetivos e características de metadados 
 
Conceito 
 
 
 
Metadados são um conjunto de dados-atributos, devidamente 
estruturados e codificados, com base em padrões internacionais, 
para representar informações de um recurso informacional em 
meio digital ou não – digital, contendo uma série de características 
e objetivos. 
 
 
Objetivos 
 
 
 
1- Localizar, identificar e recuperar dados de um recurso 
informacional . 
2- Propiciar controles de ordem gerencial e administrativo 
permitindo conexões e remissões (links) para pontos 
internos e externos. 
3- Possibilitar a interoperabilidade entre sistemas de 
informação, dentro de padrões. 
4- Informar sobre as condições de acesso e uso da informação. 
5- Ser legível tanto pelo homem como pela máquina. 
6- Possibilitar a elaboração de índices. 
 
 
 
 
Características * 
 
 
 
1- Descrição, com pormenores, das condições físicas dos 
componentes com o fim de identificar e caracterizar o 
recurso de informação. 
2- Observância de padrões internacionais para a sintaxe e 
semântica da especificação do recurso de informação, em 
meio digital ou não – digital. 
3- Informam sobre armazenagem, preservação, acesso e uso 
dos dados. 
4- Dispõem informações administrativas e gerenciais para a 
devida criação e definição de responsabilidades dos 
metadados 
5- Possibilitam análises da qualidade, avaliações e formas de 
uso. 
6- Auto-descrevem e criam documentação própria que 
subsidia o gerenciamento dos recursos informacionais. 
 
* Aqui as características representam os papéis que exercem na configuração dos metadados. 
Fonte: Rosetto (2003) 
Tendo como característica a observância a padrões internacionais para a descrição do 
conjunto de dados, os metadados devem estar alinhados com as regras previstas por 
padrões desenvolvidos por organizações de renome na área, e que são designados como 
formatos de metadados. Esses formatos, que servem a distintas necessidades e audiências, 
podem ser utilizados para descrever os mesmos recursos para múltiplos propósitos, tendo 
como função fornecer as definições que estabelecem a organização padronizada de 
conteúdos e condições para o intercâmbio por meio magnético (Hodge, 2001). 
Muitos formatos de metadados são especificações estabelecidas por consenso de 
determinadas comunidades que gerenciam recursosde informação em suporte digital, com 
o fim de atender necessidades de informação específicas. Entretanto, o trabalho 
desenvolvido nessa área ainda está longe de ter um aval que atenda de forma universal as 
necessidades e permita o gerenciamento de metadados de forma adequada. Nesse sentido, 
vários projetos estão sendo realizados para permitir o estabelecimento de um padrão geral 
de formatação de metadados com parâmetros em âmbito mundial. 
De um modo geral um formato deve ter sempre uma especificação formal da estrutura e da 
semântica; deve definir um conjunto coerente de atributos e das terminologias adotadas na 
descrição. Conforme Weibel (2002), o requisito formal significa que o formato é mantido 
por uma agência autorizada e responsável pelas especificações conferindo credibilidade ao 
esquema dos dados; o requisito estrutura possui características codificadas dos valores 
contidos; e o requisito semântica determina atributos cujo significado é compreendido pelo 
homem e pela máquina dentro de uma coerência indiscutível. 
Complementando, Watson (ALA, 2002) identifica que um formato de metadados deve 
permitir atingir o objetivo dos metadados, facilitando a identificação, localização, 
recuperação e uso da informação pelo usuário. Cada formato é construído sob um 
conjunto de especificações e necessidades, e elaborados por especialistas nas áreas em que 
foram implementados. 
Em estudo realizado por Dempsey & Heery (1997), foram identificados até aquele 
momento vinte e dois formatos de metadados 3. Os critérios utilizados para avaliar esses 
formatos foram estabelecidos em dois grandes focos, e que estão descritos no Quadro 3. 
Quadro 3 – Critérios para avaliar formatos de metadados 
 
 
3
 Formatos analisados: BibTex, CDWA, CIMI, Dublin Core, EAD, The EELS Metadata Format ,The EEVL 
Metadata Format, FGDC, GILS, IAFA/Whois++ Templates, ICPSR SGML Code book Iniative, LDAP Data 
Interchange Format (LDIF), MARC (General overview), USMARC, UKMARC, UNIMARC, PICA+, RFC 1807 da 
IETF, Summary Object Interchange Format (SOIF), Text Enconding Initiative (TEI), Independent Headers, 
Uniform Resource Characteristics Citations (URCs) , Warwick Framework. 
Foco Aspectos verificados 
Ambiente de uso 
 
Documentação, consistência de uso, facilidade de uso, 
progresso quanto ao uso de padronização 
internacional. 
 
Emissões do formato Designação, conteúdo, regras para a construção dos 
elementos, emissões multi-lingüísticas, designação, 
codificação, habilidade para representar relações entre 
objetos, completeza, emissão de protocolo, 
implementações. 
Fonte: Dempsey & Heery (1997) 
Elaboração:Rosetto (2003) 
 
A partir das características identificadas, foi possível criar uma tipologia com três 
categorias de formatos de metadados, conforme descrito no Quadro 4. 
Quadro 4 – Tipologia de formatos de metadados 
 
 
Banda um Banda dois Banda três 
Características do 
registro 
- Formatos simples - Formatos estruturados - Formatos 
altamente 
estruturados 
 
 - Padrão 
proprietário 
- Padrões emergentes - Padrões 
internacionais 
 
 - Todo texto 
indexado 
- Estrutura em campos - Estrutura por meio 
de etiquetas (tags) 
 
Formatos dos 
registros 
- Lycos, Alta Vista, 
Yahoo, etc 
- Dublin Core, Planilha 
IAFA, RFC 1807, 
SOIF, LDIF 
- MARC, TEI, CIMI, 
EAD, ICPSR 
Fonte: Dempsey & Heery (1997) 
Adaptação: Rosetto (2003) 
 
As informações consolidadas refletem o estágio em que se encontram os formatos de 
metadados, bem como suas características e funcionalidade para propiciar o controle dos 
recursos de informação em meio digital. De acordo com os autores, os formatos se 
classificam pelas características identificadas em uma das categorias abaixo especificadas: 
 
1) Na banda um, encontram-se os formatos com dados não- estruturados, tipicamente 
extraídos em base automática dos recursos e indexados por motores de busca 
existentes na Internet; 
2) Na banda dois, entram os formatos com dados básicos estruturados, contendo 
descrições suficientes que permitem ao usuário verificar a potencialidade de sua 
utilidade ou o interesse por um recurso sem ter que recuperá-lo ou conectá-lo; 
3) Na banda três, encontram-se os formatos cujos registros são descritos mais 
formalmente , que podem ser usados tanto para a localização e recuperação como 
para documentar os objetos, ou muito freqüentemente as coleções de objetos. 
Para cada formato analisado, há informações completas sob os aspectos assinalados, sendo, 
portanto, uma fonte de informação importante para se conhecer melhor cada um dos 
formatos relacionados. 
A titulo de ilustração sobre o emprego de formatos de metadados, na Figura 1 encontram-
se as telas utilizadas pelo sistema Connexion do OCLC (Online Computer Library Center), 
que propicia condições para a catalogação de recursos de informação recuperados na Web, 
podendo-se optar pelo formato MARC (Figura 1.1), ou formato Dublin Core (Figura 1.2). 
Já na Figura 2 há um exemplo de recurso de informação de uma Website, em HTML 
,contendo a descrição dos metadados de acordo com as regras definidas pelo formato 
Dublin Core, e em estrutura XML/RDF 4. 
 
 
 
 
 
 
 
 
 
 
4
 XML – Extensible Markup Language 
 RDF – Resource Description Framework 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 1.1 - Planilha com etiquetas do Formato MARC para descrição de metadados 
de recursos informacionais eletrônicos e não- eletrônicos 
(Sistema Connexion do OCLC) 
 
 
 
 
 
 
 
Figura 1.2 - Planilha com etiquetas do Formato Dublin Core para descrição de 
metadados de recursos informacionais eletrônicos e não- eletrônicos 
 (Sistema Connexion do OCLC) 
 
 
 
 
 
 
 
 
 
 
 
Figura 2– Exemplo de recurso informacional em Website, em HTML, utilizando o 
formato Dublin Core para descrição dos metadados 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Fonte: Mendez Rodriquez (2000) 
Adaptação: Rosetto (2003) 
 
 
Embora a adoção de formatos seja uma prática de longa data na área de ciência da 
informação, como é o caso do MARC, novas regras estão sendo elaboradas para estabelecer 
uma uniformização de dados visando a recuperação e o intercâmbio automatizado entre os 
sistemas. Pode-se citar, como exemplo, o formato Dublin Core que hoje é uma norma 
internacional, e cujas categorias encontram-se relacionadas no Quadro 5, e é utilizado como 
padrão em inúmeros projeto como o Prossiga, Biblioteca Digital de Teses do IBICT, entre 
Metadados 
Descritivo Etiquetas 
Dublin 
Core 
outros, diminuindo custos e esforços e, principalmente, melhorando os procedimentos 
para a consistência precisa das informações. 
 
Quadro 5– Categorias dos elementos de metadados do formato Dublin Core 
 
Coteúdo Propriedade Intelectual Características fisicas 
Titulo Criador Data 
Assunto Editor Tipo (de recurso) 
Descrição Contribuinte Formato (suporte físico) 
Fonte Direitos Identificação (local) 
Idioma 
Relação 
Cobertura (extensão) 
 
 
No desenvolvimento de bibliotecas digitais, a formatação de acordo com uma semântica da 
estrutura com regras bem definidas para a descrição dos componentes, e de uma sintaxe 
estabelecida para codificação e transferência de dados são condições para o 
estabelecimento de sistemas robustos de acesso a informação digital. Como exemplo pode-
se citar a Biblioteca Digital de Teses da USP (Figura 3), que estabelece padrões para a 
descrição e estruturação de dados designados pelo DublinCore, e complementados com 
metadados locais. 
 
 
 
 
Figura 3 – Biblioteca Digital de Teses da USP – exemplo de alguns campos definidos 
conforme formato Dublin Core 
 
 
 
A partir das experiências já existentes, a “nova concepção de biblioteca”, substanciada em 
todos os tipos de bibliotecas emergentes, requererá dos profissionais da informação um alto 
grau de conhecimento das tecnologias e dos padrões necessários para sua estruturação e 
gestão. O desafio que as tecnologias da informação e comunicação estabelecem nesse novo 
século, e a forma como estarão sendo utilizadas é que irão proporcionar o diferencial das 
organizações responsáveis pelo controle bibliográfico nacional e universal. 
 
 
 
 
4 Referências Bibliográficas 
 
ALA.Committe on Cataloging:Description and Access. Task Force on Metadata. Summary 
report,june 1999. [on-line].Disponível em http://www.ala.org/alcts/organization/ccs/ccda/tf-
meta3.html Acesso em : 24 de dezembro de 2002. 
ALVARENGA, Lídia. A teoria do conceito revisitada em conexão com ontologias e 
metadados no contexto das bibliotecas tradicionais e digitais. DataGramaZero – Revista de 
Ciência da Informação, v. 2, n.6, dez. 2001,18p. [on-line]. Disponível 
em:<http://www.dgzero.org/Atual/Art_05.htm > Acesso em: 26 de dezembro de 2001 
ATKINS, Dan. Vision for digital libraries. In: An International research agenda for digital 
libraries, p.11-14, outubro1998. 
BLATTMANN, Ursula. Modelo de gestão da informação digital online em bibliotecas 
acadêmicas na educação à distância: biblioteca virtual. Florianópolis, 2001. 187p. 
DEMPSEY, Lorcan; HEERY, Rachel. A review of metadata: a survey of current resource 
description formats – version 1.0 March 1997. [on-line]. Disponível em 
:<http://www.ukoln.ac.uk/metadata/desire/overview > Acesso em: 04 de outubro de 1997. 
FOX, Edward A.; MARCHIONINI, Gary. Toward a worldwide digital library. 
Communications of the ACM, v.41, n.4, p.29-32, abril 1998. 
FOX, Edward A.;URS, Shalini R. Digital libraries. Annual Review of Information Science 
and Technology, v.33, 2002. p.503-589. 
GILS:overview-ideas behind the GILS approach. [on-line]. Disponível em : 
<http://www.gils.net/overview.html > Acesso em: 26 de novembro de 2001. 
 
HERRING, Susan C. Computer-mediated communication on the Internet. Annual Review 
of Information Science and Technology, v.36, 2002. p.109-168. 
HODGE, Gail. Metadata made simpler: a guide for libraries, Bethesda, MD: National 
Information Standards Organizations, 2001. 15p 
ISO. International Standartization Organization. Introduction to ISO. s.l.p.,1999. s.p. 
LANCASTER, F. W.; SANDORE, Beth. Technology and management in library and 
information services. Champaign: University of Illinois, 1997. 
LANGE, Holly; WINKLER, B. Jean. Taming the internet: metadata, a work in progress. 
Advances in librarianship, v. 21, 1997, p.47-72. 
MÉNDEZ RODRÍGUES, Eva M. Reflexiones em torno a los metadatos: um nuevo reto 
para la organización de bibliotecas digitales. In: Videoconferência promovida pela 
Universidade de São Paulo e Universidad Carlos III, 10 de dezembro de 2002. 
 
MÉNDEZ RODRÍGUES, Eva M; MERLO VEGA, José A. Localización, identificación y 
descripción de recursos web: tentativas hacia la normalización, 1999. [on-line]. Disponível 
em: <http://rayela.uc3m.es/~mendez/ > Acesso em:15 de janeiro de 2003 
 
MILSTEAD, Jéssica; FELDMAN, Susan. Metadata: cataloging by any other name... 
Online, jan. 1999, 20p. [on-line]. Disponível em < 
http://www.onlineinc.com/onlinemag/OL1999/milsteadl.html> Acesso em: 21 de fevereiro 
de 2001 
 
MOORE,Nick. A sociedade da informação. In: A informação: tendências para o novo 
milênio. Brasilia: IBICT, 1999. p. 94-108. 
PEÓN ESPANTOSO, José Juan. O arquiteto da informação e o bibliotecário do futuro. 
Revista de Biblioteconomia de Brasília, v.23/24, n.2, p.135-146, especial 1999/2000. 
ROSETTO, Márcia Metadados e formatos de metadados em sistemas de informação: 
caracterização e definição.--São Paulo, 2003. 112 p. (Dissertação de mestrado apresentada 
ao Curso de Pós – Graduação da Escola e Comunicações e Artes da Universidade de São 
Paulo) 
 
ROWLEY, Jennifer. A biblioteca eletrônica. Brasília: Briquet de Lemos/Livros, 2002. 
399p. 
SABATTINI, Marcelo. Publicações científicas eletrônicas na Internet: modelos, padrões, e 
tendências. São Bernardo do Campo, 1999. 256p. (Dissertação apresentada ao Curso de 
Pós-Graduação em Comunicação Social da Universidade Metodista de São Paulo) 
SOCIEDADE da informação no Brasil: livro verde. Brasília: Ministério da Ciência e 
Tecnologia, 2000. 203p. 
VELLUCCI, Sherry L. Metadata. Annual Review of Information Science and 
Technology, v.36, p. 503-389,2002. 
WEIBEL,Stuart; GODBY, Jean; MILLER, Eric. OCLC/NCSA metadata workshop report. 
[on-line]. Disponível em : < http://dublincore.org/ > Acesso em: 15 de outubro de 2002.

Outros materiais