Buscar

Bibliotecas Digitais

Prévia do material em texto

Bibliotecas 
Digitais
Bibliotecas 
DigitaisDigitaisDigitais
JustificativasJustificativas
• Explosão da informação
• Tempo para encontrar a informação
• Sobrecarga de informação• Sobrecarga de informação
(EUA 150Kg papel/estudante/ano + inf. eletrônica
DefiniçãoDefinição
Uma BIBLIOTECA DIGITAL é
um espaço virtual para dar suporte à pesquisa um espaço virtual para dar suporte à pesquisa 
em alguma área de conhecimento
Por Que Bibliotecas DigitaisPor Que Bibliotecas Digitais
•A biblioteca digital traz a biblioteca para o usuário
•A capacidade do computador é usado para 
pesquisar e mostrar
•A informação pode ser compartilhada e copiada
•A informação é facilmente atualizada•A informação é facilmente atualizada
•A informação está sempre disponível
•Novas formas de informação tornam-se possível
•Menor custo de manutenção
CaracterísticasCaracterísticas
Uma BIBLIOTECA DIGITAL é um 
Sistema de informação com: 
• suporte a colaboração
• preservação e recuperação de documentos digitais 
(SGBDDig)(SGBDDig)
• suporte a Hipertexto, Hiperdocumentos, Multimídia
• filtragem e indexação da informação
• Módulos instrucionais
• Direitos de propriedade intelectual
• Inteface e processamento de consultas 
• descoberta de recursos
• disseminação da informação
CaracterísticasCaracterísticas
apresentado
OBJETO DIGITAL disseminadoarmazenado
Representada por
OBRA
• papel
• papel digitalizado
• híbrido
• eletrônico puro
• livros, monografias
• artigos, periódicos
• Imagens, etc.
• e-mails, programas,..
meiotipo
CaracterísticasCaracterísticas
Pesquisador
USUÁRIO livrariaeditora
Bibliotecário
Modelo 5SModelo 5S
1. Sociedades (pessoas, componentes de HW e de SW) 
ajudam a satisfazer as necessidades dos usuários
(administradores, usuários, relacionamentos entre atores)
2. Cenários (provêm serviços de informação) 
serviços, atividades, tarefas, operações
(diagramas de sequência UML)(diagramas de sequência UML)
3. Espaços localizam e apresentam informação de forma
adequada = {objetos, operações}
(visões lógicas e de apresentação de diversos componentes) 
4. Estruturas organizam informação de forma adequada
(grafos dirigidos com labels descrevendo metadados, hipertextos, 
taxonomias, esquemas XML, RDF)
5. Streams comunicam informação com usuários e máquinas
(estáticos: sequências de bits, caracteres, imagens,..
dinâmicos: fluxo de informação, animação, sicronização) 
Modelo 5SModelo 5S
Estrutura formal de 5 SEstrutura formal de 5 S
Estrutura formal de 5 SEstrutura formal de 5 S
Estrutura formal de 5 SEstrutura formal de 5 S
Objetos digitaisObjetos digitais
Objetos digitaisObjetos digitais
FORMATOS de 
Intercâmbio (Metadados):
• Z39.50
•MARC/IBICT
• DC – Dublin Core
FORMATOS 
dos Documentos
• PDF, PS
• DOC, TXT
• HTML, XML, etc.
• MP3, MPEG, etc.dos Documentos • MP3, MPEG, etc.
Indexação
catalogação
• CDU, CDD, CR
• MeSH
• LCSH.
Identificação
• semântica X surrogate
• ISBN, URL, URN
• SICI – Serial Item and Contributor Id.
cadastro
resposta
consultas
Sistema de Biblioteca (Digital)
ASSUNTOS
Cópias
sugestões de
aquisição
indexação
DOCUMENTOS
USUÁRIOS
REFERÊNCIAS
Bi Di GlobalBi Di Global
Uma Federação de Bibliotecas Digitais
INTEROPERABILIDADE
• Técnica (hardware, redes, 
TECNOLOGIAS
• Interfaces
• Recuperação Multilíngue• Técnica (hardware, redes, 
protocolos)
• De Informação (escopo, 
linguagem, metadados, 
convenções, semânticas)
• Social (direitos e 
responsabilidades pessoais
e de organizações)
• Recuperação Multilíngue
• Indexação Multimídia (textos,
análise de discursos, músicas, 
vídeos, imagens, gráficos) 
• Recuperação da Informação
Multimídia 
• Novas Publicaçoes Eletrônicas
• Digitalização
cadastro
resposta
BD­1
Biblioteca Digital Federada
•
I
N
T
E resposta
indexação
BD­n
consultas
•
•
•
E
R
F
A
C
E
ProjetosProjetos
• University of California at Berkeley
- informação digital no trabalho ­
Digital Libraries InitiativeDigital Libraries Initiative
Coordenação de projetos de:
DLI2 (1999-)DLI1 (1994-1998)
- informação digital no trabalho ­
[3.5 TB de dados, Consultas baseadas em imagens, ling. Natural, OCR, OR Postgres 
• Carnegie Mellon University
­ análise de videos por conteúdo –
[200HS de gravações da TV pública, reconh. voz, reconh. rostos humanos, 
ling. Natural]
• University of California at Santa Barbara
­ informação espacial em mapas –
[Bib. Alexandria, mapas, fotos aéreas, múltiplas resoluções, OR Postgres
• University of Illinois
- coleções federadas de publicações científicas ­
[200.000 documentos digitais; Internet, rec. semântica, groupware] 
Digital Libraries InitiativeDigital Libraries Initiative
• University of Michigan
­ agentes inteligentes para localização da informação –
[Agentes, interfaces, busca distribuida, aprendizagem colaborativa]
• Stanford University (Garcia­Molina)
­ interoperabilidade –
[Pub. Cienc. Computação; protocolos, agentes, interfaces) InterLib
EU 6th Framework (2002-2006)EU 6th Framework (2002-2006)
1. genomics and biotechnology for health; 
2. information society technologies; 
€12 billion
2. information society technologies; 
3. nanotechnologies and nanosciences; 
4. aeronautics and space; 
5. food safety;
6. sustainable development; and 
7. economic and social sciences. 
advance the techniques for 
evaluation of networked systems 
EU 6th Framework (2002-2006)EU 6th Framework (2002-2006)
• bibliotecas digitais
• sistemas baseados em agentes, 
• grid computing, e 
• Web semântica
evaluation of networked systems 
COMBINA:
DL ABS
EU 6th FrameworkEU 6th Framework
Grid SW
Common Metrics
EU 6th FrameworkEU 6th Framework
• Issues of scale and scalability; 
• Interoperability among heterogeneous sources and systems • Interoperability among heterogeneous sources and systems 
challenge; 
• usability of these systems by a broad range of individuals;
• information content, computational tools, and user needs. 
• evaluation standards and measures.
PROJETOSPROJETOS
• DIPPO: Federação de dados estatísticos governamentais; 
• Maeda et.al. Documentos Multiliguais (MHTML viewer)
• Klavans&Schäuble NSF_EU Multilingual Information access
• Endres&Fuhr MeDoc – Multimedia Electronic Documents. 
• Gonçalves&Medeiros Disseminação Científica (BD 
Tropicais+EMBRAPA+GEOLIB.
• NCSTRL­Networked Computer Science Technical Reports 
Library Biblioteca Digital Distrribuída na Europa Central
• NEW ZEALAND DIGITAL LIBRARY 
PROJETOSPROJETOS
• NEW ZEALAND DIGITAL LIBRARY 
• Múltiplas línguas (Inglês, Francês, Alemão, Arábico, Maori,
Português, Swahili)Português, Swahili)
• Múltiplas midias (Local Oral History Collection Interiews and photographs), 
Musik Library (10 000 folk tunes)
• Sistema MG para textos
• Sistema MR para músicas
Bibliotecas Digitais FederadasBibliotecas Digitais Federadas
 Bibliotecas setoriais
 Bibliotecas integradas
}USP­DEDALUS
 USP + 
 Unicamp + 
 UNESP
} UNIBIBLI
DELOS (Projeto ESPRIT, part of ERCIM DL Initiative) Workshops:
­ "Information Seeking, Searching and Querying in Digital Libraries", 
11­12 December 2000, Zurich, Switzerland.
EVENTOSEVENTOS
NSF Post Digital Library Futures Workshop
15­17 Junho 2003 – Massachusetts
(http://www.sis.pitt.edu/%7Edlwkshop/papers.html)
11­12 December 2000, Zurich, Switzerland.
­ "Personalisation and Recommender Systems in Digital Libraries", 
18­20 June 2001, Dublin, Ireland.
­"Interoperability and Mediation in Heterogeneous Digital Libraries", 
8­9 September 2001, Darmstadt, Germany
­ Evaluation of Digital Libraries: Testbeds, Measurements, and Metrics
6­7 June 2002 Budapest, Hungary
Topicos de pesquisaTopicos de pesquisa
• Modelos de objetos
• interfaces e interação
• descoberta da informação (browsing+IR)
• Metadados: catalocação e indexação• Metadados: catalocação e indexação
• Processamento linguagem (multi-)lingual
• material não textual (metadados e pesquisa)
• armazenamento e gerência de coleções
• conversão: físico -> digital
• interoperabilidade(interfaces, identificação (URN),
formatos, metadados, pesquisa distrib.,
comunicação e transmissão )
• Autenticação e segurança (direitos autorais) 
REFERÊNCIAS
• E. Fox & G. Marchionini (eds.) Towards a Worldwide Digital Library + diversos
Artigos sobre Interoperability, Special types of Digital Libraries; Multilingual 
Support; National Efforts, Special Issue on DL, CACM 41(4) 1998
• E. Fox Overview of Digital Library Components and Developments
• M. Gonçalves, E. Fox et.al. Streams, Strtuctures, Spaces, Scenarios, Societies (5S): 
A Formal Model for Digital Libraries
• W. Arms Digital Libraries, MIT Press, 2000• W. Arms Digital Libraries, MIT Press, 2000
• N. Adami et. al, ToCAI: a Framework for Indexing and Retrieval of Multimedia 
Documents
• E. Bertino, A. Elmagarmid & Hacid Quality of Services in Multimidia Digital 
Libraries, ACM SIGMOD Record 30(1), 2001
• L. Feng, M. Jeusfeld & J. Hoppenbrowers Towards Knowledge Based Digital 
Libraries, ACM SIGMOD Record 30(1):41­46, 2001
• IEEE Computer – Special Issue on Digital Libraries, February 1999
• Franciska de Jong & Thijs Westerveld MUMIS: multimedia indexing and 
searching EU Founded project
• Alfredo Sánchez Bibliotecas Digitales: Introducción, ENC, 1997
SISTEMAS
• DIALOG Corporation
•Cobre mais de 500 bancos de dados. Recupera
informações bibliográficas e textos integrais
• LEXIS­NEXIS
• banco de dados de textos integrais sobre assuntos
jurídicos e de negóciosjurídicos e de negócios
• OCLC (Online Computer Library Center)
• 70 bancos de dados com 1,5 milhões de textos 
integrais
• H.W.Wilson
• 40 bancos de dados com informação colegial
(versões eletrônicas, CD­ROM e Web dos dados)
SISTEMAS
• DIALOG Corporation
•Alguns bancos de dados:
• Chemical abstracts (20 milhões, + 11.000/semana); • Chemical abstracts (20 milhões, + 11.000/semana); 
• MEDLINE (12 milhões + 7.700/semana); 
• NYT full text desde 1981; 
• Psych. Abstracts (2 milhões + 5000/mês);.. 
SISTEMAS
• Tipos de pesquisas comuns:
• Termo simples
• Frases
• Cada sistema tem sua linguagem
• Tentativas de standard:
• CCL (Common Command Language)
• NISO Z39.58
•ISO 8777
• Frases
• Combinações Booleanas
• Proximidades (‘A’ adjacente/perto­de ‘B’)
• Colocações (‘A’ no título ou no resumo, etc.)
• Caminhar por relações entre termos (no thesaurus)
• funções de BDs específicos (p.ex. químico)
• Consultas são iterativas
• Pesquisas cross­databases
Acesso a bibliotecas – Ficha catalográfica
Sobrenome do autor, Nome
Título da tese: subtítulo / Nome completo do autor. ­ ­ Rio de Janeiro: 
UFRJ / Nome ou sigla da Unidade, ano.
x, 90 f. : il. ; 31 cm.
Autoria
Título da tese inicia-se
abaixo da 4º letra do 
sobrenome
Imprenta
Descrição Física
Subtítulo
x, 90 f. : il. ; 31 cm.
Orientador: Nome 
Tese (doutorado) – Universidade Federal do Rio de Janeiro, 
Nome ou sigla da Unidade, Nome do Programa de Pós­graduação, ano. 
1. Assunto. 2. Área de concentração – Tese. I. Sobrenome do orientador, 
Nome. II. Universidade Federal do Rio de Janeiro, Nome da Unidade, Nome do 
Programa de Pós­graduação. III.Título.
Notas 
Assunto(s)
Pista
Tamanho: 12,5 cm x 7,5 cm
Acesso a bibliotecas – Ficha catalográfica
Pastura, Patrícia Souza Valle Cardoso
Infecção suspeita em crianças com neoplasia hematológica e neutropenia / 
Patrícia Souza Valle Cardoso Pastura. -- Rio de Janeiro: UFRJ / Faculdade de 
Medicina, 2003.
xi, 110 f. : il. ; 31 cm.
Orientadores: Guilherme Santoro Lopes e Marcelo Gerardin 
Poirot LandPoirot Land
Dissertação (mestrado) – UFRJ / Faculdade de Medicina / DIP, 
2003.
Referências bibliográficas: f. 88-104
1. Neutropenia. 2. Neoplasias hematológicas. 3. Leucemia linfocítica 
aguda L1. 4. Infecção. 5. Febre. 6. Criança. 7. Prognóstico. 8. Estudos 
prospectivos. 9. Doenças Infecciosas e Parasitárias - Tese. I. Lopes, 
Guilherme Santoro. II. Land, Marcelo Gerardin Poirot. III.Universidade 
Federal do Rio de Janeiro, Faculdade de Medicina, DIP. IV. Título.
Acesso a bibliotecas – Ficha BibTex
@Book{abramowitz+stegun, 
author = "Milton Abramowitz and Irene A. Stegun",
title = "Handbook of Mathematical Functions with Formulas, Graphs, and 
Mathematical Tables", 
publisher = "Dover",
year = 1964, address = "New York", 
edition = "ninth Dover printing, tenth GPO printing" edition = "ninth Dover printing, tenth GPO printing" 
___________________________________________________________________
_______
@proceeding{646491, 
editor = {Alberto H. F. Laender and Arlindo L. Oliveira}, 
title = {SPIRE 2002: Proceedings of the 9th International Symposium on String 
Processing and Information Retrieval}, 
year = {2002}, 
isbn = {3­540­44158­1}, 
publisher = {Springer­Verlag}, 
address = {London, UK}, } 
Acesso a bibliotecas – Ficha MARC
Autoria:Setzer, Valdemar Waingort, 1940-
Título:Curso de Fortran IV, básico. 
Imprenta:São Paulo, E. Blucher, Ed. da U.S.P. [1972] 
Descrição física:102 p. il. 
Notas:Registro Pré-MARC
Assuntos:Fortran (Linguagem de programação) Programação, Linguagens de.
Autorias secundárias:Simon, Imre, 1943- Kowaltowski, Tomasz, 1942-
Classificação Decimal de Dewey:651.8 
LDR005840000000002170004500
0012003083004544984914
003Br
00520030830045449.8
035__ |a 155489
082__ |a 651.8082__ |a 651.8
092__ |a II­1,7,11
100__ |a Setzer, Valdemar Waingort, 1940­
245__ |a Curso de Fortran IV, básico.
260__ |a São Paulo, E. Blucher, Ed. da U.S.P. [1972]
300__ |a 102 p. il.
590__ |a Registro Pré­MARC
650__ |a Fortran (Linguagem de programação)
650__ |a Programação, Linguagens de.
700__ |a Simon, Imre, 1943­
700__ |a Kowaltowski, Tomasz, 1942­
856__ |a 142703
Acesso a bibliotecas – Ficha MARC
00001017cam a22002654a 450
00113216768
00520031008121527.0
008030529s2004 maua b 001 0 eng 
906__ |a 7 |b cbc |c orignew |d 1 |e ocip |f 20 |g y­gencatlg
9250_ |a acquire |b 2 shelf copies |x policy default
955__ |a pc21 2003­05­29 to ASCD |c jf05 2003­06­02 to subj.; |d jf04 2003­
06­02 to S.L. |e jf12 2003­06­02 to Dewey |a aa05 2003­06­03 |a ps07 2003­
08­21 1 copy rec’d., to CIP ver. |a jf00 2003­08­28 |f jf05 2003­10­08 to sl |e 
jf12 2003­10­08 to BCCD
010__ |a 2003052442010__ |a 2003052442
020__ |a 0321197844
040__ |a DLC |c DLC |d DLC
042__ |a pcc
05000 |a QA76.9.D3 |b D3659 2003
08200 |a 005.74 |2 21
1001_ |a Date, C. J.
24513 |a An introduction to database systems / |c C.J. Date.
24630 |a Database systems
250__ |a 8th ed.
260__ |a Boston : |b Pearson/Addison Wesley, |c 2004.
300__ |a xxvii, 983, 22 p. : |b ill. ; |c 24 cm.
504__ |a Includes bibliographical references and index.
650_0 |a Database management.
Acesso a bibliotecas – Registro MARC
01099cam 2200289 a 
450000100080000000500170000800800410002503500210006690600450008795501280013201000
170026002000150027704000180029205000260031008200150033610000160035124500540036725
000120042126000550043330000360048844000460052450400510057065000250062192000410064
6991005200687991007000739­3012967­20010731111512.0­940201s1995 maua b 001 0 
eng ­ ­9(DLC) 94003187­ ­a7­bcbc­corignew­d1­eocip­f19­gy­gencatlg­ ­apc03 to ja00 02­01­94; 
jf06 to subj 02­02­94; jf11 to sl 02­02­94; jf12 02­02­94; recd. je00 2Sept94; CIP ver je25 09­19­
94­ ­a 94003187 ­ ­a020154329X­ ­aDLC­cDLC­dDLC­00­aQA76.9.D3­bD3659 94­ ­a 94003187 ­ ­a020154329X­ ­aDLC­cDLC­dDLC­00­aQA76.9.D3­bD3659 
1995­00­a005.74­220­1 ­aDate, C. J.­13­aAn introduction to database systems /­cC.J. Date.­ ­a6th 
ed.­ ­aReading, Mass. :­bAddison­Wesley Pub. Co.,­cc1995.­ ­axxiii, 839 p. :­bill. ;­c24 
cm.­ 0­aAddison­Wesley systems programming series­ ­aIncludes bibliographical references and 
index.­ 0­aDatabase management.­ ­a** LC HAS REQ'D # OF SHELF COPIES **­ ­bc­
GenColl­hQA76.9.D3­iD3659 1995­tCopy 1­wBOOKS­ ­bc­GenColl­hQA76.9.D3­iD3659 
1995­p00023608856­tCopy 2­v54329­wCCF­
Acesso a bibliotecas : DC – Dublin Core
<rdf:Description rdf:about="http://www.ieee.org">
<dc:title>Proceedings of the 13th International Workshop on Research Issues on Data 
Engineering: Multi-lingual Information Management-RIDE-MLIM</dc:title><dc:creator> CROFT W. Bruce </dc:creator>
<dc:creator> SANGAL Rajeev </dc:creator>
<dc:subject>Workshop</dc:subject>
<dc:subject>Management</dc:subject>
<dc:subject>Multilingual</dc:subject>
<dc:publisher>IEEE</dc:publisher><dc:publisher>IEEE</dc:publisher>
<dc:date>2003</dc:date>
<dc:type>Proceedings</dc:type>
<dc:format>
<dc:medium>text</dc:medium>
<dc:extent pages>420</dc:extent pages>
</dc:format>
<dc:source>IEEE Computer Society</dc:source>
<dc:identifier>ISBN 0-7803-7868-7</dc:identifier>
</rdf:Description>
Acesso a bibliotecas ­ Catálogos
• Fichas de papel, 
• Livros catalográficos, microfilmes, microfichas
• On­Line (gerações de Hildreth):• On­Line (gerações de Hildreth):
1. pesquisa por autor, título, Palavras­chave 
2. Visualização simples, detalhada e diálogos 
personalizados
3. Assistência na pesquisa; texto livre ou com vocabulário 
controlado; cross­database; correção de erros sensível ao
contexto 
Acesso a bibliotecas – Catálogos on­line
OPAC-Online Public Acess Catalog
• PROBLEMAS: 
• Interface amigável para catálogos MARC ou 
assuntos LCSH.
• Consequências:
1. retorno vazio ou retorno excessivo.
Estudo MELVYL: 82% de retornos vazios, 25% dos retornos não 
continham a informação procurada
2. Borgman’86: “porque catálogos on-line são difíceis de 
serem usados?” 
3. Borgman’96: “porque catálogos on-line ainda são 
difíceis de serem usados?”
Acesso a bibliotecas – Catálogos on­line
OPAC-Online Public Acess Catalog
Bibliotecas Digitais
• TIPOS DE DOCUMENTOS
1. Documentos Multilíngues
crescimento de documentos não-inglês
2. Documentos Multimídia
(streams sincronizados)
3. Documentos estruturados
(streams estruturados)
4. Coleções distribuídas
Bibliotecas Digitais Distribuidas
Publications = [title: string,
authors; {[name string, initial string]},
journal: <uncontrolled: string,
Sistema BioKleisli
journal: <uncontrolled: string,
controlled <medline­jta: string, %Medline journal title abbreviation
isso­jta: string, %ISO journal title abbreviation
journal­title: string, %Full journal title
issn: string>> %ISSN number
volume string,
issue string,
year int,
pages string,
abstract string,
keywd: {string}]}
CPL – Collection Programming Language
{[title = p.title, authors = p.authors] \p <- DB, 
p=“Date, C.”}
Sistema BioKleisli
p=“Date, C.”}
seleciona título e autor do banco de dados DB
Sistema BioKleisli
Sistema BioKleisli – BDs Fonte
• SGBD:
• Sybase; ASN.1­Entrez, ACeDB e OPM
• comunidade de archival nucleic acid (GenBank, EMBL, DDBJ e GSDB)• comunidade de archival nucleic acid (GenBank, EMBL, DDBJ e GSDB)
• Genome Database (GDB) de Sybase para OPM
• BLAST Software de comparação entre sequências de proteinas com um BD 
de sequêncais
Sistema BioKleisli – Consultas
Sistema BioKleisli – Consultas
define Loci22 = GDB([query = 
“select locus_symbol, genbank_ref
from locus, object_genbank_eref, locus_cyto_location
where locus.locus_id = locus_cyto_location_id
and locus.locus_id = object_genbank_eref.object_id
and object_class_key = 1
SQL
CPL
and object_class_key = 1
and loc_cyto_chrom_num = ’22’ “]) CPL

Continue navegando