1 bibliotecas digitais centro de informática universidade federal de pernambuco almir moura glauber...

43
1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

Upload: henri-de-cotis

Post on 07-Apr-2016

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

1

Bibliotecas Digitais

Centro de Informática

Universidade Federal de Pernambuco

Almir MouraGlauber AraújoMarcos CardosoMarcos Silva

Page 2: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

2

Roteiro Introdução Desenvolvimento de coleções Descrição de conteúdos Consulta e acesso Preservação Aspectos econômicos Conclusões Material de Consulta

Page 3: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

3

Introdução

Sociedade da informação marcada pela importância crescente de documentos digitais– Artigos eletrônicos, hipertextos, imagens,…

Grande volume de informação digital:– Computadores pessoais– Avanço da Internet

Ferramentas para atender as necessidades de informação dos usuários– Bibliotecas Digitais

Page 4: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

4

Introdução

A biblioteca foi uma das primeiras instituições que fizeram uso de tecnologias da informação e comunicação– Bancos de dados e as redes de computadores– Sistemas de gerenciamento de bibliotecas – Bases de dados catalográficos– OPACs - On-line Public Access Catalogs

Com o barateamento de recursos de memória, versões digitais (eletrônicas) dos próprios conteúdos de informação são disponibilizadas

Page 5: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

5

Bibliotecas Digitais

Biblioteca sem um ambiente físico e informação não mais atrelada ao suporte de papel impresso

Interesse impulsionado com o surgimento da Internet na década de 90

Conteúdos de informação estão contidos em formatos digitais diversos – Textos, vídeo, áudio, imagens, hipertextos...

Acessadas pelos usuários a qualquer hora e local

Page 6: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

6

Bibliotecas Digitais

Um conjunto de serviços integrados para capturar, catalogar, armazenar, buscar, proteger e recuperar informação;

Em uma biblioteca digital qualquer recurso online pode ser gerenciado e compartilhado, tornando-o muito mais acessível do que antes;

A internet possibilitou o surgimento de bibliotecas com acervos imensos.

Page 7: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

7

Bibliotecas Digitais

Desenvolvimento do acervo Descrição dos

conteúdos

Consulta e acesso

PreservaçãoDigital

Page 8: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

8

Desenvolvimento do Acervo

Documentos pode ser produzidos originalmente em formatos digitais – Uso de editores de texto, imagens,…– Biblioteca Digital da ACM– Liber com dissertações e teses da UFPE

Documentos podem ser cópias digitalizadas dos documentos originais– Uso de scanner e reconhecimento ótico de

caracteres

Page 9: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

9

Biblioteca do Vaticano: com 150 mil manuscritos e 100 mil gravuras e miniaturas

Bibliotecas de Documentos Digitalizados

Page 10: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

10

Bibliotecas de Documentos Digitalizados

Projeto Making of America (MoA): cerca de 8500 livros do século 19

Page 11: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

11

Internet Archive–Localizada no presidio de São

Francisco, foi fundada por Brewster Kahle, em 1996

–A coleção inclui filmes, audio (em especial de concertos ao vivo), livros e softwares;

–Em 2004 a quantidade de dados chegou a 1 petabyte com média de crescimento mensal de 20 terabytes.

Bibliotecas de destaque na Web

Page 12: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

12

Bibliotecas de destaque na Web

Ibiblio– Projeto da Universidade da Carolina do

Norte;– Fundada em 1992 como SunSITE ;– Faz parte do Centro de Domínio Publico

e hospeda o desenvolvimento de projetos open source;

Page 13: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

13

Bibliotecas de destaque na Web Library of Congress (LoC)

– É uma das quatro bibliotecas nacionais oficiais dos Estados Unidos;

– A biblioteca física contem cerca de 128 milhões de itens;

– O processo de digitalização já criou 20 terabytes de informação;

– Realiza muitas pesquisas sobre bibliotecas digitais e intercambio de dados.

Page 14: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

14

Google Prints Usa o esquema de busca do Google para

encontrar livros, a maioria de domínio publico;

Projeto prevê a digitalização de 16 milhões de livros;

Parcerias com grandes bibliotecas digitais e editoras pode tornar o projeto a maior biblioteca digital do mundo;

Ainda em fase beta.

Page 15: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

15

Integração/importação de recursos digitais disponíveis em fontes eletrônicas externas – Outras bibliotecas digitais ou a Internet.

Redes de computadores que permitem transmissão de informação de forma rápida e confiável

Diversos autores apontam uma tendência para a integração de recursos

Desenvolvimento do Acervo

Page 16: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

16

As bibliotecas digitais geram novos desafios para descrição de documentos– Formatos digitais heterogêneos– Formatos complexos como hipertextos e arquivos

multimídia

Existem padrões de metadados aceitos internacionalmente– Padrão MARC (Machine Readable Cataloging)– Padrão Dublin-Core

Descrição dos Documentos

Page 17: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

17

O registro MARC é dividido em campos identificados por um código de três dígitos numéricos– Código 020: ISBN– Código 100: autor– Código 245: título– Código 260: publicação

Ao todo são cerca de 800 campos com códigos associados

Padrão MARC

Page 18: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

18

Padrão MARC – Exemplo de Registro 090   

$a 308 $c R484p $8 1 /  $8 13 /  $8 5 $a 301.2 $c R484p $8 9 

100 1  $a Ribeiro, Darcy, 1922-  245 1 2 $a O povo brasileiro :  $b a formacao e o

sentido do Brasil /  $c Darcy Ribeiro. -  250 $a 2.ed. - 

260 #  $a Sao Paulo :  $b Companhia das Letras,  $c 1995.   $a 476p. :  $b il.    

650 0 3 $a Antropologia - Brasil. $a Cultura - Brasil. $a Etnologia - Brasil. 

901    $a Livro  910    $a BC $a CAC $a FCH $a CE

300

  

Page 19: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

19

O significado dos códigos é universal e o conteúdo dos campos segue padrões internacionais como AACR2

Duas bibliotecas usando o formato MARC podem trocar registros entre si

Programas usam códigos e conteúdo dos registros conforme a necessidade– Fazer pesquisa por palavra-chave– Visualizar o registro na tela do computador

Padrão MARC

Page 20: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

20

Padrão MARCNúmero de Chamada

308 R484p  Biblioteca Central /   Bib. Filosofia e C. Humanas /   Bib. Artes e Comunicacao 301.2 R484p  Bib. Educação

Autor Principal Ribeiro, Darcy, 1922-  T¡tulo Principal

O povo brasileiro : a formacao e o sentido do Brasil

Edição 2.ed. -  Descrição Física

Sao Paulo :  Companhia das Letras,  1995.

476p. :  il.  Antropologia - Brasil. Cultura - Brasil. Etnologia - Brasil. 

Assuntos

Publicação

Page 21: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

21

Padrão MARC que contem mais de 800 elementos de metadados (alguns bastante específicos)

A proposta do padrão DC é definir um conjunto de metadados simples e intuitivo capaz de descrever diferentes documentos digitais

O DC oferece 15 elementos de metadados definidos em cooperação internacional

Padrão Dublin-Core (DC)

Page 22: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

22

Descrição de conteúdo (7 elementos)– Título, assunto, descrição, fonte, linguagem,

relacionamentos, cobertura

Propriedade intelectual (4 elementos) – Autor, publicador, colaborador, direitos

Instanciação do documento (4 elementos)– Tipo (texto, imagem, vídeo,...), data, formato,

identificador único

Padrão Dublin-Core (DC)

Page 23: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

23

Conjunto mínimo de elementos de metadados compreendidos por qualquer comunidade

Extensões do padrão DC são encorajadas para atender a necessidades específicas– Ex.: elemento “contato” (nome e e-mail da pessoa

ou instituição ao qual o recurso está vinculado)

Conjunto mínimo de elementos devem ser mantido nas extensões

Padrão Dublin-Core (DC)

Page 24: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

24

Documentos como hipertexto e multimídia são difíceis de serem descritos– Páginas com inúmeros relacionamentos, com

vídeos, arquivos para download... – Metadados para descrever contexto de

arquivos multimídia

Soluções têm sido propostas, usando normalmente estruturas em hipertexto– XML (eXtensible Markup Language)– RDF (Resource Description Framework)

Descrição dos Documentos

Page 25: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

25

Diferentes tipos de ferramentas para recuperação de informação– Pesquisa por palavra-chave, booleana, pesquisa em

linguagem natural, navegação em estruturas hierárquicas, navegação em hipertexto

Catálogos On-Line: OPACs (On-line Public Access Catalogs)

Acesso aos conteúdos de informação:– Download, leitura da tela do computador, pay-per-

view,...

Consulta e Acesso

Page 26: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

26

Definição das ferramentas devem levar em conta as especificidades dos usuários– Idade, contexto social, diferentes habilidades no uso de

computadores,... Melhorar o desempenho das ferramentas de

acesso envolve: – Pesquisa nos aspectos cognitivos dos usuários– Modelos individualizados de perfil do usuário– Técnicas de inteligência artificial

Consulta e Acesso

Page 27: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

27

Preservação Digital O que seria Preservação?

– Preservar o que não pode ser manuseado

– Tentar garantir a integridade da informação

– Evitar a perda de informação

Page 28: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

28

Preservação Digital - Objetivos Auxiliar a preservação dos documentos originais

Tentar garantir que a informação digital esteja disponível para acesso pelas gerações futuras

2225?

Page 29: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

29

Preservação Digital Dificuldades:

– Vida útil dos meios físicos de armazenamento

– Obsolescência dos dispositivos computacionais usados

para armazenar e visualizar documentos• Meios físicos• Software

– Mudança de versão, perda de informação

Page 30: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

30

Preservação Digital - Estratégias Migração para formatos mais seguros

Migração para meios físicos de armazenamentos mais seguros

Page 31: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

31

Preservação Digital - Estratégias Construção de infra-estrutura para preservação

– Software para preservação, dispositivos para armazenamento, pessoal qualificado,...

Page 32: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

32

Aspectos Econômicos Gastos com infra-estrutura

– Acesso a internet, softwares de edição, reconhecimento óptico…

Page 33: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

33

Aspectos Econômicos

Gastos com pessoal qualificado– Administradores, profissionais da informação,

programadores,…

Page 34: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

34

Aspectos Econômicos Custos relacionados ao desenvolvimento das

coleções– processo de digitalização.

Custos relacionados ao acesso às fontes de informação. – Gastos com direitos de acesso

Page 35: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

35

Aspectos Econômicos Custos relacionados ao acesso às fontes de

informação. – Gastos com direitos autorais

Page 36: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

36

Aspectos Econômicos Preservação dos documentos

– Custos da preservação digital são difíceis de serem estimados a longo prazo

– Como estimar o preço de uma coisa que tem valor• Cultural• Histórico

Page 37: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

37

Conclusões

Tendências – Buscar mais informações

• Biblioteca híbrida– Sistema de busca

• Integração de fontes de informações

Page 38: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

38

Conclusões

Tendências – Buscar adoção de padrões

• W e b

• Padrões para descrição de documentos para a internet

Page 39: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

39

Conclusões

Exigências para o profissional da informação– Lidar com as novas tecnologias de informação e

comunicação

– Lidar com equipes de profissionais de formações heterogêneas

– Constante atualização de seus próprios conhecimentos e competências

Page 40: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

40

Conclusões

Interesse crescente nas bibliotecas digitais– Educação, entretenimento, negócios,…

Page 41: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

41

Material de Consulta

E. Fox e O. Sornil, “Digital Libraries”, Modern Information Retrieval, Baeza-Yates e Ribeiro-Neto (Eds), 1999

Revista Ciência da Informação– M. B. da Cunha, “Desafios para a construção de uma

biblioteca digital”, Vol. 28(3), 1999– P. Z. Marchiori, “Ciberteca ou biblioteca virtual”,

Vol. 26(2), 1997– M. Levacov, “Bibliotecas virtuais: (r)evolução”,

Vol.26(2), 1997

Page 42: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

42

Material de Consulta

E. Fox, R. Akscyn, M., R. Furuta e J. Leggett, “Digital Libraries”, Communications of the ACM, Vol. 38(4), 1995

Universidade de Michigan, Making of America, Humanities Text Initiative, www.hti.umich.edu

ACM Digital Library, www.acm.org

Page 43: 1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva

43

Bibliotecas Digitais

Centro de Informática

Universidade Federal de Pernambuco

Almir MouraGlauber AraújoMarcos CardosoMarcos Silva