capítulo 1 introdu˙ˆo · 21 1.2 proposiçªo na tentativa de encontrar caminhos para a soluçªo...
TRANSCRIPT
18
Capítulo 1
INTRODUÇÃO
19
1 INTRODUÇÃO
�Conhecimento é a capacidade de atuar num contexto�
(Karl-Erik Sveiby)
Esta pesquisa insere-se na linha de pesquisa Informação e Tecnologia do Programa de
Pós-Graduação em Ciência da Informação da Universidade Estadual Paulista �Júlio de
Mesquita Filho� � UNESP - campus de Marília. Tem como tema MarcOnt Initiative1 no
âmbito das bibliotecas digitais na era da Web Semântica, ferramenta tecnológica considerada
um padrão de representação e de descrição da informação que contempla forma e conteúdo do
recurso informacional, no âmbito das bibliotecas digitais.
A pesquisa é integrante do projeto financiado pelo CNPq intitulado �Da Catalogação
ao uso de recursos informacionais digitais: questões sobre a interoperabilidade em ambientes
informacionais�, sob a coordenação da Dra. Plácida Leopoldina Ventura Amorim da Costa
Santos, junto ao Grupo de Pesquisa Novas Tecnologias em Informação da UNESP/Marília e
conta com o apoio financeiro da Coordenação de Aperfeiçoamento de Pessoal de Nível
Superior (CAPES).
Vivenciamos atualmente constantes mudanças nos mais variados segmentos de nossa
sociedade, uma delas de cunho tecnológico, no contexto que conhecemos hoje por Sociedade
da Informação. Percebe-se que nos últimos tempos houve um aumento desordenado e caótico
na quantidade de informações produzidas e disponibilizadas em meio digital, requerendo uma
mudança e um repensar nas formas de armazenamento, de representação, de descrição e de
preservação dos recursos informacionais digitais.
1 As informações concernentes ao projeto MarcOnt Initiative © 2005 MARCONT.org estão disponibilizadas no Portal MarcOnt. Disponível em: <http://portal.marcont.org>. Acesso em: 04 jan. 2008. Vale destacar que os estudos referentes ao projeto MarcOnt Initiative contam com a parceria da National University of Ireland- Galway, Leopold Franzens University-Innsbruck, Gdansk University of Technology e Digital Enterprise Research Institute (DERI).
20
A Web atual, caracterizada como um espaço �aberto� e de fácil socialização do
conhecimento vem enfrentando mudanças significativas em sua estrutura e na sua forma de
representar e apresentar os recursos informacionais digitais, o que exige e pressupõe um novo
olhar de diversos profissionais, especialmente os da área de Ciência da Informação e de
Biblioteconomia que têm um papel sine qua non, enquanto agentes transformadores no século
XXI.
Nesse contexto, temos o papel das bibliotecas que atuam como segmentos na Internet
e que passam a ser totalmente dependentes de tecnologias e precisam se adaptar às novas
perspectivas tecnológicas na constituição de ambientes informacionais digitais e novos
formatos de armazenamento, descrição e representação das informações.
A relevância tanto da Web quanto das bibliotecas digitais para os diversos ramos da
ciência tem impulsionado pesquisadores e comunidades científicas a buscar soluções de
integração, intercâmbio e entendimento semântico sobre os conteúdos que nelas circulam, a
fim de proporcionar uma recuperação mais precisa, relevante e significativa para o usuário
final.
1.1 Definição do problema
As bibliotecas digitais se caracterizam como ambientes facilitadores de acesso às
informações, sem a limitação de espaço e tempo, uma vez que nessas o tratamento dado ao
recurso informacional requer uma descrição de forma e de conteúdo legível por máquinas
com resultados compreensíveis aos humanos. Desse modo, destaca-se a necessidade de um
tratamento de forma e conteúdo adequado para a representação e para a apresentação de
informações, visando uma recuperação mais eficiente.
Verifica-se, no cenário atual, uma forte tendência para a disponibilização de conteúdos
digitais e a falta de uso de padrões adequados para a representação e a descrição destes
recursos em ambientes digitais, e que garanta a sua apresentação para o uso, a preservação e o
reuso das informações para os usuários.
21
1.2 Proposição
Na tentativa de encontrar caminhos para a solução do problema, Kruk, Decker e
Zieborak (2005), apontam o MarcOnt Initiative, que apresenta instrumentos subjacentes à
Web Semântica, tais como as ontologias e o uso de padrões de metadados, contemplando
parâmetros que vão ao encontro dos objetivos das bibliotecas digitais e propiciam meios mais
adequados de representar e organizar os recursos informacionais digitais, atrelados aos
aspectos semânticos de seus conteúdos.
Nesse contexto, a proposição desta pesquisa é verificar na literatura científica a
aplicabilidade e a funcionalidade de tais tecnologias e instrumentos como padrões de
representação e descrição de conteúdo e forma, no âmbito das bibliotecas digitais e no
ambiente Web de um modo geral.
1.3 Objetivos
A Ciência da Informação como uma área que tem como objeto de estudo a
informação, desde a sua geração até o seu uso, pautada nos processos de representação,
descrição, organização, acesso e recuperação de recursos informacionais, busca identificar
algumas ferramentas para a construção de formas de representação de recursos em bibliotecas
digitais. Nesse sentido, a presente pesquisa tem como objetivos:
1.3.1 Objetivo geral
De acordo com os novos cenários, tais como, Web Semântica, Web 2.0 etc. e
caracterizados por novas perspectivas tecnológicas, a pesquisa tem como objetivos a
identificação e o estudo de métodos e ferramentas tecnológicas disponíveis para a
representação e a descrição de recursos informacionais bem como de seu conteúdo, no
contexto das bibliotecas digitais e da Web, na tentativa de identificar o embasamento
conceitual subjacente às ferramentas para a padronização da descrição dos aspectos de forma
22
e do conteúdo dos recursos informacionais nestas ambiências, na abordagem da Ciência da
Informação.
1.3.2 Objetivos específicos
Nesse sentido, os objetivos específicos elencados para uma abordagem mais
aprofundada da pesquisa, são os seguintes:
• Identificar e caracterizar o MarcOnt Initiative, como um padrão de representação da
informação (forma e conteúdo) em bibliotecas digitais e na Web na atualidade;
• Justificar a adoção da ferramenta MarcOnt como possibilidade de proporcionar a
interoperabilidade semântica entre bibliotecas digitais e outros sistemas de
informação.
1.4 Metodologia
Na busca de um conhecimento teórico sobre as ferramentas tecnológicas disponíveis
para a construção de formas de representação de recursos informacionais, no âmbito das
bibliotecas digitais, o presente trabalho caracteriza-se por ser uma pesquisa de análise
exploratória e descritiva do tema (CERVO; BERVIAN, 2003).
Os estudos exploratórios, segundo Dencker e Viá (2001, p. 41),
São investigações de pesquisa empírica que tem por finalidade formular ou esclarecer questões para desenvolver hipóteses. O estudo exploratório aumenta a familiaridade do pesquisador com o fenômeno ou com o ambiente que pretende investigar, servindo de base para uma pesquisa futura mais precisa. São também utilizados para esclarecer ou modificar conceitos. As descrições, nesse caso, tanto podem ser qualitativas quanto quantitativas. Os métodos de coleta de dados também podem variar da pesquisa bibliográfica e documental ao uso de questionário, entrevista ou observação.
23
Assim, no referencial teórico publicado sobre o tema, foi possível identificar
elementos para responder aos principais objetivos estabelecidos neste trabalho.
A adoção dessa metodologia permitiu abordar os aspectos envolvidos nos objetivos
específicos definidos anteriormente e a proporcionar a compreensão e a concretização do
objetivo geral proposto. O método de coleta de dados escolhido é a pesquisa bibliográfica e
documental.
Os procedimentos metodológicos podem ser assim delineados:
• Levantamento bibliográfico em níveis nacional e internacional, em fontes
bibliográficas primárias (livros, periódicos, anais de congressos, teses e
documentos eletrônicos da Internet, entre outros documentos congêneres),
secundárias (Bases de dados textuais e referenciais como: Lisa, Scielo, Current
Contents, Web Spirs, Periódicos Capes, Web of Science, entre outras) e terciárias
(bibliografias, índices, catálogos coletivos, diretórios e outros) da área de Ciência
da Informação.
• Seleção dos documentos, constantes nas referências e bibliografia consultada deste
trabalho, a partir dos critérios de pertinência com relação aos assuntos principais
desta pesquisa, com os termos: MarcOnt, MARC21, Web Semântica, Bibliotecas
digitais, Representação da informação, Catalogação automatizada, Informação e
Tecnologia nos idiomas português, inglês e espanhol, com período de publicação
limitado aos últimos dez anos, apenas como abordagem inicial, não havendo
limitação cronológica para referências citadas nos documentos selecionados.
• Leituras e documentação dos textos selecionados, que possibilitaram a criação de
um referencial teórico com o qual será possível obter subsídios para um maior
entendimento e compreensão mais detalhados do MarcOnt e as metodologias para
a descrição de recursos informacionais, no âmbito das bibliotecas digitais na
abordagem da Ciência da Informação.
24
1.4.1 Forma de análise dos resultados
Para que os objetivos propostos pela pesquisa fossem alcançados, os resultados
obtidos foram sistematizados sob os focos:
1. Identificação de categorias de análise para avaliação sistemática do MarcOnt.
2. Identificação e caracterização do MarcOnt Initiative no âmbito da Ciência da Informação,
a fim de contextualizar o objeto de estudo da pesquisa e sua relevância e contribuição
científica para a área;
3. Possibilidade de aplicação do MarcOnt Initiative, enquanto padrão de representação e de
descrição (forma e conteúdo) na perspectiva das bibliotecas digitais e da Web.
1.5 Justificativa
Um dos aspectos que motivaram o desenvolvimento da pesquisa foi a familiaridade do
autor desde a pesquisa na graduação em Biblioteconomia no ano de 2002 no tema
Catalogação Automatizada e formato de intercâmbio MARC21, o que impulsionou um estudo
mais aprofundado sobre a temática aqui tratada. Em 2005, no curso de especialização Uso
Estratégico das Tecnologias em Informação oferecido pela Universidade Estadual Paulista
�Júlio de Mesquita Filho� � UNESP/Marília, o autor se deparou com questões relacionadas às
novas abordagens da representação e da descrição de recursos informacionais em ambientes
informacionais digitais, tais como a Web Semântica e as Bibliotecas Digitais e os novos
rumos da Catalogação aplicada a essas ambiências, culminando assim, na presente pesquisa.
Partindo do princípio que cada vez mais informações são produzidas, principalmente
no meio digital, tais ambientes passam requerer métodos mais adequados que possibilitem a
representação e a organização de seus conteúdos de modo mais eficiente e preciso.
25
Há na comunidade científica várias pesquisas neste sentido, principalmente no âmbito
das bibliotecas digitais, na tentativa de estabelecer formas mais eficazes de recuperação e
comunicação entre estes ambientes. Tal cenário requer uma preocupação com a identificação
e o desenvolvimento de normas e padrões para a representação das informações que facilitem
a sua descrição e localização, e ainda que proporcionem a interoperabilidade entre os sistemas
informacionais.
Uma dessas iniciativas é o desenvolvimento do padrão MarcOnt que possui uma
arquitetura baseada no modelo RDF (Resource Description Framework), proposta por
Berners-Lee para a Web Semântica e com algumas aplicações preliminares em bibliotecas
digitais semânticas específicas, tais como a JeromeDL, que será abordada posteriormente no
capítulo 5.
Ainda que amplamente discutido em nível internacional, como por exemplo, na
Biblioteca Digital Semântica JeromeDL, na Polônia, no Brasil não existem relatos de
discussão a respeito do MarcOnt Initiative, no processo de recuperação da informação e
identificação do recurso informacional em ambientes digitais.
Pensando nisso, acredita-se que esta seja uma pesquisa de relevância por contribuir
para o desenvolvimento de referencial teórico e metodológico na disciplina de Catalogação da
área de Biblioteconomia.
A atualidade do assunto e sua repercussão na comunidade científica, atrelado ao
desejo e a necessidade de uma investigação científica de forma mais aprofundada no tema
MARC e formas de representação no âmbito das bibliotecas digitais na era da Web Semântica,
também é levado em consideração.
Verifica-se, preliminarmente, a falta de publicações do assunto em língua portuguesa,
destacando dessa forma, a relevância da pesquisa por contribuir como uma fonte de
informação bibliográfica; além disso, a relevância social na realização desta pesquisa está em
fornecer subsídios teóricos para que profissionais da área de Ciência da Informação possam
desenvolver métodos e técnicas mais eficazes de representação para a localização e a
recuperação da informação em ambientes informacionais digitais.
26
Justifica-se seu desenvolvimento no que tange em acompanhar os avanços da área de
Ciência da Informação sobre a temática abordada e a questão da padronização da
representação e da descrição dos recursos informacionais e seus conteúdos em bibliotecas
digitais e no ambiente Web.
O presente capítulo compreende a Introdução e aborda questões iniciais, bem como o
contexto que esta se insere, tais como o problema da pesquisa, a hipótese, a proposição, os
objetivos (geral e específico), a metodologia, a justificativa, a relevância social, a relevância
para a área de Ciência da Informação. As demais partes desta dissertação são:
CAPÍTULO 2 - UMA ABORDAGEM REVISITADA DAS TECNOLOGIAS DA
INFORMAÇÃO E COMUNICAÇÃO NO ÂMBITO DA CIÊNCIA DA INFORMAÇÃO � Nesse
capítulo procura-se mostrar como as Tecnologias da Informação e Comunicação � TICs vêem
permeando os ambientes informacionais, desde o pensamento de alguns renomados autores da
área da Ciência da Informação, dentre os quais, Paul Otlet e Vannevar Bush, e a preocupação
da comunidade em criar ferramentas e metodologias para a padronização dos processos
informacionais e o percurso do campo científico da Ciência da Informação, assim como as
novas perspectivas tecnológicas apontadas pela literatura, tais como, Web Semântica, Web 2.0
etc.
CAPÍTULO 3 � BIBLIOTECAS DIGITAIS: GÊNESE E CONTEMPORANEIDADE � Esse
capítulo trata do surgimento das bibliotecas digitais até como estas se apresentam
hodiernamente, apontando que estas se encontram como ambiências específicas e
padronizadas e que podem auxiliar, com suas metodologias e tecnologias advindas da
Biblioteconomia e da Ciência da Informação a construção e a efetivação da Web Semântica,
no que diz respeito à descrição e à representação dos recursos informacionais, promovendo
uma sinergia e a possibilidade de um trabalho colaborativo entre ambientes informacionais
digitais.
27
CAPÍTULO 4 � FORMAS DE REPRESENTAÇÃO DA INFORMAÇÃO: UM DIÁLOGO
INTERSUBJETIVO � Nesse capítulo destacou-se a necessidade de se criar e ter estruturas
padronizadas para a construção de formas de representação da informação registrada,
destacando que as metodologias da Biblioteconomia e da Ciência da Informação
proporcionam e dão respaldo para qualquer tipo de representação do recurso informacional.
Além disso, propõe-se a construção da forma de representação de um recurso informacional,
destacando as novas perspectivas tecnológicas e as aspirações do cenário atual, tais como:
Bibliotecas Digitais e Web Semântica, a fim de promover e possibilitar a interoperabilidade
semântica entre ambientes informacionais digitais.
CAPÍTULO 5 - MARCONT INITIATIVE: UMA PROPOSTA PARA A REPRESENTAÇÃO E
A DESCRIÇÃO DE RECURSOS INFORMACIONAIS NA WEB � Com o intuito de analisar e
verificar as formas de representação e de descrição de recursos informacionais na Web,
procurou-se destacar as tendências e os novos olhares para os ambientes informacionais
digitais com os cenários conhecidos hoje, como Web Semântica, Web 2.0 etc. Nesse contexto,
apontamos como umas das possíveis soluções para as questões de padronização dos recursos
informacionais na rede, o desenvolvimento de um novo padrão de descrição semântica
indicado pela literatura científica como MarcOnt Initiative. Além disso, mostramos os
ambientes e o aparecimento das primeiras bibliotecas digitais semânticas, com destaque para a
Biblioteca Digital Semântica JeromeDL, ambiência na qual procurou-se testar as
potencialidades e as funcionalidades do padrão MarcOnt, no que diz respeito às questões de
busca e de recuperação dos recursos informacionis no âmbito digital.
CAPÍTULO 6 - CONSIDERAÇÕES FINAIS � Esse capítulo apresenta os resultados,
observações e reflexões acerca do padrão de descrição bibliográfica semântica MarcOnt, bem
como os novos rumos da Catalogação e o impacto na evolução de ambientes informacionais
digitais na perspectiva da Ciência da Informação.
REFERÊNCIAS � São apresentadas as referências que constituem e formam o corpus teórico
dessa pesquisa.
28
Capítulo 2
Uma abordagem revisitada das Tecnologias da Informação
e Comunicação no âmbito da Ciência da Informação
29
2 UMA ABORDAGEM REVISITADA DAS TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO NO ÂMBITO DA CIÊNCIA DA INFORMAÇÃO
�Nenhuma ciência goza do privilégio de uma imaculada concepção�.
Paul Ricouer
Para se contextualizar a questão de pesquisa, torna-se importante afirmar que esta
insere-se na linha de pesquisa Informação e Tecnologia do Programa de Pós-Graduação em
Ciência da Informação da Universidade Estadual Paulista �Júlio de Mesquita Filho� � UNESP
- do campus de Marília. Neste sentido, por estar contemplada em tal linha, tornou-se relevante
traçar um panorama sobre como as Tecnologias da Informação e Comunicação (TICs2) foram
se desenvolvendo ao longo dos tempos, atuando significamente no campo da Ciência da
Informação enquanto instrumentos na facilitação dos processos informacionais.
Serão revisitados os pensamentos de autores e conceitos que contribuíram com a
emergência da Ciência da Informação.
A Ciência da Informação tem como dos um dos seus principais precursores Paul Otlet,
que contribuiu de forma marcante na evolução das práticas bibliotecárias e documentais. Ele
desenvolveu uma nova classificação que foi considerada como o ponto de partida para o
lançamento do Repertório Bibliográfico Universal (RBU), durante a Conferência
Bibliográfica Internacional celebrada em Bruxelas em 1895.
Em 1907, o termo documentação foi formulado por Otlet para expressar uma
abordagem mais ampla à organização de fontes de conhecimento do que tradicionalmente
associada ao termo bibliografia, ou seja, era considerada uma atividade complementar à
educação e à pesquisa. Nesse sentido, Otlet destaca o que no seu entendimento, seriam as
fontes da documentação: documentos escritos (livros, periódicos, jornais e manuscritos), as
ilustrações (gravuras, desenhos, fotografias etc.), os ideogramas (mapas, plantas, quadros
2 Para este estudo adotaremos a sigla (TICs) para nos referirmos às Tecnologias da Informação e Comunicação.
30
sinópticos, diagramas etc.) e a música. (RAYWARD, 1997). Pode-se dizer que o
entendimento de Otlet sobre documentação, bem como sua organização, como sendo um
campo de estudo e pesquisa, pode ser traduzido em nosso termo de Ciência da Informação.
Durante o período compreendido entre as duas grandes guerras mundiais, exatamente
em 1924, foi reorganizado o Instituto Internacional de Bibliografia (IIB) que se constituiu na
Federação de Organizações de Documentação. O IIB em suas finalidades foi criado com o
intuito de criar ferramentas para registrar, de forma sistemática e padronizada, as referências
dos documentos. As primeiras preocupações do IIB era a de desenvolver um sistema de
classificação único, com o propósito de ser adotado por todos, na indexação dos documentos.
Em 1925, Otlet desenvolve uma biblioteca portátil de microfichas, o que pode ser
considerado como uma iniciativa da preocupação de armazenar o conhecimento em algum
suporte informacional para posterior acesso e uso. Nesse contexto, surge a Classificação
Decimal Universal (CDU) que possibilitava o tratamento temático de outros tipos de
documentos além do livro e de outros produtos impressos. A CDU era um sistema de
gerenciamento de banco de dados (entendidos nesse contexto, como arquivos impressos,
classificados por título, autor e assunto) extremamente complexo, descrita no contexto de um
sistema de armazenamento e recuperação de informação de hipertexto: um mecanismo de
recuperação para acesso e gerenciamento efetivos de banco de dados. (RAYWARD, 1997).
Segundo Otlet (1934) a criação e a organização de sistemas de acesso a banco de dados,
precisava de uma tecnologia da informação especial, que foi denominada de tecnologia de
ficha e arquivo, cujo padrão era de 3� X 5� para fins de uso bibliográfico. Ao separar o
conteúdo de um livro de seu autor e de sua intenção autoral, Otlet imaginava que seria capaz
de extrair sistematicamente dos livros tudo o que representasse uma nova contribuição para o
conhecimento. Essas informações poderiam ser armazenadas em fichas, de modo que elas
refletissem as afinidades envolvidas em cada assunto. Dessa forma, as fichas foram
consideradas como instrumentos fundamentais para o sistema tecnológico idealizado por
Otlet. (RAYWARD, 1997).
Já em 1931 o antigo instituto passa a ser o IID � Instituto Internacional de
Documentação. O fato mais marcante desse período é a publicação do monumental Traité de
Documentation de autoria de Otlet (1934), que expõe as noções relativas ao livro e ao
documento, ao emprego separado dos elementos que constituem a documentação, além de
31
destacar o valor de vínculo necessário entre os homens e lembrar o fenômeno da explosão dos
documentos. (ROBREDO, 2003).
A necessidade de tornar acessível o enorme acúmulo de documentação gerada dia a
dia foi sempre expressada por Otlet. Em 1935 a realização em Copenhague do 3º Congresso
Internacional promovido pelo Instituto Internacional de Documentação foi muito
significativa, principalmente pelas discussões sobre a tecnologia da informação, ou seja, a
preocupação no desenvolvimento de instrumentos para representar de forma padronizada os
documentos, na garantia do acesso mais efetivo às informações.
Paul Otlet era um homem com imensa curiosidade em relação às inovações
tecnológicas que pudessem ser úteis no processo documentário. Ele realizou diversas
experimentações com a microfilmagem e previu um futuro promissor para uma invenção
surgida na época: a televisão, além de antevir o desenvolvimento de diferentes equipamentos
tecnológicos como o fax, os microcomputadores, o hipertexto. Otlet, de certa forma, sempre
procurou meios para estabelecer o armazenamento e a padronização de informações,
principalmente com o avanço do conhecimento tecnológico e o uso de dispositivos mecânicos
que possibilitariam o acesso remoto às informações previamente armazenadas.
Outra contribuição importante trata-se de Mooers (1951), que cunha o termo
recuperação da informação numa perspectiva em que ela engloba os aspectos intelectuais da
descrição de informações e suas especificidades para a busca, além de quaisquer sistemas,
técnicas ou máquinas empregadas para o desempenho da operação. A recuperação da
informação assumiu um papel decisivo no surgimento da Ciência da Informação, trazendo em
seu bojo suas associações com a tecnologia da informação. (OLIVEIRA, 2005).
A prática profissional é indissociável dos processos tecnológicos. Os anos de 1950
foram considerados um período significativo devido ao crescimento da informação científica,
em diferentes formatos, sobretudo sob a forma de relatórios técnicos, e por um rápido
desenvolvimento dos sistemas automáticos de armazenamento e de recuperação da
informação, com especial destaque para recuperação por assunto. (ROBREDO, 2003).
De meados ao final da década de 1960, a UNESCO em consonância com outros
órgãos internacionais voltados para informação científica, discutem as bases da informação
32
científica voltadas para o desenvolvimento científico, tecnológico, econômico, social e
cultural, como �bem da humanidade�, atrelada aos princípios da Federação Internacional de
Documentação - FID. (GOMES; ZAHER, 1972). A documentação da FID era considerada,
em seu sentido mais cooperativo, uma forma de garantir o intercâmbio bibliográfico
internacional, ligado à concepção do conhecimento como �bem da humanidade�.
O surgimento da documentação é confirmado, despertando um grande interesse pelas
atividades de ciência e tecnologia, ocasionando o fenômeno da explosão da informação,
caracterizado por um crescimento exponencial de registros de conhecimento. Estudos sobre a
evolução da Ciência da Informação e sobre a diversidade considerável de profissionais da
informação, bem como a atividade técnico-profissional são realizados.
A necessidade de encontrar uma forma de organizar a gama de informações geradas
durante a Segunda Guerra, foi expressa por Vannevar Bush em 1945. Após a Segunda Guerra,
define-se o problema do gerenciamento da informação e é proposta uma máquina,
denominada Memex (Memory Extension), que agregava as mais modernas tecnologias da
informação existentes na época. O Memex pode ser comparado ao princípio de funcionamento
de um computador conectado a Internet com a finalidade de contribuir para a criação e a
distribuição do conhecimento adquirido em pesquisas, facilitando o compartilhamento e a
busca de informações. Pode-se de acordo com a figura 1, visualizar o que seria o Memex.
33
FIGURA 1: Memex (Memory Extension)
Fonte: Disponível em: <http://www.unicamp.br/~hans/mh/memex.html>. Acesso em: 23 mar. 2007
O funcionamento do Memex pode ser assim representado:
• Estoque: multimídia de documentos, abrangendo ao mesmo tempo imagens, sons
e textos;
• Dispositivos periféricos: facilitariam a integração rápida de novas informações,
outros permitiriam transformar automaticamente a palavra em texto escrito;
• Miniaturização desta massa de documentos: microfilme e fita magnética, que
acabavam de ser descobertos naquela época. Tudo isso deveria caber em um ou
dois metros cúbicos, o equivalente ao volume de um móvel de escritório;
• Acesso às informações seria feito através de uma tela de televisão munida de alto-
falantes. Além dos acessos clássicos por indexação, um comando simples
permitiria criar ligações independentes de qualquer classificação hierárquica entre
uma dada informação e outra;
• Manipulação: estabelecida a conexão, cada vez que determinado item fosse
visualizado, todos os outros que tivessem sido ligados a ele poderiam ser
instantaneamente recuperados, através de um simples toque em botões e
alavancas. (TÁLAMO, 2006).
34
O Memex pode ser considerado em suas funções como um dispositivo mecânico de
classificação e seleção por associação, paralelo ao princípio da indexação clássica, ou seja,
uma máquina considerada visionária para auxiliar a memória e guardar conhecimentos. O
Memex nunca foi construído, mas as idéias que inspiraram sua idealização ainda fazem parte
das aspirações de pesquisadores e cientistas da atualidade. (TÁLAMO, 2006). Vale destacar
que enfrentamos hoje, talvez em maior escala, os mesmos problemas apontados por Otlet e
Bush, buscando-se nas tecnologias da informação e comunicação a solução de tais problemas.
A criação de novas tecnologias para tratamento e recuperação da informação, tais
como os cartões perfurados para a recuperação da informação por assunto, foi largamente
acelerada em agências de inteligência governamentais, sendo transpostos para os serviços de
documentação científica e tecnológica no pós-guerra. (SHERA; CLEVELAND, 1977).
Em 1960, foi utilizado o termo hipertexto cunhando por Theodore Nelson considerado
discípulo de Bush, na tentativa de exprimir a idéia de leitura/escrita não linear em um sistema
de informática. Nelson vislumbrava uma imensa rede de informações que pudessem ser
acessíveis em tempo real pelos usuários num processo interativo utilizando-se de todos os
recursos disponíveis em diferentes mídias (texto, imagem, som etc.).
O que diferencia o conceito de hipertexto das outras formas de armazenamento eletrônico da informação é a estrutura associativa que reproduz, muito de perto, a estrutura da memória humana e pode tornar-se seu complemento íntimo e ampliado. Permite substituir as estruturas clássicas arborescentes da informação por estruturas mais ricas e mais complexas, organizadas em redes, mostrando um número infinito de caminhos, abertos a todas as navegações e interligando múltiplos objetos. (LE-COADIC, 2004, p. 59-60).
A partir da década de 1960 começa a surgir o que conhecemos hoje como Internet,
uma tecnologia que causou impactos sociais, pois trouxe assuntos relativos, que alteraram o
modo de vida dos indivíduos e da sociedade, como: democratização da informação,
globalização, sociedade da informação, velocidade de disseminação da informação, novo
papel do bibliotecário e do profissional da informação, entre outros.
A Internet nasce com iniciativa do Departamento de Defesa dos Estados Unidos �
ARPA (Advanced Research Projects Agency) - como estratégia militar. Seu grande objetivo
era
35
[...] projetar um sistema de comunicação invulnerável a ataque nuclear. Com base na tecnologia de comunicação por comutação de pacotes, o sistema tornou a rede independente de centros de comando e controle, de modo que as unidades de mensagens encontrariam suas rotas ao longo da rede, sendo remontadas com sentido coerente em qualquer ponto dela. (CASTELLS, 2000, p. 375).
A Internet é uma rede que, em uma visão simples, pode ser vista como sistemas que se
apresentam como um conjunto de partes interagentes e interdependentes que formam um todo
unitário, com determinado objetivo e efetuam determinada função. Possui como elementos
principais a conectividade e a coerência. Suas principais características são: transmissão de
informações na forma eletrônica com velocidade e confiabilidade; dependência aos seus
usuários; crescimento dos servidores; popularização das homepages pessoais; interesses
econômicos; e atividades de lazer. (ROBREDO, 2003). A Internet tem contribuído na
construção da maneira de ver e de processar a informação, visto que a informação em tempo
real tem ganhado espaço não só na rede, mas também em outros meios de informação e
comunicação.
A moderna tecnologia da informação baseada em computador e nas telecomunicações
reduziu o impacto dos problemas nos serviços atuais de banco de dados bibliográficos e
textuais. Notadamente caracterizada como a era da difusão do computador, transformando o
processamento e armazenamento de dados centralizados em um sistema compartilhado e
interativo de computadores em rede, tal fato ocasionou mudanças nas interações sociais e
organizacionais onde tempo e espaço são regidos pela velocidade, ou seja, do imediatismo das
informações estabelecidas nos processos de comunicação.
A idéia elementar de rede é bem simples e antecede a utilização efetiva das tecnologias de informática. Trata-se de uma articulação entre diversas unidades que, através de certas ligações, trocam elementos entre si, fortalecendo-se reciprocamente, e podem se multiplicar em novas unidades, as quais, por sua vez, fortalecem todo o conjunto à medida que são fortalecidas por ele, permitindo-lhe expandir-se em novas unidades ou manter o equilíbrio sustentável. Cada nó na rede representa uma unidade, e cada fio um canal por onde essas unidades se articulam através de diversos fluxos. (SANTOS, 2004, p. 104).
Além da grande quantidade de informação, a morosidade em um processo de
recuperação de informação se torna preocupante; em meados da década de 1960 foi gerado
um modelo, ou seja, um dispositivo que pudesse representar as informações armazenadas pelo
computador e interpretadas por sistemas inteligentes. Este princípio se baseia na organização
36
prévia das informações, criando meios de acesso para agilizar o fornecimento ou indicação de
respostas. Esse modelo, tradicionalmente utilizado por bibliotecas e centros de documentação,
tem como princípio fundamental a geração de respostas antes de receber os estímulos. Esse
processo consiste na geração de meios de respostas (classificação da informação e geração de
catálogos ou índices) com base na previsão das perguntas mais freqüentes a que o sistema
estará sujeito. (ROBREDO, 2003).
A comprovada capacidade do computador na simulação dos mecanismos mentais de
processamento de informações foram fatores que levaram a um novo modelo de sistema. Para
a alimentação desse novo sistema, não se requer o processamento prévio das informações. As
rotinas de comparação, associação, classificação, ordenação e geração de meios, obrigatórias
na fase de alimentação do sistema tradicional deixam de existir como rotinas de alimentação
do sistema artificial, dando lugar à rotina de descrição da informação a ser referenciada ou
armazenada (metadados3). Essa rotina consiste no fornecimento de dados que representem
fielmente a informação, permitindo ao computador interpretá-los, processá-los e fornecê-los
de acordo com os parâmetros impostos na pergunta pelo usuário. (ROBREDO, 2003).
Fundamentados no modelo tradicional de processamento de informação e com os
novos recursos tecnológicos advindos com o computador, surgiram técnicas até então
inaplicáveis sem os recursos da informática. O computador, com suas qualidades
comprovadas na simulação de processos, gradativamente foi sendo alvo de atenção daqueles
encarregados dos serviços de tratamento de informações. Sua grande capacidade em executar
tarefas repetitivas, exigidas pelos sistemas tradicionais de processamento, desviou a atenção
de alguns quanto a sua capacidade no processamento de informações. A elaboração de
catálogos classificados, índices numéricos ou alfabéticos, controles estatísticos e controles
burocráticos foi o grande alvo de aplicação da máquina. (OLIVEIRA, 1998).
Já em 1961 e 1962 surge a primeira formulação do que seria a Ciência da Informação
nas conferências do Geórgia Institute of Technology. Uma das definições clássicas, de acordo
com a literatura científica é a de Borko (1968), que define Ciência da Informação: �ciência
interdisciplinar que estuda as propriedades e o comportamento da informação, as forças que
3 Os metadados serão tratados de forma específica no capítulo 4.
37
dirigem o fluxo e o uso da informação e as técnicas, tanto manuais quanto mecânicas de
processar a informação visando sua armazenagem, recuperação e disseminação�.
Ampliando tal definição e aplicando-se nos dias atuais, e com base nos autores Shera e
Cleveland (1977), Robredo (2003, p. 55) apresenta a Ciência da Informação nos seguintes
termos:
Ciência da Informação é a que investiga as propriedades e comportamento da informação, as forças que regem o fluxo da informação e os meios de processamento da informação para um máximo de acessibilidade e uso. O processo inclui a origem, disseminação, coleta, organização, armazenamento, recuperação, interpretação e uso da informação. O campo deriva ou relaciona-se com a matemática, a lógica, a lingüística, a psicologia, a tecnologia computacional, as operações de pesquisa, as artes gráficas, as comunicações, a biblioteconomia, a gestão e alguns outros campos.
Capurro (2003), no que tange às origens históricas da Ciência da Informação,
descreve-a como um campo que possui duas raízes: a primeira está relacionada à
Biblioteconomia clássica, mais especificamente ao estudo dos problemas referentes com a
transmissão de mensagens, enquanto a segunda está atrelada à computação digital.
Em 1966, discutem-se os aspectos profissionais da ciência e tecnologia da informação
e no mesmo ano Ingwersen (1992) publica um artigo intitulado �Perspectivas cognitivas da
interação na recuperação da informação: elementos de uma teoria cognitiva da recuperação
da informação�, no qual enfatiza a importância do estudo do comportamento humano no
processo de recuperação da informação.
Nesse momento é pertinente destacar a preocupação da comunidade científica nos
tempos hodiernos em estudos voltados principalmente para a usabilidade e a acessibilidade de
recursos informacionais, notadamente em ambientes informacionais digitais, retomando as
perspectivas cognitivas de Ingwersen (1992), Popper (1974), Borlund (2000), Buckland
(1991), Brookes (1977), Maturana e Varela (1980), Saracevic (1995), Hjørland (2002),
Capurro e Hjørland (2007), destacando não somente o uso de tecnologias, mas também o
usuário (sujeitos cognoscentes) enquanto protagonista na participação efetiva dos sistemas de
recuperação da informação.
38
As novas tecnologias da informação difundiram-se de maneira global em menos de
duas décadas, entre meados dos anos de 1970 e 1990, por meio de uma lógica que é
caracterizada pela aplicação imediata no próprio desenvolvimento da tecnologia gerada,
conectando o mundo através da tecnologia da informação. [...] esse período de transformações tecnológicas em aceleração marca uma descontinuidade histórica irreversível na base material da espécie humana. O repentino aumento de aplicações tecnológicas transformou os processos de produção e distribuição, criou uma grande quantidade de novos produtos e mudou de maneira decisiva a localização das riquezas e do poder no mundo, que ficou ao alcance dos países e elites capazes de comandar esse sistema tecnológico. (CASTELLS, 2000, p. 53)
Le Coadic (2004, p. 84, grifo nosso) ao se reportar às tecnologias da informação,
elucida que,
Se as técnicas de informação são conjuntos de processos metódicos, baseados ou não em conhecimentos científicos, empregados na produção, tratamento, comunicação, uso e armazenamento de informações, a tecnologia da informação é, se nela reconhecemos uma dignidade científica, o estudo científico dessas técnicas. Mais prosaicamente, ela tem por objetivo a concepção de produtos, sistemas e serviços que permitem a construção, comunicação, armazenamento e uso da informação.
Na década de 1970 as novas tecnologias da informação difundiram-se amplamente,
acelerando seu desenvolvimento sinérgico e convergindo em um novo paradigma. A
microeletrônica mudou tudo isso, causando uma �revolução dentro da revolução�,
principalmente com o microprocessador e uso de chips. (CASTELLS, 2000). Em suma, o
paradigma da tecnologia da informação não evolui para seu fechamento como um sistema,
mas rumo à abertura como uma rede de acessos múltiplos.
De acordo com Le Coadic (2004, p. 20) ‘‘[...] o surgimento das tecnologias eletrônicas
(analógicas ou digitais) e fotônicas da informação (microcomputadores, telas de monitor
sensíveis ao toque, discos laser, fibras ópticas, dispositivos de multimídia, videodiscos,
programas de gerenciamento de acervos etc.)’’ ocasionaram transformações nas unidades de
informação4 deixando de ser depósitos para se tornarem centros de informação. Nessa
perspectiva é possível evidenciar o impacto das tecnologias, em especial as TICs na
transformação das unidades de informação e no surgimento da Ciência da Informação
4 Para este estudo a terminologia Unidades de Informação refere-se à biblioteca.
39
alicerçada nas tecnologias de processamento de dados e nas técnicas de controle da
informação.
Na década de 1990, Hawkins (2001) sugere a conservação do termo �information
retrieval� e observa a tendência para associar �library� a �information science�, retratando os
serviços bibliográficos, departamentos das universidades e também de alguns títulos de
publicações.
Numa abordagem mais contemporânea e outro marco para a Ciência da Informação é
Saracevic (1995), ao afirmar que a Ciência da Informação é interdisciplinar por natureza,
estando relacionada com a tecnologia da informação, possuindo forte dimensão social e
humana. O autor ainda afirma que a Ciência da Informação tem se desenvolvido a partir de
três idéias principais: recuperação da informação, relevância e interação. Ele ainda recomenda
três áreas emergentes para serem incluídas no atual conceito de Ciência da Informação:
estudos de interação, recuperação da informação multimídia e multilíngua, bibliotecas virtuais
e buscas na Internet.
Wersing (1993) destaca que a Ciência da Informação não pode ser vista como uma
disciplina clássica, mas como um protótipo de um novo tipo de ciência, que nesse contexto,
rompe com as percepções tradicionais sobre o conhecimento, sobre o prisma de que tal
disciplina visa apenas o estudo da constituição de sistemas de informação.
Em 1991, foi realizada a Primeira International Conference on Conceptions of Library
and Information Science � CoLIS 1 e buscaram-se reflexões sobre o conceito de Ciência da
Informação. Saracevic (1995) estabeleceu a diferença entre a Biblioteconomia ao dizer que
esta possui atribuições mais culturais e tecnicistas nos ambientes de bibliotecas, enquanto a
Ciência da Informação possui uma natureza tecnológica.
No Brasil, a partir da década de 1970 inicia-se um processo de transformações no
âmbito do Instituto Brasileiro de Bibliografia e Documentação (IBBD) que em 1976 se
transforma em Instituto Brasileiro de Informação Científica e Tecnológica (IBICT). Em 1970
nascia o Curso de Mestrado em Ciência da Informação, em convênio do IBBD com a UFRJ �
Universidade Federal do Rio de Janeiro, com uma forte orientação para a formação dos
40
profissionais da informação, privilegiando as atividades de informação e documentação
científica e o uso das emergentes tecnologias da informação. (ROBREDO, 2003).
A Ciência da Informação em sua gênese assume um papel importante na resolução de
problemas que podem ser elencados como: reunir, organizar e tornar acessível o
conhecimento cultural, científico e tecnológico produzido em todo o mundo, que podem
também ser contemplados na Documentação e na Recuperação da Informação.
Numa visão mais sucinta, desde a época de Otlet (1934) havia uma preocupação na
recuperação da informação com o apoio de tecnologias, principalmente com relação ao
armazenamento e tratamento informacional; em seguida houve a preocupação de tecnologias
para apoiar as práticas profissionais que estavam sendo desenvolvidas. Posteriormente, com a
iniciativa de Bush (1945), surge a idéia de desenvolver uma máquina, o Memex, para auxiliar
no processamento da informação. Na década de 1960 é cunhando o termo hipertexto por
Nelson e também o surgimento da Internet, que impactou decisivamente a forma de
tratamento da informação. Nessa mesma década, o conceito do que pode ser Ciência da
Informação é definido, e nesse conceito está claramente identificada a relação da tecnologia
com a área. Em 1966, Ingwersen (1992) constrói um artigo falando sobre os sujeitos
cognoscentes e formas de interação com os sistemas informacionais numa perspectiva sobre a
recuperação das informações. Mais recentemente, Saracevic (1995), destaca a tecnologia da
informação como fator fundamental na área e apresenta três áreas emergentes, ao mencionar
que a Ciência da Informação é interdisciplinar por natureza, estando relacionadas com estudos
de interação, recuperação da informação de diversos tipos de conteúdos e estratégias e
ferramentas de buscas em ambientes de informação digital.
A partir desse contexto, pode-se constatar que desde os instrumentos e ferramentas
vislumbradas por Otlet (1934), há uma presença marcante da tecnologia da informação e
comunicação durante a evolução da Ciência da Informação, bem como o investimento no
desenvolvimento e estudo das mesmas, visando aos benefícios que as tecnologias podem
proporcionar à sociedade de um modo geral e em especial aos profissionais da informação.
41
Santos (2004, p. 107; 114) afirma que
As tecnologias são instrumentos de infinitas possibilidades, que precisam ser explorados na formação do profissional da informação de maneira a gerar condições de uso estratégico, especialmente na prática não-discursiva de atuação desse profissional [...]. Todavia, as tecnologias não são nada além de um recurso instrumental à disposição dos sujeitos institucionais, e para utilizar estrategicamente a plenitude de sua capacidade devem-se conhecer suas potencialidades e seus limites.
Atualmente, é possível notar com os avanços tecnológicos, mudanças significativas
nos modelos de tratamento documentário e o desenvolvimento de ferramentas que
possibilitam formas mais eficazes de interação e colaboração dos sujeitos/usuários com os
novos ambientes informacionais digitais. Podemos destacar dentre esses avanços, o que a
literatura aponta como Web Semântica, proposta por Berners-Lee (2001), que tem em seus
objetivos, embutir um maior nível semântico nos conteúdos informacionais, de modo a
permitir que as informações possam ser interpretadas de forma �inteligente�, pelos agentes de
software e que será tratada detalhadamente, no capítulo 5.
Além disso, destaca-se também, o paradigma da Web 2.0, criada por Tim O�Reilly
(2005), considerada como a próxima geração da World Wide Web. Trata-se, portanto, da
construção de ambientes colaborativos, interativos e de compartilhamento de recursos
informacionais, com a participação mais efetiva da comunidade (usuários).
É preciso um olhar da Ciência da Informação, bem como dos profissionais envolvidos
nos processos informacionais, da transposição para o novo, ou seja, têm-se novas ambiências
e recursos disponíveis que precisam ser analisados e revisitados constantemente, a fim de
propiciar o uso e o reuso estratégico das informações e suas potencialidades. Podemos
encontrar na Ciência da Informação, respaldo indispensável, no que tange à representação
(forma e conteúdo) e à descrição dos recursos informacionais na potencialização dos
ambientes informacionais.
Ao nos reportarmos às abordagens epistemológicas da área, a literatura disponível
aponta que a Ciência da Informação, enquanto campo específico e disciplina do campo das
Ciências Sociais Aplicadas carece de construção conceitual, ou seja, não tem uma base
epistemológica bem delineada, constituindo-se, portanto, de um campo ou disciplina em
42
desenvolvimento/constituição, que utiliza aportes teóricos e metodológicos de outros campos
científicos em busca de cientificidade.
Pinheiro (1997, p. 6) reforça que
Mesmo os teóricos da área reconhecem a ausência de um sólido terreno teórico, essência do estágio científico de qualquer área, na visão tradicionalista. Este parece ser um problema não exclusivo da Ciência da Informação, mas de campos do conhecimento mais recentes, surgidos no limiar dos anos 50 e 60 e que marcam a era da sociedade da informação.
Podemos dizer, nessa perspectiva, que a Ciência da Informação atua como adjuvante
da Sociedade da Informação, enquanto um campo disciplinar constituído de interfaces que
trabalha com problemas informacionais usando a interdisciplinaridade para resolvê-los.
�Assim, uma disciplina científica que pretenda alcançar o status de ciência, como é o caso da
Ciência da Informação, classificada na área de ciências sociais aplicadas, necessita tanto de
teorias quanto de práticas�. (ANDRADE; OLIVEIRA, 2005, p. 45).
O desenvolvimento tecnológico, principalmente com o impacto dos computadores e
das telecomunicações no gerenciamento da informação, deu-se de tal forma, que podemos
apontar hoje, que a Ciência da Informação atrelada às tecnologias da informação e
comunicação é tema de estudos, pesquisas e discussões acerca do percurso do campo
científico, o que vem sendo discutido em âmbito mundial.
Nesse sentido, faz-se necessário o entendimento das tecnologias da informação e
comunicação para saber como usá-las estrategicamente como instrumentos pautados em
processos, metodologias que atuam e norteiam o fazer profissional de qualquer área, em
especial, dos profissionais da Ciência da Informação, levando em consideração o contexto
sócio-cultural, que determinará o uso efetivo das tecnologias em diferentes ambiências
informacionais na potencialização dos processos relacionados à geração, à transferência, à
utilização e à preservação da informação e de documentos.
O campo da Biblioteconomia e da Ciência da Informação já detém um corpo de
conhecimento e ferramentas para se trabalhar com o conteúdo dos documentos visando sua
recuperação. Verificou-se que as �tecnologias� usadas de Otlet (1934), passando por Bush
(1945) e Nelson (1960) sempre buscaram gerenciar conceitos, assuntos dispersos nos
43
documentos, de forma a possibilitar a recuperação de partes de documentos dos mais variados
tipos e suportes.
Portanto, pode-se considerar que as tecnologias da informação e comunicação, vêm
permeando e potencializando o âmbito informacional. Assim, pode-se dizer que as TICs
possibilitam os ensaios idealizados por Otlet (1934) e por Bush (1945) de forma mais efetiva,
principalmente no que tange à construção de formas de representação da informação para sua
identificação, localização e uso, e sua aplicação em ambiências específicas, tais como as
bibliotecas digitais, que serão objeto de análise do próximo capítulo.
44
Capítulo 3
Bibliotecas digitais:
gênese e contemporaneidade
45
3 BIBLIOTECAS DIGITAIS: GÊNESE E CONTEMPORANEIDADE
�Às bibliotecas está reservado o papel de repensar suas atividades e funções, adaptando-se
aos novos modelos organizacionais e extraindo das tecnologias disponíveis o substrato para
a melhoria na prestação de serviços e na utilização eficaz de informações�.
Luiz Atílio Vicentini
Dando continuidade aos assuntos tratados no capítulo anterior, antes de embarcarmos
ao universo da pesquisa propriamente dito, procura-se contextualizar a evolução das
bibliotecas com os avanços tecnológicos, caracterizado principalmente pela presença
marcante das Tecnologias da Informação e Comunicação nos variados estágios desse processo
evolutivo. Vale frisar que esta pesquisa tem como ponto focal as bibliotecas digitais, que
estão sendo apontadas de acordo com a figura 2, a seguir.
FIGURA 2: Evolução das bibliotecas com a presença das TICs.
Fonte: Cunha (2000, p. 75)
46
De acordo com Cunha (2000), tal como apresenta a figura 2, podemos verificar que a
biblioteca passou e continua passando por uma série de transformações à medida que são
desenvolvidas novas tecnologias visando a agilização dos processos informacionais em cada
momento.
• Era I - compreendida como Biblioteca Tradicional moderna - têm-se as bibliotecas
caracterizadas por seu espaço físico bem delimitado, cujo acervo é constituído por
documentos em papel.
• Era II � compreendida como Biblioteca Automatizada � caracterizada pela utilização
dos computadores nos processos e serviços da biblioteca, por exemplo, organização do
acervo, catalogação, indexação etc.
• Era III � compreendida como Biblioteca Eletrônica � caracterizada pela formação de
bancos de dados eletrônicos, cujo acesso era realizado via rede de computadores de
forma on-line.
• Era IV � compreendida como Biblioteca Digital e Virtual
o Biblioteca Digital � formada por documentos em formato digital, com acesso
via rede de computadores.
o Biblioteca Virtual � formada por um conjunto de bibliotecas digitais. Destaca-
se ainda, nesse caso, a Biblioteca Virtual com realidade virtual.
Nosso interesse de pesquisa está voltado principalmente para as questões de
representação e de descrição dos recursos informacionais no âmbito das bibliotecas digitais, o
que tem se tornado alvo de investigação e estudos pela comunidade científica atualmente.
Para melhor compreendermos o desenvolvimento das bibliotecas digitais, vejamos sua
dimensão contextual a fim de subsidiar uma discussão de forma mais aprofundada sobre a
forma em que elas são apresentadas contemporaneamente.
3.1 Dimensão contextual acerca das Bibliotecas Digitais
Bem antes do desenvolvimento da imprensa de Gutenberg, o homem procura de
alguma forma armazenar o conhecimento registrado em algum suporte informacional a fim de
47
assegurar a guarda e a memória de sua história. Pode-se verificar essa evolução, desde as
bibliotecas da Antiguidade, com os tabletes de argila, o papiro, o pergaminho, até o papel,
destacando que cada período é marcado por características próprias determinadas pelas
tecnologias vigentes em cada época.
Como ponto de partida, temos num primeiro momento o estabelecimento das
bibliotecas convencionais ou tradicionais caracterizadas por seus espaços físicos bem
delimitados, com suas coleções, bem como seus catálogos em suporte papel para registro das
informações. �O objetivo principal, a razão de ser das bibliotecas, consiste no atendimento às
demandas do público quanto aos registros do conhecimento, ou seja, quanto ao conteúdo dos
itens, suportes físicos do conhecimento�. (MEY, 1995, p. 1).
As bibliotecas tradicionais têm em suas funções o tratamento, o armazenamento, a
disseminação e a disponibilização dos seus documentos de forma convencional, independendo
de seu suporte físico que é apresentado, caracterizadas como espaços de preservação do
conhecimento acumulados pela humanidade.
Segundo Houaiss, Villar e Franco (2001, p. 58) a biblioteca seria uma �coleção de
livros; um lugar [espaço] que guarda, cataloga e empresta livros e outros impressos ao
público�. A biblioteca, inicialmente considerada como um depósito de livros com o objetivo
apenas de preservação dos documentos (MATOS, 2003), com o passar do tempo teve sua
função transformada de simples guardiã do conhecimento para assumir um papel social e
cultural mais amplo como ponto de acesso à socialização do conhecimento da humanidade.
Para Almeida Júnior (2004, p. 2),
[...] a biblioteca também foi e continua sendo vista como dissociada dos interesses da maioria da sociedade; como um equipamento cultural que contribui para a perpetuação de uma estrutura em que o saber é ferramenta para ampliação das desigualdades; como uma instituição cujas ações reforçam e ampliam o fosso entre os que possuem e os que não possuem informação.
É possível verificar que desde a época de Otlet (1934), conforme apontado no capítulo
2, o homem tem em suas preocupações a necessidade de armazenar e padronizar as
informações em um espaço para sua socialização e efetivo uso. No caso das bibliotecas
tradicionais, estas concentravam as informações em um espaço físico para servir a uma
48
diversidade de usuários que restringiam-se apenas às comunidades que conseguiam acessá-la
localmente.
Uma característica marcante na evolução das bibliotecas é a utilização de catálogos
em fichas, abandonando os catálogos que eram em forma de livros, ponto este centrado no
início do processo de automação em bibliotecas.
Com o surgimento da tecnologia do computador, os serviços das bibliotecas
(catalogação, classificação, indexação) e a própria organização do acervo, começam ser
realizados de forma automatizada, proporcionando o acesso on-line aos bancos de dados
através de redes de telecomunicações e a dinamização dos processos de disseminação e
recuperação das informações.
Para alavancar ainda mais os processos informacionais, com a chegada da Internet,
tem-se um novo espaço além do físico � o ciberespaço, onde neste tipo de ambiência,
encontram-se textos na íntegra, disponíveis de forma on-line, ampliando as possibilidades de
acesso aos conteúdos informacionais na facilitação ao usuário final.
Para Lévy (1999, p. 92, 107) o ciberespaço pode ser definido como,
[...] o espaço de comunicação aberto pela interconexão mundial de computadores e das memórias de computadores. [...] Esse novo meio tem a vocação de colocar em sinergia e interfacear todos os dispositivos de criação de informação [...] pesquisas sobre as interfaces de navegação são orientadas, direta ou indiretamente, pela perspectiva última de transformar o ciberespaço em um único mundo virtual, imenso, infinitamente variado e perpetuamente mutante.
O uso efetivo das tecnologias da informação e a associação dos computadores às
tecnologias da comunicação culminaram no aumento exponencial das facilidades com relação
ao fluxo e ao acesso aos recursos informacionais potencializando a conectividade entre os
sujeitos e viabilizando a amplitude da disseminação das informações.
Como apresentado no capítulo anterior, as bibliotecas, em diferentes épocas, sempre
foram dependentes das TICs acompanhando dessa forma, o desenvolvimento de paradigmas
tecnológicos. Desde a iniciativa de Bush em 1945 com a criação do Memex, é possível
49
observar o trabalho árduo de diferenciados profissionais no estabelecimento de mecanismos
que pudessem agilizar as tradicionais rotinas de tratamento das informações a fim de garantir
a integridade e recuperação das mesmas. A evolução das bibliotecas tem merecido grande
destaque ao longo destes anos, no que se refere ao desenvolvimento e uso de tecnologias,
principalmente as da informação e comunicação (TICs) que se potencializam por meio dos
novos recursos de acesso e formatos de intercâmbio advindos principalmente da área de
Biblioteconomia no tratamento de informações bibliográficas e catalográficas.
A história das bibliotecas digitais está intimamente ligada à realidade dos últimos anos
do século XX: o uso corrente das tecnologias da informação e comunicação, permitiram a
ampliação da produção de informações em formato digital e o êxito social das redes de
comunicação, impulsionaram o intercâmbio de informações em diferentes formatos.
Pode-se considerar que a diferença entre a biblioteca tradicional e a biblioteca digital
está na potencialização do suporte eletrônico que, por meio dos avanços tecnológicos amplia
as possibilidades de tratamento, acesso e recuperação dos recursos informacionais.
Vale ressaltar, que a temática bibliotecas digitais têm sido alvo de estudo e pesquisa de
muitas comunidades científicas, principalmente por profissionais da Ciência da Informação
onde muitos, numa perspectiva futurista a denominam de �Biblioteca Universal� que
vislumbra ser aquela que, por meio de redes de computadores, em diferentes suportes,
garantirá o acesso livre aos conteúdos informacionais permitindo a recuperação.
Para tanto são oferecidos vários congressos, simpósios e seminários em níveis
nacional e internacional onde os profissionais da área procuram discutir e sanar problemas
relativos ao tema, na tentativa de identificar conceitos, teorias, instrumentos tecnológicos e
metodologias que permitam ser aplicados a esta ambiência digital, na melhoria dos processos
informacionais abarcados pelas bibliotecas digitais.
Uma variedade de estudos para a definição de bibliotecas digitais está disponível,
alguns centrados nos objetivos que as bibliotecas digitais devem contemplar, outros voltados
para o conteúdo informacional, no sentido de que tipo de informação deve ser armazenado e
disponível e outros direcionados ao público que estas devem servir. Nesse sentido, procura-se
mostrar alguns conceitos relativos às bibliotecas digitais, abarcados pela literatura científica, a
50
fim de subsidiar uma discussão mais acurada do universo da pesquisa. Para tanto, estabelece-
se um recorte dos últimos dez anos, resgatando através dos tempos e propondo a ampliação do
conceito de biblioteca digital no cenário atual.
Segundo Borgman (1996, p. 6, tradução nossa),
Bibliotecas digitais são um conjunto de fontes eletrônicas e serviços técnicos associados para a criação, pesquisa e uso da informação, que possibilitam uma extensão e um aumento do armazenamento da informação e dos sistemas de recuperação de informação, manipulando dados digitais em qualquer meio (texto, imagens, sons, imagens dinâmicas e estáticas) em redes distribuídas de trabalho. O conteúdo das bibliotecas digitais inclui dados e metadados que descrevem vários aspectos do dado (representação, criador, dono, direitos de reprodução) e metadados que consistem em ligações ou relacionamentos com outros dados ou metadados, sejam esses externos ou internos à biblioteca digital.
É pertinente destacar neste momento, de acordo com a citação anterior que a presente
pesquisa tem como objetivos, a identificação de padrões de representação e descrição de
recursos informacionais no âmbito das bibliotecas digitais, que se dão por meio dos
metadados, instrumentos fundamentais nos ambientes de manipulação de dados bibliográficos
e que potencializam os resultados das buscas. Sem a utilização dos metadados não
conseguimos ter uma ambiência padronizada o que acarretará a dificuldade nos processos de
recuperação dos recursos informacionais.
As bibliotecas digitais incorporam o uso de rede de computadores e dispositivos de
armazenamento, tais como discos magnéticos, memórias e CD-ROM, facilitando o
armazenamento e distribuição de conteúdos digitais.
Para Marchiori (1997, p. 117),
A biblioteca digital difere das demais, porque a informação que ela contém existe apenas na forma digital, podendo residir em meios diferentes de armazenagem. [...] a biblioteca digital não contém livros na forma convencional e a informação pode ser acessada em locais específicos e remotamente, por meio de redes de computadores.
51
A concepção de representação, descrição, organização e do acesso às informações
juntamente com as tecnologias da informação e comunicação tem proporcionado um
desenvolvimento mais intensivo nos serviços de informação de forma global.
Pereira e Rutina (1999, p. 7), consideram que �[...] a biblioteca digital seria aquela que
teria, além de seu catálogo, os textos dos documentos de seu acervo armazenado de forma
digital, permitindo sua leitura na tela do monitor ou sua importação (download) para o disco
rígido do computador�.
Para melhor entendermos a estrutura das bibliotecas digitais, bem como seu
funcionamento, Cunha (1999, p. 258) aponta algumas características, tais como:
a) acesso remoto pelo usuário, por meio de um computador conectado a uma rede; b) utilização simultânea do mesmo documento por duas ou mais pessoas; c) inclusão de produtos e serviços de uma biblioteca ou centro de informação; d) existência de coleções de documentos correntes onde se pode acessar não somente a referência bibliográfica, mas também o seu texto completo. O percentual de documentos retrospectivos tenderá a aumentar à medida que novos textos forem sendo digitalizados pelos diversos projetos em andamento; e) provisão de acesso em linha a outras fontes externas de informação (bibliotecas, museus, bancos de dados, instituições públicas e privadas); f) utilização de maneira que a biblioteca local não necessite ser proprietária do documento solicitado pelo usuário; g) utilização de diversos suportes de registros da informação, tais como: texto, som, imagem e números; h) existência de unidade de gerenciamento do conhecimento, que inclui sistema inteligente ou especialista para ajudar na recuperação de informação mais relevante.
Com relação à estrutura tecnológica que a biblioteca digital deve possuir, vale destacar
que o planejamento e o desenvolvimento devem estar pautados de acordo com o modelo
estipulado em uma biblioteca tradicional, ou seja, todo o tratamento informacional
(representação descritiva e temática), formas de aquisição, recuperação, disseminação, serviço
de referência até mesmo a preservação, devem estar contemplados de acordo com uma
política institucional que norteará a funcionalidade da biblioteca digital.
Nesta perspectiva, conforme pode ser observado por Wainwright (1996, p. 2, tradução
nossa),
52
[...] as bibliotecas digitais, ainda permanecem sendo bibliotecas, [sustentadas] com os mesmos propósitos, funções e metas das bibliotecas tradicionais [convencionais]. A parte digital do termo indica meramente que os materiais estão armazenados e acessados digitalmente.
Podemos dizer que a Internet propicia às bibliotecas formas mais efetivas de atuação
no ciberespaço. Nesse contexto, é necessário um olhar para os estudos voltados para o
desenvolvimento de websites que possibilitem melhores formas de acesso, uso e reuso dos
recursos informacionais para os usuários.
3.2 Pontuações sobre os Websites
Vale destacar nesse momento, que não é nosso objetivo neste trabalho, estudar com
profundidade as tecnologias e as metodologias para a construção de websites, mas apontarmos
a necessidade de estudos para a construção de ambientes padronizados, na facilitação da
interação dos sujeitos com os recursos disponíveis.
Num primeiro momento, pode-se pensar no website de uma biblioteca digital, como
uma mimetização de um modelo de biblioteca convencional, ou seja, com sua estrutura física
transportada para um ambiente tecnológico.
Se a Internet propicia às bibliotecas estarem presentes na Web para continuarem a desempenhar suas funções, o website da biblioteca passa a ser sua forma de atuar no ciberespaço. Nesta lógica de raciocínio, o website da biblioteca deve ser capaz de desempenhar todas as funções da biblioteca, de modo a aproveitar todo o potencial de acessibilidade, disponibilidade, interconectividade e interatividade à informação e ao conhecimento que a Web pode oferecer. (AMARAL, 2005, p. 22).
Complementando tal idéia, outro ponto que deve ser repensado é a arquitetura da
informação de websites, que podem ser potencialmente aplicados ao contexto das bibliotecas
digitais, com a facilitação de interfaces mais amigáveis para os usuários. Para tanto,
Rosenfeld e Morville (1998), Vidotti e Sant�Ana (2006, p. 80-2) apresentam alguns elementos
que devem estar descritos no delineamento de um sistema informacional, tais como:
53
• Sistema de organização: formas de agrupamento dos conteúdos informacionais � responsável pela estruturação dos conteúdos, nele são definidos os critérios de disposição dos itens informacionais, observando os esquemas e /ou estruturas que melhor satisfaçam a necessidade do usuário, sem comprometer a navegabilidade do website. Os esquemas podem ser dos tipos exatos, ambíguos ou híbridos. As estruturas podem ser hierárquicas, de base relacional ou hipertextuais; • Sistema de rotulagem: denominação do conteúdo do grupo informacional � forma de representar um conjunto de informações utilizando uma palavra ou um ícone, de modo a facilitar a recuperação da informação e a navegabilidade do website. Possibilita ao usuário decidir qual caminho seguir, permitindo que o mesmo possa identificar-se com a linguagem e com a estruturação do site, culminando em um tempo de navegação mais otimizado;
• Sistema de navegação: forma de interação do usuário com o ambiente e com o conteúdo informacional disponível, permitindo ao usuário ir de um ponto ao outro pelo caminho desejado, possibilitando melhor aproveitamento do tempo de uso ou de acesso. Mantém o equilíbrio entre a movimentação e o oferecimento de opções de links para o usuário. As estruturas de navegação baseiam-se geralmente nas formas hierárquicas, globais e locais; • Sistema de busca: possibilita ao usuário a formulação das expressões de busca para a recuperação dos documentos que correspondem à informação desejada. Para a recuperação das informações, é necessária uma forma de representação descritiva e temática adequada aos conteúdos do metadados. Deve-se observar, antes da implementação, a forma como os usuários potenciais realizam essas buscas, e seus diferentes tipos de necessidades informacionais. Os tipos de buscas são os seguintes: busca por itens conhecidos, busca por idéias abstratas, buscas exploratórias e buscas compreensivas.
Além dos elementos propostos por Rosenfeld e Morville (1998), Vidotti e Sant�Ana
(2006), a literatura científica aponta o estudo da usabilidade de websites ou das bibliotecas
digitais, que visa o estudo de usuários na garantia de satisfação de suas necessidades
informacionais num processo de interação homem (usuário) e sistema.
Segundo Dias (2003, p. 28),
Um sistema interativo é considerado eficaz quando possibilita que os usuários atinjam seus objetivos. A eficácia é a principal motivação que leva um usuário a utilizar um produto ou sistema. Se um sistema é fácil de usar, fácil de aprender e mesmo agradável ao usuário, mas não consegue atender a objetivos específicos de usuários específicos, ele não será usado, mesmo que seja oferecido gratuitamente.
Com a utilização das redes de computadores, foi possível uma maior agilidade nos
processos de recuperação e disseminação da informação. Nesse sentido, Machado, Novaes e
54
Santos (1999, p. 217), apontam que �[...] com o surgimento da Internet a biblioteca ganha
uma nova dimensão, deixa de ter somente um espaço físico e ganha um novo espaço - o
Ciberespaço�.
Parece ser consensual entre muitos autores que uma das características principais das
bibliotecas digitais é o fácil compartilhamento instantâneo dos recursos informacionais
através de redes de computadores de forma que o acesso aconteça local ou remotamente, em
qualquer lugar e a qualquer tempo, cujo custo é proporcionalmente baixo.
Neste sentido, Machado, Novaes e Santos (1999, p. 216), para reforçarem tal assertiva
dizem que [...] a biblioteca digital tem como característica uma coleção de documentos eminentemente digitais, independendo se forem criados na forma digital ou digitalizados a partir de documentos impressos, e permite, por meio do uso de redes de computadores, compartilhar a informação instantânea e facilmente.
Numa visão mais contemporânea, outros autores, tais como Dias (2001, p. 4) na
tentativa de conceituar as bibliotecas digitais, bem como seu desenvolvimento, diz que
[...] a biblioteca digital parece estar se firmando como um conjunto de artefatos, conhecimento, práticas e uma comunidade que engendra compromissos realísticos assumidos por profissionais da informação, analistas de sistemas e usuários. [...] elementos estes que em conjunto constituiriam a instância dos conhecimentos/práticas tecno-científicas, com as práticas ativas e em evolução substitutas da considerada passiva e estática estrutura tradicional.
O discurso de uma biblioteca digital onde todos possam acessar �todo� o
conhecimento em tempo real, sem restrições, ainda parece utópico, uma vez que mesmo
havendo iniciativas por parte do governo ao inserir todo e qualquer cidadão no mundo digital,
fica visível que apenas uma parcela da população realmente tem acesso às tecnologias e são
participantes ativos nesta sociedade. Dentre essas iniciativas, podemos destacar a chamada
Sociedade da Informação5, que visa incluir os cidadãos numa sociedade digital,
5 Sociedade da Informação é o termo concebido aos programas nacionais voltados às Tecnologias da Informação e Comunicação como forma de garantir sua utilização e distribuição para toda a população, a fim de que as TICs não sejam mais um fator de exclusão social, mas possibilite a troca de informação em formato digital, suportando a interação entre indivíduos e entre estes e instituições, recorrendo a práticas e métodos em construção permanente. No Brasil, o projeto é finalizado entre 1999 e 2000. (NAZARENO et al., 2007).
55
principalmente com o uso intensivo das tecnologias da informação e comunicação, que são
consideradas a base material da sociedade.
Para Hernández e Tosete Herranz (2004, p. 189, tradução nossa),
[...] as bibliotecas digitais deveriam possibilitar a qualquer cidadão acessar a todo o conhecimento humano, em qualquer momento e lugar e de forma amigável, multi-modal, eficiente e efetiva, superando as barreiras da distância, da linguagem e da cultura - mediante o uso de múltiplos dispositivos de conexão a Internet.
É possível identificar na literatura científica que biblioteca digital é a terminologia
mais empregada para aplicar ao contexto de um cenário marcado pelos aparatos tecnológicos,
em especial, as tecnologias da informação e da comunicação, o que implica uma mudança de
paradigma, principalmente no que diz respeito ao fazer profissional dos bibliotecários e dos
cientistas da informação, uma vez que �nas bibliotecas digitais, as fontes não são catalogadas
e classificadas como os bibliotecários entendem esses termos, tornando impossível um
tratamento da informação nos moldes tradicionais�. (ALVARENGA, 2001, p. 11). Deste
modo, é preciso repensar formas diferenciadas para um tratamento de forma mais compatível
com o potencial das novas tecnologias, na possibilidade da garantia de uma recuperação mais
precisa e eficaz.
Ao tentar-se construir um conceito de biblioteca digital que mais se adeque aos tempos
hodiernos, verifica-se uma pluralidade discursiva na área de Ciência da Informação.
Em uma das obras mais recentes no Brasil sobre a temática bibliotecas digitais,
Toutain (2006, p. 16), as define como sendo
Biblioteca que tem como base informacional conteúdos em texto completo em formatos digitais - livros, periódicos, teses, imagens, vídeos e outros -, que estão armazenados e disponíveis para acesso, segundo processos padronizados, em servidores próprios ou distribuídos e acessados via rede de computadores em outras bibliotecas ou redes de bibliotecas da mesma natureza.
Nessa perspectiva, vale salientar que a pluralidade conceitual na área é demarcada pela
consideração de que as bibliotecas digitais são formadas por documentos em formato digital.
Entretanto, faz-se necessário acrescentar a importância da utilização de procedimentos e
56
metodologias pautadas em normas e padrões, para a representação e a descrição dos recursos
informacionais para o tratamento, a divulgação, o acesso, o uso e o reuso dos conteúdos
informacionais, de modo a garantir a preservação das informações digitais e a
interoperabilidade entre os sistemas informacionais, por meio de redes de computadores,
proporcionando a ampliação do acesso, otimização de recursos e a integração ambiências.
Para reforçar tal definição, e de acordo com os conceitos apresentados no texto, pode-
se neste momento, de acordo com Vicentini (2006, p. 242), estabelecer os principais
componentes em uma biblioteca digital:
• Coleção/conteúdo
• Recursos humanos
- Equipe multidisciplinar
- Capacitação
• Padronização
- Metadados
- MARC
- Formato do arquivo digital
- Padrão de digitalização
• Tecnologia
- Hardware
- Software
- Livre
- Proprietário
- Flexibilidade de desenvolvimento
- Facilidade de gerenciamento da coleção digital
- Linguagem de programação
- Utilização de protocolos de comunicação para importação e exportação de
dados
• Digitalização
• Garantia de direito autoral
• Preservação do documento digital
57
A coleção/conteúdo do acervo digital, compreendida aqui como o processo de
aquisição (compra, digitalização etc.), pode ser composta por recursos multimídias (imagem,
som, texto), interligados por informações referenciais. Os recursos humanos - devem ser
formados por equipes multidisciplinares e com a atualização e a capacitação dos sujeitos
constantemente, uma vez que tem-se um cenário com os mais variados recursos e serviços
tecnológicos, disponíveis no atendimento digital ao usuário. A padronização dos recursos
informacionais, entendida nesse contexto, como o processamento técnico do material
informacional, é o elemento-chave na representação (forma e conteúdo) e na descrição dos
recursos informacionais na confecção de metadados. A tecnologia possibilita a integração dos
serviços, bem como dos conteúdos informacionais, de modo a permitir uma amplitude na
interação dos sujeitos com a ambiência. As questões de direito autoral, também devem ser
levadas em consideração, na garantia de preservar a integridade e a fidedignidade dos
conteúdos informacionais para um posterior uso das informações digitais. Além disso, é
necessário um olhar para o estabelecimento de políticas que contemplem à preservação dos
conteúdos digitais, de forma a garantir a integridade lógica e física do ambiente
informacional.
As bibliotecas digitais apresentam-se hoje como importantes instrumentos que
possibilitam a facilitação da disseminação da informação, em ambiências digitais de forma
global, no que concerne à democratização da informação e dos conteúdos informacionais,
além de garantir a confiabilidade e a integridade dos recursos informacionais, uma vez que o
mesmo não ocorre, por exemplo, na Internet, cujas informações são caracterizadas pela
efemeridade e não asseguram que tais informações possuam um determinado grau de
veracidade em sua totalidade.
Pode-se considerar, pelo estado da arte sobre bibliotecas digitais abordado no texto,
que há um grande desafio e inúmeras possibilidades no desbravamento desta ambiência
digital por parte de uma diversidade de profissionais, com destaque para os da área de Ciência
da Informação, no tocante em questões de representação e descrição de conteúdo e forma dos
recursos informacionais.
O armazenamento e a preservação dos recursos informacionais e de seu conteúdo têm
sido objetos de estudo de pesquisas atuais na área de Ciência da Informação, isto é, uma área
de investigação que tem adquirido cada vez mais importância, uma vez que a massa de
58
informações em meio digital cresce exponencialmente, dificultando muitas vezes o controle, o
acesso e a integridade das informações.
Vale destacar também que a necessidade de estudos sobre a temática hoje, é uma
realidade brasileira e está presente também nos cursos de Pós-Graduação em Ciência da
Informação. Sendo assim, o que motivou a construção da seção seguinte, foi uma disciplina
ministrada no curso de Pós-Graduação em Ciência da Informação da Universidade Estadual
Paulista � UNESP � campus de Marília, pormenorizando um conjunto de iniciativas e
desenvolvimento de políticas e ambientes informacionais digitais que contemplem os
princípios da preservação digital.
Nosso objetivo neste capítulo não é tratar com profundidade as técnicas,
procedimentos e metodologias concernentes à preservação digital, mas alertarmos para a
importância sobre o assunto para que seja estudado em consonância no estabelecimento e
desenvolvimento de uma biblioteca digital, e as iniciativas que norteiam o cenário atual.
3.3 Paradigma da Preservação digital na perspectiva das Bibliotecas Digitais
Com a grande quantidade de bibliotecas digitais desenvolvidas nos últimos tempos e o
volume avassalador de informações no ambiente Web, cresce também paralela e
vertiginosamente o número de documentos digitais permitindo uma ampla produção e
disseminação de conteúdos informacionais no ambiente digital, causando assim, um repensar
dos tradicionais modelos para preservação destes conteúdos no cenário atual.
As informações geradas atualmente estão, cada vez mais, sendo armazenadas no formato digital. As vantagens desta forma de armazenamento de informações são muitas, destacando-se, entre elas, a flexibilidade oferecida para a sua recuperação e a possibilidade de armazenamento e veiculação em diferentes tipos de mídia. (CARVALHO, 2003, p. 76).
Por preservação digital entende-se ser a capacidade de manter disponíveis informações
e documentos digitais para que possam transcender a largo prazo com os avanços
59
tecnológicos nos ambientes digitais, sem riscos de que haja alteração ou perda de legibilidade
destes documentos.
O que pode ser constatado atualmente é que a grande parte das informações
produzidas hoje �nascem� em formato digital e as que se encontram armazenadas em suportes
convencionais, tais como, papel, disquetes, CD-ROMs, por exemplo, rapidamente são
transformadas/convertidas ao suporte digital. Mas a grande preocupação da comunidade e
alvo de discussão e estudos é como garantir o acesso de longo prazo aos recursos
informacionais digitais, uma vez que não são determinadas políticas e estratégias
consolidadas que contemplem a preservação para documentos digitais.
Vale mais uma vez destacar que as bibliotecas, desde a Antiguidade, constituem-se
como centros de preservação da memória e do conhecimento da humanidade. Neste sentido,
com o uso cada vez mais intenso das tecnologias da informação e comunicação, temos as
bibliotecas digitais que são consideradas por alguns especialistas o caminho mais adequado
para a preservação dos recursos informacionais digitais. (HILDRETH, 1996; ARELLANO,
2004).
As bibliotecas e os arquivos têm estabelecido programas de preservação para materiais
tradicionais. A preservação digital possui uma natureza diferente, principalmente na
diversidade de formatos de materiais existentes atualmente. Segundo Hedstrom (1997-1998) a
preservação digital abarca o material que começa sua vida no formato digital, bem como o
material que é convertido do formato tradicional/convencional para o formato digital.
Sendo assim, pode-se considerar que as bibliotecas digitais apresentam-se como
espaços propícios para o armazenamento, a disseminação e a preservação das informações
digitais, uma vez que elas podem ser manipuladas simultaneamente em vário locais, sem a
limitação de espaço e tempo, com uma maior amplitude de acesso aos recursos
informacionais.
Ainda nessa perspectiva, Lesk (1997) e Arellano (2004, p. 17), afirmam que �as
bibliotecas digitais são meios mais dinâmicos para preservação digital do que as bibliotecas
tradicionais, no sentido da sua adaptação às freqüentes mudanças tecnológicas�.
60
De acordo com a figura 3, pode-se melhor compreender os elementos que devem estar
contemplados numa estrutura tecnológica de um acervo digital.
FIGURA 3: Elementos básicos do acervo digital
Fonte: Innarelli (2005)
De acordo com a figura 3, a responsabilidade de preservar documentos digitais por um
longo prazo, em uma biblioteca digital, por exemplo, só se efetivará de acordo com uma infra-
estrutura tecnológica adequada por meio de hardware e software sofisticados (atualizados de
acordo com determinada época). Ferreira (2006) elucida que além da parte física e lógica do
acervo digital, necessita-se atentar para o tratamento das informações, entendidas nesse
contexto, na transformação de bits, mediados pelo hardware e software, de forma a serem
interpretados/processados pelas máquinas, proporcionando significado aos objetos digitais.
A preservação de informação no domínio analógico manifesta-se, sobretudo, pela tentativa de conservar o suporte inalterado durante o máximo de tempo possível. No contexto digital, a preservação do suporte ou da seqüência de bits que constitui o objecto, não é condição suficiente para garantir que a informação permanece acessível, reutilizável e autêntica ao longo do tempo. Preservar informação digital consiste, por vezes, em modificar ou transformar deliberadamente o objecto físico ou lógico que transporta a mensagem. Para que essa transformação não produza uma mensagem exageradamente degradada, é fundamental definir quais as propriedades da mensagem que deverão ser asseguradas durante o processo de transformação. (FERREIRA, 2006, p. 51).
O grande desafio da preservação de documentos em ambientes digitais é garantir a
integridade e autenticidade dos recursos informacionais e o acesso contínuo a seus conteúdos,
bem como suas funcionalidades, através dos recursos tecnológicos disponíveis em cada
momento, a fim de proporcionar a facilidade no processamento, transmissão e armazenamento
das informações de forma eficiente.
61
Em uma carta aprovada pela UNESCO em 2003 sobre a temática preservação digital
que culminou em um texto apresentado pela Conferência de Diretores das Bibliotecas
Nacionais � CDNL � destacaram a preservação digital como um dos pontos emergentes na
constituição da sociedade da informação, no sentido dos países refletirem sobre o
estabelecimento de políticas nacionais de preservação e que garanta o acesso aos recursos
digitais.
Para o delineamento da preservação digital que permita o armazenamento em
repositórios de dados digitais, faz-se necessária a adoção de algumas estratégias, métodos e
ferramentas tecnológicas que integrem determinado processo, tais como:
Preservação física: A preservação física está centrada nos conteúdos armazenados em mídia magnética (fitas cassete de áudio e de rolo, fitas VHS e DAT etc.) e discos óticos (CD-ROMs, WORM, discos óticos regraváveis). Preservação lógica: A preservação lógica procura na tecnologia formatos atualizados para inserção dos dados (correio eletrônico, material de áudio e audiovisual, material em rede etc.), novos software e hardware que mantenham vigentes seus bits, para conservar sua capacidade de leitura. Preservação intelectual: No caso da preservação intelectual, o foco são os mecanismos que garantem a integridade e autenticidade da informação nos documentos eletrônicos. (ARELLANO, 2004, p. 17).
Uma vez adotadas as estratégias anteriormente mencionadas, tem-se a possibilidade de
potencializar o acesso aos recursos informacionais de forma mais efetiva, na melhoria e na
integridade dos conteúdos digitais, para um posterior uso e reuso das informações. A seção
seguinte, apresenta brevemente algumas iniciativas apontadas pela literatura científica, nas
questões de preservação digital.
3.3.1 Modelo de Referência Open Archival Information System (OAIS)
Uma das iniciativas da preservação digital, no âmbito das bibliotecas digitais e alvo de
pesquisa de muitos profissionais da Ciência da Informação, que norteiam a manutenção do
acesso aos recursos informacionais, é o modelo de referência Open Archival Information
System (OAIS), mais conhecido como Sistema Aberto para Arquivamento de Informação,
62
publicado pelo Consultive Committee for Space Data Systems6 (CCSDS), que consiste numa
proposta de padronização de um sistema de arquivamento destinado à preservação e ao acesso
dos recursos informacionais digitais em longo prazo.
Um arquivo nos termos do OAIS significa considerar os arquivos como organizações de pessoas e sistemas, que aceitaram a responsabilidade de preservar a informação e torná-la disponível e melhorar a comunicação e produtividade entre diferentes comunidades. (CCSDS, 1998 apud ARELLANO, 2004, p. 19).
Um aspecto importante a ser considerado no modelo OAIS é sua linguagem ou
terminologia, no estabelecimento de um vocabulário compartilhado na forma de um glossário
para a disseminação de conhecimento de formal mundial, proporcionando uma melhoria nos
processos de comunicação científica.
Quanto aos objetos de informação delineados para uma base de preservação digital dos
documentos, podemos destacar 4 (quatro) categorias de informação, de acordo com a figura 4:
FIGURA 4: Tipos de informação segundo o Modelo de referência Open Archival Information System (OAIS).
Fonte: Arellano (2004, p. 20)
6 Maiores informações sobre a documentação do modelo OAIS podem ser encontradas no site do Consultive Committee for Space Data Systems. Disponível em: <http://public.ccsds.org/default.aspx>. Acesso em: 20 dez. 2007.
63
As categorias de informação, apresentadas no modelo OAIS, podem ser interpretadas
da seguinte maneira:
� informação de conteúdo: uma informação que é o objeto primário da preservação. Ela contém o objeto digital primário e informação representada necessária para transformar este objeto em informação com significado. � informação de descrição de preservação: qualquer informação necessária para preservar adequadamente a informação de conteúdo com a qual está associada. Ela inclui: � informação de referência: e.g. identificadores; � informação de contexto: e.g. classificações por assunto; � informação de proveniência: e.g. copyright, histórico; � informação de integridade: documenta os mecanismos de autenticação. � informação de pacote: informação que enlaça e relaciona os componentes de um pacote dentro de uma entidade identificável em uma mídia específica. � informação descritiva: informação que permite localizar, analisar, recuperar ou ordenar a informação de pacote dentro de um OAIS. (ARELLANO, 2004, p. 20).
Nesse sentido, pode-se observar, por exemplo, quando comparado a uma ambiência do
tipo biblioteca, seja ela convencional ou digital, que as etapas acima citadas, podem ser
compreendidas como processos padronizados, pautados em normas e padrões que
estabelecem a garantia da representação (informação descritiva e informação de conteúdo, por
exemplo) dos recursos informacionais, de modo que garanta a facilitação pelo usuário no
acesso e o uso aos conteúdos informacionais.
Na preservação digital, pode-se evidenciar a ocorrência de duas práticas distintas: na
primeira, as bibliotecas escolhem gerar e guardar uma cópia de preservação e uma de acesso
ao mesmo tempo ou gerar uma cópia de preservação e fazer cópias de acesso; na segunda, as
matrizes de preservação têm o tratamento de preservação e não as demais cópias. Neste
sentido, as bibliotecas digitais assumem uma responsabilidade vital no que concerne às
práticas de preservação digital em sua totalidade, devendo estas estar inseridas e englobadas
nos fluxos normais de trabalho.
Os formatos digitais (mídia magnética e óptica) são qualitativamente diferentes, uma
vez que são considerados meios reusáveis pondendo deteriorizar-se rapidamente, em vez de
décadas, em apenas alguns anos começam um processo de deteriorização.
64
Um outro problema destacado é a obsolescência das tecnologias (hardware e
software), aliado à ausência de padrões, protocolos e métodos para preservar a informação
digital. Para garantir uma acessibilidade futura, faz-se necessário determinar fatores em
relação à arquitetura, ao alocamento dos recursos informacionais e ao planejamento das
bibliotecas digitais.
Outros dois tópicos precisam ser discutidos quando falamos em preservação digital: a
memória de massa, ou seja, a grande capacidade de armazenamento e a preservação a longo
prazo. Há duas maneiras distintas para examinar as exigências da preservação digital:
• Da perspectiva dos usuários e a respeito da opinião das bibliotecas, arquivos e
repositórios e;
• Dos administradores responsáveis pela manutenção, preservação e distribuição da
informação. (HEDSTROM, 1997-1998, tradução nossa).
O armazenamento digital não é apenas uma alternativa para armazenar formatos
impressos, porque muitos tipos de objetos digitais não possuem equivalentes impressos e não
podem ser preservados em formatos que não seja o digital.
Na concepção de Hedstrom (1997-1998, tradução nossa) muita informação que
começa sua vida no formulário eletrônico é impressa no papel ou no microfilme para ser
armazenada de forma segura. O papel neutro ácido de alta qualidade pode durar um século ou
mais, o microfilme pode durar 300 anos ou mais e mesmo assim, eles não requerem nenhum
tipo de equipamento ou software especial para a recuperação ou visualização da informação.
Uma outra estratégia para a preservação digital é preservar a informação digital nos
diversos formatos possíveis. A informação digital pode ser transferida por meio de gerações
sucessivas de tecnologias em um �software-independente� como o formato ASCII (arquivos
em formato texto) ou como arquivos simples e uma estrutura uniforme, homogênea, que
necessita ser migrada periodicamente. (HEDSTROM, 1997-1998, tradução nossa).
Portanto, as ameaças comuns a todos os tipos de documentos, independentemente do
seu suporte físico, requerem as mesmas estratégias de preservação. Já as ameaças atreladas
65
somente aos documentos digitais requerem o uso de estratégias diferenciadas e, na maioria
das vezes, de forma associada.
A importância de salvaguardar a integridade do objeto digital como parte da missão é
um ponto importante para todas as bibliotecas digitais que estão envolvidas em preservação
digital e neste contexto, podemos destacar o papel dos repositórios institucionais (RI) que
atuam para assegurar e preservar a produção intelectual de comunidades acadêmicas
específicas, além de tornar acessível o capital intelectual de uma determinada instituição e
estabelecer melhores níveis de comunicação científica.
De acordo com a definição de Café et al. (2003, p. 4),
Um repositório institucional agrega um conjunto avançado de serviços relativos à organização, tratamento, acesso e disseminação do conteúdo digital produzido por uma instituição e sua comunidade acadêmica e de pesquisa. Dentre estes serviços, inclui-se principalmente o de preservação digital, uma vez que o gerenciamento da migração do conteúdo digital de uma tecnologia em vias de ser desativada para um sistema de ponta deve ocupar um espaço primordial nas preocupações das organizações que detêm os repositórios institucionais.
Pode-se ainda nesta perspectiva enumerar algumas estratégias técnicas para a
preservação em ambientes digitais tais como:
• Atualização: compreende a cópia do conteúdo de um meio de armazenamento para
outro. Como tal, só se centra na obsolescência do meio, não é uma estratégia de
preservação completa. Exemplo: copiar um grupo de arquivos de CD-ROMs a DVDs.
• Emulação: é a preservação do objeto digital junto com o software original, ou seja, é a
recriação do ambiente técnico requerido para ver e utilizar a coleção digital.
• Migração/Conversão: é o processo de transferência de informação digital de uma
configuração de hardware e software para outra, ou de uma geração de computadores
a gerações subseqüentes. As melhorias em tecnologias da conversão podem suportar
soluções híbridas à preservação e alcançar problemas permitindo repositórios
armazenar determinados formatos do material digital em meios estáveis, tais como o
66
microfilme, com versão da demanda do formulário digital para a análise e reuso.
(HEDSTROM, 1997-1998, tradução nossa).
Ainda nessa perspectiva, deve-se considerar como um fator primordial no processo de
preservação digital a utilização de metadados, que podem documentar a manutenção e usam a
história do documento, tempo e descrição, e uma série de documentos que são essenciais para
determinar a autenticidade e a compreensão da origem das fontes.
O objetivo da presente pesquisa é analisar os metadados descritivos para informações
bibliográficas no ambiente de bibliotecas digitais, advindos das áreas de Biblioteconomia e de
Ciência da Informação que serão tratados de forma específica no capítulo 4. Assim, a intenção
deste estudo não é analisar os metadados específicos para a preservação digital, mas
pontuarmos a necessidade de usá-los para que se tenha uma representação completa e
padronizada para o acesso e o uso efetivos das informações.
3.3.2 O papel dos metadados na preservação digital
É pertinente destacar nesse momento, que a representação dos recursos informacionais
por metadados, é uma condição-chave para as questões de preservação digital, ou seja, uma
vez as informações bem descritas e representadas, melhores condições de uso, reuso e
preservação dos conteúdos informacionais haverá.
A criação e uso de metadados é uma parte essencial para a caracterização dos recursos
informacionais em todas as estratégias operacionais de preservação digital, uma vez que elas
estão baseadas na conservação de software e hardware, emulação ou migração, ou seja, um
meio para garantir a autenticidade, registrar o gerenciamento de direitos e coleções de dados,
a interação com os recursos de busca, bem como a identificação e a localização dos recursos
informacionais. (ROTHENBERG, 1996, tradução nossa).
A palavra-chave neste contexto de bibliotecas digitais, repositórios institucionais,
comunicação científica, é interoperabilidade, ou seja, a capacidade entre sistemas
67
heterogêneos intercambiar recursos informacionais que somente ocorrerá com o uso efetivo
dos metadados para a potencialização dos ambientes informacionais.
Neste sentido, foi desenvolvido o Open Archives Initiative Protocol for Metadata
Harvesting (OAI-PMH), que em português - Protocolo de Coleta de Dados da Iniciativa de
Arquivos Abertos, o qual oferece um ambiente de interoperabilidade, baseado na coleta de
metadados, que é independente das aplicações (computadores, seus programas e suas
tecnologias).
Os metadados nesta perspectiva de preservação digital, atuam como ferramentas
indispensáveis no âmbito das bibliotecas digitais, podendo estar agrupados em quatro grandes
categorias:
• Metadados descritivos: metadados usados para descrever e identificar
informações sobre recursos;
• Metadados de acesso: metadados que definem os termos e condições para o
acesso e a recuperação de um recurso;
• Metadados estruturais: metadados que respondem a uma estrutura previsível ou
pré-determinada, tanto se essa estrutura é um padrão ou não;
• Metadados administrativos/preservação: metadados usados no gerenciamento e
administração dos recursos informacionais.
Além disso, pode-se apontar algumas iniciativas do desenvolvimento de metadados
para preservação digital, tais como o METS (Metadata Encoding and Transmission
Standard), criado pela Library of Congress, que consiste num esquema XML (Extensible
Markup Language) � Linguagem de Marcação Extensível, usado para codificar todo o
conteúdo e o metadado de um objeto digital. Um documento METS pode ser um simples
arquivo com conteúdo e metadado, um documento direcional que aponta para o conteúdo e
para o metadado ou ainda, uma combinação dos elementos acima mencionados.
A importância da utilização dos METS pode ser destacada em três momentos:
68
1. Interoperabilidade: partilhar objetos digitais entre sistemas de bibliotecas, permitindo
que a biblioteca digital trabalhe no compartilhamento com objetos de outros
repositórios;
2. Escalabilidade: a utilização de um único software podendo ser usado para indexar,
navegar e mostrar diferentes tipos de conteúdos;
3. Preservação: auxilia as estratégias de processo de migração.
Como pode ser apontado de acordo com a literatura, verifica-se que as bibliotecas
digitais assumem um papel decisivo na constituição da sociedade da informação, uma vez que
são produzidas gigantescas quantidades de informações no ambiente digital, precisando ser
repensado constantemente formas diferenciadas para preservar os conteúdos informacionais
para uma futura recuperação.
Vale destacar neste contexto que a atuação dos profissionais da informação, em
especial, os bibliotecários � sujeitos protagonistas neste cenário - precisam mais ainda agir de
forma ética, a fim de assegurar a integridade dos recursos informacionais e permitir o acesso e
o uso das informações pelo usuário final. Neste sentido, serão levantados alguns pontos com
relação aos elementos éticos para possíveis reflexões sobre o fazer do profissional do
bibliotecário.
3.4 Elementos éticos no contexto das Bibliotecas Digitais
Nosso objetivo neste estudo não é apresentarmos teorias, conceitos ou filosofias
concernentes à ética, mas sim, fornecer subsídios para uma maior compreensão da existência
de elementos éticos que norteiam a atuação e o fazer profissional dos profissionais da
informação, em ambiências informacionais sejam estas convencionais ou digitais.
De acordo com McGarry (1999) as bibliotecas existem há quase tanto tempo quanto os
próprios registros escritos; as práticas realizadas nas bibliotecas geralmente estão relacionadas
entre si, como, guardar para preservar e organizar para usar. Tanto os aspectos de
armazenagem como organização apresentam uma evolução maior nos estudos e busca de
soluções aos aspectos relativos ao acesso.
69
Vivencia-se uma mudança de paradigmas com os aportes e instrumentos tecnológicos
desenvolvidos ultimamente, onde nossa sociedade, em especial a sociedade da informação é
caracterizada pela interconectividade permeada por redes de computadores nos processos de
interação.
Neste sentido, pode-se mais uma vez considerar neste cenário marcado pela
impactante presença das tecnologias da informação e comunicação (TICs) na potencialização
de ambientes informacionais, tais como as bibliotecas digitais, que trouxeram consigo um
novo repensar sobre questões éticas, principalmente no que diz respeito à preservação e ao
acesso aos recursos informacionais.
Entretanto, não se trata somente de uma mudança no ambiente tecnológico, mas, indo além, de uma mudança nas bases da ação profissional, visto que o componente ético passa a exigir uma constante reflexão em virtude da própria mutabilidade do ambiente. (CASTRO et al., 2006, p. 11).
A grande oportunidade para as bibliotecas digitais, bem como para o profissional
bibliotecário reside na mediação e criação de facilidades para o desenvolvimento no que
concerne ao acesso e uso da informação com o propósito de gerar conhecimento.
Como destaca Valentim (2004, p. 55),
[...] o fazer intrínseco do profissional da informação, haja vista a natureza eminentemente mediadora do mesmo, �desde a prospecção e filtragem de dados e informações, até a disseminação e transferência desses mesmos dados e informações ao público interessado�, com especial destaque para o tratamento de conteúdos informacionais, no âmbito dos quais o uso das linguagens, como instrumentos de mediação, requer uma atitude - e reflexão - ética constante e vigilante.
As novas tecnologias de produção, de processamento, de difusão e de exploração da
informação digital modificam profundamente as práticas sociais e profissionais relativas ao
uso da informação, causando dessa forma, questionamentos sobre os fundamentos ou
justificativas das reivindicações dos direitos autorais, por exemplo.
70
Nesta perspectiva, Stuber e Franco (1999, p. 3) afirmam que,
O fato das obras e informações transmitidas através da Internet estarem sob a forma digital não retira delas a característica de criação humana, passíveis de proteção jurídica, garantindo ao criador ou autor destas obras o direito exclusivo de reprodução, divulgação e utilização de seus trabalhos, e o direito à remuneração por sua utilização, seja através da aplicação das normas de direito do autor, seja através da aplicação de normas de proteção à propriedade industrial.
Sem dúvida as bibliotecas digitais começam a se expandir exponencialmente. Sendo
assim, necessitam ser analisadas e tratadas sob o enfoque dos aspectos legais. Questões sobre
os direitos autorais (copyright) precisam ser esclarecidas, haja vista serem essenciais para a
aquisição, o armazenamento e a disseminação dos conteúdos digitais à medida que se
populariza o uso da informação digital por meio das redes eletrônicas abertas e das
ferramentas e produtos da multimídia.
Atualmente, os diferentes contextos que pautam discussões éticas compreendem
questões como propriedade intelectual e direitos autorais, principalmente com o número de
informações disponíveis na Internet, fomentadas pelas tecnologias da informação e
comunicação que rompem com tradicionais formas de circulação e de produção de
conhecimento e de informação.
As bibliotecas digitais, ao possibilitar o acesso aos recursos informacionais, permitem
ampliar a capacidade discursiva humana e, portanto, propiciam condições para a participação
cidadã e produtiva dos indivíduos na sociedade.
Mas a questão chave no atual cenário das bibliotecas digitais com relação aos aspectos
éticos, apontados por Brey (1999) é a necessidade de um olhar sobre os aspectos
representacionais (do ambiente e dos recursos informacionais) e aos aspectos interativos e de
comportamento (do usuário) nos ambientes informacionais digitais.
Nesse sentido, as questões éticas no contexto das bibliotecas digitais merecem ser
amplamente debatidas pela comunidade científica, como desafio para proporcionar o acesso à
informação neste ambiente.
71
Pode-se, dessa maneira conforme apontado por Castro et al. (2006, p. 12) elencar
alguns problemas éticos específicos no âmbito das bibliotecas digitais, tais como:
A. ACESSO • Haveria controle de acesso aos recursos informacionais e como se daria o acesso a estes na biblioteca virtual [digital]? • A interação com o bibliotecário virtual (agente inteligente) atenderia a todas as necessidades dos usuários? • O custo do desenvolvimento e manutenção de uma Biblioteca virtual [digital] viabilizaria sua implementação?
B. DIREITOS AUTORAIS • Os usuários teriam acesso parcial (simples visualização) ou total (na íntegra) aos recursos informacionais? • Como resolver a questão do direito autoral na hipótese de acesso total aos recursos informacionais? • Como se resolve o conflito entre o respeito aos direitos de autor e os direitos de acesso à informação?
C. REPRESENTAÇÃO DO VIRTUAL [digital] • Entre a proposição e a representação da biblioteca virtual [digital] existe violação ética, quando não houver fidedignidade? O profissional estaria sendo tendencioso? • O fato de alguns serviços (e não dos recursos informacionais) da biblioteca virtual [digital] ser disponibilizada em outras línguas violaria a fidedignidade da representação em realidade virtual, em detrimento da garantia cultural?
D. REPRESENTAÇÃO DO RECURSO INFORMACIONAL • Evitar desvios • Evitar tendenciosidade • Evitar insuficiência • Evitar suprimir a informação (censura) • Evitar a ausência de padronização • Evitar a má-representação
Conforme apontado pela literatura científica, as questões éticas sempre permearam os
ambientes informacionais, tais como as bibliotecas e neste contexto, principalmente com o
uso intensivo das tecnologias da informação e comunicação. Atualmente, tanto na Web quanto
nas bibliotecas digitais verifica-se uma forte tendência para a disponibilização de conteúdos
digitais o que sugere um novo repensar dos profissionais envolvidos no que tange num
comportamento ético que vá ao encontro das necessidades informacionais dos usuários,
considerados os sujeitos que atuam decisivamente nos sistemas informacionais no âmbito
digital.
72
Nesse momento, retomam-se algumas questões no que tange ao contexto das
bibliotecas digitais. As bibliotecas digitais, como ambientes propícios para a recuperação de
informações, têm na utilização de metadados a padronização das formas de representação e a
possibilidade de garantia de interoperabilidade entre sistemas, favorecendo a integridade e a
acessibilidade dos recursos informacionais de forma eficiente pelo usuário final.
Diante disso, pode-se dizer que, sem o uso de metadados, não haverá o
estabelecimento de uma biblioteca digital de acordo com um conjunto de padrões e normas
que garantam o acesso, a recuperação, o uso e a reutilização dos recursos informacionais e
que atendam às necessidades dos usuários apresentadas nas solicitações de busca. (CASTRO;
SANTOS, 2007).
Nesse sentido, pode-se considerar que as bibliotecas digitais, que são consideradas
ambientes específicos e padronizados, e distribuídas de acordo com áreas do conhecimento, já
se constituem como segmentos na Internet e proporcionarão o estabelecimento da semântica
aos recursos informacionais de forma mais precisa, uma vez que os metadados atribuídos nas
bibliotecas digitais garantirão a representação dos recursos informacionais e contribuirão para
aplicações mais efetivas na construção Web Semântica.
Assim, o capítulo seguinte aponta a necessidade de estruturas padronizadas para as
questões de representação e de descrição dos recursos informacionais e o surgimento de novas
ferramentas e instrumentos tecnológicos, que atuam decisivamente nos ambientes
informacionais digitais.
73
Capítulo 4
Formas de representação da
informação:
um diálogo intersubjetivo
74
4 FORMAS DE REPRESENTAÇÃO DA INFORMAÇÃO: UM DIÁLOGO INTERSUBJETIVO
�Representar algo significa conter a semelhança da coisa�.
(Tomás de Aquino)
Esse capítulo destaca a necessidade de se ter e se criar estruturas e modelos
padronizados para a construção de formas de representação da informação registrada,
pautados principalmente nas metodologias cristalizadas da Biblioteconomia e da Ciência da
Informação, na possibilidade do estabelecimento de ambientes informacionais digitais
interoperáveis.
4.1 Representação da informação
A tarefa de representação é uma atividade que os seres humanos, por se tratarem de
sujeitos cognitivos, realizam-na de forma espontânea e a todo o momento, uma vez que a
estrutura do cérebro permite uma analogia com o sistema hipertexto à medida que o
pensamento (complexo simbólico) é processado e disponibilizado na �teia� neural a exemplo
de uma verdadeira rede cíclica7.
A interação das mensagens constrói redes de significação transitórias na mente de um
ouvinte, e Lévy (2001, p. 23) elucida que �Quando ouço uma palavra, isto ativa
imediatamente em minha mente uma rede de outras palavras, de conceitos, de modelos, mas
também de imagens, sons, odores, sensações proprioceptivas, lembranças, afetos etc.�.
7 Rede cíclica nesta pesquisa é entendida como um processo mental, construído exatamente na instabilidade e na não-linearidade da construção da forma de representação da informação.
75
A representação documentária acontece desde as primeiras tentativas de registro do
conhecimento em suportes passíveis de armazenamento para posterior utilização. Nesse
sentido, Castro (2002, p. 22) afirma que
Desde que o homem começou a registrar suas descobertas e conquistas, desde os primitivos meios de comunicação quando foi possível registrar o pensamento em um suporte informacional, a necessidade e a preocupação em recuperar de alguma forma o que foi registrado e armazenado parece existir.
A representação e a mediação do conhecimento são destacadas como os elementos-
chave para acesso rápido à informação, necessidade que originou várias formas de
organização da informação. A representação deve ser suficientemente rica sob o aspecto
cognitivo e, ao mesmo tempo sintética para economizar a energia do usuário de uma maneira
significativa. (MARCONDES, 2001). Deve ser levado em consideração o papel ativo do
usuário (sujeitos cognitivos), que é o principal personagem que se apropriará da representação
e fará uso do conhecimento registrado.
Algumas áreas do conhecimento, tais como a Ciência Cognitiva e a Psicologia, por
exemplo, ressaltam que os sujeitos ao interagirem com um determinado ambiente, devem ter
em mente algum tipo de representação de segmentos deste ambiente, ou seja, ter
representações internas. Em contrapartida, temos as representações externas, ou seja,
manipulações que operam as representações numa externalização do comportamento do
sujeito que poderia conduzir a estabilidade entre o sujeito e o ambiente. Vale destacar que os
humanos fazem uso de representações externas constantemente, tais como o alfabeto, a tecla
do piano, notas musicais, computador etc. (PESCHL, 2002).
A construção de uma forma de representação apropriada pode ser vantajosa e ainda
facilitar a compreensão, a resolução de problema, o cálculo e especialmente, a ampliação de
nossos conhecimentos. (SANTOS; VIDOTTI, 2007).
A representação não tem que conter e mostrar toda a possível informação sobre uma
certa realidade, mas tem que prover a informação que é pertinente a realização de uma tarefa.
Não se tem acesso direto ao ambiente e o conhecimento sempre é um sistema relativo, no
sentido de que é constituído para ser aplicado para a solução de um problema ou por gerar um
comportamento que é específico para o usuário em uma determinada tarefa. A questão está
76
em estabelecer uma boa estabilidade dentro do sistema cognitivo e entre o ambiente, ou seja,
prover a informação que é pertinente para a realização de uma tarefa. (PESCHL, 2002).
Vale destacar também que a forma escolhida de representação tem que ser apropriada
com respeito à tarefa que o usuário da representação (sujeitos que se apropriarão e farão uso
das representações) tem que realizar.
Diferentes formas de representação podem ainda ser usadas para apresentar um objeto
ou conceito de diferentes pontos de vista. (CASA, 1997). O aspecto positivo está justamente
na possibilidade de obter �estruturas capazes de representar somente a informação relevante
em um determinado momento�. (CASA, 1997, p. 210). Podemos entender como estrutura
neste contexto, algo que propicie e dê suporte informacional.
Nesse sentido, McGarry (1999, p. 11) diz que �a informação deve ser ordenada,
estruturada ou contida de alguma forma, senão permanecerá amorfa e inutilizável�, ou seja, a
informação deve receber um tratamento que permita seu acesso para o uso, a preservação e a
reutilização e se apresentar representada de alguma forma para que tenha sentido.
Para tanto, faz-se necessário um veículo de comunicação para que a informação seja
compreensível para o receptor. McGarry (1999) destaca três tipos de veículos para a
transmissão de informações: sinais, símbolos e signos.
• Os sinais proporcionam ou determinam as relações com as ações a serem desenvolvidas
pelo receptor. Por exemplo, um indivíduo ao dirigir um carro, no momento de estacionar
ou deslocar-se para a direita ou para a esquerda, sinaliza que o momento e o local para
determinada ação estão próximos. Nessa perspectiva, de uma forma genérica, percebe-se
que o indivíduo (receptor) recebeu uma dada informação ao detectar os sinais. Os sinais
podem ser considerados como uma forma de signo, enfatizando uma dada necessidade que
será seguida por algum tipo de reação, requerendo também, algum tipo de reação do
receptor. Em termos gerais �um sinal é comunicado de uma pessoa a outra para indicar
que o momento de agir está próximo�. (McGARRY, 1999, p. 12).
77
• Os símbolos constituem-se em representações culturalmente construídas e reconhecidas
por uma comunidade específica. Um símbolo pode ter ou não semelhanças com o que
representa. Um ícone de uma impressora pode ter uma boa semelhança com aquilo que
pretende representar e pode ter sentido para indivíduos do mundo todo, desde que
consigam identificar o objeto real. Entretanto, a palavra impressora terá sentido apenas
para quem a conhece, ao mesmo tempo, o objeto real e a Língua Portuguesa. Neste
contexto, podemos fazer uma distinção entre os símbolos icônicos, pois de acordo com
McGarry (1999, p. 13) estes possuem uma semelhança sensorial com o que representam.
�Um símbolo icônico pode ser uma pintura, uma imagem esculpida, etc. Tais
representações têm utilidade mais prática quando transmitem informações através das
barreiras lingüísticas�.
• Os signos indicam a presença física de determinada coisa ou algum evento relacionado a
eles. Por exemplo, a fumaça representa ou indica fogo, o aumento da temperatura pode
indicar febre e até mesmo um simples olhar entre duas pessoas pode ter um sentido ou
significado conhecido. �Há também numerosas linguagens de signos em que gestos
convencionais são usados como substitutos da fala, como por exemplo, em nossa
comunicação com os surdos ou entre eles próprios�. (McGARRY, 1999, p. 13).
A representação da informação passa por uma definição de conjuntos de elementos
básicos e de regras para a conjunção desses elementos. Partindo desse pressuposto, podemos
dizer que a tarefa de representar a informação registrada não é algo simples de realizar,
porque a própria construção do processo de representação é redutora da informação, pois é
realizada por um intermediário/mediador.
No contexto atual das Tecnologias da Informação e Comunicação, tem-se a
representação da informação por metadados, criados por humanos e o acesso aos recursos
informacionais, realizados por sistemas/agentes especialistas das ferramentas de busca
(intermediário/mediador), por exemplo, que realizam as buscas na Web, percorrendo bases de
conhecimento pré-estabelecidas e/ou regras de inferências.
Pode-se dizer que a representação da informação registrada é compreendida numa
perspectiva de que é primeiramente mentalizada ou internalizada numa estrutura cerebral,
onde os sujeitos cognoscentes (mediadores ou intermediários), precisam externalizar em um
78
formato ou em um suporte informacional, que garanta o registro (armazenamento) do
conhecimento para uma posterior socialização, uso e reuso dos recursos informacionais.
Reforçando tal assertiva, Alvarenga (2003, p. 4) diz que
A representação compreende em ambos os casos, um processo cognitivo. Destaca-se como uma instância do processo cognitivo humano aquela que culmina com a representação primária do conhecimento, situando-se no âmbito do registro do pensamento em um suporte documental, incluindo as etapas de percepção, identificação, interpretação, reflexão e codificação, etapas que são envolvidas no ato de se conhecer um novo ser ou coisa, ou aprofundar-se no conhecimento de um ser ou uma coisa já conhecida, utilizando-se dos sentidos, da emoção, da razão e da linguagem.
A principal função da representação é criar uma estrutura eficientemente rica com o
objetivo de recuperação das informações. Entretanto, a transferência da informação por meio
de sua representação é algo impreciso. Por exemplo, na descrição de conteúdo de uma
determinada obra, são adotadas palavras-chave que resumem um assunto, no entanto, essas
palavras são apenas representações parciais ou longínquas que contemplam a originalidade, a
integridade e a perfeição do documento.
Na perspectiva de Peterson (1996) formas de representação podem ser vistas como um
tema interdisciplinar à ciência cognitiva, pois há uma grande multiplicidade de formas de
representação (anotações, formalismos, interfaces, linguagens de programação etc.), e a
admissão de uma nova forma de representação pode tornar um domínio mais acessível para
um determinado propósito, comunidades de interesse específico ou tipo de usuário.
Unidade informacional8 é o que queremos representar de acordo com algum
formalismo escolhido, pois é isso que efetivamente seremos capazes de manipular no
ambiente de geração e uso de informações.
No trabalho de informar, a representação é tão trivial que sua relevância é
freqüentemente ignorada. E hoje, o aporte das Tecnologias da Informação e Comunicação �
TICs - disponíveis no auxílio da construção de formas de representação, para uma diversidade
8 Unidades informacionais nesta pesquisa são os recursos informacionais representados pelos seguintes tipos documentais: livros, periódicos, fotografias, filmes, músicas etc.
79
de recursos nos mais variados suportes, remete a tarefa de representar a patamares de grande
necessidade e ao mesmo tempo de invisibilidade.
Nesse momento, passaremos ao interesse específico de tratar da análise da construção
de formas de representação para informações registradas a partir de um código textual e/ou
imagético e sustentada em um suporte de informação caracterizando um tipo documental
passível de armazenamento, recuperação, uso e reuso.
Nesse sentido, a representação da informação pode ser caracterizada por um processo
dúplice que é constituído pelo desenvolvimento de uma operação e que resulta em um
produto, a partir das etapas de catalogação e classificação.
Nosso interesse de pesquisa está voltado para a análise do processo de catalogação e a
construção do registro bibliográfico como elemento que agrega a representação de forma e
conteúdo do recurso informacional na construção de metadados que comporão o catálogo em
ambientes informacionais ou quaisquer dimensões.
Destaca-se, portanto, que o principal objetivo dos catálogos é representar os recursos
informacionais para que se possa recuperar a informação contida nos recursos disponíveis.
4.2 Breves considerações sobre os catálogos, as regras e os códigos de catalogação:
marcos de formas de representação na perspectiva da Biblioteconomia e da Ciência da
Informação
O catálogo é um dos instrumentos mais antigos na história da descrição e organização
da informação registrada. A palavra vem do grego kata, que significa (de acordo com, sob, em
baixo ou parte) e logos (ordem, razão). Muitas vezes define-se o catálogo como lista ordenada
dos documentos existentes em um ou mais acervos. (CASTRO, 2002).
No Renascimento, o Libri Graeci Impressi foi o primeiro catálogo impresso com
objetivos comerciais de acordo com o desenvolvimento e o aperfeiçoamento da imprensa,
80
juntamente com a criação das chamadas feiras de livros, com destaque para as de Frankfurt e
as de Leipizig.
A necessidade de construção de um instrumento facilitador para a identificação e a
localização das informações disponíveis impulsionou o desenvolvimento de padrões de
representação que oferecessem o mínimo de uniformidade aos registros bibliográficos.
No século XIX, mais exatamente em 1839, na Inglaterra, Antony Panizzi estabeleceu
as 91 regras de catalogação, como forma de padronização das informações. Tais regras
estabeleciam a valorização da página de rosto, a introdução do conceito de autoria coletiva e o
cabeçalho de entrada de autor conforme determinada pela página de rosto.
Em 1850, Charles Jewett, adapta e amplia as 91 regras de Panizzi e utiliza a tecnologia
de esteriotipia em seu trabalho de catalogação centralizada, numa proposta precursora de
implantação do catálogo coletivo nos Estados Unidos.
Em 1876, Charles Ami Cutter define os objetivos e funções dos catálogos em Rules
for a Dictionary Catalog e destaca a relevância de uma estrutura que contemple os interesses
do usuário no catálogo de uma biblioteca, a partir de representações uniformes dos
documentos.
Em 1895, Otlet e La Fontaine criaram os primeiros passos para o Controle
Bibliográfico Universal - CBU, iniciando o levantamento de registros das publicações
editadas no mundo que se baseava numa estimativa de aproximadamente 16 milhões de
registros, partindo do princípio de socialização do conhecimento.
A padronização na representação das informações contidas nos catálogos passa a ser
preocupação e, nesse sentido, diversos códigos de catalogação são desenvolvidos e
aperfeiçoados. A preocupação com a uniformidade encontra eco nas discussões da
Conferência Internacional sobre Princípios de Catalogação, realizada em 1961, em Paris, que
culminou na publicação da Declaração de Princípios.
O período compreendido entre 1992 até 1997 é marcado por estudos realizados pela
IFLA - International Federation of Library Association and Institutions (Federação
81
Internacional de Associações e Instituições Bibliotecárias) a respeito da representação
descritiva na reflexão pautada nos Princípios de Catalogação ou Princípios de Paris de 1961
para o estabelecimento de novas regras ou princípios que resultaram no documento publicado
em 2003, denominado Declaración de Princípios Internacionales de Catalogación (2003, p.
1, tradução nossa), destacando que
[...] novos princípios substituem e alargam os Princípios de Paris, consignando todos os tipos de materiais e não apenas as obras textuais e considerando a escolha e a forma de entrada para todos os aspectos dos registros bibliográficos e de autoridade utilizados em catálogos de bibliotecas.
Ainda nesse sentido esses novos princípios cobrem ou abrangem de acordo com a
DECLARACIÓN... (2003, p. 1-6, tradução nossa, grifo nosso):
1. Âmbito: Os princípios aqui enunciados destinam-se a orientar o desenvolvimento de códigos de catalogação. Aplicam-se a registros bibliográficos e de autoridade e a catálogos correntes de bibliotecas. Os princípios podem também ser aplicados a bibliografias e ficheiros de dados criados por bibliotecas, arquivos, museus e outras comunidades. 2. Entidades, Atributos e Relações: Para a criação de registros bibliográficos devem considerar-se as seguintes entidades, respeitantes a produtos de natureza intelectual ou artística: Obra, Expressão, Manifestação, Exemplar. 2.1.1. Os registros bibliográficos devem refletir tipicamente manifestações. Estas manifestações podem incorporar uma coleção de obras, uma obra individual ou uma parte componente de uma obra. As manifestações podem aparecer em uma ou mais unidades físicas. 3. Funções do Catálogo: As funções do Catálogo destinam-se a permitir ao utilizador: 3.1. Encontrar recursos bibliográficos numa coleção (real ou virtual) como resultado de uma pesquisa, utilizando atributos ou relações dos recursos: 3.1.1. Para localizar um determinado recurso. 3.1.2. Para localizar conjuntos de recursos representados 4. Descrição Bibliográfica: A parte descritiva do registro bibliográfico deve ser baseada na Descrição Bibliográfica Internacional Normalizada e pode ser feita de acordo com vários níveis de exaustividade. 5. Pontos de Acesso: O registro bibliográfico deve incluir pontos de acesso controlados e formulados de acordo com um código de catalogação normalizado ou com princípios internacionais. Esses pontos de acesso controlados devem ser feitos utilizando as formas autorizadas dos nomes usados para a entidade, de acordo com o que constar em registros de autoridade.
82
6. Registros de Autoridade: 6.1. Os registros de autoridade devem ser construídos para controlar as formas autorizadas de nomes e referências que são usados como pontos de acesso para entidades como pessoas, coletividades, obras, expressões, manifestações, exemplares, conceitos, objetos, eventos e lugares. 6.2. Se uma pessoa, família ou coletividade usa nomes variados ou formas variantes dos nomes, deve escolher-se um nome ou uma forma do nome como cabeçalho autorizado. Se há títulos variados para uma obra, deve escolher-se um como título uniforme. 7. Fundamentos para permitir a Pesquisa: Os pontos de acesso são os elementos dos registros bibliográficos que providenciam 1) recuperação confiável de registros bibliográficos e de autoridade e respectivos recursos bibliográficos associados e 2) limitação dos resultados de pesquisa.
Antecedendo a publicação da Declaración de Princípios Internacionales de
Catalogación, a IFLA em 1998, verifica a necessidade de um reexame dos registros
bibliográficos e lança os Functional Requirements of Bibliographic Records (FRBR) �
Requisitos Funcionais para Registros Bibliográficos, ou seja, com uma proposta de,
[...] produzir um quadro que fornecesse um entendimento claro, precisamente determinado e compartilhado [por todos] do que seria aquilo sobre o que o registro bibliográfico proveria informação e o que se esperaria que o registro obtivesse, em termos de responder às necessidades dos usuários. (IFLA, 1998, p. 8).
Os FRBR constituem em uma nova abordagem para a representação descritiva nos
seus moldes convencionais, no sentido de propiciar uma recuperação mais efetiva e intuitiva
dos itens documentários, agindo como um bibliotecário de referência, ou seja, relaciona todos
os materiais atrelados ao termo da busca, trazendo-os de uma só vez em uma única interface.
Por exemplo, se um determinado autor além de livros, possui outras manifestações, tais como
discos, CDs, DVDs, o sistema permitirá através do modelo de relacionamento FRBR, no
momento da busca realizada pelo usuário, relacionar todas essas manifestações e recuperá-las
uma única vez.
Os FRBR não são formatos para catalogação, mas sim, um referencial teórico atualizado para orientar a elaboração de formatos de descrição que sejam mais úteis para as diversas categorias de usuários dos catálogos. Utiliza uma abordagem baseada no usuário para analisar os requisitos da descrição bibliográfica e, a partir da análise, define de forma sistemática os elementos que o usuário espera encontrar no registro bibliográfico. (CAMPELLO, 2006, p. 61).
83
De acordo com Moreno (2006) os requisitos funcionais para registros bibliográficos
constituem-se de um modelo conceitual que tem por objetivo reestruturar os registros
bibliográficos a fim de reorganizar os elementos por meio da análise de entidades9, atributos10
e relacionamentos11.
No que se refere à entidade, por exemplo, vale dizer que compreende 3 (três) grupos:
Grupo 1: entidades que são produto de trabalho intelectual ou artístico,
Grupo 2: entidades que são responsáveis pelo conteúdo intelectual, guarda ou disseminação
das entidades do primeiro grupo e,
Grupo 3: entidades que são ou podem ser assunto das entidades.
Pode-se visualizar de acordo com a figura 5, uma das manifestações no modelo de
relacionamento propostos pelos FRBR no Grupo 1.
FIGURA 5: Entidades do Grupo 1 e Relações Bibliográficas Primárias
Fonte: Mey (1999) apud Moreno (2006, p. 57).
9 As entidades podem ser compreendidas, por exemplo, como uma obra, um texto, um livro etc. 10 Os atributos correspondem às características dos dados relacionados à entidade e servem para diferenciar o conteúdo intelectual ou artístico, por exemplo. (MORENO, 2006). 11 Os relacionamentos descrevem as ligações entre uma entidade e outra, na facilitação de manuseio do recurso informacional pelo usuário em um sistema.
84
Moreno (2006, p. 35, grifo do autor) de uma forma mais resumida apresenta que
Obra é uma entidade abstrata, uma criação intelectual ou artística distinta. A entidade Expressão é a realização intelectual ou artística específica que assume uma obra ao ser realizada, excluindo-se aí aspectos de alteração da forma física. Uma Manifestação é a materialização de uma expressão de uma obra, ou seja, seu suporte físico, que podem ser livros, periódicos, kits multimídia, filmes, etc., que é representada pelo Item, um único exemplar de uma manifestação. As duas últimas entidades refletem a forma física, são entidades concretas, enquanto as duas primeiras refletem o conteúdo intelectual ou artístico.
De acordo com a figura 5, pode-se fazer a seguinte interpretação para
compreendermos a estrutura dos FRBR. Tomemos como exemplo, um romance literário
(Obra), onde se tem o texto original e o mesmo fora traduzido ou tivera alguma modificação,
tal como uma edição ilustrada (Expressão); as formas em que a obra está disponível podem
ser encontradas/visualizadas em um formato impresso (manual) ou num formato
eletrônico/digital (Manifestação); e no momento em que a obra está disponibilizada na
estante de uma biblioteca, ou seja, os exemplares relativos àquela obra são denominados
Itens.
Os FRBR podem ser vistos como instrumentos que beneficiam e facilitam as tarefas
dos usuários em um sistema de informação automatizado, reforçando as tarefas/objetivos
tradicionais de um catálogo, por exemplo, enquanto um canal ou um meio como descrito por
Cutter12 em 1876, com a finalidade de habilitar os usuários a encontrar e sistematizar suas
obras. Nesse sentido, seriam tarefas dos usuários no modelo de relacionamento FRBR:
• Encontrar: encontrar recursos que correspondam aos critérios de busca especificados
pelo usuário, por meio de um atributo ou um relacionamento de uma entidade;
• Identificar: confirmar que o recurso descrito corresponde ao recurso buscado, ou
distinguido entre dois ou mais recursos com características similares;
• Selecionar: selecionar um recurso que é apropriado às necessidades dos usuários, de
acordo com suas especificidades, por exemplo, conteúdo, formato físico, etc.
• Obter: adquirir ou acessar o recurso descrito, por meio de compra, permuta ou acesso
eletrônico remoto, por exemplo. (TILLET, 2004, tradução nossa).
12 CUTTER, C. A. Rules for a printed dictionary catalogue. Washington, D.C.: Government Printing Office, 1876, p. 10.
85
Considerando que os FRBR fornecem uma nova perspectiva da estrutura e nos
relacionamentos dos registros bibliográficos, pois relacionam os metadados presentes em um
registro bibliográfico com as necessidades dos usuários e recomendam um nível básico de
funcionalidade para esses registros, os FRBR têm como objetivo padronizar e possibilitar um
acesso mais efetivo aos recursos informacionais por meio do estabelecimento de
representações mais adequadas e seus relacionamentos.
Perspectiva essa que vai ao encontro da DECLARACIÓN... (2003, p. 1, tradução
nossa), que retrata a intenção de que,
[...] estes princípios potencializem a troca internacional de dados bibliográficos e de autoridade e orientem os que têm a missão de preparar regras de catalogação nos seus esforços para desenvolver um código internacional de catalogação.
Criado em 1966, o Comitê de Direção para a Revisão do AACR - Joint Steering
Committee for Revision of AACR, desde 2002 tem trabalhado e são os responsáveis pela
atualização do código internacional de catalogação. Em 2004, iniciou-se uma revisão do
AACR2 e em dezembro do mesmo ano foi lançado o que seria um primeiro esquema do novo
código de catalogação - AACR3.
Com o aumento dos recursos informacionais em meio digital em novos formatos e
com novas tecnologias disponíveis e para atender às exigências atuais no que concerne aos
impactos nas estruturas de descrição bibliográfica, o Comitê estabeleceu que tais regras eram
inadequadas e adaptaram-nas desenvolvendo o Resource Description and Access (RDA13)
com lançamento de sua versão primeira prevista para 2008.
De acordo com Tillett (2007, tradução nossa) o RDA será um novo padrão para a
descrição e o acesso dos recursos informacionais, remodelado/projetado para o mundo digital,
que proverá um conjunto compreensível de normas e instruções abarcando todos os tipos de
conteúdos e mídias.
13 Detalhes mais específicos sobre o RDA estão disponíveis no site: http://www.collectionscanada.ca/jsc/rda.html
86
O RDA possibilitará aos usuários dos catálogos de bibliotecas e outros sistemas de
organização da informação potencializar as tarefas de encontrar, de identificar, de selecionar e
de obter recursos apropriados e melhor explicitados de acordo com suas necessidades
informacionais. (TILLET, 2007; JOINT STEERING COMMITTEE FOR REVISION OF
AACR, 2006, tradução nossa).
Para Tseng (2005, p. 1) o novo código de catalogação deverá contemplar
[...] modelos multinacionais de conteúdos a fim de fornecer descrições bibliográficas e acesso que abriguem todos os tipos de informação, incluindo meios emergentes, audiovisuais, objetos tridimensionais, etc. [...]. Será aplicado não apenas a bibliotecas, como a museus, arquivos, galerias e fontes de informação digitalizadas disponíveis na Web. O AACR3 irá englobar o conjunto de princípios e regras internacionais para catalogação denominado FRBR (Functional Requirements for Bibliographic Records) para controle das fontes autorizadas.
O RDA de acordo com Bowen e Attig (2007) deverá ser constituído de duas partes,
conforme pode ser visto, na figura 6:
• Parte A: Descrição e Relacionamentos
• Parte B: Controle de Pontos de Acesso
FIGURA 6: Estrutura do código RDA. Fonte: Bowen e Atting (2007, p. 19).
87
Ao ser comparado com o código em exercício - AACR2, pode-se verificar notórias
diferenças com relação à estrutura do RDA. O AACR2 contempla atualmente duas partes:
Description (descrição) e Access (acesso). No RDA percebemos a inserção de alguns
elementos, como por exemplo, na parte A (Descrição) onde estão agregados os Relationship
(Relacionamentos) dados pelo modelo de relacionamento FRBR, ou seja, a parte A é agora
descrição e relacionamento e abarca o conteúdo dos registros bibliográficos. Já a parte B
Access Point Control (Controle de Pontos de Acesso) abarca o conteúdo de autoridade dos
registros bibliográficos.
Retomando a questão da preocupação da padronização, em especial da descrição
bibliográfica, podemos dizer que foi a partir de Panizzi (1839) que houve uma efetivação de
regras e normas no sentido de estabelecer uma padronização nas formas de representação, ou
seja, regras que garantissem a uniformidade da descrição bibliográfica, o que pode ser
visualizado nos tempos atuais e que vem influenciando decisivamente o trabalho da
representação descritiva, mais comumente denominada catalogação.
4.3 Catalogação ou metadados... �eis a questão�: paradigmas e transformações no
cenário atual
O uso dos computadores contribuiu para o avanço da tecnologia e da ciência em geral,
permitindo a automação de bibliotecas e o desenvolvimento de formas de representação que
agilizassem o processamento dos dados bibliográficos e catalográficos para máquinas,
contemplados nos catálogos convencionais. (CASTRO; SANTOS, 2005).
À medida que as coleções aumentam uma das principais preocupações, principalmente
das bibliotecas, e uma condição elementar é representar e descrever documentos de acordo
com normas e técnicas padronizadas a fim de proporcionar a recuperação dos itens e
posteriormente o seu uso.
O surgimento da Web em meados dos anos de 1990 foi marcado pelo crescimento
exponencial de informações em meio digital e nesse cenário há uma participação
interdisciplinar entre bibliotecários, profissionais da Computação e da Lingüística, por
88
exemplo, na tentativa de se criar novas técnicas e instrumentos tecnológicos nos processos de
produção, armazenagem representação, descrição e recuperação dos recursos informacionais
digitais.
Sobre esse aspecto, vale dizer que a Web caracterizada como um ambiente
heterogêneo abarcando vários tipos de mídias tais como, som, imagem, texto etc. requer um
olhar para novas formas diferenciadas do tratamento dos recursos informacionais digitais, a
fim de que tais unidades possam ser representadas e descritas com o propósito de garantir o
acesso, a recuperação, o uso e o reuso pelo usuário final.
Nesse contexto, os formatos que possibilitam a descrição de documentos digitais,
aparecem estruturados em formas denominadas metadados que etimologicamente refere-se a
dados sobre dados, apontados pela literatura científica com o objetivo de descrever e localizar
documentos eletrônicos na Web, de forma a permitir a sua recuperação de forma mais
adequada e precisa. O catálogo de uma biblioteca é um exemplo típico de metadados, pois,
nele existem várias informações que descrevem os recursos armazenados, auxiliando os
usuários na recuperação.
Muitas são as definições e conceitos sobre o termo metadados disponíveis hoje na
literatura científica, o que vem causando uma pluralidade semântica acerca do seu uso, que
interfere na sua compreensão por diferentes profissionais. Para este estudo recorremos a Alves
(2005, p. 115), pois este é o conceito de metadados que mais se aplica aos propósitos dessa
pesquisa. Segundo a autora, �[...] os metadados são conjuntos de atributos, mais especificamente
dados referenciais, que representam o conteúdo informacional de um recurso que pode estar em meio
eletrônico ou não�.
A Internet ao ser considerada um ambiente com informações desestruturadas, tem nos
metadados, a possibilidade de melhor estruturar os dados a fim de representar e proporcionar
uma maior consistência na descrição dos recursos informacionais bem como sua recuperação.
Os metadados podem ter diferentes níveis de especificidades e estruturas com o
objetivo de descrever e identificar um recurso eletrônico mais exaustivamente, de forma a
possibilitar sua integridade a fim de garantir o acesso, o uso, a preservação e a
interoperabilidade entre ambientes informacionais digitais.
89
Para os profissionais da Ciência da Informação, o termo metadados está relacionado
com o tratamento da informação, mais especificamente às formas de representação que
caracterizam um recurso informacional para fins de identificação, de localização e de
recuperação, ou seja, dados sobre catalogação e indexação que servem para organizar e tornar
a informação mais acessível (GILLILAND-SWETLAND, 1999).
Sobre essa ótica faz-se necessário retomar o ponto sugestivamente intitulado neste
subcapítulo a fim de assoalhar o cenário atual. Surge a dúvida catalogação ou metadados? A
questão-chave é a utilização ou a criação de terminologias novas para designar conceitos,
atividades e funções há muito tempo sedimentadas por áreas específicas, tais como a
Biblioteconomia e a Ciência da Informação num verdadeiro �reinventar a roda�. Tal práxis é
realizada cotidianamente por profissionais de outras áreas sem o conhecimento das atribuições
biblioteconômicas. Nesse sentido, é imprescindível um reexame dos aportes teóricos,
conceituais e metodológicos da Biblioteconomia e da Ciência da Informação que propiciarão
formas de representação mais efetivas.
Os bibliotecários produzem e padronizam metadados há séculos, desde as primeiras
tentativas de organização da informação a partir da descrição de documentos. O que vem
acontecendo ultimamente é que profissionais de diversas áreas estão buscando criar
instrumentos de descrição da informação, mas seu desconhecimento dos métodos, processos e
peculiaridades característicos da documentação da Biblioteconomia, tem gerado uma
variedade de padrões que muitas vezes não atende satisfatoriamente às exigências de uma
lógica descritiva estabelecida na Biblioteconomia e que dê conta da complexidade da
caracterização desse material. (MILSTEAD; FELDMAN, 1999; ALVES, 2005; CASTRO;
SANTOS, 2007).
Assim, podemos dizer que o objetivo e a função dos metadados estão fundamentados
nos princípios da catalogação, ou seja, garantir a padronização dos recursos informacionais
(forma e conteúdo), pautados em normas e regras internacionais na tentativa de facilitar e
potencializar a identificação, a busca, a localização, a recuperação, a preservação, o uso e o
reuso dos recursos informacionais. �A diferença dessa forma de representação está na nova
abordagem dada pelo ambiente tecnológico em que ela se insere�. (ALVES, 2005, p. 117).
90
Nesse sentido, os metadados e padrões de metadados pormenorizados nessa pesquisa
são MARC21, MARCXML, Dublin Core e BibTeX, pois estes são formatos vislumbrados
pela iniciativa MarcOnt, no sentido de permitir a representação dos documentos e a
interoperabilidade semântica entre formatos distintos.
4.3.1 Padrão de metadados MARC21
O padrão de metadados MARC21 é datado da década de 1960 e foi desenvolvido pela
Library of Congress (LC), com o objetivo de padronizar a descrição bibliográfica em meio
eletrônico com o início da utilização de computadores para gerenciar o processo de
catalogação. O padrão de metadados MARC21 está inserido na era pré-internet e é
considerado segundo as características dos metadados, um formato rico.
O padrão de metadados MARC21 é considerado um formato completo e complexo,
pois sua estrutura está baseada na semântica estrutural do AACR2 para a descrição e a
identificação das características e especificidades do recurso informacional, por meio de uma
representação padronizada, apresentando-se como o primeiro formato para a comunicação de
registros bibliográficos.
Quanto às suas funções, podemos dizer que o MARC21 é um formato destinado à
criação, ao armazenamento, ao gerenciamento e ao intercâmbio de registros bibliográficos e
catalográficos, de forma que diferentes computadores e programas possam reconhecer, processar
e estabelecer pontos de acesso dos elementos que compõem a descrição bibliográfica. (ALVES;
SOUZA, 2007).
De acordo com Ferreira (2002), o formato MARC21 é um padrão amplamente
utilizado na área biblioteconômica e é aceito internacionalmente para estabelecer a estrutura
de representação, a importação e a exportação de dados bibliográficos e catalográficos.
Outro fato que devemos destacar no padrão de metadados MARC21 é sua
abrangência, ou seja, o formato contempla a descrição bibliográfica dos recursos
informacionais em diferentes suportes de armazenamento, tais como: livros, periódicos,
91
mapas, música, materiais de arquivo e manuscritos, arquivos de computador e materiais
visuais.
O registro MARC é formado por campos14, subcampos e indicadores; cada campo,
etiqueta ou tag é constituído por três caracteres numéricos para sua identificação possuindo
uma estrutura complexa e extensa (FURRIE, 2003), como pode ser vista na figura 7, a seguir.
FIGURA 7: Exemplo de registro bibliográfico em formato MARC21 comentado pelo autor. Fonte: MARC21 Standards. Disponível em: < http://www.loc.gov/marc/marc-functional-
analysis/multiple-versions.html#intro>. Acesso em: 24 jun. 2007.
Como pode-se perceber de acordo com a figura 7, o formato MARC21 apresenta um
conjunto de campos em sua estrutura, com funções e objetivos para a representação e a
sistematização de cada dado. Sendo assim, foi instituída a família MARC com a finalidade de
dar um tratamento mais adequado e específico para diferentes tipos de dados, tais como:
• Formato MARC21 para dados bibliográficos (Bibliographic data): contêm
especificações para a representação dos mais variados tipos de recursos
informacionais, garantindo a descrição e a recuperação dos diferentes suportes;
14 Para este estudo adotaremos a termo campo para nos reportarmos à estrutura do formato MARC.
92
• Formato MARC21 para controle de dados (Holding): contêm especificações para a
codificação dos elementos referentes ao controle e a localização dos recursos
informacionais, além de ser utilizado para o gerenciamento dos materiais;
• Formato MARC21 para dados de autoridade (Authority): possui especificações para a
codificação de elementos que identificam autoridade (responsabilidade pela obra) de
um registro bibliográfico e estabelecem o controle do conteúdo;
• Formato MARC21 para comunidade informacional (Community Information): contêm
especificações para a codificação de registros que contenham informações sobre
eventos, programas, serviços etc. Permite a inclusão e a disseminação de informações
que podem ser integrados ao catálogo, tornando o recurso informacional acessível ao
público;
• Formato MARC21 para dados de classificação (Classification): contêm especificações
para a codificação e controle dos elementos de dados relacionados à classificação do
conteúdo dos recursos informacionais. (LIBRARY OF CONGRESS, 2006).
À medida que as tecnologias se desenvolvem, novos padrões de metadados surgem
para atender à comunidade e para acompanhar os avanços tecnológicos. Sendo assim, o
MARC21 para atender tal exigência, juntamente com a linguagem computacional XML
estabelece a criação do padrão MARCXML, desenvolvido pela LC, abordado a seguir.
4.3.2 Padrão de metadados MARCXML
Como mencionado anteriormente, o MARCXML foi desenvolvido pela LC com a
finalidade de padronização e intercâmbio de dados em formato MARC para a linguagem
computacional XML, além de permitir a navegabilidade na Web. Com o desenvolvimento
tecnológico e para acompanhar os avanços da área de Ciência da Informação, a XML está
sendo considerada cada vez mais a base de vários padrões da área de informação,
93
principalmente no âmbito das bibliotecas digitais, ocorrendo, dessa forma, a migração do
formato MARC21 para o MARCXML.
De acordo com Siqueira e Santos (2004, p. 106),
[...] a estrutura do MARC21 em XML suporta todos os dados codificados na forma tradicional e sua arquitetura é baseada em componentes, e é extensível, ou seja, permite que os programadores de computador distribuam partes diferentes do software para construir soluções feitas sob encomenda.
Vale destacar que o MARCXML possui exatamente a mesma estrutura do formato
MARC21 (campos, subcampos, indicadores) apenas sua representação incorpora a XML
redefinindo sua estrutura para potencializar a descrição dos recursos informacionais em meio
digital. O MARCXML pode ser compreendido de acordo com a figura 8, a seguir.
<?xml version="1.0" encoding="UTF-8" ?> - <collection xmlns="http://www.loc.gov/MARC21/slim">
- <record> <leader>01142cam 2200301 a 4500</leader> <controlfield tag="001">92005291</controlfield> <controlfield tag="003">DLC</controlfield> <controlfield tag="005">19930521155141.9</controlfield> <controlfield tag="008">920219s1993 caua j 000 0 eng</controlfield> - <datafield tag="010" ind1="" ind2="">
<subfield code="a">92005291</subfield> </datafield> - <datafield tag="020" ind1="" ind2="">
<subfield code="a">0152038655 :</subfield> <subfield code="c">$15.95</subfield>
</datafield> - <datafield tag="040" ind1="" ind2="">
<subfield code="a">DLC</subfield> <subfield code="c">DLC</subfield> <subfield code="d">DLC</subfield>
</datafield> - <datafield tag="042" ind1="" ind2="">
<subfield code="a">lcac</subfield> </datafield> - <datafield tag="050" ind1="0" ind2="0">
<subfield code="a">PS3537.A618</subfield> <subfield code="b">A88 1993</subfield>
</datafield> - <datafield tag="082" ind1="0" ind2="0">
<subfield code="a">811/.52</subfield> <subfield code="2">20</subfield>
</datafield> - <datafield tag="100" ind1="1" ind2="">
<subfield code="a">Sandburg, Carl,</subfield> <subfield code="d">1878-1967.</subfield>
</datafield> - <datafield tag="245" ind1="1" ind2="0">
<subfield code="a">Arithmetic /</subfield> <subfield code="c">Carl Sandburg ; illustrated as an anamorphic
adventure by Ted Rand.</subfield>
94
</datafield> - <datafield tag="250" ind1="" ind2="">
<subfield code="a">1st ed.</subfield> </datafield> - <datafield tag="260" ind1="" ind2="">
<subfield code="a">San Diego :</subfield> <subfield code="b">Harcourt Brace Jovanovich,</subfield> <subfield code="c">c1993.</subfield>
</datafield> - <datafield tag="300" ind1="" ind2="">
<subfield code="a">1 v. (unpaged) :</subfield> <subfield code="b">ill. (some col.) ;</subfield>
<subfield code="c">26 cm.</subfield> </datafield>
</datafield> - <datafield tag="500" ind1="" ind2="">
<subfield code="a">One Mylar sheet included in pocket.</subfield> </datafield> - <datafield tag="520" ind1="" ind2="">
<subfield code="a">A poem about numbers and their characteristics. Features anamorphic, or distorted, drawings which can be restored to normal by viewing from a particular angle or by viewing the image's reflection in the provided Mylar cone.
</subfield> </datafield> - <datafield tag="650" ind1="" ind2="0">
<subfield code="a">Arithmetic</subfield> <subfield code="x">Juvenile poetry.</subfield>
</datafield> - <datafield tag="650" ind1="" ind2="0">
<subfield code="a">Children's poetry, American.</subfield> </datafield> - <datafield tag="650" ind1="" ind2="1">
<subfield code="a">Arithmetic</subfield> <subfield code="x">Poetry.</subfield>
</datafield> - <datafield tag="650" ind1="" ind2="1">
<subfield code="a">American poetry.</subfield> </datafield> - <datafield tag="650" ind1="" ind2="1">
<subfield code="a">Visual perception.</subfield> </datafield> - <datafield tag="700" ind1="1" ind2="">
<subfield code="a">Rand, Ted,</subfield> <subfield code="e">ill.</subfield>
</datafield> </record>
</collection> FIGURA 8: Estrutura de um registro em formato MARCXML.
Fonte: MARCXML. Disponível em: <http://www.loc.gov/standards/marcxml/Sandburg/sandburg.xml>. Acesso em: 23 jul.
2007.
Pode-se destacar que o padrão de metadados MARCXML está sendo usado cada vez
com mais intensidade nas questões de descrição, recuperação e preservação dos recursos
informacionais na potencialização e padronização de ambientes informacionais digitais, o que
implica e requer uma nova postura dos profissionais envolvidos na construção de formas de
representação da informação.
95
4.3.3 Padrão de metadados Dublin Core
O Dublin Core Metadata (DC), em seus objetivos, é destinado a organizar as
informações disponíveis nas páginas da Web, na tentativa de estabelecer padrões de
catalogação dos recursos informacionais em meio digital. É considerado como o primeiro a
ser denominado padrão de metadados, cujo conceito é previsto nos fundamentos da
Catalogação da área de Biblioteconomia e originário do MARC.
Segundo Marcondes (2006, p. 108),
Dublin Core é um padrão voltado principalmente para a descrição e a descoberta de documentos eletrônicos. Caso a biblioteca digital, além de referenciar recursos eletrônicos, seja uma publicadora ou editora, como o são várias bibliotecas digitais especializadas ou arquivos eletrônicos que têm a custódia dos documentos que compõem sua coleção, terá de se preocupar, além de referenciar seus documentos com metadados segundo padrões como o Dublin Core, com questões como copyright, administração e gestão destes documentos e a preservação digital dos mesmos. Para todas estas atividades, existem conjuntos de metadados específicos.
O Dublin Core foi desenvolvido em 1995 por um consórcio de instituições produtoras
de informação no setor de pesquisas da OnLine Computer Library Center (OCLC), cuja
filosofia é que a descrição de um documento pode ser elaborada/representada pelo seu criador
ou produtor devido a �simplicidade� do preenchimento dos campos, sem a obrigatoriedade de
um profissional (bibliotecário/catalogador) especialista em catalogação.
De acordo com Souza, Vendrusculo e Melo (2000, p. 93),
[...] o Dublin Core, pode ser definido como sendo o conjunto de elementos de metadados planejado para facilitar a descrição de recursos eletrônicos. A expectativa é de que os autores e Websites, que não possuam conhecimentos em catalogação, possuam capacidade de usar o Dublin Core para descrição de recursos eletrônicos, tornando suas produções mais visíveis aos mecanismos de busca e sistemas de recuperação.
Nesse momento é pertinente destacar que mesmo possuindo essa característica de
simplicidade e flexibilidade apontadas pela literatura científica, vale dizer que há normas e
96
princípios que norteiam a sua construção de forma a garantir uma representação efetiva e para
que se estabeleça a interoperabilidade entre os sistemas informacionais digitais.
O Dublin Core é constituído por 15 elementos para facilitar a descrição e a
recuperação dos recursos informacionais em meio digital. Barreto (1999, p. 74) destaca-os.
Nome do elemento
Descrição do elemento
Subject Tópico relacionado ao objeto descrito
Title Nome do objeto
Author Pessoas diretamente responsáveis pelo conteúdo intelectual do objeto
Publisher Agente ou agência responsável por tornar o objeto disponível
OtherAgent Pessoas, tais como editores e ilustradores, que contribuíram de forma significativa para o conteúdo intelectual do objeto.
Date Data da publicação
ObjectType Gênero do objeto, tal como uma novela, um poema ou dicionário.
Form Formato de dado do objeto, tal como postScript, HTML, etc.
Identifier Números ou caracteres usados para identificar o recurso de forma única
Relation Categoria de relacionamento do objeto com outros objetos
Source Objetos dos quais o objeto descrito é derivado
Language Idioma relativo ao conteúdo intelectual do objeto
Coverage Localização especial e duração temporal do objeto
Rights Contém ou referencia o direito de propriedade sobre o objeto
Description Contém uma descrição textual do objeto ou uma referência para essa descrição
FIGURA 9: Elementos contemplados no padrão de metadados Dublin Core. Fonte: Adaptado de DCMI (2006).
Assim, para melhor compreender-se a estrutura de um documento no formato de
metadados Dublin Core, segue de acordo com a figura 10, um modelo.
97
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" lang="en-US" xml:lang="en-US"> <head> <title>Dublin Core Metadata Initiative (DCMI)</title> <link rel="schema.DC" href="http://purl.org/dc/elements/1.1/" /> <meta name="DC.title" content="Dublin Core Metadata Initiative (DCMI) Home Page" /> <meta name="DC.description" content="The Dublin Core Metadata Initiative is an open forum engaged in the development of interoperable online metadata standards that support a broad range of purposes and business models. DCMI's activities include consensus-driven working groups, global conferences and workshops, standards liaison, and educational efforts to promote widespread acceptance of metadata standards and practices." /> <meta name="DC.date" content="2006-08-28" /> <meta name="DC.format" content="text/html" /> <meta name="DC.contributor" content="Dublin Core Metadata Initiative" /> <meta name="DC.language" content="en" /> <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" /> <link rel="meta" href="index.shtml.rdf" /> <link rel="alternate" type="application/rss+xml" title="RSS" href="http://dublincore.org/news.rss" /> <link rel="stylesheet" href="/css/default.css" type="text/css" /> <script src="/js/default.js" type="text/javascript"></script> </head>
FIGURA 10: Estrutura de registro em formato Dublin Core. Fonte: Dublin Core Metadata Initiative. Disponível em: <http://dublincore.org>. Acesso em: 24 jul.
2007.
Vale destacar de acordo com a figura 10, que os mesmos elementos (campos) do DC
correspondem a elementos (campos) do padrão de metadados MARC21, por exemplo,
�DC.title� (DC) e �245� (MARC21), ver figuras 7 e 8: dizem respeito à indicação do título do
recurso informacional. Isso significa que ambos os formatos provêm da mesma fonte e têm a
possibilidade de intercambiar seus dados, ou seja, estabelecer a interoperabilidade entre
formatos e padrões distintos.
Uma das grandes discussões na comunidade científica é a polêmica de qual padrão de
metadados utilizar (MARC21 ou DC), uma vez que devido a sua simplicidade grande parte
dos ambientes informacionais, tais como repositórios digitais, bibliotecas digitais etc., adotam
o DC. Mas o que precisa ficar evidente são quais princípios que norteiam sua criação. O DC
foi criado com o objetivo de facilitar a descoberta do recurso informacional no ambiente Web,
ou seja, abarca uma representação mínima que proporciona a sua identificação bem como a
sua localização. Enquanto o MARC21 está relacionado à criação, ao armazenamento, ao
98
gerenciamento e ao intercâmbio de registros bibliográficos e catalográficos e atende às
peculiaridades exigidas nas grandes coleções.
Sendo assim, a adoção de um formato/padrão ou outro dependerá dos objetivos
institucionais dos ambientes informacionais e de uma lógica descritiva que atenda e
contemple suas necessidades informacionais e que permita o estabelecimento dos requisitos
da interoperabilidade na satisfação dos usuários.
Faz-se necessário destacar também que para acompanhar os avanços tecnológicos, o
padrão de metadados Dublin Core já se encontra também disponível numa versão na
linguagem computacional XML o que implica uma melhor estruturação e efetividade dos
dados e dos metadados.
4.3.4 Padrão de metadados BibTeX
O padrão de metadados BibTeX foi desenvolvido em 1985 por Oren Patashnik e Leslie
Lamport enquanto um formato bibliográfico para a preparação de documentos no sistema
LaTeX. LaTeX é um sistema de preparação para buscas abertas de documentos utilizado na
comunidade acadêmica. (KRUK; SYNAK; ZIMMERMANN, 2005, tradução nossa). De
acordo com os autores o BibTeX é considerado um formato bibliográfico simples para a
descrição dos recursos informacionais na Internet e aplicado atualmente em bibliotecas
digitais.
Pode-se perceber que o BibTex é um padrão muito parecido com o Dublin Core no
aspecto da �simplicidade� e autonomia dos autores na descrição e na criação do registro
bibliográfico. Os autores provêm suas referências/citações de outras publicações, totalmente
baseadas nas características originais do documento, para então, serem compartilhadas pela
comunidade na Internet. (KRUK; SYNAK; ZIMMERMANN, 2005, tradução nossa).
Os elementos contemplados pelo padrão podem ser assim elencados de acordo com
Kruk, Synak e Zimmermann (2005):
• Abreviação
99
• Editor/autor
• Título
• Título (livro, revista, série)
• Mês/dia/ano
• Issn/Isbn
• Volume/número/páginas
• Instituição/organização/escola
• Publicador/URL
• Endereço
• Notas
O tipo de publicação (recurso informacional) pode ser classificado de acordo com 13
categorias diferentes. Cada arquivo de BibTeX contém um número de entrada. Uma entrada
descreve uma única publicação, que pode ser uma entidade autônoma (como um livro, por
exemplo) ou uma parte da publicação no todo (como um capítulo de um livro, por exemplo).
Há entradas padrão em BibTeX tais como:
• Artigo - artigo de um periódico ou jornal
• Livro
• Conferência
• Inbook - parte de um livro, bem como um capítulo, seção
• Incollection - parte de um livro com o seu próprio título
• Inproceedings - um artigo nos anais do evento
• Manual � documentação técnica
• Dissertação
• Miscelânea
• Tese (PHD)
• Anais/Resumos de uma conferência
• Relatórios técnicos � um relatório publicado por uma instituição ou
universidade
• Unpublished � um documento nunca publicado, mas com um título e um autor.
(KRUK; SYNAK; ZIMMERMANN, 2005, tradução nossa).
100
O formato BibTeX apresenta quatro tipos diferentes de entradas, tais como:
• @STRING: define abreviações na forma de apresentação do conteúdo do recurso
informacional, como por exemplo, @string { foo = "Mrs. Foo" }
• @PREAMBLE: define como o texto deve ser formatado;
• @COMMENT: para comentários não feitos por BibTeX;
• Cada uma das entradas declarando uma referência única para um determinado tipo de
publicação, por exemplo: @article, @book, @inproceedings, etc. (FEDER, 2006,
tradução nossa).
Para melhor compreender-se a estrutura de um registro BibTeX vejamos um modelo,
de acordo com a figura 11, a seguir.
FIGURA 11: Estrutura de um registro no padrão de metadados BibTeX
Fonte: Synak (2005, p. 55)
Como pode ser observado na figura 11, um registro BibTeX contempla alguns
elementos descritivos tais como (author, title, address etc.) referente neste caso a um recurso
informacional do tipo artigo publicado em anais de evento (inproceedings). Vale destacar
também alguns sinais diacríticos, tais como { (chaves) que constituem a entrada do conteúdo
101
do registro BibTeX, e finalizado também por } (chave); pode-se ainda verificar que cada
campo do registro é separado por um sinal do tipo , (vírgula).
Uma entrada de BibTeX consiste no tipo (uma palavra antecedida de @), uma palavra-
chave e um número de metadados que definem várias características de uma entrada
específica de BibTeX. Entre esses metadados, pode-se destacar: autor, título, ano etc. Alguns
campos são obrigatórios para determinados tipos de entradas em BibTeX, alguns são
opcionais. Cada campo é especificado por seu nome seguido por um sinal de igual e pelo
conteúdo contemplado no registro bibliográfico e por um sinal de marcação do tipo �� (aspas).
Há um conjunto de metadados-padrão existentes, que podem ser interpretados por
BibTeX ou ferramentas autorizadas por ele. Os campos que são desconhecidos pelo padrão
são �ignorados� por ele e podem assim, ser usados para o armazenamento de informações
adicionais sem interferir no resultado de uma busca de um documento original. (FEDER,
2006, tradução nossa).
O padrão BibTeX tem em seus objetivos a possibilidade de facilitar a separação da
bibliografia com a apresentação do texto, ou seja, utiliza-se do mesmo conceito da distinção
do conteúdo com o estilo do texto utilizada no próprio LaTeX, por exemplo, ou da própria
linguagem computacional XHTML15 (eXtensible Hypertext Markup Language).
Além disso, pode-se dizer que tal padrão está voltado principalmente para a
comunidade científica (pesquisadores) e temas relacionados à educação. Em uma biblioteca
digital que contenha publicações técnicas diferentes, publicar registros em BibTeX junto com
essas pode ser muito mais útil para a comunidade de pesquisadores. (SYNAK, 2005, tradução
nossa).
Dessa forma, assim como os padrões de metadados MARC21 e Dublin Core que
possuem versões na linguagem computacional XML, o formato BibTeX também possui em
sua versão o padrão BibTeXML. Além disso uma das iniciativa atuais do Massachussets
Institute of Technology (MIT) é a representação de BibTeXML na linguagem computacional
OWL (Web Ontology Language), destinada a construção de ontologias cuja base está calcada
15 Trata-se de uma evolução da linguagem HTML para a imposição de regras semânticas às páginas escritas em HTML bem como a sua integração com outras aplicações. (FEITOSA, 2006).
102
na arquitetura de metados RDF (Resource Description Framework) que atua efetivamente na
construção Web Semântica.
Além dos padrões de metadados mencionados anteriormente, faz-se necessário o
estudo e a atenção para outras ferramentas e instrumentos tecnológicos para o estabelecimento
da interoperabilidade entre ambientes informacionais digitais. Para que haja um trabalho
conjunto entre os sistemas, destaca-se a linguagem de marcação XML (Extensible Markup
Language) e a arquitetura de metadados RDF (Resource Description Framework), pois são
consideradas a base da infra-estrutura da Web Semântica e da iniciativa MarcOnt.
4.4 XML (Extensible Markup Language)
Antes de adentrar-se no assunto propriamente dito, precisa-se destacar a importância
da XML16 para a construção Web Semântica e para o desenvolvimento da iniciativa MarcOnt.
No primeiro caso, com a necessidade de embutir semântica para que os agentes de softwares
possam entender o conteúdo dos dados, a XML atua como ferramenta que proporcionará,
além da sintaxe, a semântica, na padronização e na estruturação dos dados. Já no segundo
caso, vale dizer que para haver a interoperabilidade semântica entre os padrões de metadados
vislumbrados pelo MarcOnt, é imprescindível uma linguagem comum, que poderá
proporcionar melhores resultados na busca e na recuperação dos recursos informacionais e
esta linguagem é a XML.
A XML (Extensible Markup Language) foi desenvolvida em 1996 por um grupo de
especialistas do W3C (World Wide Web Consortium), com o objetivo de tornar-se um padrão
universalmente aceito para a descrição e a redefinição da estrutura de documentos eletrônicos
e está sendo cada vez mais utilizada de forma generalizada na codificação de metadados.
16 É pertinente retratar que não é nosso objetivo nesta pesquisa abordar com profundidade a linguagem XML, mas sim apontar sua importância no desenvolvimento de ambientes informacionais específicos, como por exemplo, a Web Semântica e as Bibliotecas digitais. Informações mais detalhadas sobre XML podem ser encontradas em Furgeri (2006); Feitosa (2006); Flamino (2006); Alves (2005); Siqueira (2003); Siqueira e Santos (2004); Almeida (2002) e Bax (2001).
103
A linguagem computacional XML originou-se a partir da linguagem SGML (Standard
Generalized Markup Language) e provê a estruturação de dados independente de plataforma,
ou do modelo de dados em que as informações estão representadas sendo apontada na
literatura como uma meta-linguagem, ou seja, uma linguagem genérica para definir a
formatação de documentos.
Um ponto que se faz necessário destacar é a diferença entre a HTML (HyperText
Markup Language) e a XML; a primeira diz respeito à disposição de como o documento será
apresentado, enquanto a segunda especifica o significado (semântica) das informações
contempladas pelo documento na facilitação de proporcionar ao usuário uma busca mais
significativa e dados melhor compreensíveis pelos agentes de softwares.
Alguns autores como Esteves, Santos e Guimarães (2002) apud Siqueira (2003, p. 78)
relatam que
A XML aparece, no contexto da internet, para facilitar a difusão da informação documental. Como possui uma semântica própria, descreve a estrutura e conteúdo do documento, não a sua formatação, tornando-se, por isso, "revolucionário" em relação ao HTML que apenas possibilita a formatação dos dados no que respeita à sua apresentação gráfica, não fornecendo nenhum conteúdo semântico.
A figura 12 apresenta uma forma de apresentação de um documento na estrutura
XML, a seguir.
FIGURA 12: Exemplo de documento livro em XML. Fonte: do autor.
<documento> <livro ano= �2006�>
<autor> <nome> Bernadete</nome>
<sobrenome> Campello</ sobrenome> </autor> <titulo> Introdução ao controle bibliográfico</titulo> <editora>
<nome> Briquet de Lemos/Livros</nome> </editora>
</documento>
104
Como pode ser observado pela figura 12, a estrutura de um documento XML é sempre
constituído por marcações de início <documento> e marcações de fim </documento> onde a
estrutura textual é denominada por elementos (atributos) e cada atributo é dado por um valor
entre aspas (�2006�).
Ao nos reportarmos ao cenário da Biblioteconomia e da Ciência da Informação, vê-se
que a XML é apontada na literatura, de acordo com vários autores (Furgeri, 2006; Feitosa,
2006; Flamino, 2006; Siqueira, 2003; Siqueira e Santos, 2004; Almeida, 2002; Bax, 2001)
como uma ferramenta tecnológica que contribui significamente com os padrões de metadados
no sentido de potencializar a preservação, o uso e o reuso dos recursos informacionais. Para
este estudo adotam-se alguns conceitos de Siqueira (2003) e Siqueira e Santos (2004), pois de
acordo com sua análise são os que mais se adaptam aos princípios do MarcOnt.
A XML depende também da participação de outras tecnologias para a sua efetividade;
dentre essas tecnologias destacam-se o DTD, XSL, XML Schema.
• DTD (Document Type Definition) � estabelece um conjunto de regras (sintaxe) para a
validação da estrutura de um documento XML. Umas das desvantagens da DTD é que
ela permite apenas a verificação sintática de um documento sem nenhum tipo de
controle semântico (conteúdo). �[...] pode-se garantir que o título foi digitado, mas não
se realmente era o título, ou ainda, pode-se verificar se o dado informado no campo
�data de publicação� é realmente uma data, mas não se garante que seja a data correta�.
(SIQUEIRA, 2003, p. 75).
• XSL (Extensible Stylesheet Language) � funciona como um instrumento na
transformação de dados XML de forma a serem apresentados em HTML, cujo
objetivo é permitir a correta visualização dos dados no navegador. Em relação ao
MarcOnt, esta linguagem tem um papel importante principalmente no que diz respeito
às formas de apresentação dos padrões de metadados contemplados no âmbito das
bibliotecas digitais, por exemplo. A XSL juntamente com as linguagens XSLT
(Linguagem de Transformação) e XSLFO (Linguagem de Formatação de Objetos)
potencializa as estruturas de apresentação de um recurso informacional. (SIQUEIRA,
2003).
105
• XML Schema � recomendada pelo W3C essa ferramenta está sendo empregada em
substituição à DTD aplicada a diferentes contextos, com a finalidade de garantir a
integridade sintática e semântica da estrutura de um documento XML. O papel de um
XML Schema �é similar ao dos esquemas de especificações de estruturas de dados
[elementos, atributos e tipos de dados] � como nomes de campos e seus respectivos
tipos � em um banco de dados relacional�. (FURGERI, 2006, p. 93). Vale destacar
nesse momento, que a XML juntamente com a XML Schema localiza-se na camada
base da Web Semântica e são, portanto, uma das linguagens que proporcionarão uma
melhor estruturação dos dados (sintaxe e semântica) a fim de uma melhor recuperação
dos recursos informacionais.
A XML, no contexto das bibliotecas digitais, apresenta-se como uma das linguagens
que mais se adapta às formas de representação da informação, permeado pelas TICs no que
diz respeito à descrição bibliográfica dos recursos informacionais.
Nessa perspectiva pode-se considerar que a linguagem XML visa à criação e o
estabelecimento de padrões de comunicação entre os sistemas informacionais, tais como, por
exemplo, as bibliotecas digitais na possibilidade de integração entre sistemas, plataformas e
arquiteturas heterogêneos favorecendo a interoperabilidade semântica entre ambientes
informacionais digitais.
Além da linguagem computacional XML e para promover o estabelecimento da
interoperabilidade, e de acordo com a diversidade de padrões de metadados, surgem as
arquiteturas de metadados, que são apontadas pela literatura, como uma forma de representar
e dar suporte à uma variedade de esquemas de metadados. Nesse sentido, a seção seguinte
apresentará a arquitetura de metadados RDF, considerada uma estrutura computacional
proposta por Berners-Lee para a Web Semântica.
4.5 Arquitetura de metadados RDF
Assim como os padrões de metadados abordados anteriormente, esta seção apresenta a
arquitetura de metadados RDF (Resource Description Framework), umas das recomendações
106
do W3C que permeia a construção da Web Semântica, bem como apontada na literatura como
o pilar para a iniciativa MarcOnt, além de possibilitar a interoperabilidade semântica entre
bibliotecas digitais.
De acordo com o idealizador do MarcOnt, Kruk (2005, tradução nossa), a arquitetura
de metadados RDF, constitui o centro ou �coração� da arquitetura deste novo padrão, na
possibilidade de funcionar como uma ferramenta para o armazenamento de descrições
bibliográficas semânticas e a comunicação entre recursos informacionais de ambientes
heterogêneos, com diferentes arquiteturas e plataformas.
Com a heterogeneidade de dados e metadados disponibilizados no ambiente Web, faz-
se necessário o desenvolvimento de um esquema ou estrutura que comporte esta diversidade
de metadados, de modo que permita sistemas interoperáveis na rede. Esse esquema ou
estrutura é denominado arquitetura de metadados, cujos objetivos são representar e
proporcionar uma base de codificação de metadados por meio de estruturas flexíveis.
Vale destacar que assim como há padrões de metadados diversificados, há também
arquiteturas de metadados distintas. Para este estudo trataremos da arquitetura RDF, pelos
motivos anteriormente explicitados. A arquitetura de metadados RDF possibilita o
processamento e o gerenciamento automatizado de recursos informacionais, de acordo com
áreas do conhecimento distintas, principalmente com relação: à descoberta de recursos
informacionais, à descrição das relações entre os recursos informacionais representadas na
rede, ao auxílio aos agentes de software, ao intercâmbio e ao compartilhamento de
informações entre outros tipos de aplicações. (LASSILA; SWICK, 1999).
A arquitetura RDF em seus objetivos visa
[...] ter um modelo de dados simplificado; possuir semântica formal e provável inferência; utilizar um vocabulário extensível; utilizar sintaxe baseada em XML; dar suporte aos tipos de dados do XML Schema; permitir que qualquer pessoa possa fazer declarações acerca de qualquer recurso informacional. (FEITOSA, 2006, p. 101-102).
De acordo com o World Wide Web Consortium (W3C), em termos semânticos, a
estrutura de um documento RDF é baseada no conceito de tripla, ou seja, partes que
107
contemplam a informação para sua compreensão tanto por homens, quanto por máquinas.
Essas partes são denominadas como sujeito, predicado e objeto.
Para Daconta (2003) apud Feitosa (2006, p. 102-103, grifo do autor), as partes de RDF
podem ser assim entendidas:
O sujeito, no contexto gramatical, corresponde a um nome ou frase nominal que representa aquele que pratica uma ação � no campo da lógica, esse é o objeto sobre o qual se elabora alguma declaração. Em RDF, necessita-se de um URI para a identificação unívoca do conceito sobre o qual se elabora tal declaração; esse URI é também representativo de um recurso [unidade informacional]. O predicado, gramaticalmente, é a parte da sentença que modifica o sujeito e inclui uma frase verbal; em outras palavras, o predicado diz algo a respeito do sujeito � no campo da lógica, um predicado é uma função de um indivíduo (um tipo particular de sujeito) para valores verdade, com base em certo número de argumentos. [�] um predicado é uma relação entre o sujeito e o objeto. Gramaticalmente, um objeto é um nome que sofre a ação expressa por um verbo � para a lógica um objeto é influenciado pelo predicado. [�] o objeto pode ser também um recurso [unidade informacional], referenciado por um predicado ou por um valor literal.
Pode-se visualizar uma estrutura RDF, bem como suas características explicitadas
anteriormente, de acordo com a figura 13, a seguir:
FIGURA 13: Arquitetura RDF simples.
Fonte: Lassila e Swick (1999)
108
Conforme pode ser observado na figura 13, apresenta-se uma estrutura RDF, onde se
podem traçar os seguintes comentários: o assunto (recurso) é definido neste diagrama pelo
arco http://www.w3.org/Home/Lassila, cujo predicado (propriedade) é definido por um
criador (creator), possuindo como objeto (Ora Lassila). Além disso, o recurso possui
atributos e valor estruturado com identificador (85740), criado por (Ora Lassila) que possui o
e-mail [email protected].
A arquitetura de metadados RDF pode ser representada e apresentada também na
linguagem XML, conforme pode ser visto na figura 14.
<rdf : RDF>
< rdf: Description about= �http://www.w3.org/Home/Lassila� >
<creator> Ora Lassila </ Creator >
</ rdf: Description >
</rdf : RDF>
FIGURA 14: Declaração RDF utilizando a sintaxe XML. Fonte: Lassila e Swick (1999)
Conforme pode ser observado pela figura 14, uma declaração RDF utilizando a
linguagem XML pode ser representada de acordo com a etiqueta rdf : RDF cujo conteúdo
dessa etiqueta é expressa por outra etiqueta do tipo rdf: Description, bem como a validação ou
referência de um recurso já existente, representado pela etiqueta about.
Para melhor potencializar a descrição e o relacionamento entre os recursos
informacionais, surge o RDF Schema a fim de estabelecer uma amplitude semântica nas
formas de representação, conforme pode ser visto, a seguir.
4.5.1 RDF Schema
Além da arquitetura RDF pode-se destacar também uma outra ferramenta tecnológica
que em outras palavras, pode ser considerada uma extensão de RDF, o denominado RDF
Schema ou RDFS.
109
O RDFS apresenta-se nesse contexto como uma linguagem de descrição de
vocabulário, ou seja, descreve as propriedades de um recurso informacional bem como
estabelece relações entre propriedades de outros recursos, podendo, além disso, descrever
classes, propriedades e outros recursos informacionais condizentes aos pares atributo-valor
contemplados em XML. (FEITOSA, 2006).
Assim como no XML Schema, o RDF Schema foi originado para fornecer a sintaxe e a
semântica a um documento, com a finalidade de estabelecer uma estrutura/arquitetura para a
descrição de classes e de propriedades específicas para atender a determinadas aplicações.
Além disso, o RDF Schema fornece um modelo de dados para os recursos informacionais da
Web e seus relacionamentos, propiciando uma semântica simples, com a possibilidade de
representações do próprio modelo em XML. (FEITOSA, 2006).
De uma maneira mais sucinta, o RDF Schema pode ser compreendido da seguinte
forma:
[...] os recursos podem ser divididos em grupos chamados classes. Os membros de uma classe são denominados instâncias. As classes em si, são também recursos e podem ser descritas por meio de propriedades. Ao conjunto de instâncias de uma classe denomina-se extensão da classe. Uma classe pode ser membro de sua própria extensão, isto é, pode ser uma instância de si própria. Todas as classes em RDF Schema são agrupadas em uma classe principal denominada rdfs:Class. De tal maneira, se uma classe X é uma subclasse de Y, todas as instâncias de X serão também instâncias de Y e poderão ser declaradas com o uso da propriedade rdfs:subClassOf. O termo superclasse é utilizado para designar uma classe superior em relação a suas subclasses. Coleções de recursos podem ser representadas em RDF pelo uso de contêineres, que podem ser de valores alternativos (rdf:Alt), de valores não ordenados (rdf:Bag) e de valores seqüenciais (rdf:Seq). (FEITOSA, 2006, p. 109, grifo do autor).
O RDF Schema, nesse sentido, pode ser compreendido como uma ferramenta que
permite descrever vocabulários, bem como as classes e as propriedades para um recurso RDF,
fornecendo assim, uma estrutura mais flexível e com uma maior amplitude semântica na
descrição dos recursos informacionais.
A estrutura do RDF Schema pode ser visualizada de acordo com a figura 15, a seguir.
<?xml version="1.0"?>
110
<!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xml:base="http://example.org/schemas/vehicles"> <rdfs:Class rdf:ID="MotorVehicle"/> <rdfs:Class rdf:ID="PassengerVehicle"> <rdfs:subClassOf rdf:resource="#MotorVehicle"/> </rdfs:Class> <rdfs:Class rdf:ID="Truck"> <rdfs:subClassOf rdf:resource="#MotorVehicle"/> </rdfs:Class> <rdfs:Class rdf:ID="Van"> <rdfs:subClassOf rdf:resource="#MotorVehicle"/> </rdfs:Class> <rdfs:Class rdf:ID="MiniVan"> <rdfs:subClassOf rdf:resource="#Van"/> <rdfs:subClassOf rdf:resource="#PassengerVehicle"/> </rdfs:Class> <rdfs:Class rdf:ID="Person"/> <rdfs:Datatype rdf:about="&xsd;integer"/> <rdf:Property rdf:ID="registeredTo"> <rdfs:domain rdf:resource="#MotorVehicle"/> <rdfs:range rdf:resource="#Person"/> </rdf:Property> <rdf:Property rdf:ID="rearSeatLegRoom"> <rdfs:domain rdf:resource="#PassengerVehicle"/> <rdfs:range rdf:resource="&xsd;integer"/> </rdf:Property> <rdf:Property rdf:ID="driver"> <rdfs:domain rdf:resource="#MotorVehicle"/> </rdf:Property> <rdf:Property rdf:ID="primaryDriver"> <rdfs:subPropertyOf rdf:resource="#driver"/> </rdf:Property> </rdf:RDF>
FIGURA 15: Estrutura da arquitetura RDF Schema. Fonte: W3C (2004)
Pode-se perceber pela figura 15, que a descrição de um recurso informacional em RDF
Schema é escrita em XML (<?xml version="1.0"?>). O recurso descrito é indicado aqui,
111
pela sua URL � Universal Resource Locator �
(xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"). O recurso é dado por
uma classe, definida aqui, por exemplo, como (<rdfs:Class rdf:ID="Truck">),
possuindo uma subclasse, expressa por (<rdfs:subClassOf
rdf:resource="#MotorVehicle"/>), possuindo como valor ("#MotorVehicle").
Além disso, o recurso é descrito com algumas propriedades, ou seja, é uma subclasse de
(rdfs:Class), tal como: (<rdf:Property rdf:ID="registeredTo">). Destaca-se
ainda, que o recurso possui um domínio relativo à propriedade, dado por (<rdfs:domain
rdf:resource="#MotorVehicle"/>) e um valor expresso por ("#MotorVehicle"). O
recurso, possui uma extensão relativa à propriedade domínio (<rdfs:range
rdf:resource="#Person"/>), cujo valor é expresso por ("#Person"). Vale dizer ainda,
que o recurso possui uma subpropriedade (<rdfs:subPropertyOf
rdf:resource="#driver"/>), cujo valor é expresso por ("#driver").
A arquitetura de metadados RDF está sendo acoplada a outros padrões de metadados,
tais como Dublin Core e também a linguagens computacionais do tipo XML, por exemplo, o
que implica uma maior e melhor estruturação dos recursos informacionais e uma amplitude
entre os relacionamentos e características semânticas dos metadados em ambientes
informacionais digitais.
4.6 Apontamentos sobre as formas de representação da informação
Faz-se necessário nesse momento retomarmos algumas questões acerca da
representação da informação, a fim de tecermos discussões e reflexões com um olhar para os
ambientes informacionais digitais.
De acordo com a literatura disponível, os metadados são considerados uma condição
sine qua non para a resolução de problemas de descrição e posteriormente de recuperação de
informações no contexto Web. É possível visualizar-se o uso de metadados bem como
aplicações em ambientes informacionais específicos, tais como as bibliotecas digitais e sob
esse prisma precisa-se atentar para as seguintes abordagens:
112
a) A adoção de um padrão de metadados ou outro está pautada e dependerá de uma
lógica descritiva e o princípio para o qual o padrão foi criado que norteará uma representação
mais efetiva do recurso informacional;
b) As bibliotecas digitais são apresentadas contemplando estruturas pré-estabelecidas e
padronizadas (metadados) o que possibilita uma maior e melhor interoperabilidade, entre não
somente bibliotecas digitais, mas também entre outros sistemas informacionais;
c) Os padrões de metadados gerenciados por bibliotecários no âmbito de bibliotecas
digitais terão que ser inteligentes/compreensíveis não somente por humanos, mas também
para que possam ser interpretados e gerenciados semanticamente pelas máquinas ou agentes
de softwares, trabalhando numa sinergia e de forma colaborativa entre ambientes
informacionais digitais, como é o caso da Web semântica, Web 2.0, Repositórios
Institucionais etc. (LOURENÇO, 2007).
Pode-se dizer que cada tipo de formato ou padrão de metadados fornecerá um tipo de
representação e quanto mais específica, completa e detalhada for uma representação, mais
pontos de acesso à unidade informacional ela fornecerá e melhor ou mais possibilidades de
recuperação haverá. A adoção de um padrão ou outro dependerá de uma lógica descritiva que
contemple à realidade e às necessidades de cada instituição, de forma a possibilitar a
individualização da unidade informacional e multidimensionar suas formas de acesso,
evitando um re-trabalho na construção das formas de representação da informação bem como
na descrição da unidade informacional.
Além dos metadados e padrões de metadados, podemos dizer que XML, RDF e RDF
Schema, são apontadas como tecnologias que poderão proporcionar estruturas de descrição do
significado dos recursos informacionais em ambiências informacionais digitais específicas,
por exemplo, Bibliotecas Digitais, Web Semântica e Repositórios Institucionais melhor
explicitadas.
Vale destacar que as bibliotecas digitais, ao adotarem a arquitetura de metadados RDF,
podem encontrar um caminho para o estabelecimento da interoperabilidade semântica entre
ambientes informacionais heterogêneos e distintos. Uma dessas iniciativas é o
113
desenvolvimento do padrão MarcOnt que possui uma arquitetura baseada no modelo RDF e
algumas aplicações preliminares em bibliotecas digitais semânticas específicas, tais como a
JeromeDL, que será tratada posteriormente no capítulo 5.
Nessa perspectiva, vale salientar que até o presente momento ainda não se tem uma
representação plena, de acordo com normas e padrões internacionais que contemple às
necessidades informacionais dos usuários na sua totalidade. Sobre essa ótica, faz-se
necessário a criação ou o reaproveitamento de teorias e metodologias sedimentadas e
cristalizadas da Biblioteconomia e da Ciência da Informação no tocante às questões de
descrição dos recursos informacionais para um estabelecimento mais efetivo da construção de
formas de representação em ambientes informacionais digitais. Vale dizer ainda que tais
metodologias oferecem respaldo para qualquer tipo de apresentação para a representação do
recurso informacional.
Assim, ao se pensar na construção de formas de representação da informação por
metadados podemos considerar que estamos diante de um diálogo intersubjetivo entre o
catalogador (sujeito pensante) - profissional responsável pela representação - e os recursos
tecnológicos que estão à sua disposição. Uma coisa é pensarmos na representação do ponto de
vista do catalogador e outra é para quem a representação foi construída (usuários que se
apropriarão da representação), uma vez que tal representação estará numa constante mutação,
ou seja, a representação poderá ser adequada e atender a determinados usuários num dado
período. Vale destacar que a representação muda de acordo com as percepções da realidade.
A construção da representação caracteriza-se exatamente pela não-linearidade e plasticidade,
isto é, as contribuições no processo não são estáticas, muito pelo contrário, encontram-se em
permanente mudança.
Observa-se, atualmente, o surgimento de novos padrões para a descrição de forma e
conteúdo dos recursos informacionais e a possibilidade de um aproveitamento das
metodologias cristalizadas da Biblioteconomia e da Ciência da Informação para a construção
de formas de representação da informação, bem como sua efetiva aplicação. Dentre esses
padrões, destaca-se o MarcOnt, que será apresentado no capítulo seguinte.
114
115
Capítulo 5
MarcOnt Initiative: uma proposta para a representação e a descrição de recursos informacionais na Web
116
5 MARCONT INITIATIVE: UMA PROPOSTA PARA A REPRESENTAÇÃO E A DESCRIÇÃO DE RECURSOS INFORMACIONAIS NA WEB �Será que, via Web Semântica, [...] o conto de fadas está a caminho de se tornar realidade?�
Jaime Robredo
Nesse capítulo, procura-se apresentar o surgimento e o desenvolvimento de um novo
padrão de descrição bibliográfica (MarcOnt Initiative), no contexto que atualmente se
conhece por Web Semântica, cujo impacto repercute nas formas de tratamento, de
armazenamento, de descrição, de representação, de preservação, e de uso dos recursos
informacionais, no âmbito de ambientes informacionais digitais, especificamente na
Biblioteca Digital Semântica JeromeDL. Apresenta-se também o Portal Colaborativo
MarcOnt.
5.1 Web Semântica: novos olhares para a representação e a descrição de recursos
informacionais
Pode-se observar contemporaneamente um cenário marcado por grandes
transformações tecnológicas e pelo surgimento e criação das mais variadas técnicas para as
questões de representação, de descrição, de produção, de organização, de transmissão e de uso
das informações em ambientes informacionais digitais. Conforme apontado nos capítulos 3 e
4, essas questões vem permeando o contexto digital e trazendo um constante repensar nos
paradigmas informacionais.
O ambiente Web, por possuir informações heterogêneas e efêmeras, pode ser
caracterizado como caótico, onde profissionais de diversas áreas buscam soluções para um
tratamento mais significativo dos conteúdos que ali estão armazenados e disponibilizados para
um uso mais efetivo.
117
Idealizada por Tim Berners-Lee e liderada pelo World Wide Web Consortium (W3C) -
a Web Semântica é um projeto que visa a solucionar e a minimizar os problemas de
recuperação da informação na Web por meio do acesso automatizado aos recursos
informacionais. Para tanto, pretende implantar uma estrutura tecnológica e instaurar uma
maior representação do conhecimento na rede com o estabelecimento semântico das
informações contidas nas unidades e assim, possibilitar técnicas mais eficazes de recuperação
(BERNERS-LEE; HENDLER; LASSILA, 2001, tradução nossa).
A Web Semântica, por meio de sua estrutura tecnológica, quer incorporar maior nível
semântico nas representações dos recursos informacionais, tornando-os mais significativos
para as ferramentas de busca e recuperação, além de possibilitar a criação de ferramentas mais
eficazes, que serão capazes de �entender� e gerenciar os dados representados.
De acordo com a literatura disponível na área de Ciência da Informação, que parece
ser consensual, as teorias e os conceitos subjacentes à Web Semântica, encontram-se
principalmente nos autores Berners-Lee, Hendler e Lassila (2001); Alves (2005); Ramalho
(2006); Marcondes (2006); Feitosa (2006); Ferreira (2006); Campos, Campos e Campos
(2006); Shadbolt, Hall e Berners-Lee (2006); e Pickler (2007).
Conforme relatado por Marcondes (2006, p. 71),
[...] a Web Semântica está ainda em seus estágios iniciais, mas há evidências de que sua consolidação depende apenas de tempo e do amadurecimento das tecnologias utilizadas. Uma dessas evidências é o investimento crescente de grandes fabricantes, organizações internacionais de padronização e comunidades, com destaque para a área de bibliotecas digitais, na qual problemas de tratamento de informações são cada vez mais críticos, devido ao volume e à complexidade cada vez maior de manipular e integrar informações heterogêneas e distribuídas de maneira dinâmica.
De acordo com a assertiva acima, pode-se dizer que se visualizam teorias e aportes
teóricos bem cristalizados e a ausência de aplicações práticas no cenário atual, destacando
que, as bibliotecas digitais com sua estrutura pré-estabelecida (metadados) têm muito a
contribuir no que concerne ao tratamento documentário, com a possibilidade de integrar e
manipular recursos informacionais em ambientes e plataformas heterogêneas.
118
A Web Semântica pode ser definida como,
[...] uma extensão da Web atual que apresentaria recursos informacionais melhor estruturados e representados, ou seja, o conteúdo informacional desses recursos seriam melhor explicitados e definidos semanticamente, formando uma rede de informações conectadas que por meio de ferramentas tecnológicas, tais como os agentes de softwares, proporcionaria uma melhor recuperação de informação (ALVES, 2005, p. 28).
Com base nos autores Berners-Lee, Hendler e Lassila (2001), podemos dizer que a
Web Semântica fornecerá estrutura para o conteúdo dos recursos informacionais, criando um
ambiente onde agentes de softwares realizam atividades sofisticadas de processamento e
entendimento dos dados solicitados na busca, com o propósito de oferecer uma recuperação
mais precisa.
A arquitetura da Web Semântica está representada em um esquema de camadas
sobrepostas, onde cada camada apresenta uma ferramenta ou tecnologia responsável por uma
determinada tarefa, ao mesmo tempo em que trabalham de modo complementar umas com as
outras, com o intuito de melhorar a recuperação.
Na primeira versão esquemática da arquitetura da Web Semântica temos, nas primeiras
camadas, a indicação de algumas ferramentas tecnológicas responsáveis pela estruturação e
representação dos dados. Era necessário estabelecer uma padronização nas camadas iniciais
para posteriormente definir e indicar as ferramentas tecnológicas mais específicas das
camadas superiores, que inicialmente continham apenas a indicação de modo mais geral das
tecnologias envolvidas. (RAMALHO, 2006).
As propostas atuais para a arquitetura da Web Semântica seguem o mesmo esquema da
arquitetura anterior, com a diferença de possuir um pouco mais de detalhamento nas
ferramentas tecnológicas17 presentes em certas camadas, conforme pode ser visualizado na
figura 16, a seguir.
17 Vale destacar que nessa pesquisa, não é nosso objetivo tratar com profundidade as ferramentas tecnológicas contempladas na arquitetura da Web Semântica, mas apontar a necessidade de estudá-las adequadamente e em consonância com os instrumentos e metodologias da Biblioteconomia e Ciência da Informação, para um estabelecimento pleno e efetivo.
119
FIGURA 16: Arquitetura da Web Semântica proposta em 2005 comentada pelo autor. Fonte: Berners-Lee (2005).
Tendo como base a categorização em camadas apontadas por Moura (2002) e adaptada
por Alves (2005), pode-se destacar, de modo resumido, as seguintes características dos
elementos que compõe a arquitetura da Web Semântica:
• Característica Internacional: composta por padrões de descrição e identificadores
universais, tais como a URI (Uniform Resource Identifier) e UNICODE, que são
responsáveis por uma identificação e localização mínima do recurso informacional na
rede;
• Camada Sintática: responsável pelo estabelecimento da sintaxe de descrição dos dados,
essa camada é composta pela linguagem XML, namespaces e também pelo XML Schema,
que permite uma melhor estruturação dos dados e conseqüentemente uma melhor
visualização do conteúdo dos recursos pelos agentes de software;
Característica Internacional
Camada Sintática
Camada de Ontologia
Camada de dados
Camada Lógica
Camada de Prova
Camada de Validação
Assinatura Digital complementada pela
Criptografia
120
• Camada de Dados: essa camada trabalha com a representação, processamento e
codificação dos metadados, é composta pela arquitetura de metadados RDF (RDF Core) e
o RDF Schema, que são ferramentas responsáveis por expressar significados e promover a
interoperabilidade. É importante destacar que nesta camada e na camada anterior está
implícito o uso de padrões de metadados para garantir a representação dos recursos
informacionais;
• Camada de Ontologia: o uso de ontologias permite o estabelecimento da semântica, ou o
significado dos dados descritos e representados pelos metadados. A definição dos
conceitos nessa camada servirá para os agentes inteligentes �compreenderem� a semântica
dos dados e a linguagem recomendada pelo W3C é a OWL � Ontology Web Language.
Vale destacar que as ferramentas SparQL, DLP são canditadas a recomendação pelo
W3C;
• Camada Lógica: é responsável por uma recuperação mais eficiente devido ao uso de
agentes, regras (presentes também na camada de ontologia) e mecanismos de inferência,
mas para isso contam como base as camadas responsáveis pela estruturação, representação
e estabelecimento semântico dos dados, para posteriormente relacionar e processar as
informações de forma lógica;
• Camada de Prova: responsável pelo intercâmbio entre agentes; é nessa camada onde serão
processadas as definições lógicas pelos agentes para a construção da prova, que será
criada para verificar se a dedução do agente estava correta;
• Camada de Validação: essa última camada é responsável pelo estabelecimento de
verdades, autenticidade, confiabilidade e validade dos dados recuperados, garantindo aos
agentes que raciocinam sobre os dados se a informação é verdadeira. (ALVES, 2005).
O potencial da Web Semântica será notado pela troca de informações disponibilizadas
em fontes de informações diversas e processadas pelos agentes de softwares; mas para isso é
necessário o acesso a coleções de recursos informacionais estruturados e representados, além
do trabalho conjunto das ferramentas citadas em sua arquitetura. (ALVES, 2005).
121
Quanto ao funcionamento da Web Semântica os autores Souza e Alvarenga (2004)
explicam que os usuários teriam acesso a esta por meio de portais nos quais formulariam suas
buscas. Em seguida os agentes de softwares, presentes nos mecanismos de busca e inferência,
acessariam um repositório de metadados constituído por recursos informacionais
representados pelos padrões de metadados e anotados semanticamente pelas definições
estabelecidas nas ontologias. Nesse ambiente, os agentes trabalhariam formando uma espécie
de sinergia ao trocarem informações entre si, além disso, proporcionando uma recuperação
mais eficaz, pois teriam acesso a coleções de recursos informacionais melhores estruturados e
representados.
Neste cenário, dois pontos são destacados pelos autores: a) a questão da representação
e indexação dos recursos, por meio dos metadados, padrões de metadados e as definições
semânticas presentes nas ontologias, e; b) a questão da recuperação mais eficiente dos
recursos informacionais ocasionadas pelos agentes de softwares, associados aos mecanismos
de busca e inferência. Esses dois fatores promovem o acesso mais amplo aos recursos
informacionais disponibilizados em comunidades de interesse distintos e uma recuperação
mais eficiente, pois os mecanismos de busca são capazes de �compreender� o significado das
informações presentes no conteúdo dos recursos devido a essa representação informacional
(SOUZA; ALVARENGA, 2004).
Deste modo, é importante destacar que as ferramentas e tecnologias presentes na
arquitetura da Web Semântica trabalham em conjunto: os agentes de softwares responsáveis
pela busca recuperam de modo mais eficiente porque encontram recursos informacionais
melhor representados pelos metadados e ontologias, além disso, tem como apoio a linguagem
XML que promove a estruturação dos dados e a arquitetura RDF responsável pelo
estabelecimento da interoperabilidade. (ALVES, 2005).
Nesse ponto, retoma-se a questão de a Web Semântica possuir uma estrutura elaborada
de implementação, na qual todas as ferramentas tecnológicas devem estar atuando em
conjunto para garantir seu funcionamento. Contudo, acreditamos que é na representação da
informação que se encontra o núcleo de seu funcionamento, pois se não houver uma
representação por metadados adequada dos recursos informacionais, as outras tecnologias
envolvidas não terão onde se apoiar para realizar suas tarefas. Por isso, a necessidade de se ter
uma estrutura bem representada a fim de potencializar a recuperação dos recursos
122
informacionais pelo usuário final. Deste modo podemos concordar com Berners-Lee, Hendler
e Lassila (2001) quando dizem que o estabelecimento da Web Semântica irá se concretizar a
partir da representação dos recursos informacionais e isso só será garantido pelo uso efetivo
dos metadados.
Na tentativa de solucionar problemas de descrição e representação dos recursos
informacionais nos ambientes digitais, novas normas e novos horizontes encontram-se em
constituição à luz da Web Semântica.
5.2 Descrição bibliográfica na era da Web Semântica
Durante as últimas décadas observou-se que mais e mais informações têm sido
publicadas, armazenadas e disponibilizadas na Web. No entanto, somente uma parte dessas
informações e em ambientes específicos, tais como as bibliotecas digitais, por exemplo,
possuem um padrão de metadados para a descrição bibliográfica e que possibilite a
padronização dos recursos informacionais para atender aos requisitos da interoperabilidade.
As bibliotecas digitais apresentam-se e atuam como um segmento na Internet onde
procuram desenvolver e criar métodos e técnicas para a padronização dos recursos
informacionais. Mas garantir/assegurar a interoperabilidade entre �ilhas� de informações bem
estruturadas e padronizadas entre formatos bibliográficos distintos encontra-se numa questão
de investigação e preocupação pela comunidade científica.
Novas tecnologias baseadas em pesquisas na temática Web Semântica desenvolvem-se
com o intuito de tentar agregar semântica à descrição bibliográfica para um tratamento mais
efetivo dos conteúdos digitais. A Web Semântica oferece algumas soluções para diferentes
problemas criando uma nova visão para o armazenamento e o processamento dos dados.
Algumas dessas soluções poderiam ser implementadas para potencializar os resultados das
buscas no âmbito das bibliotecas digitais.
Sendo assim, o projeto MarcOnt Initiative surge nesse cenário numa perspectiva na
tentativa de solucionar os problemas de descrição e de representação dos recursos
123
informacionais em ambientes digitais, tais como as bibliotecas digitais, por exemplo, atrelado
aos padrões de metadados advindos das áreas da Biblioteconomia e da Ciência da Informação,
como o MARC21 para a descrição bibliográfica e outros padrões, como o Dublin Core, para a
localização de recursos na Web.
MarcOnt Initiative se desenvolveu a partir da Biblioteca Digital Semântica
JeromeDL. Como relata Synak (2005), num primeiro momento, as primeiras experiências na
JeromeDL eram positivas, mas logo, foram detectados alguns problemas, pois os objetivos
iniciais eram desenvolver e aumentar a busca automaticamente atribuindo semântica aos
recursos informacionais a fim de potencializar os processos de recuperação de informação. As
razões pelas falhas iniciais podem ser assim entendidas de acordo com dois fatos:
1. Aumentar a busca semanticamente requer a informação sobre os recursos
armazenados inicialmente na biblioteca na forma de descrições semânticas. O problema era
convencer realmente os bibliotecários que criando dados semânticos resolveria o problema de
trabalhos futuros. Como um resultado � as instalações existentes da primeira biblioteca digital
semântica não usavam suas potencialidades semânticas e nem usavam um nível mínimo de
capacidade semântica.
2. Verificou-se que as descrições na JeromeDL poderiam fornecer capacidade de
descrição de formatos de metadados conhecidos e usados por comunidades da
Biblioteconomia, tais como o MARC21. A ontologia simples da JeromeDL, consistindo de
somente três conceitos, não foi projetada simplesmente para esse tipo de dado e metadado.
(SYNAK, 2005, tradução nossa).
Nesse sentido, depois de muitos estudos realizados pelos pesquisadores da JeromeDL
e a equipe envolvida no projeto, decidiu-se tratar desses problemas criando-se uma ontologia
bibliográfica que pudesse contemplar os aspectos semânticos de forma e conteúdo dos
recursos informacionais e que pudessem atuar de forma mais efetiva numa biblioteca digital
semântica. Assim, os requisitos iniciais foram elaborados por Sebastian Ryszard Kruk e se
constituindo o projeto MarcOnt Initiative©200518.
18 O projeto detalhado encontra-se disponibilizado no Portal MarcOnt no site: Disponível em: <http://portal.marcont.org>. Acesso em: 10 out. 2007.
124
Nessa perspectiva, o que seria o MarcOnt Initiative?
De acordo com Kruk, Synak e Zimmermann (2005a, p. 1, tradução nossa) �o objetivo
da iniciativa MarcOnt é desenvolver um novo padrão para a descrição bibliográfica na forma
de uma ontologia e relacionar as ferramentas da Web Semântica utilizando tecnologias
semânticas�.
Em outras palavras, e pautado nos autores supracitados, podemos dizer que o
MarcOnt Initiative seria um padrão de descrição bibliográfica semântica que contempla
forma e conteúdo do recurso informacional, a fim de sua identificação e individualização para
leitura e processamento compreensíveis por máquina/computador, utilizando-se de
instrumentos e ferramentas tecnológicas subjacentes à Web Semântica, podendo ser aplicado
no contexto de ambientes informacionais digitais.
O primeiro passo para agregar semântica à descrição das informações em bibliotecas
digitais e sua compatibilidade para que ocorra a interoperabilidade é o desenvolvimento de
uma ontologia comum. A ontologia pode ser considerada como um instrumento para a
descrição bibliográfica dos recursos informacionais, pois se cria uma rede de conceitos com
propriedades apropriadas e restritas. Kruk, Synak e Zimmerman (2005b, p. 1, tradução nossa)
alegam que �infelizmente, é muito difícil convencer os bibliotecários para realizarem o
esforço da criação da descrição semântica dos recursos, tais como, livros, por exemplo�.
Nesse contexto, pode-se destacar nesse momento, a importância da participação ativa
de profissionais de áreas interdisciplinares na criação do MarcOnt, em especial dos
profissionais da Biblioteconomia, uma vez que este profissional, em sua formação, possui as
técnicas e habilidades necessárias para o tratamento documentário dos recursos
informacionais. A Catalogação, instrumento de descrição bibliográfica da área, pautada em
regras e esquemas de descrição, fornece subsídios para a construção de formas de
representação e descrição de forma padronizada, possibilitando o armazenamento, a
preservação, o uso e o reuso das informações de forma mais efetiva.
Como aponta Synak (2005), muitas são as razões para a construção de um novo
padrão para a descrição bibliográfica semântica que podem ser assim delineadas:
125
• O primeiro fato é o argumento de que o padrão de metadados MARC21 não fornece
informação semântica necessária de forma a ser compreendida por uma máquina.
Synak (2005, p. 50, tradução nossa) afirma que
O formato MARC21 nos permite descrever dois tipos específicos de recursos: Língua dos materiais (que podem ser aproximadamente descritos como livros, periódicos, jornais etc.) e Língua de materiais manuscritos (tal como livros valiosos, livros antigos, escritos a mão).
Em outras palavras, quando o autor se refere à Língua dos materiais e Língua de
materiais manuscritos, podemos nos reportar à estrutura do MARC na posição 06 (Tipo de
Registro) do LÍDER, onde utiliza-se a letra �a� para Material textual (Impresso) e a letra
�t� para Material textual (Manuscrito).
Um recurso que represente �Língua dos materiais� é identificado em MARC21 colocando a letra �a� no campo número 06 no líder do registro MARC21. Para �Língua de materiais manuscritos�, a marca apropriada requer colocar a letra �t� no mesmo lugar. O problema é que não há absolutamente nenhuma conexão entre a �Língua do material� e a �Língua de material manuscrito�. Para alguém que não tem uma pista quando o recurso vem do livro, estes dois tipos de recursos poderiam ser chamados �Pedras� e �Flores�. Este é o caso quando uma máquina é usada para processar o dado. (SYNAK, 2005, p. 51, tradução nossa).
Nesse mesmo sentido, Synak (2005, p. 51, tradução nossa) para uma explicação ainda
mais plausível, diz que:
MARC21 não nos permite descrever que �Língua dos materiais� e �Língua de materiais manuscritos� são ambos adequados para leitura (têm algumas características comuns) ou que �Língua de materiais manuscritos� é de fato também, �Língua dos materiais�, mas tem algumas características específicas que as fazem diferentes. Se nós quiséssemos escrever uma busca na máquina que incluísse na busca manuscritos quando há uma falta de livros usuais no assunto, nós teríamos que especificar cada uma das conexões. Uma ontologia nos permite fazer isso automaticamente.
Um dos motivos desta pesquisa e na busca por subsídios que procuramos responder e
caracterizar o MarcOnt, está pautado na tese que o autor procura defender com tanta
propriedade, ao mencionar que o MARC21 mesmo sendo um padrão mundial e
internacionalmente aceito e adotado pelas bibliotecas e pela comunidade da Biblioteconomia,
de um modo geral, possuindo uma estrutura completa e complexa, não há um padrão de
126
descrição semântica que contemple a profundidade da descrição, ou ainda, que cubra a
extensão requerida ou suportada pelo MARC21 usado para os propósitos da Biblioteconomia.
Pensando nisso, pode-se considerar que o padrão de descrição bibliográfica semântica
MarcOnt pode possibilitar uma melhora na explicitação das informações de forma a permitir
uma compreensão pela máquina nas solicitações de busca para o usuário final.
Ao mencionar esse desafio, Synak (2005) questiona a necessidade do por que em se
criar outra ontologia, dizendo que ainda não existe uma adequada que vá ao encontro dos
objetivos da descrição bibliográfica e que atenda aos requisitos dos profissionais da
Biblioteconomia.
As novas soluções não podem negligenciar padrões e formatos existentes ou nunca se tornarão amplamente conhecidos. No momento, o formato de dados bibliográficos MARC21 é ainda o principal padrão utilizado em todas as bibliotecas do mundo. A ontologia que aspira ser seu sucessor (ou ao menos contrapartes semânticas) tem que oferecer não menos capacidade na descrição. (SYNAK, 2005, p. 63, tradução nossa).
Ainda tentando responder a alguns questionamentos sobre a criação de uma ontologia
bibliográfica, bem como sua relevância, o autor menciona que se vivenciou uma experiência
com descrições semânticas na biblioteca digital semântica JeromeDL e que os resultados
apontam uma melhora nos serviços de busca e de comunicação entre as bibliotecas digitais
possibilitando uma amplitude na recuperação dos recursos informacionais.
Vale destacar que para o desenvolvimento pleno do MarcOnt os estudos mostram e
apontam algumas exigências ou requisitos a fim de atingir suas funcionalidades, onde seu
idealizador procurou, por meio do estado da arte no domínio da Biblioteconomia, levantar os
principais padrões de metadados na área com o objetivo de procurar se haveria
compatibilidade com a iniciativa MarcOnt. Segundo Synak e Kruk (2005), dentre os
principais requisitos, destacam-se:
• A ontologia deve prover não menos capacidade de descrição tal como o formato de
descrição bibliográfica MARC21. Esta exigência é fácil de explicar. MARC21 é atualmente o padrão mais popular e forte para descrever recursos em bibliotecas. É muito provável que os futuros usuários do MarcOnt queiram mover seu registros armazenados em MARC21 para o novo formato. Permitiria que fizessem avaliações das vantagens da semântica e de novos serviços. O plano (esquema) de
127
conversão sem perda de informação requer que o MarcOnt seja extensível quando descrever recursos, assim como o MARC21. MARC21 é o �nome-motivo� para MarcOnt, que é basicamente uma fusão do �MARC� e a palavra �ontologia�. (SYNAK, 2005, p. 63, tradução nossa).
Pelo que pode-se perceber é que a relação entre o MARC21 e o MarcOnt, não
consiste em transformar a estrutura pré-estabelecida do MARC21 para a linguagem da
ontologia, mas sim fornecer a informação semântica à descrição dos recursos informacionais
que o MARC21 não oferece de modo a ser compreendida pela máquina/computador.
• A ontologia deve ser descrita usando OWL DL
A linguagem OWL (Ontology Web Language) tem determinadas vantagens sobre outras, por ser a mais antiga especificação de linguagem para ontologia. Ela é um novo padrão, aprovado e recomendado pelo W3C (World Wide Web Consortium). Pode-se facilmente predizer que a maioria das ontologias no futuro serão descritas usando OWL. Foi selecionada a OWL Description Logic (OWL DL) � Lógica de Descrição OWL. OWL DL tem expressado suficientemente as maiores razões para suportar outras ontologias. (SYNAK, 2005, p. 64, tradução nossa).
Vale destacar que a linguagem OWL DL, assim como a OWL destinam-se ao
processamento dos recursos informacionais de forma mais inteligente, localizada na camada
de ontologias da arquitetura da Web Semântica, possuindo suas bases na arquitetura de
metadados RDF, o que implica uma maior potencialidade de uso e reuso das informações no
âmbito de bibliotecas digitais e no atendimento aos requisitos de interoperabilidade.
• A ontologia deve reusar (se possível) outras ontologias existentes ou suas partes. Ela
deve ser relativamente fácil para aderir a ontologia MarcOnt com ontologias
existentes se requerido.
Estas exigências são mais fáceis para realizar com OWL, pois esta, já é uma exigência indicado primeiro. Nós não podemos somente importar alguns conceitos de outras ontologias, mas adicionar novas propriedades ou facetas a elas e criar subclasses etc. Tal prática é comum. Por exemplo, o Semantic Web Portal Ontology usa o conceito de foaf: Agent da ontologia Friend-of-a-friend e o expande para refletir pessoas/organizações específicas no ambiente acadêmico. (SYNAK, 2005, p. 64, tradução nossa).
Nesse caso, a existência de outras ontologias podem possibilitar um compartilhamento
dos recursos tecnológicos para o desenvolvimento do MarcOnt indo ao encontro da filosofia
de ambientes colaborativos subjacentes à Web 2.0, no cenário atual, principalmente com os
conceitos de foaf: Agent que visa definir propriedades para os perfis dos usuários do sistema e
128
os responsáveis pela criação dos recursos. É usada para expressar os metadados sobre pessoas
(usuários) assim como seus nomes, endereços, etc., na possibilidade de um agente de software
acessar e fazer uso de uma descrição num processo de busca.
• Deve ser fácil traduzir descrições semânticas MarcOnt compatíveis para outros
formatos, tais como MARC21, Dublin Core ou BibTeX. Isto vem ao encontro dos objetivos da Iniciativa MarcOnt. A definição para o problema da tradução encontra-se mais nas ferramentas que serão desenvolvidas junto com a ontologia do que a própria ontologia. Mas a exigência de traduções fáceis tem que ser mantida em mente ao projetar/delinear a estrutura da ontologia. A conversão de menos perdas de informações entre outros formatos e MarcOnt requer que MarcOnt seja capaz de preservar a informação em primeiro lugar. (SYNAK, 2005, p. 64, tradução nossa).
Sobre esse aspecto, pode-se dizer que um dos propósitos do MarcOnt é possibilitar a
integração entre recursos informacionais de padrões de metadados heterogêneos e o
reaproveitamento das informações, agregando semântica às informações e torná-las
armazenadas e disponíveis numa mesma interface ou plataforma, permitindo uma busca e
recuperação de forma mais efetiva e significativa.
• O primeiro esboço/esquema da ontologia deve ser um ponto de partida para um
trabalho futuro A primeira versão da ontologia não tem que estar completa ou imediatamente pronta para ser usada. Ela deve definir as principais estruturas e prover um mínimo de funcionalidades requeridas para começar as avaliações e estar pronta para um desenvolvimento colaborativo mais adicional. A primeira versão da ontologia MarcOnt será desdobrada testando suas funcionalidades na Biblioteca Digital JeromeDL. (SYNAK, 2005, p. 64, tradução nossa).
Nesse ponto, pode-se destacar que o MarcOnt já encontra-se disponível na Biblioteca
Digital Semântica JeromeDL, o que será tratado nas seções seguintes e o próprio Portal
MarcOnt, disponibiliza um ambiente para a construção de descrições bibliográficas
semânticas para experiência e testes.
129
5.3 Arquitetura MarcOnt
Para uma melhor compreensão do padrão de descrição semântica MarcOnt, os autores
Kruk, Synak e Zimmermann (2005) propuseram uma arquitetura inicial a fim de ter uma
visualização como seria o seu funcionamento ao se pensar na questão da interoperabilidade
semântica entre padrões de metadados heterogêneos bem como o acesso aos recursos
informacionais numa única interface.
Nesse sentido, a figura 17, em seguida, apresenta o delineamento de uma arquitetura
inicial dos serviços de mediação MarcOnt.
FIGURA 17: Arquitetura de serviços de mediação MarcOnt.
Fonte: Kruk, Synak e Zimmermann (2005a, p. 2)
130
De acordo com a figura 17, pode-se nesse momento, traçar alguns comentários no que
concerne ao funcionamento do padrão de descrição semântica MarcOnt.
A arquitetura forma um fluxo, onde a parte superior é a entrada (input), as descrições
semânticas estão no centro (MarcOnt ontology) e a parte mais inferior é a saída (output).
Nota-se que o centro da arquitetura é o RDF (Resource Description Framework) �
considerado o núcleo para o armazenamento para descrições semânticas compiladas de outros
padrões de metadados.
As caixas na primeira fileira (na entrada) e na última fileira (na saída) da arquitetura
representam os formatos inerentes aos tradicionais (arquivos neste formato). As caixas no
meio (MARCXML, BibTeXML) representam a primeira fase do processo de tradução onde
os arquivos inerentes são analisados gramaticalmente (sintaxe) e seus conteúdos são incluídos
no formato XML.
Os adaptadores de entrada e saída (input e output) são implementados usando o
mecanismo de inferência Sesame19. De um lado dos adaptadores, nós temos as descrições
semânticas e do outro, dados de descrições bibliográficas convertidas para um modelo RDF.
Converter diferentes formatos de descrição para o modelo RDF depende do formato original
do arquivo. Registros em formato MARC21 são armazenados em arquivos binários; então a
conversão exige primeiro que tais arquivos sejam transformados para o formato MARCXML
e então, numa fase posterior, transformam-se os dados para o modelo RDF usando XSLT.
Nesse aspecto, vale ressaltar que o autor destaca que ainda não há representações
oficiais de dados de MARC21 em RDF, desenvolvido pela Library of Congress (LC) e que os
pesquisadores do MarcOnt, criaram seu próprio formato (MARCRDF). �Apoiar outros
formatos é uma questão de desenvolver adaptadores e conversores apropriados. Atualmente,
nós estamos desenvolvendo adaptadores para MARC21�. (SYNAK, 2005, p. 75, tradução
nossa).
19 Sesame é uma ferramenta, ou seja, um conjunto de classes-base desenvolvido em Java com código aberto para o desenvolvimento de sistemas, com o objetivo de armazenar e consultar dados em RDF. Este sistema é totalmente extensível e configurável no que concerne aos mecanismos de inferência e armazenamento de dados em formato RDF. Maiores informações sobre o sistema Sesame podem ser encontrados no site: Disponível em: <http://www.openrdf.org/>. Acesso em: 10 mar. 2008.
131
A fase final é traduzir os dados RDF para dentro de estruturas compatíveis com o
padrão de descrição bibliográfica MarcOnt. Os estágios precedentes requerem escrever
ferramentas simples para que as bibliotecas disponíveis usassem e pudessem ser relativamente
fáceis para intercambiá-las. (SYNAK, 2005, tradução nossa). Assim, pode-se dizer que essa
arquitetura inicial, visa o compartilhamento entre padrões de metadados distintos, podendo
proporcionar a interoperabilidade semântica entre bibliotecas digitais, por exemplo, onde as
informações semânticas estarão disponíveis e armazenadas em uma única interface, neste
caso, no MarcOnt.
Outra releitura sobre a questão da descrição bibliográfica, pautada na arquitetura de
serviços de mediação MarcOnt, pode ser compreendida de acordo com a figura 18,
reforçando a criação e a necessidade de um padrão de descrição bibliográfica semântica que
contemple a representação de forma e de conteúdo dos recursos informacionais.
FIGURA 18: Estrutura de representação em MarcOnt.
Fonte: Kruk, Synak e Zimmermann (2005b, p. 27)
Conforme se pode observar pela figura 18, temos a representação dos recursos
informacionais no padrão de metadados MARC21, MARCXML (na estrutura MARC com a
linguagem computacional XML) e MARC-RDF (estrutura MARC em RDF), uma vez que
132
essas representações passam por ferramentas de tradução/conversão, dadas por RDF
Translator gerando nesse sentido, informações semânticas armazenadas em MarcOnt. Assim,
pode-se dizer que o estabelecimento de uma linguagem comum (vocabulary) que proporcione
e garanta uma busca e recuperação dos recursos informacionais para o uso e o reuso das
informações pelo usuário final, será determinado por MarcOnt.
Umas das grandes dificuldades apontadas pela literatura e um problema para a
interoperabilidade entre padrões de metadados distintos em bibliotecas digitais é que os dados
para a tradução das informações nem sempre estão representados em RDF, o que implica o
desenvolvimento de novas tecnologias para o tratamento adequado dos recursos
informacionais.
O autor menciona a dificuldade em se criar regras que contemplem os objetivos do
MarcOnt , dizendo que a �tarefa requer escrever centenas de regras de inferência para
traduzir aos usuários do MarcOnt sua lógica de funcionamento, bem como suas propriedades
para garantir de forma apropriada um pouco mais de informação sem possíveis perdas�.
(SYNAK, 2005, p. 75, tradução nossa).
Synak (2005) elucida que os formatos de descrição bibliográfica são exatamente tal
caso. A informação é armazenada em cada arquivo binário ou textual (dependendo do
formato). Para processar a informação usando as tecnologias da Web Semântica faz-se
necessário que primeiramente representemos estas informações em RDF.
Ainda nesse sentido, Synak (2005) enumera duas fases para a tradução/conversão
entre os padrões de metadados:
1. Tradução do formato original para RDF
2. Tradução de um grafo RDF para outro.
Os três formatos que foram avaliados são MARC21, BibTeX e Dublin Core, tratados
de forma específica no capítulo 4.
• MARC21- formato binário, os arquivos necessitam de ser analisados gramaticalmente. O resultado de um arquivo no formato MARCXML pode ser transformado em RDF usando XSL Transform. O problema é que não há nenhuma representação oficial de MARC em RDF (ao menos
133
não desenvolvido pela LC). Para nossas necessidades, nós especificamos o formato MARCRDF (para RDF Schema de MARCRDF), que é uma representação RDF das estruturas de MARCXML.
• BibTeX- formato de texto. Segue a sintaxe TeX. Os arquivos BibTeX
necessitam ser analisados gramaticalmente antes de ser processados mais adiante. Há representações BibTeX em XML (BibTeXML) e RDF (BibTeX em OWL). O arquivo XML analisado gramaticalmente pode ser facilmente transformado para RDF usando XSLT.
• Dublin Core- muitas sintaxes disponíveis (em XML, como metadado em
HTML, RDF), os elementos de DC são usados geralmente em RDF. Ao contrário do MARC21 ou BibTeX, DC não é um formato de arquivo fechado, podendo ser mais flexível na transformação dos dados. (SYNAK, 2005, p. 73, tradução nossa).
Nessa perspectiva, foram formuladas algumas regras para as transformações de
descrições no padrão de metadados MARC21, a fim de possibilitar melhores níveis de
relacionamento entre os registros bibliográficos.
A figura 19, apresenta regras que poderiam ser usadas no processo de transformações
de descrições em MARC21 para descrições semânticas em MarcOnt. No exemplo abaixo,
visualiza-se um registro MARC21, descrevendo um tipo documental do tipo livro, com
metadados de autor e título, utilizando os conceitos de MarcOnt (marcont:Book) para o
armazenamento das informações. As regras de transformações de um padrão de metadados
específico para MarcOnt, e vice-versa, encontram-se disponíveis no Anexo A.
134
FIGURA 19: Regras para construção de descrição semântica de MARC21 para MarcOnt. Fonte: Synak (2005, p. 74)
Vale lembrar que o padrão de metadados MARC21 descreve vários recursos
informacionais e que o exemplo acima (livros) é apenas um dos tipos documentais
contemplados pelo formato.
Na figura 19, pode-se verificar a criação de regras para apenas dois campos
específicos abarcados pelo padrão de metadados MARC21 (autor e título), o que implica, para
um registro completo, a construção detalhada e padronizada de normas que forneçam a
semântica tão necessária para o entendimento de cada campo para uma leitura das
informações pela máquina/computador.
A ontologia terá que ser atualizada constantemente para permitir uma melhor representação da informação. As regras existentes terão que refletir estas mudanças. Atualmente, existem um conjunto de regras que permite mover uma quantidade limitada de informações de formatos tradicionais para MarcOnt. A informação (a mais importante) como título ou autor é suportada. Criar ferramentas que simplificariam e acelerariam o processo de criação de regras será a próxima etapa e um dos assuntos de trabalhos no Portal Colaborativo MarcOnt. A primeira etapa que nós já fizemos foi criar um framework (estrutura), uma máquina (sistema) que poderia processar as regras. (SYNAK, 2005, p. 74, tradução nossa).
Com a finalidade de um maior aproveitamento das informações em diferentes
formatos bibliográficos, foram definidas algumas ferramentas a fim de constituir a estrutura
MarcOnt, conforme pode ser visualizada na figura 20, a seguir.
135
FIGURA 20: Estrutura básica do MarcOnt.
Fonte: Synak (2005, p. 65)
As partes do padrão de descrição semântica MarcOnt, pautadas na figura 20, e de
acordo com Synak (2005), podem ser assim entendidas:
• Material: Compreendida aqui como uma classe com suas subclasses. Vale dizer que
Material é um nome comum designado para qualquer tipo de recurso informacional, o
qual pode estar armazenado em uma biblioteca.
• Marc21Description: O conjunto de descrições das classes incorpora a terminologia
oriunda do padrão de metadados MARC21, originando a classe Marc21Description.
Marc21Description pode ser compreendida como uma superclasse usada para prover a
descrição para diferentes tipos de materiais. Em geral, podemos simplesmente
conectar Material a Marc21Description. �Essa ligação seria afirmar que qualquer
material pode ter um número de características derivados do MARC21. Mas essa
ligação não transportaria qualquer informação semântica sobre que tipos de recursos
estão associados aos tipos de propriedades�. (SYNAK, 2005, p. 67, tradução nossa).
• As subclasses por sua vez, contemplam os seguintes tipos documentais: livros,
periódicos, material cartográfico, arquivo de computador, música, material visual etc.
136
• Foaf:Agent: Todo recurso informacional pode estar associado com seu criador,
domínio e palavras-chave. MarcOnt utiliza foaf:Agent que permite a descrição de
pessoas e organizações/instituições responsáveis pela criação do recurso.
• Domain: O sistema Domain permite a visualização do conteúdo do recurso,
compatível com normas e códigos de Classificação, como por exemplo, a
Classificação Decimal de Dewey (CDD) e outros sistemas que utilizam algum tipo de
código decimal. A classe domínio pode ser usada para sistemas que são baseados em
classificações decimais. O tipo de classificação é especificada pela propriedade
classificationType da classe Domain. Para a definição dos tipos de classificação é
utilizada a OWL.
• wnet:LexicalConcept: WordNet20 pode ser descrito como uma ferramenta que
proporciona serviços de referência lexicais via on-line. �Substantivos, verbos e
adjetivos em Inglês são organizados dentro de conjuntos de sinônimos. Cada conjunto
representa um conceito léxico. Os usuários submetem a palavra e o sistema encontra
palavras relacionadas (sinônimos, antônimos e outras). (SYNAK, 2005, p. 69,
tradução nossa). É usado como uma classe para a representação de palavras-chave em
MarcOnt. Em outras palavras podemos dizer que essa classe, funcionaria como uma
ferramenta para a representação temática do recurso informacional, ou seja, definiria o
conteúdo do recurso.
Nesse momento, retomam-se algumas questões para a justificativa de criação do
padrão de descrição bibliográfica semântica MarcOnt. Pode-se dizer que o padrão surgiu à
luz da Web Semântica, projetado para atender aos requisitos de interoperabilidade semântica
entre ambientes informacionais, por exemplo, as bibliotecas digitais. Para garantir uma
melhora na performance na manipulação de formas de representação bibliográfica e da
interação dos sujeitos com o ambiente informacional, tem-se no MarcOnt, um ponto de
partida para a integração de fontes/sistemas que se utilizam de padrões de metadados
heterogêneos, potencializando a busca e a recuperação dos recursos informacionais, e
possibilitando a preservação, o uso e o reuso das informações de forma mais efetiva numa
única interface. 20 Informações mais detalhadas podem ser encontradas no site: Disponível em: <http://wordnet.princeton.edu/>. Acesso em: 22 out. 2007.
137
Assim, trataremos agora da aplicação do MarcOnt em um ambiente informacional
específico, a biblioteca digital semântica denominada JeromeDL, onde pode-se verificar como
está atuando em sua aplicabilidade e funcionalidade, fornecendo modelos de experiências e
testes.
5.4 Biblioteca Digital Semântica JeromeDL
Conforme abordado no capítulo 3 sobre as bibliotecas digitais, vale dizer que essas
têm muito a contribuir com as questões da padronização da representação dos recursos
informacionais, constituindo-se de uma ambiência pré-estabelecida (metadados) de acordo
com regras e normas que permeiam a construção dos recursos, possibilitando um maior nível
de interoperabilidade entre ambientes informacionais digitais.
Entretanto, com a finalidade de potencializar os serviços que uma biblioteca digital
pode oferecer e de acordo com as novas esferas tecnológicas trazidas no bojo da chamada
Web Semântica, evidencia-se várias tentativas de melhorar os sistemas de busca e navegação
por meio da agregação de tecnologias semânticas aos recursos informacionais, de forma a
obter resultados mais significativos pelos usuários.
Nesse sentido, para acompanhar esse cenário de evoluções tecnológicas e como um
modelo de aplicação do padrão de descrição semântica MarcOnt, surge a Biblioteca Digital
Semântica JeromeDL como uma ambiência que visa ou procura, por meio da semântica,
possibilitar um refinamento nos mecanismos de busca.
A Biblioteca Digital Semântica JeromeDL originou-se de experiências e testes da tese
de Sebastian Ryzard Kruk na Gdańsk University of Technology (GUT) � Polônia, em
2004/2005 contando com a participação e a supervisão da Digital Entreprise Research
Institute (DERI), em Galway, na Irlanda, que é uma parte da National University of Ireland,
na mesma cidade. JeromeDL consiste numa biblioteca digital semântica que utiliza as
principais tecnologias abordadas na Web Semântica.
138
A descrição dos recursos informacionais tem como base a arquitetura de metadados
RDF e a realização de buscas semânticas baseadas em ontologias, o que significa a
possibilidade de melhorias na busca e na usabilidade com o estabelecimento de um maior
nível de interoperabilidade entre ambientes informacionais digitais. (KRUK; DECKER;
ZIEBORAK, 2005, tradução nossa).
Nesse momento, é oportuno tecer algumas diferenças no que tange aos aspectos
conceituais entre biblioteca digital e biblioteca digital semântica. Pautado nos autores
supracitados, podemos dizer que uma biblioteca digital semântica pode ser considerada aquela
que:
• Tem a possibilidade de integrar/compartilhar informações baseadas em diferentes
padrões de metadados com anotações semânticas dos recursos e perfil dos usuários;
• Pode prover níveis de interoperabilidade não somente com bibliotecas digitais, mas
com outros sistemas de informação, por exemplo, Repositórios Digitais, com
metadados distintos;
• Possibilita a construção de interfaces mais amigáveis ao usuário com relação às
buscas e à navegação determinadas pela semântica.
• Pode apresentar-se como um modelo no que concerne à transição de informações
estáticas (somente armazenadas em bibliotecas digitais convencionais) para uma
estrutura dinâmica e colaborativa na formação e geração de espaços de construção de
conhecimento.
Kruk (2006a, tradução nossa) elucida que as bibliotecas digitais, as quais se têm e
conhecemos hoje, trazem descrições semânticas básicas e que juntamente com anotações
semânticas comunitárias (perfil do usuário) e dos recursos informacionais, podem trazer a
próxima ou a nova geração da Internet.
Isso nos leva a inferir que as bibliotecas digitais apresentam-se com uma nova visão,
caracterizadas como ambientes sociais colaborativos com o uso e o reuso de informações
semânticas, indo ao encontro dos princípios do modelo que vem se constituindo hoje, como
Web 2.0.
139
Pensando nisso, a Biblioteca Digital Semântica JeromeDL foi projetada a fim de
atender desde os profissionais responsáveis pela confecção dos recursos informacionais até os
usuários que irão se beneficiar e fazer uso desses recursos. Assim, de acordo com Kruk,
Decker e Zieborak (2005, p. 2, tradução nossa) foram traçados os principais requerimentos
para JeromeDL, tais como:
• Suportar a herança de bibliotecas clássicas/convencionais (ex., livros antigos), • Prover características de navegação orientadas ao usuário, • Permitir busca eficiente, • Suportar múltiplos formatos dos recursos, • Possibilitar a comunicação com outros sistemas de biblioteca digital, • Utilizar resultados dos últimos resultados na Web Semântica bem como a comunicação e o gerenciamento da informação nas pesquisas.
Esses requerimentos contemplam inicialmente, a arquitetura estabelecida para a
Biblioteca Digital Semântica JeromeDL, que pode ser visualizada de acordo com a figura 21,
a seguir.
FIGURA 21: Arquitetura da Biblioteca Digital Semântica JeromeDL.
Fonte: Kruk, Decker e Zieborak (2005, p. 3)
140
O produto central da JeromeDL implementa características dos aspectos dos recursos,
busca e navegação, o gerenciamento do perfil dos usuários (baseado em FOAF) e o
gerenciamento dos recursos informacionais. A descrição e o conteúdo dos recursos, por
exemplo, o índice (do texto completo) do conteúdo dos recursos, descrições bibliográficas em
MARC21 e BibTeX e a descrição semântica de acordo com a ontologia Jerome, estão
empregadas em vários sistemas de armazenamento. (KRUK; DECKER; ZIEBORAK, 2005,
tradução nossa).
A parte dos recursos textuais do sistema da Biblioteca Digital JeromeDL tem sido
designada para também assegurar o escaneamento de coleções de livros antigos e outros
recursos binários, como por exemplo, apresentações em Macromedia Flash. Uma ligação na
comunicação no ambiente Web fora do sistema possibilita a busca em uma rede de bibliotecas
digitais. (KRUK; DECKER; ZIEBORAK, 2005, tradução nossa).
O conteúdo da base de dados do sistema JeromeDL está traduzido em XHTML
seguindo uma solicitação em HTTP. Para administrar o conteúdo da base de dados e
descrever os recursos em uma aplicação de base de dados autônoma, é utilizado o
JeromeAdmin. JeromeDL comunica-se diretamente com o sistema principal pelo protocolo
RMI (Remote Method Invocation). O conteúdo da base de dados JeromeDL pode ser buscado
não somente pelas páginas Web da biblioteca digital, mas também em outras bibliotecas
digitais e outras aplicações Web, um serviço especial de interface Web baseado no Extensible
Library Protocol (ELP). (KRUK; DECKER; ZIEBORAK, 2005, tradução nossa).
Embora as bibliotecas construídas (convencionais), foram inicialmente criadas para
lidar somente com livros, os usuários encontravam usualmente uma remota e ampla variedade
de recursos. Segue o mesmo paradigma o sistema JeromeDL, suportando não somente
recursos em formatos PDF ou RTF, mas também outro conteúdo multimídia (ex.,
apresentações em Flash). Para suportar ambos, flexibilidade e especialização no manusear os
recursos, cada recurso tem sua própria descrição de sua estrutura. (KRUK; DECKER;
ZIEBORAK, 2005, tradução nossa).
É possível o recurso estar armazenado no formato XSL: FO o que permite a leitura
para escolher entre diferentes tipos de tradução, ex. PDF, RTF, HTML. O conteúdo dos
recursos pode ser adicionalmente protegido desde a impressão ou cópia (se aplicável) com o
141
ACL (Access Control List) anexado ao recurso. (KRUK; DECKER; ZIEBORAK, 2005,
tradução nossa).
Freqüentemente um usuário de uma biblioteca digital que busca por informações
específicas é �inundado� com uma abundância de resultados inadequados na elaboração da
pergunta. Muitas tentativas têm sido feitas para limitar o número de respostas do processo de
pergunta. A pesquisa na usabilidade das características da busca cobre uma larga variedade de
aproximações, desde palavras com sentido ambíguo baseadas nas expressões e léxicos
booleanos até a dinâmica de perguntas usadas nas interfaces. (KRUK; DECKER;
ZIEBORAK, 2005, tradução nossa).
Desde prover o acesso aos recursos na base de dados, um sistema de biblioteca digital
espera fornecer características da busca e da navegação dos recursos. A Biblioteca Digital
Semântica JeromeDL almeja agregar alta qualidade nas características de busca e navegação
do sistema. A diversidade de padrões de metadados utilizado no sistema da biblioteca digital
reflete a sofisticação de algoritmos de busca. Para alcançar o conjunto de resultados (os mais
próximos/exatos) às exigências dos usuários, conceitos de conteúdo, significado e
preferências do usuário têm sido adaptados aos algoritmos de busca semântica. Enquanto o
usuário está navegando, a base de dados da JeromeDL possibilita anotar semanticamente o
perfil do usuário de acordo com informações estatísticas geradas pelo próprio sistema. Então,
os perfis são utilizados no processo de busca. (KRUK; DECKER; ZIEBORAK, 2005,
tradução nossa).
Uma das maneiras para adicionar recursos à Biblioteca Digital Semântica JeromeDL e
descrevê-los é usando a aplicação autônoma de administração de Java � JeromeAdmin. A
aplicação JeromeAdmin fornece uma interface para gerar a descrição dos recursos e o
uploading do conteúdo dos recursos para o sistema da base de dados. Com JeromeAdmin um
administrador/criador pode anexar a descrição bibliográfica em MARC21 e BibTeX bem
como anotações ontológicas para o recurso. Os usuários podem submeter também recursos ao
sistema de JeromeDL. Neste caso, um dos dois estágios do processo é requerido. Primeiro um
usuário submete o conteúdo do recurso e o conjunto de descrições. Então, o administrador
aprova e finaliza a submissão do recurso à base de dados. (KRUK; DECKER; ZIEBORAK,
2005, tradução nossa).
142
Para melhor entender-se o funcionamento da arquitetura da Biblioteca Digital
Semântica JeromeDL, bem como a estrutura MarcOnt ,vejamos como ela está disponibilizada
para os usuários, a seguir.
5.4.1 Formas de representação dos recursos informacionais na Biblioteca Digital
Semântica JeromeDL
Ao se pensar em formas de representação da informação registrada, como visto no
capítulo 4, além da descrição e da representação dos recursos em um ambiente informacional,
de acordo com normas e padrões que norteiam sua construção, deve-se também pensar nas
formas de apresentação do recurso informacional, de forma a possibilitar uma boa usabilidade
dos sujeitos que se apropriarão das informações no sistema.
Assim, as seções seguintes apresentarão de uma forma sucinta o ambiente da
Biblioteca Digital Semântica JeromeDL, apontando como estão construídas as formas de
representação dos recursos informacionais, bem como estão distribuídas ou apresentadas para
os usuários.
FIGURA 22: Interface de apresentação da Biblioteca Digital Semântica JeromeDL. Fonte: Disponível em: <http://www.jeromedl.org/>. Acesso em: 31 out. 2007.
143
A figura 22 apresenta a interface de apresentação da biblioteca digital semântica, onde
constam alguns links sobre a documentação da biblioteca, as formas de acesso e manuseio aos
recursos informacionais, projetos relacionados à biblioteca, os órgãos e instituições que estão
vinculados à JeromeDL, uma breve contextualização da criação da biblioteca etc.
FIGURA 23: Formas de busca e tipos documentais.
Fonte: Disponível em: <http://library.deri.ie/?lang=pt_BR>. Acesso em: 31 out. 2007.
A figura 23 descreve outra interface que contempla as formas de busca aos recursos
informacionais, bem como os tipos documentais que estão armazenados na biblioteca digital
semântica. Vale destacar que no menu da biblioteca, tem-se uma opção de Idiomas, onde o
usuário pode escolher em qual idioma ele deseja visualizar a interface da biblioteca. Vale
destacar que nesse caso, nos reportaremos ao idioma português.
Um dos grandes desafios da iniciativa da Biblioteca Digital Semântica JeromeDL, é
oferecer e estender seus serviços a uma ampla variedade de países com a finalidade de se
tornar uma biblioteca universal. O que se pode nesse momento, fazer uma analogia com os
sonhos e ideais do visionário Paul Otlet (1934), que vislumbrava uma biblioteca universal,
onde todos, sem a limitação de espaço e tempo, pudessem ter o acesso aos registros do
conhecimento.
144
Ainda com relação a essa interface pode-se destacar as formas de busca aos recursos
informacionais constando-se de três opções: simples, avançada e semântica. As buscas
simples e avançadas constam de operadores booleanos encontrados em qualquer tipo de
biblioteca digital.
Vale atentar-nos para um diferencial na busca avançada onde se têm opções de
pesquisarmos pelo conteúdo do recurso informacional, bem como pelo tipo de padrão de
metadado (Dublin Core, BibTeX, MARC21), o que pode ser visto na figura 24, a seguir.
FIGURA 24: Interface de busca avançada. Fonte: Disponível em: <http://library.deri.ie/search?type=advanced>. Acesso em: 31 out. 2007.
O grande impacto e o diferencial está na busca semântica, que se pode visualizar de
acordo com a figura 25, a seguir.
metadados
145
FIGURA 25: Interface de Busca semântica.
Fonte: Disponível em: <http://library.deri.ie/search?type=semantic>. Acesso em: 31 out. 2007.
O desafio para a Biblioteca Digital Semântica JeromeDL está justamente em fornecer
informações semânticas que outras bibliotecas digitais não oferecem. Na opção Select
template, o usuário pode optar pelas seguintes opções: Exiba todos os recursos na biblioteca,
Exiba todos os recursos criados por..., Exiba todos os recursos criados por meus amigos,
Exiba todos os recursos criados por alunos de... Pode-se dizer que num primeiro momento a
biblioteca digital semântica funciona como um ambiente colaborativo, como mencionado nas
seções anteriores, com a participação, não somente de profissionais (bibliotecários,
informáticos), mas também dos sujeitos (usuários) que se apropriarão dos recursos
informacionais.
Destaca-se, nesse momento, que a opção de busca semântica não está ativa e que
segundo informações do idealizador da JeromeDL, Sebastian Kruk (2006a) encontra-se ainda
em fase de experimentos e testes para um funcionamento breve.
146
Com relação aos tipos documentais que estão armazenados na Biblioteca Digital
Semântica JeromeDL, escolhemos um recurso do tipo livro para analisar-se sob o prisma da
Catalogação como o recurso estaria representado e apresentado ao usuário.
FIGURA 26: Recurso informacional Livro. Fonte: Disponível em: <http://library.deri.ie/preview?show=book>. Acesso em 31 out. 2007.
A figura 26 apresenta algumas informações do recurso, como por exemplo, as
palavras-chave, descrições adicionais do recurso e uma opção de apresentação do recurso de
acordo com um padrão de metadado numa única interface .
Além disso, a Biblioteca Digital Semântica JeromeDL possibilita a apresentação dos
recursos informacionais no momento da busca e sua visualização num padrão de metadado de
acordo com a preferência do usuário, conforme pode ser visto na figura 27, logo em seguida.
147
FIGURA 27: Formas de apresentação dos recursos informacionais Fonte: Disponível em:
<http://library.deri.ie/servlet/mms?uri=http://books.deri.ie/resource/oSdCFq9y>. Acesso em: 31 out. 2007.
A figura 27 mostra um recurso informacional apresentado ao usuário numa única
plataforma contemplando os padrões de metadados vislumbrados na iniciativa MarcOnt
(BibTeX, BibTeXML, BibTeXRDF, Dublin Core, MARC21, MARCXML, MARCRDF e
MarcOnt) uma vez que temos nessa interface a possibilidade de interoperabilidade entre
padrões de metadados heterogêneos.
Assim, a figura 28 mostrará a apresentação da representação de um recurso
informacional no padrão de descrição bibliográfica semântica MarcOnt.
148
FIGURA 28: Representação de um recurso informacional em MarcOnt. Fonte: Disponível em: <
http://library.deri.ie/servlet/mms?uri=http://books.deri.ie/resource/oSdCFq9y>. Acesso em: 31 out. 2007.
De acordo com a figura 28, pode-se considerar que o MarcOnt, utiliza-se para o
armazenamento das suas descrições a arquitetura de metadados RDF, possibilitando um nível
de interoperabilidade entre os campos do registro, bem como a possibilidade de
compartilhamento entre outras bibliotecas digitais e sistemas de informação que fazem uso de
padrões de metadados heterogêneos.
Faz-se necessário tecermos alguns comentários, pautados e vivenciados na prática
biblioteconômica, mais especificamente à luz dos fundamentos da Catalogação, que permite
como visto no capítulo 4, a padronização da descrição e da representação dos recursos
informacionais.
Um dos pontos que vale a pena ser destacado é como se apresenta uma descrição em
MARC21, por exemplo, na Biblioteca Digital Semântica JeromeDL. Em outras buscas
realizadas na biblioteca com a finalidade de verificar a representação e a descrição de um
recurso informacional, foram observadas algumas falhas nesses quesitos. Encontramos um
registro MARC21 que possuía mais de um autor, responsável pela obra. E o mais curioso era
que o campo 100 (Entrada Principal � Nome Pessoal) do registro estava repetido. De acordo
149
com a estrutura MARC, este campo não se repete, pois de acordo com os esquemas de
descrição AACR2, que antevêem ou norteiam a construção do campo numa estrutura legível
por máquina MARC, seria necessário a criação de uma entrada secundária de autoria, que no
registro MARC é dado pelo campo 700 (Entrada Secundária � Nome Pessoal). Vale relembrar
também que até o presente momento, não se encontram disponíveis representação e descrição
em MARC21 na sua totalidade, julgando relevante, segundo Kruk (2007) apenas os campos
de autoria (100) e título (245) para a busca e a recuperação dos recursos informacionais.
Dessa forma, o bibliotecário é considerado protagonista na construção de regras para o
estabelecimento da semântica para outros campos do registro MARC21, podendo estes
compartilhar informações semânticas não só num mesmo registro/estrutura, mas também com
outros padrões de metadados e em sistemas diferentes.
Assim, pode-se dizer e reforçar a tese de que para um estabelecimento mais efetivo de
representações na estrutura MarcOnt e para a funcionalidade da Biblioteca Digital Semântica
JeromeDL, é imprescindível a participação ativa e direta do profissional bibliotecário, pois
este é o sujeito que possui as técnicas e as habilidades necessárias para um tratamento das
informações de forma padronizada, pautada em normas e regras na construção e confecção de
registros bibliográficos. O bibliotecário em consonância com profissionais da Computação e
outros atores envolvidos no processo, podem propiciar a clareza nos serviços oferecidos pela
biblioteca digital semântica, no atendimento e na satisfação nas solicitações de busca
requeridas pelo usuário.
Ainda nesse sentido, pode-se dizer que, para o funcionamento pleno do padrão de
descrição semântica MarcOnt, faz-se necessário que este compreenda e absorva a égide dos
conceitos oriundos da Catalogação, uma vez que esta proporcionará e subsidiará os elementos
fundamentais para a construção padronizada da representação. Além disso, a possibilidade de
permitir uma melhora na performance de interoperabilidade semântica entre os padrões de
metadados vislumbrados em JeromeDL e outros sistemas e ambientes informacionais digitais,
de forma a garantir a apresentação dos recursos para a preservação, o uso e o reuso das
informações para o usuário final.
150
5.5 Portal Colaborativo MarcOnt: um modelo de aplicação para recursos
informacionais
Conforme mencionado nesse capítulo, a proposta MarcOnt caminha para os novos
paradigmas tecnológicos que vêem se constituindo hoje: Web Semântica, Bibliotecas Digitais
Semânticas, Repositórios Institucionais Digitais, Web 2.0 etc. E o grande desafio é oferecer
aos usuários de informações serviços que os atendam com qualidade e rapidez no acesso e no
uso dessas informações.
Nesse contexto, o padrão de descrição semântica MarcOnt emerge-se como uma
ferramenta tecnológica que pode propiciar a semântica às informações, no que tange às
formas de representação da informação registrada, de forma a atender uma diversidade de
usuários num único ambiente.
Pensando nisso, uma das iniciativas de MarcOnt, foi desenvolver um portal para que
os usuários, profissionais de diversas áreas, pesquisadores etc., pudessem participar
ativamente no processo de construção de representações e descrições semânticas, funcionando
como um ambiente colaborativo, a fim de testar as potencialidades do padrão de descrição
semântica MarcOnt.
Assim, as seções seguintes, apresentam os cenários de construção e a aplicação da
ferramenta MarcOnt, com o objetivo de reforçar sua relevância e a possibilidade de testes e
experimentos nessa ambiência.
Vale dizer que não é nosso objetivo nesse momento, relatar detalhadamente as
ferramentas e os instrumentos tecnológicos desenvolvidos no Portal MarcOnt, mas sim
apresentarmos um modelo e um sistema que já se encontram disponíveis para uso, aberto à
comunidade. Faz-se necessário um estudo de forma mais aprofundado sobre tais tecnologias
de modo a testar suas funcionalidades e potencialidades em aplicações efetivas.
151
FIGURA 29: Interface de entrada no Portal MarcOnt. Fonte: Disponível em: <http://portal.marcont.org/>. Acesso em 31 out. 2007
A figura 29 apresenta a interface inicial mostrando que o usuário ao entrar no sistema,
deverá cadastrar-se por meio de um login e uma senha, que atualmente, o próprio sistema
fornece aos usuários encontrados na página do Portal.
FIGURA 30: Principais ferramentas para a construção de descrições semânticas. Fonte: Disponível em: <
http://portal.marcont.org/main.jsf;jsessionid=1FF0FCA2148B85E6D27EFDECC8CB7B2D>. Acesso em: 31 out. 2007.
152
Uma vez cadastrados e conectados ao sistema, os usuários são remetidos
automaticamente para a interface onde estão disponibilizadas as ferramentas tecnológicas para
a construção de descrições bibliográficas semânticas, conforme pode ser visto na figura 30.
FIGURA 31: Ambiente das regras gerais de transformação.
Fonte: Disponível em: < http://portal.marcont.org/rulegenerator/frameForm.jsp>. Acesso em: 31 out.
2007.
A figura 31 nos traz as regras e as ferramentas para a construção das descrições
semânticas pautadas em algumas recomendações, tais como:
• Source ontology: nessa modalidade o usuário define uma classe (assunto tratado), bem
como as propriedades, os atributos etc. que contemplarão a descrição semântica.
• Translation rules: nessa parte os usuários definem os namespaces, ou seja, regras para
validar o endereço URI da ontologia, com alternativas de adicionar novas regras ou
mudá-las quando necessário. Lembrando sempre que as estruturas que comportam as
descrições estão calcadas na linguagem computacional XML e na arquitetura de
metadados RDF.
153
FIGURA 32: Criação de múltiplas descrições. Fonte: Disponível em: < http://portal.marcont.org/diff.jsf>. Acesso em: 31 out. 2007.
De acordo com a figura 32, podem-se criar vários tipos de descrições, atribuindo a
cada uma delas as regras, as classes, as propriedades, de modo que elas possam interagir num
mesmo ambiente. Além disso, o sistema possibilita a apresentação das descrições na opção
SHOW DIFF, o que podemos verificar na figura 33, a seguir.
FIGURA 33: Apresentação do recurso em forma de tripla.
154
Fonte: Disponível em: <http://portal.marcont.org/diff.jsf>. Acesso em: 31 out. 2007. Conforme apresentado na figura 33, o sistema permite uma visualização do recurso no
processo de construção em forma de tripla, identificando o subject, predicate e object, onde o
criador do recurso tem as possibilidades de adicionar uma nova tripla, bem como removê-la.
Destaca-se que para a construção das descrições é utilizado à linguagem OWL, uma
recomendação do W3C.
FIGURA 34: Submissão da criação da descrição do recurso ao comitê de avaliação. Fonte: Disponível em: <http://portal.marcont.org/graph.jsf>. Acesso em: 31 out. 2007.
No momento de criação da descrição do recurso informacional, os sujeitos
construtores podem, conforme visto na figura 34, trabalharem em um mesmo ambiente,
facilitando a visualização das diferentes características e etapas da confecção da
representação, tais como:
• EDITOR: permite a consulta nas definições da classe, das propriedades e dos
namespaces definidos e utilizados na construção da descrição.
• CODE: define o tipo de linguagem utilizado na construção da descrição do recurso,
como por exemplo, OWL.
• TRIPLES: disponibiliza aos construtores da descrição do recurso as características dos
tipos: subject, predicate e object.
155
• GRAPH: apresenta a descrição do recurso informacional na forma de grafo.
Definida a descrição do recurso informacional, os sujeitos encaminham-na para um
comitê de avaliação, com as possibilidades de sugestões para possíveis alterações,
descrevendo os níveis de descrição com campos para comentários.
FIGURA 35: Verificação das normas exigidas para construção da descrição. Fonte: Disponível em: <http://portal.marcont.org/new.jsf>. Acesso em: 31 out. 2007.
Nessa apresentação de acordo com a figura 35, quando os sujeitos submetem as
descrições criadas nessa interface, o sistema verifica alguns elementos para analisar se são
compatíveis com as normas que permeiam a construção das descrições semânticas, como por
exemplo: se a representação da descrição obedece ao quesito da estrutura do tipo XML ou
está associada à linguagem OWL.
156
FIGURA 36: Acesso aos recursos informacionais. Fonte: Disponível em: <http://portal.marcont.org/repository.jsf>. Acesso em: 31 out. 2007.
A interface final do sistema apresenta um repositório onde estão armazenadas e
disponibilizadas as descrições para o uso e o reuso das informações; oferece as opções de
busca por palavras-chave ao recurso, o nível (classe) do recurso, os comentários por parte da
comunidade, a data de criação do recurso, permitindo ainda visualizar ou editar um modelo de
descrição (View or edit selected model).
Conforme pôde-se observar até o presente momento, o padrão de descrição semântica
MarcOnt vislumbra ser uma nova tendência para os ambientes informacionais digitais de
modo a permitir a descrição semântica dos recursos informacionais e a possibilidade de
permitir a interoperabilidade semântica, não somente entre os campos de um registro
bibliográfico, mas também entre outros padrões de metadados em plataformas e sistemas
heterogêneos.
Tem-se a Biblioteca Digital Semântica JeromeDL, juntamente com o Portal MarcOnt
a possibilidade de sistemas que apresentam-se como ambiências propícias no sentido de
compartilhar e colaborar com representações e descrições bibliográficas semânticas, onde os
sujeitos psico-sociais têm a possibilidade de interação com o ambiente na construção das
formas de representação dos recursos informacionais.
157
A partir das apresentações anteriormente explicitadas, a seção seguinte mostrará os
resultados alcançados nesta pesquisa, bem como as perspectivas para análise mais
aprofundada sobre o padrão de descrição bibliográfica semântica MarcOnt, com relação à
outros tipos de padrões de metadados.
5.6 À guisa de resultados
Tomando como base os capítulos apresentados até agora, principalmente com relação
à construção de formas de representação da informação, e a necessidade de padronização dos
recursos informacionais, a fim de garantir o acesso de maneira mais otimizado nos ambientes
informacionais digitais e a possibilidade de interoperabilidade semântica entre ambientes e
sistemas informacionais heterogêneos, foi possível identificar numa análise primeira do
MarcOnt, categorias para uma avaliação futura mais aprofundada e sistemática do padrão,
com relação ao padrão de metadados MARC21, bem como a performance de uso e de
aplicação em ambientes informacionais, atualmente. Dentre essas categorias pode-se destacar:
• Estrutura
• Número de campos e tipos
• Conceitos
• Metadados descritivos
• Níveis de Interoperabilidade
• Elementos de preservação
• Tecnologias envolvidas
• Tipos documentais contemplados
• Pontos de acesso aos recursos informacionais
Acredita-se, que estes elementos podem permitir e subsidiar uma discussão de forma
mais acurada no entendimento do padrão de descrição semântica MarcOnt, bem como sua
aplicação nos ambientes informacionais digitais, à luz dos princípios da Catalogação e na
158
otimização dos processos de representação, de descrição, de recuperação, de acesso, de
preservação, de uso e de reuso das informações.
Assim, o capítulo seguinte apresenta as considerações finais, bem como os resultados,
impressões, observações e reflexões propostas pela pesquisa, e os novos horizontes acerca dos
ambientes informacionais digitais.
159
Capítulo 6
CONSIDERAÇÕES FINAIS
160
6 CONSIDERAÇÕES FINAIS
�O futuro é uma astronave que tentamos pilotar�. Toquinho
A pesquisa ora concluída procurou revisitar as Tecnologias da Informação e
Comunicação, bem como seu desenvolvimento ao longo dos tempos, atuando significamente
no campo da Ciência da Informação enquanto instrumentos na facilitação dos processos
informacionais e na construção de ambientes informacionais. Na origem desses movimentos
destacou-se o pensamento de visionários, como Paul Otlet, Vannevar Bush, Ted Nelson etc.,
que procuraram criar e desenvolver instrumentos tecnológicos, na tentativa de padronizar e
garantir o tratamento dos recursos informacionais, de modo que pudessem ser processados e
disponibilizados, para uma busca e uma recuperação mais efetivas. Constatou-se que as
ferramentas concebidas e desenvolvidas, tais como, o Memex e o hipertexto, contribuíram e
serviram como modelo para o processamento dos recursos informacionais conhecidos hoje.
A presente dissertação, a partir de um estudo exploratório, envolvendo integração de
áreas disciplinares e ferramentas, deu origem a importantes constatações, a seguir
enumeradas:
Que a sociedade contemporânea vem sofrendo modificações constantes, nos mais
variados segmentos, político, social, econômico, cultural, ecológico etc., onde a informação é
considerada elemento chave em sua constituição e condição ímpar da pós-modernidade na Era
do Conhecimento;
Que dentre essas modificações, destaca-se a de esfera tecnológica, uma vez que a
informação vem sendo analisada numa perspectiva de formação de ambientes informacionais
digitais. Nesse contexto, as Tecnologias da Informação e Comunicação � TICs - vêem
permeando tais ambientes e, sob essa óptica, faz-se necessário um repensar sobre a
informação naquilo que diz respeito ao tratamento documentário, notadamente nos processos
de armazenamento, descrição, representação, preservação, uso e reuso das informações;
161
Que a Ciência da Informação e a Biblioteconomia apresentam-se, nesse sentido, como
áreas que têm muito a contribuir para o desenvolvimento de ambientes informacionais
digitais, uma vez que elas oferecem respaldo indispensável, com seus aportes teóricos e
metodológicos, na padronização das informações registradas;
Que as TICs causaram mudanças significativas no campo da Ciência da Informação,
principalmente no que diz respeito aos paradigmas epistemológicos da área. Trata-se,
portanto, de um campo ou disciplina em constituição, que utiliza aportes teóricos e
metodológicos de outros campos científicos em busca de cientificidade;
Que as TICs podem ser consideradas instrumentos pautados em processos e
metodologias que atuam e norteiam o fazer profissional dos profissionais da Ciência da
Informação e que possibilitam a implementação efetiva das idéias de Otlet (1934) e de Bush
(1945);
Que as TICs influenciam a construção de formas de representação da informação
registrada, tomando como modelo de aplicação as bibliotecas, sejam essas convencionais ou
digitais, que se apresentam como redes informacionais estruturadas com modelos de
ambientes colaborativos;
Que sempre foi uma preocupação, desde as primeiras tentativas de registro do
conhecimento em um suporte informacional, armazenar e representar a informação registrada
para que pudesse ser preservada e utilizada;
Que a Catalogação, enquanto instrumento de descrição da Biblioteconomia, tem um
papel decisivo na manipulação de formas de representação bibliográficas e da interação de
sujeitos psico-sociais com o ambiente informacional. Nesse contexto, especificamente, a
pesquisa se caracterizou pelo estudo da construção de formas de representação da informação,
a partir da análise do processo de catalogação e da construção do registro bibliográfico, como
elemento que agrega a representação de forma e conteúdo do recurso informacional na
confecção de metadados. Foram descritos alguns padrões de metadados, tais como MARC21,
MARCXML, BibTeX, e Dublin Core que são apontados hoje pela literatura científica e
aplicados em ambientes informacionais específicos, como as bibliotecas digitais;
162
Que a relação entre outros padrões de metadados, tais como o MARC21 e o MarcOnt,
não tem em seus objetivos, transformar a estrutura pré-estabelecida do MARC21 para a
linguagem da ontologia, mas fornecer a informação semântica à descrição dos recursos, de
modo a oportunizar uma compreensão pela máquina/computador;
Que se faz necessário a criação ou o reaproveitamento de teorias e metodologias
sedimentadas e cristalizadas da Biblioteconomia e da Ciência da Informação, no tocante às
questões de descrição dos recursos informacionais para um estabelecimento mais efetivo da
construção de formas de representação em ambientes informacionais digitais;
Que os metadados são considerados uma condição sine qua non para a resolução de
problemas de descrição e posteriormente de recuperação de informações nos ambientes
informacionais digitais, tais como as bibliotecas digitais e no contexto Web;
Que as bibliotecas digitais, enquanto estruturas pré-estabelecidas, consideradas
ambientes propícios para a recuperação de informações, têm na utilização de metadados a
padronização das formas de representação e a possibilidade de garantia de interoperabilidade
entre sistemas, favorecendo a integridade e a acessibilidade dos recursos informacionais de
forma eficiente pelo usuário final;
Que as bibliotecas digitais encontram-se como ambiências colaborativas para a
constituição de novos ambientes informacionais no cenário atual, tais como, Web Semântica,
Repositórios Institucionais, Web 2.0 e Bibliotecas Digitais Semânticas;
Que no âmbito da Web Semântica, por exemplo, é condição elementar que os
computadores/máquinas tenham acesso às coleções estruturadas de informações (metadados)
e regras de inferência (ontologias) que permitam representar explicitamente a semântica dos
recursos informacionais, para um possível uso e reuso das informações. Entretanto, se
considerarmos que a Web Semântica ainda não está consolidada, não possuindo um arcabouço
teórico sedimentado e aplicações efetivas, vislumbrada ainda numa dimensão �anímica�, fica
evidente que os aportes metodológicos e as ferramentas tecnológicas trazidas no bojo da
Ciência da Informação, podem contribuir no que concerne ao tratamento informacional dos
recursos informacionais digitais bem como de seus conteúdos, de forma a garantir a
interoperabilidade semântica entre ambientes informacionais digitais;
163
Que se destacou instrumentos e ferramentas tecnológicas surgidos no bojo da Web
Semântica para a representação e a descrição de forma e conteúdo dos recursos
informacionais digitais, ressaltando-se o MarcOnt Initiative;
Que o padrão descrição bibliográfica semântica MarcOnt surgiu à luz da Web
Semântica, com a finalidade de atender aos requisitos de interoperabilidade semântica entre os
ambientes informacionais digitais, tais como as bibliotecas digitais. Nesse contexto, depois
das experiências na Biblioteca Digital Semântica JeromeDL, decidiu-se em criar uma
ontologia bibliográfica que pudesse contemplar os aspectos de forma e de conteúdo dos
recursos informacionais, a fim de resolver os problemas de representação e de descrição dos
recursos, na tentativa de agregar semântica à descrição das informações;
Que o padrão de descrição semântica MarcOnt, é um instrumento tecnológico que no
contexto das bibliotecas digitais e da Web de um modo geral, visa ser uma ferramenta capaz
de oportunizar ao tratamento dado aos recursos informacionais uma descrição de forma e de
conteúdo legível por máquinas com a possibilidade de resultados compreensíveis aos
humanos para a apresentação das informações com vistas a uma recuperação mais eficiente.
Além da garantia da apresentação das informações para o uso, a preservação e o reuso para os
usuários;
Que se tem no padrão de descrição bibliográfica semântica MarcOnt um ponto de
partida par a integração de fontes/sistemas que se utilizam de padrões de metadados
heterogêneos, no que tange a uma melhora na performance na manipulação de formas de
representação bibliográfica e da interação dos sujeitos com o ambiente informacional;
Que o padrão de descrição bibliográfica semântica MarcOnt assume um papel chave
na evolução e na construção de bibliotecas digitais semânticas, uma vez que tem a
possibilidade de intercambiar informações semânticas, não somente entre padrões de
metadados já consolidados, mas também a possibilidade de interoperabilidade semântica entre
outros ambientes informacionais;
Que se vive atualmente uma mudança de paradigmas e novos horizontes se abrem à
Catalogação bem como novas tendências e novos olhares para os registros bibliográficos no
século XXI;
164
Que os Requisitos Funcionais para Registros Bibliográficos � FRBR, os padrões de
metadados já consagrados na área de Biblioteconomia, como por exemplo, MARC21,
juntamente com o padrão de descrição bibliográfica semântica MarcOnt, atuam em sinergia,
pois podem possibilitar uma maior potencialidade nos relacionamentos entre registros
bibliográficos e uma amplitude nas solicitações de busca pelo usuário final;
Que com relação à constituição de ambientes informacionais digitais, o curso atual da
Web Semântica e da Web 2.0 devem e podem ser combinados para o desenvolvimento de
bibliotecas digitais. Portanto, o futuro das bibliotecas digitais prevê ir além da integração
(interoperabilidade) de informações, alcançando a integração com outros serviços. (KRUK,
2006b, tradução nossa);
Que as bibliotecas digitais da próxima geração, denominadas de Biblioteca 2.0 surgem
nesse cenário redesenhando os modelos convencionais com os quais estamos acostumados
atualmente. Assim, a Biblioteca 2.0 visualiza um serviço com a atuação do usuário que opere
de acordo com as suas expectativas nas bibliotecas de hoje. Nesta visão, a biblioteca torna a
informação disponível onde e sempre que o usuário a desejar. (RAMOS, 2007, tradução
nossa);
Que o padrão de descrição semântica MarcOnt vislumbra ter um papel sine qua non
nesse contexto, onde poderá contribuir com suas representações e descrições semânticas de
forma e de conteúdo num ambiente colaborativo, com a participação, não somente de
profissionais (bibliotecários, cientistas da computação etc.) mas também dos usuários que
atuam nos processos de busca e recuperação dos recursos informacionais condicionados pela
interatividade e conectividade dos novos ambientes;
Que os bibliotecários em consonância com profissionais da Computação e outros
atores envolvidos no processo, podem propiciar a clareza nos serviços oferecidos pela
Biblioteca Digital Semântica JeromeDL, para um funcionamento mais efetivo, no que
concerne ao atendimento e na satisfação nas solicitações de busca requeridas pelo usuário;
Que aos profissionais bibliotecários, cabe a competência de se atualizarem e se
adaptarem às novas realidades tecnológicas trazidas principalmente no cenário da
Catalogação. Faz-se necessária uma mudança de comportamentos, atitudes e abertura às
165
novas filosofias de compartilhamento e colaboração de idéias, num único ambiente
informacional, provendo o acesso aos recursos de maneira mais fácil, ágil e efetiva para o
usuário final;
Pode-se afirmar que as TICs têm permeando a formação de ambientes informacionais
digitais, potencializando os processos de tratamento documentário na melhoria dos serviços
oferecidos aos usuários no ambiente Web; espera-se contribuir com subsídios de cunho
teórico e metodológico para a área de Ciência da Informação, destacando o padrão de
descrição bibliográfica semântica MarcOnt, como um caminho para a melhora da
performance do instrumento tecnológico estudo no processo de recuperação da informação e
identificação do recurso informacional na Web.
Para tanto, pode-se considerar que tal padrão de descrição bibliográfica semântica:
• Apresenta-se como um novo padrão para a representação (forma e conteúdo) do
recurso informacional no contexto digital, na busca por uma descrição bibliográfica
mais completa e complexa com a possibilidade de garantir uma melhora na
performance de interoperabilidade entre sistemas e ambientes informacionais digitais.
• Pode possibilitar uma melhora na explicitação das informações de forma a permitir
uma compreensão pela máquina nas solicitações de busca para o usuário final.
• Pode possibilitar o compartilhamento de recursos entre ambientes informacionais
heterogêneos indo ao encontro da filosofia colaborativa da Web Semântica e,
recentemente, Web 2.0.
• Apresenta-se como uma ferramenta tecnológica que pode potencializar a padronização
das informações, na otimização dos processos de representação, descrição,
organização, acesso, recuperação, preservação, uso e reuso dos recursos
informacionais em distintas ambiências.
166
Vale ressaltar que mesmo sendo amplamente discutido em nível internacional e
contando com o apoio financeiro de renomados órgãos de fomento, até o presente momento,
não encontram-se relatos e experiências do padrão de descrição bibliográfica semântica
MarcOnt no Brasil.
Espera-se que a presente pesquisa contribua como uma fonte de informação
bibliográfica em Língua Portuguesa para os profissionais da área de Ciência da Informação,
no tocante às questões de representação e de descrição dos recursos informacionais e no
ensino da Catalogação nos cursos de graduação em Biblioteconomia.
Como sugestões para pesquisas futuras, pode-se destacar:
• A análise da usabilidade da Biblioteca Digital Semântica JeromeDL;
• A construção de descrições bibliográficas semânticas no Portal Colaborativo
MarcOnt, a fim de verificar suas potencialidades;
• O delineamento de outras ferramentas tecnológicas para a construção de descrições
bibliográficas semânticas pautadas em MarcOnt;
• A aplicação dos modelos de relacionamentos FRBR em construções de registros
bibliográficos no padrão de descrição semântica MarcOnt;
• A construção de uma arquitetura de serviços destacando os padrões de metadados
(MARC21, MARCXML, BibTeX, Dublin Core) com a adoção do instrumento
tecnológico MarcOnt;
• A análise detalhada entre o padrão de metadados MARC21 e MarcOnt de acordo com
as categorias de análise identificadas e definidas nessa pesquisa;
• Estudo de ontologias voltadas para os interesses específicos de sistemas de
recuperação de informações.
167
REFERÊNCIAS
168
REFERÊNCIAS ALMEIDA, M. B. Uma introdução ao XML, sua utilização na internet e alguns conceitos complementares. Ciência da Informação, Brasília, v. 31, n. 2, p. 5-13, maio/ago. 2002. ALMEIDA JÚNIOR, O. F. de. Profissional bibliotecário: um pacto com o excludente. In: BAPTISTA, S. G.; MUELLER, S. P. M. (Org.). Profissional da informação: o espaço de trabalho. Brasília: Thesaurus, 2004. p. 70-86. (Estudos avançados em Ciência da Informação, 3). ALVARENGA, L. A teoria do conceito revisitada em conexões com ontologias e metadados no contexto das bibliotecas tradicionais e digitais. DataGramaZero � Revista de Ciência da Informação, v. 2, n. 6, p. 1-21, dez. 2001. ALVARENGA, L. Representação do conhecimento na perspectiva da ciência da informação em tempo e espaço digitais. Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florinópolis, n. 15, 2003. ALVES, M. das D. R.; SOUZA, M. I. F. Estudo de correspondência de elementos de metadados: Dublin Core e MARC21. Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, v. 4, n. 2, p. 20-38, jan./jun. 2007. ALVES, R. C. V. Web semântica: uma análise focada no uso de metadados. 2005. 180 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2005. AMARAL, S. A. do. Websites: uso de tecnologias no cumprimento das funções da biblioteca. Informação & Sociedade: Estudos, João Pessoa, v. 15, n. 2, p. 15-40, jul./dez. 2005. ANDRADE, M. E. A.; OLIVEIRA, M. de. A ciência da informação no Brasil. In: CENDÓN, B. V. et al. Ciência da informação e biblioteconomia: novos conteúdos e espaços de atuação. Belo Horizonte: Editora UFMG, 2005. 143 p. p. 45-60. ARELLANO, M. A. Preservação de documentos digitais. Ciência da Informação, Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004. BARRETO, C. M. Modelo de metadados para a descrição de documentos eletrônicos na web. 1999. 189f. Dissertação (Mestrado em Ciências em Sistemas de Computação) - Instituto Militar de Engenharia, Rio de Janeiro, 1999.
169
BAX, M. P. Introdução às linguagens de marcas. Ciência da Informação, Brasília, v. 30, n. 1, p. 32-38, jan./abr. 2001. BERNERS-LEE, T. Semantic web Concepts. 2005. Disponível em: Disponível em: <http://www.w3.org/2005/Talks/0517-boit-tbl>. Acesso em: 18 out. 2007. BERNERS-LEE, T. Semantic Web - XML2000. [2005?]. Disponível em: <http://www.w3.org/2000/Talks/1206-xml2k-tbl/Overview.html>. Acesso em: 21 maio 2007. BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic web: a new form of web content that is meaningful to computers will unleash a revolution of new possibilities. Scientific American, New York, May, 2001. Disponível em: <http://www.sciam.com/2001/050lissue/0501berners-lee.html>. Acesso em: 28 jun. 2005. BORGMAN, C. L. Social aspects of digital libraries. In: WORKSHOP ON SOCIAL ASPECTS OF DIGITAL LIBRARIES, 1996, Los Angeles. Final Report� Los Angeles: UCLA/NSF, 1996. Disponível em: <http://www.lis.gseis.ucla.edu/DL>. Acesso em: 27 jul. 2006. BORLUND, P. Evaluation of interactive information retrieval systems. Àbo, Finland: Àbo Academy University, 2000. BORKO, H. Information science: what is it? American Documentation, v. 19, n. 1, p. 3-5, 1968. BOWEN, J.; ATTIG, J. RDA: resource description and access: a new cataloging standard for a digital future. [S.l.]: Music Library Association, March 3, 2007. Disponível em: <http://www.musiclibraryassoc.org/BCC/Presentations/RDA_MLA_2007.pdf>. Acesso em: 20 jun. 2007. BREY, P. The ethics of representation and action in virtual reality. Netherlands: Kluwer Academic Publishers. Ethics and Information Technology, v. 1, p. 5-14, 1999. BROOKES, B. C. The developing cognitive view in information science. International Workshop on the Cognitive Viewpoint, CC-77, p. 195-203, 1977. BUCKLAND, M. K. Information as thing. Journal of the American Society for Information Science, v. 42, p. 351-360, 1991.
170
BUSH, V. As we may think. Atlantic Monthly, v. 176, n. 1, p. 101-108, 1945. Disponível em: <http://www.theatlantic.com/unbound/flashbks/computer/bushf.htm>. Acesso em: 02 mar. 2007. CAFÉ, L. et al. Repositórios institucionais: nova estratégia para publicação científica na rede. In: ENDOCOM � Encontro Nacional de Informação em Ciências da Comunicação, 13., 2003. Anais eletrônicos... Disponível em: <http://www.intercom.org.br/papers/2003/endocom/ENDOCOM_CAFE.pdf>. Acesso em: 30 maio 2006. CAMPELLO, B. Introdução ao controle bibliográfico. 2. ed. Brasília: Briquet de Lemos/Livros, 2006. 94 p. CAMPOS, M.L.M.; CAMPOS, M.L.de A.; CAMPOS, L.M. Web semântica e a gestão de conteúdos informacionais. In: MARCONDES, C. H. et al. (Org.). Bibliotecas digitais: saberes e práticas. 2. ed. Salvador: EDUFBA; Brasília: IBICT, 2006. p. 55-74. CAPURRO, R. Epistemologia e ciência da informação. IN: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO - ENANCIB, 5., 2003, Belo Horizonte. Anais... Belo Horizonte: UFMG, 2003. 1 CD-ROM. CAPURRO, R.; HJORLAND, B. O conceito de informação. Perspectivas em Ciência da Informação, v. 12, n. 1, p. 148-207, jan./abr. 2007. CARVALHO, J. O. F. de. O papel da interação humano computador na inclusão digital. Transinformação, Campinas, v. 15, p. 75-89, set./dez. 2003. (Edição especial). CASA, M. E. Ambientes computacionais com múltiplas formas de representação. In: GONZÁLES, M. E. Q. et al. (Org.). Encontro com as ciências cognitivas. 2. ed. rev. e ampl. Marília: Faculdade de Filosofia e Ciências, 1997. p. 209-220. CASTELLS, M. A sociedade em rede � a era da informação: economia, sociedade e cultura. 4. ed. São Paulo: Paz e Terra, 2000. CASTRO, F. F. de. Conversão retrospectiva de registros bibliográficos. 2002. 87 f. Trabalho de Conclusão de Curso (Graduação em Biblioteconomia) � Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2002. CASTRO, F. F. de et al. Impactos éticos da internet e das tecnologias de informação e comunicação na atuação do profissional da informação na atualidade: a questão das
171
bibliotecas virtuais. In: ASSOCIACIÓN DE EDUCACIÓN E INVESTIGACIÓN EM BIBLIOTECOLOGÍA, ARCHIVOLOGÍA, CIENCIAS DE LA INFORMACIÓN Y DOCUMENTACIÓN DE IBEROAMÉRICA Y EL CARIBE - EDIBCIC, 7., 2006, Marília. Anais� Marília: UNESP, 2006. p. 1-16. 1 CD-ROM. CASTRO, F. F. de; SANTOS, P. L. V. A. da C. Conversão retrospectiva de registros bibliográficos. In: FUJITA, M. S. L. (Org.). A dimensão social da biblioteca digital na organização e acesso ao conhecimento: projetos, produtos e relatos de experiência. São Paulo: Sistema Integrado de Bibliotecas da USP, Dep. Técnico: IBICT, 2005. v. 2, p. 63-87. CASTRO, F. F. de; SANTOS, P. L. V. A. da C. Os metadados como instrumentos tecnológicos na padronização e potencialização dos recursos informacionais no âmbito das bibliotecas digitais na era da web semântica. Informação & Sociedade: Estudos, João Pessoa, v. 17, n. 2, p. 12-21, maio/ago. 2007. CERVO, A. L.; BERVIAN, P. A. Metodologia científica. 5. ed. São Paulo: Prentice Hall, 2003. 242 p. CUNHA, M. B. da. Desafios na construção de uma biblioteca digital. Ciência da Informação, Brasília, v. 28, n. 3, p. 257-268, set./dez. 1999. CUNHA, M. B. da. Construindo o futuro: a biblioteca universitária brasileira em 2010. Ciência da Informação, Brasília, v. 29, n. 1, p. 71-89, jan./abr. 2000. DACONTA, M. The semantic web: a guide to the future of XML, web services and knowledge management. Indianápolis, Indiana: Wiley Publishing Inc, 2003. DECLARACIÓN de Princípios Internacionales de Catalogación. 2003. 6 p. Traducción: Elena Escolano Rodríguez. Disponível em: <http://www.loc.gov/loc/ifla/imeicc/source/declaracion_2003-sp.pdf>. Acesso em 19 jun. 2007. DENCKER, A. F. M.; VIÁ, S. C. da. Pesquisa empírica em ciências humanas: com ênfase em comunicação. São Paulo: Futura, 2001. DIAS, C. Usabilidade na web: criando portais mais acessíveis. Rio de Janeiro: Alta Books, 2003. DIAS, E. J. W. Contexto digital e tratamento da informação. DataGramaZero � Revista de Ciência da Informação, v. 2, n. 5, p. 1-10, out. 2001.
172
DUBLIN Core Metadata Initiative. DCMI metadata terms. 2006. Disponível em: <http://dublincore.org/documents/dcmi-terms/>. Acesso em: 18 dez. 2007. ESTEVES, A.; SANTOS, L.; GUIMARÃES, P. XML nas bibliotecas digitais: standard. Disponível em: <http://www.bibliosoft.pt/projectoxml/_standard.htm> Acesso em 6 nov. 2002. FEDER, A. BibTeX format description. 2006. Disponível em: <http://www.bibtex.org/>. Acesso em: 12 set. 2007. FEITOSA, A. Organização da informação na web: das tags à web semântica. Brasília: Thesaurus, 2006. 132 p. FERREIRA, E. C. H. G. Geração automática de metadados: uma contribuição para a web semântica. 2006. 229 f. Tese (Doutorado em Engenharia) � Escola Politécnica da Universidade de São Paulo, São Paulo, 2006. FERREIRA, M. Introdução à preservação digital: conceitos, estratégias e actuais consensos. Guimarães, Portugal: Escola de Engenharia da Universidade do Minho, 2006. 88 p. Disponível em: <https://repositorium.sdum.uminho.pt/bitstream/1822/5820/1/livro.pdf>. Acesso em: 20 dez. 2007. FERREIRA, M. M. (Trad. e Adap.). MARC21: formato condensado para dados bibliográficos. 2. ed. Marília: UNESP-Marília-Publicações, 2002. v. 1. 286 p. FLAMINO, A. N. MARCXML: um padrão de descrição para recursos informacionais em open archives. 2006. 164 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2006. FURGERI, S. O papel das linguagens de marcação para a ciência da informação. Transinformação, Campinas, v. 18, n. 3, p. 225-239, set./dez. 2006. FURRIE, B. Understanding MARC bibliographic: machine-readable cataloging. 7th. ed. rev. Washington, D. C.: Library of Congress; Follet Software, 2003. Disponível em: <http://www.loc.gov/marc/umb/>. Acesso em: 17 jun. 2007. GILLILAND-SWETLAND, A. J. La definición de los metadatos. In: INTRODUCCIÓN a los metadatos: vías a la información digital. [S. l.]: GETTY, 1999. p. 1-9.
173
GOMES, H. E.; ZAHER, C. Da bibliografia à ciência da informação: um histórico e uma posição. Ciência da Informação, Brasília, v. 1, n. 1, p. 5-7, 1972. HAWKINS, D. T. Information science abstracts: tracking the literature of information science. Part 1: Definition and map. Journal of the American Society for Information Science and Technology, v. 52, n. 1, p. 44-53, 2001. HEDSTROM, M. Digital preservation: a time bomb for digital libraries. Computer and the Humanities, v. 31, n. 3, p. 189-202, 1997-1998. Disponível em: <http://www.uky.edu/~kiernan/DL/ hedstrom.html>. Acesso em: 03 mar. 2007. HERNÁNDEZ, T.; TOSETE HERRANZ, F. Las bibliotecas digitales y los nuevos retos en la gestión de recursos electrónicos. In: CARIDAD SEBASTIÁN, M.; NOGALES FLORES, J. T. (coord.). La información en la posmodernidad: la sociedad del conocimiento en España e Iberoamérica. Madrid: Centro de Estudios Ramón Areces, 2004, cap. 15, p. 189-204. HILDRETH, C. R. Preserving what we really want to access, the message, not the medium: challenges and opportunities in the digital age. In: HELAL, A. H.; WEISS, J. W. (Ed.). PROCEEDING OF THE INTERNATIONAL ESSEN SYMPOSIUM, 18., Proceedings�1995, Essen. Festschrift in honour of Patricia Battin. Essen: Germany Universitätsbibliothek, 1996. p. 76-95. HJØRLAND, B. Epistemology and the socio-cognitive perspective in Information Science. Journal of the American Society for Information Science and Technology, v. 53, n. 4, p. 257-270, 2002. HOUAISS, A.; VILLAR, M. de S.; FRANCO, F. M. de M. Minidicionário Houaiss da língua portuguesa. Rio de Janeiro: Objetiva, 2001. 481 p. IFLA Study Group on the Functional Requirements for Bibliographic Records. Functional requirements for bibliographic records: final report. UBCIM Publications - New Series, vol. 19. München: K. G. Saur, 1998. 136 p. Disponível em: <http://www.ifla.org/VII/s13/frbr/frbr.pdf>. Acesso em: 18 dez. 2007. INGWERSEN, P. Conceptions of Information Science. In: VAKKARI, P.; CRONIN, B. (ed). Conceptions of Library and Information Science: historical, empirical and theoretical perspectives. London: Taylor Graham, 1992. p. 299-312. INNARELLI, H. C. Preservação de acervos digitais: a fragilidade do suporte e seus elementos de preservação. In: SIMPÓSIO INTERNACIONAL DE BIBLIOTECAS DIGITAIS, 3., 2005, São Paulo. Anais eletrônicos... São Paulo: CRUESP, 2005. Disponível em:
174
<http://bibliotecas-cruesp.usp.br/bibliotecas/APRESENT/Humberto_Innarelli_H_C.pdf>. Acesso em: 12 mar. 2007. JOINT STEERING COMMITTEE FOR REVISION OF AACR. Strategic plan for RDA 2005-2008. May, 29, 2006. Disponível em: < http://www.collectionscanada.ca/jsc/docs/5strategic1rev.pdf>. Acesso em: 19 jun. 2007. KRUK, S. R. JeromeDL 2.0: a digital library on social semantic information spaces. [2006a]. Disponível em: <http://www.sebastiankruk.com/storage/presentation/jeromedl2.0stable_gut/img0.html>. Acesso em: 25 ago. 2007. KRUK, S. R. The role of ontologies in semantic digital libraries. Alicante, Spain. NKOS WORKSHOP 1., Sep., [2006b]. 30 p. Disponível em: <http://www.sebastiankruk.com/storage/presentation/nkos2006/img0.html>. Acesso em: 25 ago. 2007. KRUK, S. R. ; DECKER, S. ; ZIEBORAK, L. JeromeDL: reconnecting digital libraries and the semantic web. Chiba, Japan, May 2005. Disponível em: <http://www.marcont.org/marcont/pdf/www2005_jeromedl.pdf>. Acesso em: 14 jan. 2006. KRUK, S. R.; SYNAK, M.; ZIMMERMANN, K. MarcOnt initiative: mediation services for digital libraries. 2005a. Disponível em: <http://www.marcont.org/marcont/pdf/marcontecdl2005.pdf>. Acesso em: 16 jan. 2006. KRUK, S. R. ; SYNAK, M. ; ZIMMERMANN, K. MarcOnt initiative: integration ontology for bibliographic description formats. Madrid, 2005b. Disponível em: <http://dc2005.uc3m.es/program/presentations/Thursday%2015.%2015.30%20h%20-%20s.kruk.pdf>. Acesso em: 16 jan. 2006. LASSILA, O.; SWICK, R. R. Resource description framework (RDF) model and syntax specification. [S. l.: S. n.], 1999. Disponível em: <http://www.w3.org/TR/1999/REC-rdfsyntax- 19990222/>. Acesso em: 3 jul. 2007. LE COADIC, Y-F. A ciência da informação. 2. ed. rev. e atual. Brasília: Briquet de Lemos/Livros, 2004. 124 p. LESK, M. Practical digital libraries: books, bytes and bucks. San Francisco, CA: Morgan Kaufmann, 1997.
175
LÉVY, P. Cibercultura. São Paulo, Ed. 34, 1999. (Coleção Trans). LÉVY, P. As tecnologias da inteligência. Rio de Janeiro: Ed. 34, 2001. LIBRARY OF CONGRESS. MARC 21 concise formats. 2006. Disponível em: <http://www.loc.gov/marc/concise/concise.html>. Acesso em: 30 jul. 2007. LOURENÇO, C. A. O grande desafio na organização da web. Informação & Sociedade: estudos, João Pessoa, v. 17, n. 1, p. 71-80, jan./abr. 2007. MARC21 Concise Classification: introduction. 2006. Disponível em: <http://www.loc.gov/marc/classification/eccdintr.html>. Acesso em: 3 jul. 2007. MACHADO, R. N.; NOVAES, M. S. F.; SANTOS, A. H. Biblioteca do futuro na percepção de profissionais da informação. Transinformação, Campinas, v. 11, n. 3, p. 215-222, set./dez. 1999. MARCHIORI, P. Z. �Ciberteca� ou biblioteca virtual: uma perspectiva de gerenciamento de recursos de informação. Ciência da Informação, Brasília, v. 26, n. 2, p. 114-24, maio/ago. 1997. MARCONDES, C. H. Representação e economia da informação. Ciência da Informação, Brasília, v. 30, n. 1, p. 61-70, jan./abr. 2001. MARCONDES, C. H. Metadados: descrição e recuperação de informações na web. In: ______. et al. (Org.). Bibliotecas digitais: saberes e práticas. 2. ed. Salvador: EDUFBA; Brasília: IBICT, 2006. p. 95-111. MATOS, A. T. A biblioteca em realidade virtual com um ambiente colaborativo. 2003. 241 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2003. MATURANA, H. R.; VARELA, F. J. Autopoiesis and cognition. Dordrecht, The Netherlands: Reidel, 1980. McGARRY, K. O contexto dinâmico da informação. Brasília: Briquet Lemos, 1999. 206 p. MEY, E. S. A. Introdução à catalogação. Brasília: Briquet de Lemos, 1995. 123 p.
176
MILSTEAD, J.; FELDMAN, S. Metadata: cataloging by any other name. Online, [S. l.], January 1999. Disponível em: <http://www.online.com/online/ol1999/milstead1.html>. Acesso em: 22 mar. 2007. MIRANDA, A.; SIMEÃO, E. (Org.). Informação e tecnologia: conceitos e recortes. Brasília: UNB/Dept. de Ciência da Informação, 2005. 259 p. MOOERS, C. N. Zatocoding appplied to mechanical organization of knowledge. American Documentation, v. 2, p. 20-32, 1951. MORENO, F. P. Requisitos funcionais para registros bibliográficos - FRBR: um estudo no catálogo da rede bibliodata. 2006. 202 f. Dissertação (Mestrado em Ciência da Informação) � Faculdade de Economia, Administração, Contabilidade e Ciência da Informação e Documentação, Universidade de Brasília, Brasília, 2006. MOURA, A. M.ª de C. A Web Semântica: fundamentos, tecnologias e tendências. [S. l.: S. n.], 2002. Disponível em: <http://genesis.nce.ufrj.br/dataware/TESI_2002_3/unidades/tutorial_sbbd2002.pdf >. Acesso em: 13 ago. 2007. NAZARENO, C. et al. Tecnologias da informação e sociedade: o panorama brasileiro. Brasília: Câmara dos Deputados, 2007. 187 p. Disponível em: < http://www.camara.gov.br/internet/infdoc/Publicacoes/html/pdf/tecnologia_info.pdf>. Acesso em: 31 jul. 2007. OLIVEIRA, M. de. A investigação científica na ciência da informação: análise da pesquisa financiada pelo CNPq. 1998. 200 f. Tese (Doutorado em Ciência da Informação) � Departamento de Ciência da Informação e Documentação, Universidade de Brasília, Brasília, 1998. OLIVEIRA, M. de. Origens e evolução da ciência da informação. In: CENDÓN, B. V. et al. Ciência da informação e biblioteconomia: novos conteúdos e espaços de atuação. Belo Horizonte: Editora UFMG, 2005. 143 p. p. 9-28. O'REILLY, T. What is web 2.0: design patterns and business models for the next generation of software. 30 Sept. 2005. Disponível em: <http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-web-20.html#mememap>. Acesso em: 15 dez. 2007. OTLET, P. Traité de Documentation � Le livre sur le livre: théorie et pratique. Bruxelles: Mundaneum, 1934. 411 p.
177
PEREIRA, E. C.; RUTINA, R. O século XXI e o sonho da biblioteca universal: quase seis mil anos de evolução na produção, registro e socialização do conhecimento. Perspectiva em Ciência da Informação, Belo Horizonte, v. 4, n. 1, p. 5-9, 1999. PESCHL, M. F. Representing representations. 2002. Disponível em: <http://chassutoronto.ca/epc/srb/srb/representing.html>. Acesso em: 15 maio 2007. PETERSON. D. (Org.) Forms of representation: an interdisciplinary theme for cognitive science. Wiltshire: Cromwell Press, 1996. 208 p. PICKLER, M. E. V. Web semântica: ontologias como ferramentas de representação do conhecimento. Perspectivas em Ciência da Informação, Belo Horizonte, v. 12, n. 1, p. 65-83, jan./abr. 2007. PINHEIRO, L. V. R. A ciência da informação entre a sombra e luz: domínio epistemológico e campo interdisciplinar. 1997. 269 f. Tese (Doutorado em Comunicação) � ECO, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 1997. POPPER, K. R. Replies to my critics. In: SCHLIPP, P. A. (Ed.). The philosophy of Karl Popper. La Salle, IL: Open Court, 1974. p. 940-1180. RAMALHO, R. A. S. Web semântica: aspectos interdisciplinares da gestão de recursos informacionais no âmbito da ciência da informação. 2006. 120 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2006. RAMOS, M. M. The role of librarians in the 21st century. In: ALAP � ANNIVERSARY FORUM, 35., 2007. Filipinas: International Rice Research Institute (IRRI). Disponível em: <http://alapph.blogspot.com/search/label/papers%20ALAP%20Forum>. Acesso em: 23 set. 2007. RAYWARD, W. B. The origins of information science and the International Institute of Bibliography/International Federation for Information and Documentation (FID). Journal of the American Society for Information Science, n. 48, p. 289-300, Apr. 1997. Disponível em: <http://alexia.lis.uiuc.edu/~wrayward/otlet/OriginsofInfoSci.htm>. Acesso em: 12 dez. 2006. RICOEUR, P. Interpretação e ideologia. Rio de Janeiro: Francisco Alves, 1977. ROBREDO, J. Da ciência da informação revisitada aos sistemas humanos de informação. Brasília, 2003. 262 p.
178
ROBREDO, J. Documentação de hoje e de amanhã: uma abordagem revisitada e contemporânea da ciência da informação e de suas aplicações biblioteconômicas, documentárias, arquivísticas e museológicas. 4. ed. rev. e ampl. Brasília, 2005. 409 p. ROSENFELD, L.; MORVILLE, P. Information architecture for the world wide web. Sebastopol, CA: O�Reilly, 1998. 202 p. ROTHENBERG, J. Metadata to support data quality and longevity. In: PROCEEDINGS OF THE IEEE METADATA CONFERENCE, 1., 1996, Proceedings� Silver Spring: NOAA Complex, 1996. Disponível em: <http://www.computer.org/conferences/meta96/rothenberg_Paper/ieee.data-quality.html>. Acesso em: 11 mar. 2007. SANTOS, P. L. V. A. C. As novas tecnologias na formação do profissional da informação. In: VALENTIM, M. L. P. (Org.). Formação do profissional da informação. São Paulo: Polis, 2002. p. 103-116. SANTOS, P. L. V. A. da C.; VIDOTTI, S. A. B. G. Formas de representação. Aula proferida na disciplina �Formas de Representação da Informação: dos catálogos aos repositórios digitais�. Programa de Pós-Graduação em Ciência da Informação. Marília, UNESP, maio/jul. 2007. SARACEVIC, T. Interdisciplinary nature of information science. Ciência da Informação, Brasília, v. 24, n. 1, p. 36-41, 1995. SHADBOLT, N.; HALL, W.; BERNERS-LEE, T. The semantic web revisited. IEEE Intelligent Systems, vol. 21, no. 3, pp. 96-101, May/Jun. 2006. Disponível em: < http://eprints.ecs.soton.ac.uk/12614/01/Semantic_Web_Revisted.pdf>. Acesso em: 02 ago. 2007. SHERA, J. H.; CLEVELAND, D. B. History and foundations of information science. ARIST - Annual Review of Information Science and Technology. Washington, CO, v. 12, p. 249-275, 1977. SIQUEIRA, M. A. XML na ciência da informação: uma análise do MARC21. 2003. 133 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2003. SIQUEIRA, M. A.; SANTOS, P. L. V. A. da C. A versão em XML do MARC21 e as formas de representação descritiva na ciência da informação. In: VIDOTTI, S. A. B. G. (Org.).
179
Tecnologia e conteúdos informacionais: abordagens teóricas e práticas. São Paulo: Polis, 2004. p. 95-111. SOUZA, R. R. ; ALVARENGA, L. A web semântica e suas contribuições para a ciência da informação. Ciência da Informação, Brasília, v. 33, n. 1, p. 132-141, jan./abr. 2004. SOUZA, M. I. F.; VENDRUSCULO, L. G.; MELO, G. C. Metadados para a descrição de recursos de informação eletrônica: utilização do padrão Dublin Core. Ciência da Informação, Brasília, v. 29, n. 1, p. 93-102, jan./abr. 2000. STUBER, W. D.; FRANCO, A. C. de P. A Internet sob a ótica jurídica. 1999. Disponível em: <http://www.jcampos.com.br/info2.ht.1999>. Acesso em: 28 fev. 2007. SYNAK, M. MarcOnt Ontology: Semantic MARC21 Description for L2L & L2C Communication. 2005. 126 f. Master�s Thesis (Informatics, Distributed Computer Systems) - Faculty of Eletronics, Telecommunications and Informatics, Gdańsk University of Technology, Gdańsk, 2005. Disponível em: <http://library.deri.ie/servlet/showPDF?docId=http%3a%2f%2flibrary.deri.ie%2fresource%2f3a9faf28&chapter=1&view=pdf>. Acesso em: 25 jul. 2007. TÁLAMO, M. F. G. M. Quando a informação e o conhecimento fazem a diferença. Aula proferida na disciplina �Conceitos e Métodos da Ciência da Informação�. Programa de Pós-Graduação em Ciência da Informação. Marília, UNESP, ago./dez. 2006. TILLET, B. B. What is FRBR?: a conceptual model for the bibliographic universe. [S.l.]: Library of Congress/Cataloging Distribution Service, Feb. 2004. Disponível em: <http://www.loc.gov/cds/FRBR.html>. Acesso em: 19 jun. 2007. TILLET, B. B. RDA and FRBR: next big things in cataloging. Massachusetts: Massachusetts Library Association Technical Services Section, May 4, 2007. Disponível em: < http://www.collectionscanada.ca/jsc/docs/mlardappt-may07-bt.pdf>. Acesso em: 19 jun. 2007. TOUTAIN, L. M. B. B. Biblioteca digital: definição de termos. In: MARCONDES, C. H. et al. (Org.). Bibliotecas digitais: saberes e práticas. 2. ed. Salvador: EDUFBA; Brasília: IBICT, 2006. p. 15-24. TSENG, S. C. À procura do sistema de gestão de conhecimentos mais efectivo: entrevista com a Professora Sally C. Tseng, pioneira do sistema Metadata. Agenda, jan. 2005. ISSN 1810-0120. Disponível em: <http://www.library.gov.mo/Newsletter/2005/nl0501p_3.asp>. Acesso em: 22 jun. 2007.
180
VALENTIM, M. L. P. Ética profissional na área de ciência da informação. In: ______. (Org.). Atuação profissional na área de informação. São Paulo: Polis, 2004. cap. 3, p. 55-69. VICENTINI, L. A. Gestão em bibliotecas digitais. In: MARCONDES, C. H. et al. (Org.). Bibliotecas digitais: saberes e práticas. 2. ed. Salvador: EDUFBA; Brasília: IBICT, 2006. p. 239-257. VIDOTTI, S. A. B. G.; SANT�ANA, R. G. Infra-estrutura tecnológica de uma biblioteca digital: elementos básicos. In: MARCONDES, C. H. et al. (Org.). Bibliotecas digitais: saberes e práticas. 2. ed. Salvador: EDUFBA; Brasília: IBICT, 2006. p. 77-93. WAINWRIGHT, E. Digital libraries: some implications for government and education from the Australian development experience. Canberra, Austrália: National Library of Australia, 1996. Disponível em: <http://www.nla.gov.au/nla/staffpaper/ew6.html>. Acesso em: 12 mar. 2007. WERSIG, G. Information science: the study of postmodern knowledge usage. Information processing & Management, v. 29, n. 2, p. 229-239, 1993. W3C. RDF Primer. 2004. Disponível em: <http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example16>. Acesso em: 19 jul. 2007.
181
BIBLIOGRAFIA CONSULTADA
182
BIBLIOGRAFIA CONSULTADA AMERICAN LIBRARY ASSOCIATION. About AACR2. 2006. Disponível em: <http://www.aacr2.org/about.html>. Acesso em: 31 jul. 2007. BABINI, D.; FRAGA, J. Bibliotecas virtuales para las ciências sociales. Buenos Aires: Clacso, 2004. 120 p. BALBY, C. N. Formatos de intercâmbio de registros bibliográficos: conceitos básicos. Cadernos da F.F.C. Marília, v.4, n.1, 1995. p. 29-35. BEZERRA, F. M. P.; PINTO, V. B. Web semântica: uma proposta de produção de sentidos para a recuperação de informações no ciberespaço. In: CONGRESSO BRASILEIRO DE BIBLIOTECONOMIA, DOCUMENTAÇÃO E CIÊNCIA DA INFORMAÇÃO - CBBD, 22., 2007, Brasília. Anais... Brasília: FEBAB, 2007. 1 CD-ROM.
BLATTMANN, U.; SILVA, F. C. C. da. Colaboração e interação na web 2.0 e biblioteca 2.0. Revista ACB: Biblioteconomia em Santa Catarina, Florianópolis, v. 12, n. 2, p. 191-215, jul./dez., 2007. CAMPOS, L. F. de B. Web 2.0, Biblioteca 2.0 e ciência da informação: um protótipo para disseminação seletiva de informação na web utilizando mashups e feeds RSS. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO � ENANCIB, 8., 2007, Salvador. Anais� Salvador, 2007. 16 p. 1 CD-ROM.
CARDOSO, J. C; OLIVEIRA, J. B. Uma proposta de interface para bibliotecas digitais configuráveis ao perfil do usuário. Porto Alegre, 2000. Plano de Estudo e Pesquisa. CHAVES, M. S. Padrões em bibliotecas digitais. 2002. 58 f. Dissertação (Mestrado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2002. CURRÁS, E. Ontologías, taxonomía y tesauros: manual de construcción y uso. 3. ed. act. Y ampl. España: Trea, 2005. 337 p. DAVIES, J.; FENSEL, D.; HARMELEN, F. Towards the semantic web: ontology-driven knowledge management. England: John Wiley & Sons, 2005. 288 p.
183
DOWNES, S. Collaboration tools and web 2.0. Aug. 2007. Disponível em: <http://www.slideshare.net/Downes/collaboration-tools-and-web-20/>. Acesso em: 09 jan. 2008. EL-SERBINI, M. Metadata and the future of cataloging. Library Computing, [S.l.], v. 19, n. 3/4, p. 180-191, 2000. FENSEL, D. et al. Spinning the semantic web: bringing the world wide web to its full potential. Cambridge: The MIT Press, 2005. 479 p. FERREIRA JÚNIOR, H. da S. Otlet realizador ou visionário? O que existe em um nome? Ciência da Informação, Brasília, v. 35, n. 2, p. 9-16, maio/ago. 2006. GARRIDO ARILLA, M. R. Teoria e historia de la catalogación de documentos. Madrid: Sintesis, 1999. HILARIO, A. B. R. Nuevos horizontes en el análisis de los registros y la normativa bibliográfica. España: Trea, 2003. 165 p. KLENSIN, J. C. When the metadata exceed the data: data management with uncertain data. Statistics and Computing, v. 5, p. 73-84, 1995. LÉVY, P. A inteligência coletiva: por uma antropologia do ciberespaço. São Paulo: Loyola, 2000. LIMA-MARQUES, M. Ontologias: da filosofia à representação do conhecimento. Brasília: Thesaurus, 2006. 69 p. LORIST. H. H. J. ; MEER, K. V. D. Standards for digital libraries and archives: digital longevity. 2001. Disponível em: <http://www.betade.tudelft.nl/publications/LoristMeer_ICEIS2001.pdf>. Acesso em: 21 set. 2005. MACHADO, A. M. N. Informação e controle bibliográfico: um olhar sobre a cibernética. São Paulo: UNESP, 2003. 159 p. MANESS, J. M. Library 2.0 theory: web 2.0 and its implications for libraries. WeboLogy, v. 3, n. 2, jun. 2006. Disponível em: <http://www.webology.ir/2006/v3n2/a25.html>. Acesso em: 04 jan. 2008.
184
MÉNDEZ RODRÍGUEZ, E. Metadados y recuperación de información: estándares, problemas y aplicabilidad em bibliotecas digitales. Gijón: Trea, 2002. 429 p. MODESTO, F. Metadados: introdução básica. São Paulo, 2005. Apostila de aula da disciplina de representação descritiva II. Disponível em: <http://www.eca.usp.br/prof/fmodesto/textos/metadado2005f.pdf>. Acesso em: 25 mar. 2007. ORTIZ-REPISO JIMÉNEZ, V. Qué enseñamos después del MARC? Organizacion del Conocimiento en Sistemas de Información y Documentación, Zaragoza, v. 03, p. 217-225, 1999. RICH, E. Inteligência artificial. São Paulo: McGraw-Hill, 1988. 503 p. ROCHA, R. P. da. Metadados, web semântica, categorização automática: combinando esforços humanos e computacionais para a descoberta e uso dos recursos da web. Em Questão, Porto Alegre, v. 10, n. 1, p. 109-121, jan./jun. 2004. ROSETTO, M. Metadados: novos modelos para descrever recursos de informação digital. In: INTEGRAR: CONGRESSO INTERNACIONAL DE ARQUIVOS, BIBLIOTECAS, CENTROS DE DOCUMENTAÇÃO E MUSEUS, 1., São Paulo. Textos... São Paulo: Imprensa Oficial do Estado, 2002, p. 485-498. ROSETTO, M. Metadados e recuperação da informação: padrões para bibliotecas digitais. In: SIMPÓSIO INTERNACIONAL DE PROPRIEDADE INTELECTUAL, INFORMAÇÃO E ÉTICA � CIBERÉTICA, 2., 2003, Florianópolis. Anais... Florianópolis, 2003. ROWLEY, J. A biblioteca eletrônica. 2. ed. Brasília: Briquet de Lemos/Livros, 2002. SEMANTIC WEB. Disponível em: <http://www.semanticweb.org/about.html>. Acesso em: 25 ago. 2005. SENSO, J. A.; ROSA PIÑERO, A. de la. El concepto de metadato. Algo más que descripción de recursos eletrónicos. Ciência da Informação, Brasília, v. 32, n. 2, p. 95-106, maio/ago. 2003. SYNAK, M. ; KRUK, S. R. MarcOnt initiative: the ontology for the librarian world. Greece, May 2005. Disponível em: <http://www.marcont.org/marcont/pdf/ms_eswc2005marcont.pdf>. Acesso em: 06 jan. 2008.
185
ANEXOS
186
ANEXO A � Regras de transformação entre os padrões de metadados
Extraído de: SYNAK, M. MarcOnt Ontology: Semantic MARC21 Description for L2L & L2C Communication. 2005. 126 f. Master�s Thesis (Informatics, Distributed Computer Systems) - Faculty of Eletronics, Telecommunications and Informatics, Gdańsk University of Technology, Gdańsk, 2005. Disponível em: <http://library.deri.ie/servlet/showPDF?docId=http%3a%2f%2flibrary.deri.ie%2fresource%2f3a9faf28&chapter=1&view=pdf>. Acesso em: 25 jul. 2007.
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202