REPOSITÓRIOS DIGITAIS: UM ESTUDO DA APLICAÇÃO DO MODELO CONCEITUAL FRBR NA ESTRUTURAÇÃO DESCRITIVA
Elisabete Gonçalves de Souza1 Wellington Freire Cunha Costa2
Eixo temático: Novos rumos da catalogação Resumo: Descreve as características e vantagens dos repositórios na organização, preservação e disseminação de produções técnico-científicas produzidas em linha (recurso digital) cujos serviços de autoarquivamento têm o produtor/autor como o organizador de seus próprios documentos. Discute a representação descritiva e a recuperação da informação em ambientes digitais e apresenta as vantagens trazidas pelo novo modelo conceitual FRBR na estruturação de metadados descritivos em ambientes digitais. Conclui realizando uma simulação da aplicação do modelo FRBR em repositórios de modo a averiguar os limites e as possibilidades de uso do novo modelo conceitual nesse tipo de ferramenta bibliográfica e de que forma a “modelagem” pode contribuir para o refinamento das buscas liberando o usuário do uso de operadores booleanos, já que a nova estrutura permitirá relacionamentos entre as diferentes entidades de um registro bibliográfico. Palavras-chave: 1. Repositório digital. 2. Representação descritiva. 3. Modelo FRBR. Abstract: Describes the features and advantages of the repositories in the organization, preservation and dissemination of technical and scientific documents produced online (digital resource) whose services self-archiving is done by the creator / author of the documents. Discusses descriptive representation and the retrieval of information in digital environments and presents the advantages brought by the new FRBR conceptual model in the structuring of descriptive data in digital environments. Concludes performing a simulation of the FRBR model in order to determine the limits and possibilities of using the new conceptual model in this type of bibliographic resource. Show with the "modeling" can contribute to the refinement of searches freeing the user of the boolean operators, because the new structure will allow to do relationships between the different entities of a bibliographic record. Keywords: 1. Digital repository. Descriptive representation. 3. FRBR model. Resumen: Describe las características y ventajas de los repositorios de la organización, preservación y difusión de las técnicas y científicas producidas en línea (recurso digital) cuyos servicios se han auto-archivar el productor / autor como el organizador de sus propios documentos. Discute la representación descriptiva y recuperación de información en entornos digitales y presenta las ventajas aportadas por el nuevo modelo conceptual FRBR en la estructuración de los metadatos descriptivos en entornos digitales. Acabados de realizar una simulación de la aplicación de los repositorios de modelos FRBR con el fin de determinar los límites y las posibilidades de utilizar el nuevo modelo conceptual en este tipo de herramienta bibliográfica y la forma de "modelado" puede contribuir al refinamiento de búsquedas liberando al usuario el uso de operadores booleanos, ya que nueva estructura
1 Contato: <[email protected]>. Universidade Federal Fluminense. 2 Contato: <[email protected]>. Universidade Federal Fluminense.
2
permitirá que las relaciones entre las diferentes entidades de un registro bibliográfico. Palabras clave: 1. Repositorio Digital. 2. Representación descriptiva. 3. Modelo FRBR.
1 INTRODUÇÃO
O presente artigo relata os resultados da pesquisa “Impactos do novo modelo
conceitual FRBR na arquitetura da informação em repositórios digitais”, realizada
junto ao Programa de Pós-graduação em Ciência da Informação da Universidade
Federal Fluminense. As questões que nortearam o estudo foram: como o novo
modelo conceitual pode contribuir para melhorar o desempenho das bibliografias
digitais? Até que ponto formatos como o Dublin Core suportam a modelagem de
seus metadados? Quais as vantagens proporcionadas pelo novo modelo conceitual
quando aplicado em repositórios?
O trabalho se propõe a relatar os resultados da simulação do uso do modelo
FRBR na estruturação descritiva de registros em repositórios e, até onde vai o nosso
conhecimento, não há na literatura da área estudos sobre a aplicação dos novos
princípios da catalogação em bibliotecas digitais, sendo a maioria das pesquisas
voltadas para modelagem de catálogos em linha estruturados em MARC.
O objeto empírico escolhido para a aplicação do FRBR foi o repositório
“Acervo Digital do INMETRO”. A escolha desta ferramenta bibliográfica se deu
devido à variedade de documentos arrolados em sua base de dados, o que permite
ao usuário encontrar diferentes expressões e manifestações de obras de cunho
científico produzidas por pesquisadores, alunos e parceiros da instituição,
selecionando, assim, aquelas que melhor atendem às suas necessidades
informacionais.
2 REPOSITÓRIOS DIGITAIS
Repositórios representam um novo modelo de comunicação científica:
reúnem, preservam, divulgam e disponibilizam informações de forma dinâmica,
ampliando o acesso a documentos antes restritos às assinaturas de revistas
eletrônicas cujo custo era (e ainda é) muito alto. São bases de dados
3
multidisciplinares que armazenam coleções de documentos digitais disponíveis em
linha por meio da internet o que permite o acesso à distância à obra completa da
qual o pesquisador pode ser produtor, disseminador e usuário. (WEITZEL, 2006).
Um repositório pode ser caracterizado como institucional, quando reúne a
produção científica e intelectual de uma instituição, ou temático, quando reúne a
produção científica e intelectual de uma área. Há autores que conceituam
“repositório institucional” como sinônimo de “repositório digital”, não fazendo
distinção entre eles; outros denominam híbridos os repositórios institucionais cujas
coleções tratam de uma única temática como é o caso do repositório ALICE,
desenvolvido pela EMBRAPA, que reúne documentos sobre agricultura e pecuária.
No entanto, não importa a natureza de um repositório, todos têm as mesmas
características comuns: autoarquivamento da produção científica, acesso livre e
interoperabilidade, podendo ser acessado por qualquer provedor de serviço. De
acordo com Weitzel (2006 p. 61-62), “[...] a interoperabilidade é um fator primordial,
pois possibilita a busca em um só local e a reunião de conteúdos dos diferentes
tipos de publicações online produzidas por diferentes softwares sem conflitos”.
Quanto às coleções, os repositórios guardam uma tipologia de conteúdos e
de formatos documentais diversa, reunindo artigos científicos, livros eletrônicos,
capítulos de livros, preprints, postprints, relatórios, teses, dissertações, trabalhos
apresentados em congressos, palestras, material de ensino (apostilas, slides,
fichamentos, etc.), arquivos multimídia, etc.
Além de promover as instituições, os repositórios dão visibilidade às
produções de seus pesquisadores permitindo a troca de informações e o
compartilhamento de suas coleções com outras instituições sem que haja custos,
sendo o uso e o reuso destas informações um dos dados mais tangíveis para
medirmos a qualidade de uma instituição, pois demonstram sua relevância científica,
aumentando sua credibilidade e o seu reconhecimento junto ao público (CROW,
2002).
O que diferencia o repositório de outras ferramentas bibliográficas é o fato de
ser desenvolvido para atender às necessidades do usuário, que como autor pode
produzir, utilizar e disseminar informações científicas de forma simples e fácil. Isso
acontece porque a ferramenta possui uma arquitetura de informação que permite ao
autor ver e alterar o seu cadastro e atualizar a versão dos documentos de sua
4
autoria a partir de comentários e sugestões recebidas. Mas tudo isso só é possível
porque os repositórios estão inseridos no contexto do movimento internacional que
apoia o livre acesso à informação científica, conforme explicamos a seguir.
Segundo Costa (2006, p. 40), a filosofia aberta é o movimento “[...] em direção
ao uso de ferramentas, estratégias e metodologias que denotam um novo modelo de
representar um novo processo de comunicação científica [...] cujo objetivo é o
acesso amplo e rápido ao conhecimento”.
A Iniciativa dos Arquivos Abertos – Open Archives Initiative (OAI) e o Acesso
Livre/Aberto – Open Acess (OA) são os dois grandes movimentos internacionais que
vem influenciando o surgimento de novas tecnologias de informação e de
comunicação no meio eletrônico pelo fato de reunir e disponibilizar livremente
informações científicas e tecnológicas. De acordo com a Declaração de Bethesda
(2003 apud KURAMOTO, 2006, p. 96) uma publicação de acesso livre deve
satisfazer a duas condições:
1) O(s) autor(es) e o(s) detentor(es) de direitos de reprodução (copyright) concede(m) a todos os usuários o acesso livre, irrevogável, mundial e perpétuo ao trabalho, assim como uma licença de cópia, uso, distribuição, transmissão e exibição pública, e ainda de produzir e distribuir trabalhos dele derivados, em qualquer meio digital, para qualquer finalidade responsável, condicionado à devida atribuição de autoria, e concedem adicionalmente o direito de produção de uma pequena quantidade de cópias impressas para seu uso pessoal. 2) Uma versão integral do trabalho e de todo o material suplementar, incluindo uma cópia da permissão, em um formato eletrônico adequadamente padronizado, é depositada imediatamente após a publicação inicial em um repositório on-line mantido por uma instituição acadêmica, por uma associação científica, por uma agência governamental ou por qualquer outra organização solidamente estabelecida, a qual vise a propiciar o acesso livre, a distribuição irrestrita, a interoperabilidade e o arquivamento de longo prazo.
Existem duas possibilidades de acesso livre à produção científica, a “via
dourada” e a “via verde”. A “via dourada” abriga os artigos que são publicados em
revistas de acesso livre com avaliação dos pares, e a ”via verde” os artigos que são
publicados em revistas que não são de acesso livre, cujos autores ganham um “sinal
verde” das editoras para disponibilizar uma cópia livremente em repositório digital.
No entanto, há casos em que os editores liberam os artigos e os autores não se
interessam em disseminá-lo, cabendo essa tarefa às instituições de pesquisa.
5
A disponibilização e a disseminação de qualquer recurso no ambiente digital
envolvem não somente a inclusão da publicação na Web, mas também questões
tecnológicas que garantam a organização, descrição, preservação e acessibilidade
aos documentos publicados. Dentre essas tecnologias encontra-se o FRBR, modelo
conceitual que possui uma estrutura flexível e simples que muito se assemelha aos
princípios que deram origem ao formato Dublin Core (DC) usado na estruturação
dos metadados descritivos em repositórios institucionais.
De acordo com o documento da IFLA (2009) os FRBR são extensíveis a
qualquer sistema de informação. Daí a necessidade de testá-lo em repositórios,
ferramenta bibliográfica cuja arquitetura muito se aproxima dos fundamentos do
novo modelo: estrutura simples, com sintaxe extensível e próxima da linguagem do
usuário de modo a permitir que o autor/contribuidor ao arquivar um documento
também possa descrevê-lo.
O trabalho de simulação da aplicação do FRBR se fez necessário para
identificarmos as contribuições do novo modelo conceitual no processo de
recuperação da informação em sistemas de acesso aberto, como os repositórios; as
vantagens da modelagem para o usuário e as suas tarefas de encontrar, identificar,
selecionar e obter os recursos, evitando perda de tempo e garantindo-lhe maior
consistência na qualidade das respostas. Em síntese: demonstrar que a descrição
dos metadados quando feita numa estrutura relacional amplia a capacidade de
recuperação da informação além de tornar a atividade de busca uma tarefa simples,
libertando os usuários de ter que refinar suas buscas usando operadores booleanos.
3 O FORMATO DUBLIN CORE
O formato Dublin Core (DC) foi desenvolvido na década de 1990. Diferente
do MARC, que foi criado inspirado nos catálogos das bibliotecas, cujos esquemas de
metadados complexos exigiam treinamentos para ser aplicado, o DC foi pensado
para ser usado por usuários de modo a permitir que estes descrevessem seus
próprios documentos ao depositá-los nos repositórios.
A grande preocupação dos envolvidos na criação deste padrão é que ele não
possuísse muitos elementos para descrição dos recursos em rede de modo que não
se tornasse exaustivo, por isso, chegaram à conclusão que a relação dos elementos
6
não deveria ser extensa, sendo estimulados 15 elementos os quais descrevemos a
seguir tomando por referência o quadro síntese formulado por Mey e Silveira (2009,
p. 135-136). 1. Contribuidor: uma entidade responsável por fazer contribuições ao
recurso. Ex.: uma pessoa, uma organização ou um serviço. 2. Cobertura: tópico
espacial ou temporal do recurso; aplicabilidade espacial do recurso, ou a jurisdição
sob a qual o recurso é relevante; o tópico espacial pode ser um lugar ou uma
localidade especificada em coordenadas geográficas. Um tópico temporal pode ser
um período, data ou datas-limites. Uma jurisdição pode ser uma entidade
administrativa ou um lugar geográfico ao qual o recurso se aplica. 3. Criador:
entidade primariamente responsável por fazer o recurso. Ex.: uma pessoa, uma
organização ou um serviço. 4. Data: ocasião ou período de tempo associados ao
ciclo vital do recurso. 5. Descrição: uma exposição sobre o recurso. A descrição
pode incluir, embora não limitada a tal, um resumo, um sumário, uma representação
gráfica ou um texto livre. 6. Formato: formato do arquivo; o meio físico ou
dimensões do recurso. 7. Identificador: uma referência inequívoca para o recurso
em dado contexto; deve-se identificar o recurso por meio de uma sequência de
caracteres [string] de acordo com um sistema formal de identificação. 8. Idioma: Um
idioma do recurso. Para descrevê-lo deve-se usar um vocabulário controlado para
idiomas. 9. Publicador/Editor: uma entidade responsável por tornar o recurso
disponível. Ex.: um publicador pode ser uma pessoa, uma organização ou um
serviço. 10. Relação: um recurso relacionado; deve-se identificar o recurso
relacionado por meio de uma sequência de caracteres [string] de acordo com um
sistema formal de identificação. 11. Direitos: Informação sobre os direitos existentes
no recurso e sobre o recurso; informação sobre direitos incluem uma declaração
sobre os vários direitos de propriedade associados ao recurso, inclusive de
propriedade intelectual. 12. Fonte: um recurso relacionado do qual se deriva o
recurso descrito. Ressalta-se que um recurso descrito pode derivar, no todo ou em
parte, de um recurso relacionado, por isso deve-se identificar o recurso relacionado
por meio de uma sequência de caracteres [string] de acordo com um sistema formal
de identificação. 13. Assunto: tópico de um recurso. O assunto deve ser
representado por palavras-chave, frases-chave, ou códigos de classificação;
recomenda-se usar um vocabulário controlado. Para descrever tópicos espaciais ou
temporais, usa-se o elemento cobertura. 14. Título: um nome dado ao recurso, ou,
7
nome pelo qual o recurso é conhecido. 15. Tipo: natureza ou gênero do recurso.
Não se aplica a formato. Para descrever o formato do arquivo, o meio físico ou
dimensões do recurso, usa-se o elemento formato
O Dublin Core é o formato mais utilizado para a criação de repositórios e
apresenta as seguintes características: a) flexibilidade – os elementos que o
compõem são opcionais, podendo ser exibidos aleatoriamente e se houver
necessidade podem ser repetidos ou modificados por qualificadores; b) simplicidade
– é de fácil manuseio, sendo autoexplicativo, permitindo que o próprio autor do
documento faça a descrição sem a necessidade de intensos treinamentos; c)
extensibilidade – por ser um modelo simples e flexível, permite que diversas
comunidades em áreas distintas utilizem o padrão trocando informações e obtendo o
acesso a elas; d) interoperabilidade – um modelo comum de descrição utilizado por
diversas áreas o que proporciona aos usuários maior habilidade nas pesquisas; e)
âmbito internacional – embora tenha sido desenvolvido em inglês, já existem
versões em outras línguas (DCMI, 2013).
Em termos institucionais, o DC foi desenvolvido e é mantido pelo Dublin Core
Metadata Initiative (DCMI), uma organização de caráter aberto responsável pela
promoção de padrões e pelo desenvolvimento de vocabulário especializado. Os
membros do DCMI estão distribuídos pelo mundo, realizando worshops e listas de
discussão para troca de experiências e informações. Essa organização tem como
objetivo a interoperabilidade das descrições feitas no DC adaptando suas aplicações
à linguagem XML (Extensible Markup Language) e à semântica da RDF (Resource
Description Framework).
A linguagem XML é importante por fornecer o significado da informação no
documento e pelo fato de não precisar de nenhum programa para fazer sua leitura.
No entanto, descrições em RDF, no contexto da web semântica, precisam de
agentes de softwares capazes de interpretar os metadados de um recurso “de forma
independente, sem ambiguidade, de modo a poder localizá-los, combiná-los com
outros, se for conveniente, e tomar decisões baseadas em conhecimentos que
podem ser inferidos a partir dos significados interpretados” (CAMPOS; CAMPOS;
CAMPOS, 2005, p. 66).
8
De acordo com Marcondes (2005, p. 108) “enquanto a XML é uma linguagem
genérica para a descrição da estruturação de documentos eletrônicos, a RDF é
específica para criar metadados com a finalidade de localizar e identificar recursos.”
São essas especificidades que tornam o DC um padrão de grande
importância para o desenvolvimento da descrição dos recursos em rede, sendo o
mais adequado para o cenário dos repositórios institucionais.
Mas, tal como os formatos, os princípios da catalogação tiveram que se
atualizar dada a diversidade dos recursos que exigem uma nova arquitetura para as
bases de dados de modo que estas possam estruturar seus metadados
disponibilizando suas informações de forma rápida e consistente. Por isso, voltando
à hipótese que deu origem à pesquisa “o uso do modelo conceitual FRBR na
estruturação de metadados descritivos em repositórios institucionais”, na próxima
seção dedicamo-nos a discutir as bases teóricas da catalogação e seus novos
princípios (E-R) de modo a demonstrar os limites e as possibilidades de uso do novo
modelo conceitual na descrição de documentos digitais.
4 MODELO CONCEITUAL FRBR
Desde o final da década de 1990 a representação vem sofrendo mudanças
em seu enfoque. Seu “cerne deslocou-se do item para o usuário, visando permitir-
lhe as tarefas de encontrar, identificar, selecionar e obter uma ‘entidade’ adequada
aos seus propósitos”. (MEY, 2003, p.1). A resposta a essa mudança de paradigma
foi a publicação em 1998 do relatório final do Grupo de estudo da IFLA (Study Group
on the Functional Requirements for Bibliographic Records) contendo a descrição do
modelo conceitual FRBR e as novas diretrizes para a descrição de recursos em
catálogos, repositórios e outras ferramentas bibliográficas.
Essas discussões foram consolidadas na versão final da Declaração de
Princípios publicada em 2009, sendo criado, então, o FRBR Review Group com a
função de cuidar da manutenção da família FRBR de modelos conceituais e
estimular sua aplicação. Como extensões do novo modelo foram criados os
Requisitos Funcionais de Dados de Autoridade (Functional Requeriments for
Authority Data – FRAD), modelo direcionado ao controle de dados de autoridade e
os Requisitos Funcionais de Dados de Autoridade de Assunto (Functional
9
Requeriments for subject Authority Data – FRSAD), modelo ainda em
desenvolvimento e que tem como objetivo o controle de terminologia.
Em síntese: os Requisitos Funcionais para Registros Bibliográficos (FRBR) e
suas extensões são modelos conceituais que reestruturam os registros
bibliográficos, reorganizando os seus elementos através da análise de entidades,
atributos e relacionamentos, proporcionando não só uma nova sintaxe à catalogação
extensível a diferentes tipos de usuários, mas principalmente uma nova semântica.
Para superar as ambiguidades semânticas, o novo modelo aprimorou sua
sintaxe, tornando-a extensível e compreensível aos usuários; identificando para
cada entidade atributos únicos, individualizando-as para depois integrá-las nas
ações de relacionamento durante os processos de busca e recuperação. Para que o
modelo se consolidasse todos os requisitos necessários aos registros bibliográficos
tiveram como base as tarefas genéricas realizadas pelos usuários: encontrar,
identificar, selecionar e obter.
As entidades do Grupo 1 compreendem a realização de um trabalho
intelectual ou artístico, são elas: Obra: entidade abstrata que expressa uma criação
intelectual ou artística. Seu reconhecimento como entidade se dá por meio de suas
expressões (obra literária, musical, científicas, etc.). Os atributos desta entidade
permitem-nos classificar suas expressões e elaborar relações com sua criação
intelectual ou artística. Quando nos referimos a “Dom Casmurro” não estamos nos
referindo a uma edição, mas sim a uma criação intelectual, a uma obra literária,
criada pelo escritor brasileiro, Machado de Assis. Expressão: refere-se à realização
intelectual ou artística de uma obra ao ser elaborada, excluindo-se aí aspectos de
alteração da forma física. Define-se pelo uso de palavra ou frases que especificam o
conteúdo de uma obra; oferece uma distinção no conteúdo (intelectual ou artístico)
entre uma realização e outra da mesma obra. Portanto, diferenças tipográficas não
constituem uma nova expressão, mas qualquer mudança no conteúdo intelectual ou
artístico de uma obra constitui mudança na expressão: uma adaptação ou uma
tradução são apenas expressões de uma obra. Manifestação: é a materialização de
uma expressão de uma obra, ou seja, seu suporte físico, que pode ser livros,
partituras, registros sonoros, etc. Ex. um filme sobre o romance “Dom Casmurro” não
é só uma nova expressão, mas também uma nova manifestação; uma nova leitura
da obra machadiana sob outra forma física. A entidade item traz os atributos que
10
permitem o acesso físico (analógico ou digital) às diferentes expressões e
manifestações de uma obra (MORENO, 2006, SILVEIRA; MEY, 2009).
A entidades do Grupo 2 são uma extensão dos FRBR, chama-se FRAD e
representam os responsáveis pelo conteúdo intelectual ou artístico; pela produção
física e disseminação, ou pela guarda das entidades do primeiro grupo, são
descritas como pessoa ou entidade coletiva”. Pessoa: indivíduo responsável pela
criação ou realização de uma obra, ou aquele que é assunto de uma obra
(biográfico, autobiográfico, histórico, etc.). São definidos como entidade pessoa:
autores, compositores, artistas, editores, tradutores, diretores, intérpretes. Entidade
Coletiva: organizações ou grupos de indivíduos ou organizações, inclusive grupos
temporários (encontros, conferências, reuniões, festivais, etc.) e autoridades
territoriais como uma federação, um estado, uma região, uma municipalidade (ibid).
As entidades do Grupo 3 também são uma extensão do FRBR e chama-se
FRSAD. Representam o conjunto de temas que expressam diferentes acepções
do assunto coberto por uma obra. Inclui as seguintes entidades: Conceito:
abstrações temáticas de uma obra: áreas de conhecimento, disciplinas, escolas de
pensamento, teorias. Ex. Astronomia. Objeto: uma coisa material. Abrange a
categoria de “coisas materiais” que podem ser tema/assunto de uma obra: objetos
animados ou inanimados que ocorrem na natureza, fixos ou móveis; objetos que são
produtos da criação humana ou objetos que já não existam. Ex.: Apollo 11. Evento:
entidade que inclui uma variedade de ações, ocorrências ou acontecimentos:
envolve aspectos históricos, época, período de tempo. Ex.: O século XX. Lugar:
entidade referente a uma série de localizações: terrestres e extraterrestres,
históricas ou contemporâneas, características geográficas e jurisdições geopolíticas.
Ex.: Ilha de Fernando de Noronha. (MODESTO, 2007, p.2)
De modo a entendermos o impacto da aplicação modelo E-R na arquitetura
da informação em bibliotecas digitais, mais precisamente nas operações de
recuperação e acesso às informações armazenadas nos repositórios, realizamos um
estudo empírico no “Acervo digital” do INMETRO, e fizemos uma simulação da
aplicação dos modelos FRBR, FRAD e FRSAD que demonstramos a seguir.
11
4.1 Aplicações do FRBR em repositórios
Com o advento da web e da internet há um crescimento vertiginoso de
diferentes tipos de objetos digitais, o que levou as instituições de pesquisa a
organizarem repositórios de modo a poder administrar esse novo fluxo de
informações. O Brasil não ficou de fora desse movimento e hoje já ocupa o 4o lugar
entre os países que possuem mais repositórios digitais de acesso livre, ficando atrás
somente dos Estados Unidos, Reino Unido e Alemanha (KURAMOTO, 2006, p.
100).
No que diz respeito à arquitetura da informação3, os repositórios estão
estruturados sob o formato Dublin Core, que apesar das inúmeras vantagens ainda
segue os preceitos fundamentados pelas ISBD. No entanto, desde 2009 esse
referencial teórico-metodológico vem se modificando em função do surgimento de
um novo paradigma: a catalogação orientada ao objeto, expressa pelo modelo E-R
(entidade-relacionamento) cuja base para a representação descritiva se encontra no
FRBR.
No campo informacional, a maioria dos estudos sobre a aplicação do FRBR
tem sido feita em catálogos em linha, apesar de a IFLA (International Federation of
Library Associations and Institutions) ressaltar ser o mesmo extensível a outras
ferramentas bibliográficas, conforme explicita o texto da Declaração de Princípios
Internacionais de catalogação:
Os princípios aqui enunciados destinam-se a orientar o desenvolvimento de códigos de catalogação. Aplicam-se a registros bibliográficos e de autoridade e a catálogos correntes de bibliotecas. Os princípios podem também ser aplicados a bibliografias e outros ficheiros (arquivos) de dados criados por bibliotecas, arquivos, museus e outras comunidades. Os princípios pretendem promover uma abordagem consistente à catalogação descritiva e de assunto de recursos bibliográficos de todos os tipos (IFLA, 2009, p. 2).
Para demonstrar a possibilidade de uso do FRBR em repositórios
institucionais, escolhemos como campo empírico para simulação e aplicação do
3 A arquitetura da informação trata não apenas da estrutura de armazenamento de dados, mas este é o seu aspecto primordial, considerando que a estruturação descritiva e temática facilita o resgate do conteúdo informacional aumentando usabilidade do ambiente digital. O que significa dizer que, quanto melhor se descreve os metadados que representam os recursos maior possibilidade de êxito o usuário tem de encontrar o documento desejado. Sobre o assunto ver: LARA FILHO, D. O fio de Ariadne e a arquitetura da informação na WWW. Data Grama Zero – Revista de Ciência da Informação, v. 4, n. 6, dez. 2003.
12
novo modelo conceitual o Acervo Digital do INMETRO, organizado pelo Serviço de
Documentação e Informação (SEDIN). O objetivo da ferramenta é organizar,
preservar e disseminar a produção científica e acadêmica de alunos e
pesquisadores do Instituto, sendo suas coleções compostas dos seguintes
documentos: artigos publicados em periódicos, trabalhos publicados em anais de
eventos, teses e dissertações nas áreas de atuação do Inmetro ou que possuam o
Instituto como objeto de estudo, livros, capítulos de livros e documentos que refletem
a história do INMETRO (SOARES; ARAUJO; GUIA, 2010).
Figura 1. Página inicial do repositório Fonte: INMETRO (2013).
É essa variedade de documentos que dá singularidade ao repositório do
INMETRO. Nele há diferentes expressões de obras (pesquisas científicas) que
nascem como relatórios e que sofrem adequações expressando-se e manifestando-
se como artigos ou papers de eventos; projetos de pesquisa cuja consolidação dos
resultados primeiramente é apresentada na forma de relatório técnico e depois como
folhetos e/ou artigo de periódico; obras que se expressam em outros idiomas
(traduções) e são apresentadas como artigos ou como papers em eventos
internacionais. Enfim, foi essa riqueza bibliográfica que fez do “Acervo digital” a
ferramenta adequada para aplicação do modelo FRBR.
13
Figura 2. Ex. Obras: expressões e manifestações Fonte: INMETRO (2013).
Para desenvolver o repositório, o SEDIN utilizou o software livre DSPACE e o
padrão Dublin Core para a descrição dos metadados dos recursos digitais. A
realização das buscas é feita no display de “busca simples”, sendo permitido ao
usuário navegar por chaves de busca tradicionais (autor, título, assunto e tipo de
documento) ou no display “busca avançada” sendo permitido ao usuário pesquisar
em todo o INMETRO ou escolher uma das coleções de acordo com suas respectivas
áreas temáticas.
Figura 3: busca simples por autor.
Fonte: INMETRO (2013).
14
Figura 4: busca avançada – uso de operadores booleanos. Fonte: INMETRO (2013).
O repositório também possui outros filtros de busca que pode ser por assunto,
título, autor, data de envio do documento e tipologia; artigos em periódicos
indexados, livros científicos, notas técnicas, resumos em anais de congresso,
teses/dissertações, entre outros.
Figura 5: Pesquisa por eixos temáticos. Fonte: INMETRO (2013).
Ao fazer uma busca simples pelo autor “Ribeiro, Leonardo Costa” (ver figura
3) o repositório disponibiliza em ordem alfabética uma lista de autores ordenada sob
15
a forma de cabeçalho. Ao clicar no nome do autor pesquisado, encontramos todas
as expressões e manifestações de suas obras (15 documentos), cabendo ao usuário
realizar as tarefas de identificar e selecionar o recurso de seu interesse. Na atual
arquitetura do repositório, para realizar essas “tarefas” o usuário terá que clicar em
cada título para ter acesso aos metadados descritivos de cada recurso e assim obter
aquele que melhor satisfaz à sua necessidade de pesquisa. Isso ocorre porque na
estrutura Dublin Core a entidade pessoa/autor não mantém uma relação
dialógica/relacional com as outras entidades. Ou seja: a biblioteca é digital, mas o
processo de busca obedece a uma lógica hierárquica (um passo de cada vez), pois
os metadados estão estruturados por campos isolados não por bloco de entidades,
onde as mesmas deveriam aparecer individualizadas por seus atributos e
relacionadas durante o processo de busca e recuperação.
Para vermos as vantagens proporcionadas pelo novo modelo conceitual
FRBR simulou-se uma modelagem na estrutura do repositório tomando como
referência as tarefas de busca e recuperação da informação. Para não tornar o
trabalho cansativo para os leitores foi selecionado para a modelagem apenas um
dos documentos recuperados na busca.
16
Figura 6: aplicação da família FRBR no repositório (arquitetura em Dublin Core) Fonte: Modelagem dos autores a partir de INMETRO (2013).
Numa estrutura FRBR nenhuma informação sobre um recurso fica de fora.
Durante o processo de busca, todas as entidades mantêm algum tipo de
relacionamento como, por exemplo: (obra - formas de expressão e manifestação),
(obra-assunto), (obra- pessoas) sendo a integridade de cada uma destas entidades
garantida pela clareza com que são descritos os seus atributos.
A função do novo modelo conceitual é reunir em uma única busca todos os
registros bibliográficos de uma mesma entidade (obra) relacionando-as com as
17
demais entidades, por isso nesse processo de simulação mostramos as relações
das entidades FRBR-FRAD, FRBR-FRSAD.
O processo de simulação proposto teve como objetivo demonstrar como os
recursos armazenados em repositórios podem ter seus metadados descritivos
estruturados em FRBR, assim como apontar as vantagens dessa modelagem para o
serviço de busca e recuperação da informação. O processo de “modelagem”
reconfigurou a arquitetura do repositório ao distribuir seus 15 elementos descritivos
entre as diferentes entidades e mostrou que o formato Dublin Core suporta a
aplicação do novo modelo conceitual sem que haja perda da integridade do registro
e comprometimento da consistência das respostas.
5 CONSIDERAÇÕES FINAIS
Os repositórios digitais são ferramentas bibliográficas capazes de armazenar
grandes quantidades de dados, por isso seus criadores buscaram um formato mais
flexível: o Dublin Core, que por possuir características simples e ser de fácil
manuseio permite que o próprio autor do documento descreva suas informações
sem precisar de intensos treinamentos como é exigido para aqueles que usam o
formato MARC.
Nesse contexto, o modelo FRBR quando aplicado em repositórios digitais
causa grande impacto na busca e na recuperação da informação. Sua sintaxe
baseada no conceito (E-R) identifica com precisão os recursos digitais, qualifica as
entidades de uma obra e as individualiza através de seus atributos e
concomitantemente as relaciona, o que torna as buscas muito mais dinâmicas e
precisas dando ao usuário a oportunidade de encontrar, identificar, selecionar e
obter as informações de forma simples e rápida,
O processo de simulação mostrou o quanto à aplicação do modelo FRBR
contribuiu para a melhoria das buscas nos repositórios, liberando o usuário de
pesquisas exaustivas, cujo refinamento exige domínio dos recursos de busca ou de
operadores booleanos. Enfim, recursos muito limitados se comparados aos
benefícios do FRBR, cuja resposta de busca apresenta, de uma única vez, todas as
entidades relacionadas à questão de pesquisa, permitindo que num só clique o
usuário conheça todas as expressões e manifestações de uma mesma obra ou as
18
diferentes obras com suas respectivas expressões e manifestações, produzidas por
um mesmo autor.
Durante a simulação ficou provado que o modelo FRBR se ajusta ao formato
Dublin Core sem comprometer a consistência das respostas, sendo todos os
atributos relacionados às respectivas entidades não se perdendo nenhuma
informação acerca das obras. Mas muitos profissionais da informação ainda resistem
em experimentar o novo modelo e isso se dá devido à falta de clareza conceitual
sobre sua aplicação. Por isso antes de adotá-lo, é preciso definir bem seus
conceitos e entender seus fundamentos, pois enquanto houver ambiguidades na
definição de atributos, especialmente aqueles referentes às entidades abstratas
como “obra” e “expressão”, ficaremos sempre num impasse.
Cabe aos profissionais da informação se capacitarem para que tenham
domínio teórico e prático desse novo paradigma, enfrentando com sabedoria os
desafios que se apresentam aos novos rumos da catalogação no século XXI,
colaborando e apontando para as agências normatizadoras os limites e as
possibilidades de aplicação do modelo aos padrões existentes.
REFERÊNCIAS
CAMPOS, M. L. M.; CAMPOS, M. L. A.; CAMPOS, L. M. Web semântica e a gestão de conteúdos informacionais. In: MARCONDES, Carlos Henrique et. al. (Org.). Bibliotecas digitais: saberes e práticas. Salvador, BA: EDUFBA; Brasília; IBICT, 2005. p. 55-74. COSTA, S. M. S. Filosofia aberta, modelos de negócios e agências de fomento: elementos essenciais a uma discussão sobre o acesso aberto à informação científica. Ciência da Informação, Brasília, v. 35, n. 2, p. 30-50, mai./ago. 2006. CROW, R. The case for institutional repositories: a SPARC position paper. Washington, DC, Scholarly Publishing & Academic Resources Coalition, 2002. Disponível em: http://www.arl.org/sparc/bm~doc/ir_final_release_102.pdf Acesso em: 15 jun. 2013. DCMI. Dublin Core Qualifiers. Disponível em: <http://dublincore.org/documents/2000/07/11/dcmes-qualifiers/> Acesso em: 25 jul. 2013. ______. Using Dublin Core. Disponível em: <http://www.dublincore.org/documents/2001/04/12/usageguide > Acesso em: 20 jul. 2013.
19
IFLA. Declaração de princípios internacionais de catalogação. 2009. 15f. Disponível em http://www.ifla.org/files/cataloguing/icp/icp_2009-pt.pdf Acesso em: 20 maio 2013 INMETRO. Acervo digital. 2013. Disponível em: http://repositorios.inmetro.gov.br/ Acesso em 20 ago. 2013. KURAMOTO, H. Informação científica: proposta de um novo modelo para o Brasil. Ciência da Informação, Brasília, v. 35, n. 2, p. 91-102, maio/ago. 2006. MARCONDES, C. H. Metadados: descrição e recuperação na Web In: ______ et al. (Org.). Bibliotecas digitais: saberes e práticas. Salvador, BA: EDUFBA; Brasília; IBICT, 2005. p. 77-143 MEY, E. S. A. Não brigue com a catalogação! Brasília: Briquet de Lemos/Livros, 2003. ______; SILVEIRA, N. C. Catalogação no plural. Brasília: Briquet de Lemos/Livros, 2009. MODESTO, F. Da ficha ‘lascada’ aos metadados: os rumos novos da catalogação. 2007. Disponível em: < www.eca.usp.br/prof/fmodesto/textos/> Acesso em: 27 jun. 2013. MORENO, F. P. Requisitos funcionais para registros bibliográficos – FRBR: um estudo no catálogo da Rede Bibliodata. 2006. 199 f. Dissertação (Mestrado em Ciência da Informação) - Universidade de Brasília, Brasília, 2006. SOARES, C. F. S.; ARAÚJO, C. F.; GUIA, B. P. Repositórios institucionais: a experiência do Inmetro. In: CONGRESSO INTERNO DO INMETRO. Trabalhos apresentados, Rio de Janeiro, INMETRO, 2010. WEITZEL, S. R. O papel dos repositórios institucionais e temáticos na estrutura da produção científica. Em Questão, Porto Alegre, v. 12, n. 1, p. 51-71, jan/jun. 2006.