final un b_curadoria digital_2016
TRANSCRIPT
Curadoria Digital Desafios e Oportunidades para Instituições de Memória Cultural na Era Digital
Aquiles Alencar Brayner
@AquilesBrayner / #WICI2016
www.bl.uk 2
Missão das instituições de memória cultural no século XXI
• Selecionar, capturar, descrever e preservar objetos digitais, oferecendo novos sistemas de busca e plataformas de acesso e re-uso a estes objetos
• Promover seus acervos entre diferentes tipos de usuários
• Proporcionar a integração de distintos formatos eletrônicos e criação de ferramentas que facilitem o acesso e análise de conteúdos digitais
• Participação ativa nos projetos de pesquisa digital, gerenciando as atividades e disseminação de resultados obtidos
• Instituições como “laboratórios” de novas idéias e modelos em pesquisa digital
• Atuar como centros de capacitação para pesquisadores e profissionais envolvidos no manejamento de recursos e dados eletrônicos
www.bl.uk 3
Formato x informação
Homoliteratus.comLa grand danse macabre…[MathiasHuss, Lyon, 1499]
Quipu - Inca
www.bl.uk 4
Curadoria Digital: definindo o campo
Facilitar acessoremoto ao acervo
Possibilitar a criaçãode novos recursos ereutilização de dados digitais por usuários
Desenvolvimento de novos modelos e metodologias de trabalho com pesquisadores
Programas de formação e treinamento em novas tecnologias e seu uso em pesquisa
www.bl.uk 5
Curadoria Digital (DCC)
• A Curadoria Digital envolve a manutenção, preservação e agregação de valor aos objetos digitais em toda sua vida útil.
www.bl.uk 6
Biblioteca Digital: as regras dos 10 “in"1.Integridade: acesso ao objeto digital na maneira em que ele foi criado2.Integração: diferentes conteúdos e formatos acessíveis a partir de uma mesma plataforma3.Interoperabilidade: compatibilidade entre diferentes plataformas e sistemas operacionais 4.Instantaneidade: acesso irrestrito e imediato aos objetos eletrônicos5.Interação: catálogos interativos incorporando elementos de Web 2.0 (blogs, wikis, tags) e mídia social6.Informação: planificação de metadados para maior eficiência e confiabilidade nos resultados de busca7.Incorporação de conteúdos: constante inclusão de objetos digitais
8. Interpretação: objeto digital contextualizado em relação a outros itens equivalentes em vários acervos
9. Inovação: apresentação do material em plataformas inovativas
10. Acesso Indefinido: objetos digitais preservados para futura gerações
www.bl.uk 7
Humanidades Digitais: uma breve introdução
• A produção, utilização e integração de conteúdos, serviços e ferramentas digitais para facilitar a pesquisa nas areas das humanidades e ciências sociais.
• Durante as últimas décadas, bibliotecas e arquivos têm se dedicado à produção e coleta de objetos digitais. A tecnologia atual nos permite muito mais do que apenas descobrir ou acessar esses objetos nos possibilitando o uso de novas ferramentas que nos leve a novas descobertas a partir de uma nova compreensão do material analisado.
Anuario Americanista Europeo, 2014
www.bl.uk 8
Novos métodos de pesquisa digital
Uso de APIs (Application Programming Interfaces) para integrar base de dados, ex: metadados, imagens, etc.
Buscas baseadas em locação geográficaMineração de texto
Crowdsourcing / Computação humana
Anotação
Processamento em Linguagem Natural (NLP)
Visualização de dadosGeo-referenciamento
www.bl.uk 9
Programa de capacitação em Humanidades Digitais para bibliotecários e arquivistas:
1. Introdução às mídias sociais: Twitter, blogs, etc.
2. Plataformas colaborativas: Wiki, Google Docs, etc.
3. Ferramentas de apresentação: PowerPoint, Slide Share, Prezi, etc.
4. Manipulação de imagem e audio digitais
5. Criação de páginas Web
6. Metadados para recursos eletronicos: Dublin Core, METS, MODS, RDF, XML
7. Introdução às Humanidades Digitais
8. Coleções Digitais na British Library
9. Introdução à digitalização de acervos
10.Copyright para objetos digitais
11. “Crowdsourcing” em Bibliotecas, Arquivos e Museus
12.Codificação e edição de textos em XML (TEI)
13.Ferramentas de visualização e análise de dados eletrônicos
14.Geo-referência e mapeamento digital
15. Integração de informação: Mash-ups, APIs, e Web semântica
www.bl.uk 10
Contribuição em cursos online
• Programming Historian: http://programminghistorian.org/lessons/
• Digital History: http://chnm.gmu.edu/digitalhistory/
• Coursera: https://www.coursera.org/
• FutureLearn: https://www.futurelearn.com/
www.bl.uk 12
Bibliotecas na era digital
• Facilitar o acesso e a reutilização do conteúdo eletrônico – Data.bl.uk (Beta)
• Mais do que como repositório de dados, a biblioteca deve atuar como agente fomentador de projetos em humanidades digitais – BL Labs
• Estimular e difundir o acervo entre novas comunidades de usuários – Mechanical Curator e Off the Map
www.bl.uk 14
Disponibilização e re-utilização de conteúdos eletrônicos
• Curador Mecânico: extração de imagens de livros digitalizados e publicação no Flickr
• Imagens tagueadas e classificadas por grupos• Indexação sinóptica no Wikimedia Commons dos títulos com
imagens• Interface de busca comparativa para reconhecimento de imagens
www.bl.uk 15
Recentes projetos com o uso de imagens
• Narrativas interativas
• Video-clips
• Criação de aplicativos: Poetic Places
• Re-uso de metadados catalográficos
www.bl.uk 16
Plataformas que facilitem o trabalho de interpretação e enriquecimento de dados
1. Codex Sinaiticus: plataforma colaborativa de transcrição e tradução de conteúdo.
2. Retro-conversão de ficheiros: retro-conversão de 48.000 títulos chineses utilizando a plataforma Libcrowds com resgate de metadados disponíveis pela OCLC, integrando-os ao catálogo eletrônico da BL
3. Arqueologia da Leitura: transcrição e busca de anotações adicionadas a impressos antigos em coleções de cientistas da época
4. Book Traces: projeto colaborativo sobre anotações e rastros deixados em livros de bibliotecas por leitores
5. The Book of Margery Kempe Projeto de transcrição incluindo anotações feitas no manuscrito original
www.bl.uk 17
Catálogos com alternativas de buscas
• Música: Peachnote
• Imagens: Google images
• Catálogos seguindo o modelo de plataformas de mídias sociais gerando maior interatividade entre usuários e acervos
www.bl.uk 18
Serendipidade
Sistema Elástico
www.bl.uk 19
Tags (marcadores)
• Utilização de palavras ou frases para descrever e/ou classificar objetos
• Modelo de Folksonomia
• Por meio das tags, o usuário pode então recuperar informações e compartilhá-las. Pode visualizar as tags de outros usuários, assim como identificar o grau de popularidade de cada tag no sistema, e acessar as informações relacionadas a uma tag específica.
Explore.bl.uk
www.bl.uk 20
Projetos de enfoques comunitários (crowdsourcing) para a construção de acervos
• Projeto Quipu: coleta de depoimentos sobre esterilização massiva, muitas vezes não consensual, de peruanos no período do governo Fujimori (anos 90)
• Cantos Cautivos: experiências de presos políticos na época de Pinochet refletidas através da música
• Europeana 1914-18: participação pública na adição de acervos pessoais às coleções institucionais de cada país envolvido na Grande Guerra
• Plataformas abertas de crowdsourcing: Zooniverse
www.bl.uk 22
Wikipedia/wikimedia Commons
• Pedra de Roseta British Museum
• BL Wikipediano em residência– Constituição de Atenas– Maratona editorial (Edit-a-Thon)
• Rui Barbosa (Página Wikipedia)
• Fundação Casa de Rui Barbosa
• BL – Wikimedia Commons
• Wikimedia Commons Fundação Casa de Rui Barbosa
www.bl.uk 23
Youtube
• Wellcome Collections (acervos)
• British Library (serviços, atividades, etc)
• Fundação Casa de Rui Barbosa
www.bl.uk 24
Soundcloud
• British Library
• Museu da Imagem e do Som
www.bl.uk 25
Imagens e exibições
www.bl.uk 27
Novas infra-estruturas para métricas alternativas (Altmetrics)
• DataCite: rede global de bibliotecas nacionais, centros de dados e outras instiutições de pesquisa que trabalha para aumentar a identificação, citação e reutilização de dados no âmbito acadêmico, fornecendo identificadores de objetos digitais (DOI) para bancos de dados e outros produtos de pesquisa, incluindo modelos não-tradicionais.
• Thor (Technical and Human Infrastructure for Open Research): projeto de criação de identificadores persistentes que possam agregar dados do DataCite, Orcid, Odin, etc. tendo em vista 3 aspectos:
1. Identificador de especificidade: atribuição da versão do dado;2. identificador para evidência: conexão entre dado e
publicação ;3. identificador de crédito e contribuição: estabelecer
referências entre contribuidores, instituições e órgãos patrocinadores da pesquisa.
Thor visa também disseminar/popular automaticamente informação coletada, através de plug-ins, a outras plataformas, repositórios e bancos de dados ex: Platforma Lattes, Scielo, Academia.eu, SlideShare, etc.
www.bl.uk 31
Vantagens
• Ampliar acesso e uso de acervos em arquivos e bibliotecas para pesquisadores, estudantes e público em geral
• Criar uma massa crítica de conteúdo digitalizado através da agregação de coleções semelhantes espalhadas em instituições distintas
• Enriquecer a descrição dos acervos
• Facilitar a interpretação de acervos para novos usuários
• Fomentar novas áreas e modelos de pesquisa
• Estabelecer métodos inovadores de apoio para pesquisa, ensino e aprendizagem
• Preservar documentos raros e frágeis através de sua reprodução digital, protegendo documentos vulneráveis
www.bl.uk 32
Critérios
• Finalidade
• Público alvo
• Estratégias1. Fomato de Imagem2. Resolução 3. Cor4. Manipulação pós-captura 5. Metadados6. Armazenamento7. Preservação
www.bl.uk 33
Considerações
• Público
• Orçamento
• Objetivos
• Como nos certificar que o conteúdo digitalizado represente de maneira proporcional os objetos em seus formatos originais nos nossos arcervos?
www.bl.uk 34
From Originals
Black-and-white photographs 8-bit greyscale, resolution dependant on size of original likely to be in the range 300 – 1200ppi. It may be appropriate to capture as 24-bit RGB depending on image tone.
Colour photographs 24-bit RGB, resolution dependant on size of original likely to be in the range 300 – 1200ppi.
Slides or small negatives 8-bit greyscale or 24-bit RGB, effective resolution of 300 ppi relative to the size of the original
Printed texts 8-bit greyscale, 400 ppi
Printed texts with half-tone, and other black-and-white illustrations
8-bit greyscale, 400 ppi, 24-bit RGB may be considered depending on characteristic of material
Printed texts with colour illustrated 24-bit RGB, 400 ppi
Manuscripts, maps and other materials 300 ppi, 8-bit greyscale or 24-bit RGB. Spatial resolution can be adjusted to 400 ppi and greater where significant elements to be captured are less than 1.5mm
From Surrogates
Microfilm Effective resolution of 300 ppi, 8-bit greyscale, relative to the size of the original and the reduction ratio used in the microfilming.
www.bl.uk 36
Imagem multiespectral
• Consiste em imagens de um mesmo objeto, tomadas com diferentes comprimentos de ondas eletromagnéticas. Pode ser luz visível, infravermelha, ultravioleta, raio-X ou qualquer outra faixa do espectro
Exemplos:
DIAMM (Digital Image Archive of Medieval Music)
Diários de David Livingstone: http://www.livingstoneonline.org/spectral-imaging/spectral-imaging-overview
www.bl.uk 37
Imagem de ressonância magnética
• Pergaminhos herculanos:
www.bl.uk 38
Digitalização de acervos internacionais
• Programa Aquivos em Perigo (Endangered Archives)
Exemplos:
EAP755: A modern gaze on old cultural practices in Argentina: relocation and preservation of the 'Heinrich Sanguinetti Archive' (1930-1956) images
www.bl.uk 39
Alternativas experimentais
• Pesquisa levantada pela BL aponta que maioria do material digitalizado não é de interesse direto à pesquisa individual
• Uso de aparelhos de reprodução fotográfica nas salas de leitura
• Relatório OCLC
www.bl.uk 40
Referências
• Impact: http://www.digitisation.eu/
www.bl.uk 42
A Revolução Digital
• “Quando as ideias são separadas dos meios utilizados para sua transmissão, elas ficam também separadas das circunstâncias históricas que as moldam, tornando-se difícil entender o contexto de mudança em que estas ideias devem ser entendidas.“ (Elizabeth Eisenstein, The Printing Press as an Agent of Change. Cambridge: CUP, 1979.)
www.bl.uk 43
Humanidades Digitais: uma breve introdução
• A produção, utilização e integração de conteúdos, serviços e ferramentas digitais para facilitar a pesquisa nas areas das humanidades e ciências sociais.
• Durante as últimas décadas bibliotecas, museus e arquivos têm se dedicado à produção e colheita de objetos digitais. A tecnologia atual nos permite muito mais do que apenas descobrir ou acessar esses objetos nos possibilitando sobretudo o uso de novas ferramentas que nos leve a novas descobertas apartir de uma nova compreensão do material analisado.
www.bl.uk 44
Humanidades Digitais: gênese
• 1949: A colaboração entre Thomas Watson, fundador da IBM, e Padre Roberto Busa inaugurou uma nova era de pesquisa em humanidades. O resultado, o Índice Thomisticus, está disponível on-line desde 2005.
• O projeto utilizou processos algorítmicos para análise linguística, a fim de produzir um índice de 9 milhões de palavras em latim medieval das obras completas de São Tomás de Aquino.
• Na época, ninguém pensava que computadores concebidos para cálculos numéricos poderiam ser usados para o estudo de textos escritos e concordâncias lingüísticas.
www.bl.uk 45
Panorama das Humanidades Digitais hoje
• Número cada vez mais amplo de centros de pesquisa em humanidades digitais, muitos operando como espaço de laboratórios – principalmente na Europa e EUA
• Center.Net
• América Latina:México: Humanidades DigitalesArgentina: AADHBrasil: Grupos de Pesquisa em Humanidades Digitais
Mais informações: Anuario Americanista Europeo
www.bl.uk 46
Mapeamento de projetos digitais envolvendo bibliotecas e disseminação de atividades e resultados em meio acadêmico
• Publicação em revistas especializadas (ex: Anuario Americanista Europeo)
• Participação em conferencias internacionais (ex: DH)
• Comunicação com centros de pesquisa e grupos de humanidades digitais (ex: AHDig )
www.bl.uk 47
Curadoria Digital: um campo em extensão
• Cursos de pós-graduação no Reino Unido:
King’s College London: Digital Curation
University College London: Digital Humanities
• Brasil:
1. O termo “Curadoria Digital” usado muitas vezes como sinônimo de “Preservação Digital”
2. Algumas propostas e pontos de discussão
• Carta do Recife 2.0 (Rede Memorial de Pernambuco, Prof. Marcos Galindo)
• Rede Humanidades Digitais
www.bl.uk 48
Curadoria Digital
Estabelecer vários canais de acesso à coleção
Incentivar a criação e manipulação debase de dados por usuários
Apoio à pesquisa e educação
Objetivos:
Infraestrutura de acesso, depósito e preservação de conteúdos digitais
Criação extensiva de coleções digitais
Promoção e utilização de novas ferramentas aplicadas ao acervo digital: anotação, visualização, comparação, análise, etc.
Informação sobre novos métodos e modelos em pesquisa digital
Promover uma maior colaboração entre técnicos, pesquisadores e bibliotecários
Alcançados através de: Projetos colaborativos Plataformas interoperacionais Conexão entre base de dados e
ferramentas de pesquisa
Integração
Extensão
Inovação
Criação de novos modelose métodos de pesquisa
Conteúdo Digital Treinamento e suporte profissional