resource discovery neu definiert
DESCRIPTION
Presentation at MPDL Pubman Days 2013 SLUB Dresden and Avantgarde Labs have developed a multilingual semantic catalogue search SLUBsemantics. Taking this development a step further, they are now implementig a LOD-based data management platform for the integration, deduplication, normalization, FRBRization and semantic enrichment of library data. This provides the infrastructure for upcoming library services focused on all stages of the research process.TRANSCRIPT
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.de
Die multilinguale, semantische Katalogsuche der SLUB Dresden
24. Oktober 2013Dr. Jens Mittelbach, SLUB Dresden
Resource Discovery neu definiert
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.de
Resource Discovery neu definiert
24. Oktober 2013 | Seite 2
Die multilinguale, semantische Katalogsuche der SLUB Dresden
1. Das Konzept “Resource Discovery” in Bibliotheken
2. SLUBsemantics: Ein erster Schritt zu einer neuen Form von Discovery
3. EFRE-Projekt Datenmanagement-Plattform: Ein zweiter Schritt
4. Discovery und die Rolle von Bibliotheken im Digitalen Zeitalter
Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
“Resource Discovery” in Bibliotheken
24. Oktober 2013 | Seite 3
Discovery als neues Paradigma
• Konzept Resource Discovery seit Anfang des Jahrzehnts: Summons, EBSCO Discovery Service, Primo …
• „One Stop Shop“-Idee, integrierte Suche und integrierter Zugang zu in getrennten Datensilos verteilten Ressourcen
• Normalisierung/Homogenisierung heterogener Daten aus unterschiedlichen Quellsystemen
• Suchmaschinentechnologie statt feldbasierte Datenbanksuche
• Normdaten aus unterschiedlichen Systemen als Strings indexiert und damit für Suche und Facettierung nutzbar
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
“Resource Discovery” in Bibliotheken
24. Oktober 2013 | Seite 4
Herausforderungen für Discovery-Systeme
Herausforderung IBenutzer sind heute durch Google sozialisiert; sie erwarten
Volltextindizes und denken nicht in Metadaten
Herausforderung IIGängige Discovery-Systeme basieren auf dem String-Match-
Algorithmus; unscharfe bzw. thematische Suchen werden daher nur begrenzt unterstützt
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
“Resource Discovery” in Bibliotheken
24. Oktober 2013 | Seite 5
Herausforderungen für Discovery-Systeme
Lösung I: Benutze keine Bibliothekskataloge – oder benutze sie nur für “known item searches”
Herausforderung IBenutzer sind heute durch Google sozialisiert; sie erwarten Volltextindizes
und denken nicht in Metadaten
Herausforderung IIGängige Discovery-Systeme basieren auf dem String-Match-Algorithmus;
unscharfe bzw. thematische Suchen werden daher nur begrenzt unterstützt
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
SLUBsemantics
24. Oktober 2013 | Seite 6
Erster Schritt zu neuartiger Discovery
Lösung II: SLUBsemantics – Multilinguale und semantische Suche automatisch angereicherter Katalogdaten
Mögliche Abfragen:
Herausforderung IBenutzer sind heute durch Google sozialisiert; sie erwarten Volltextindizes
und denken nicht in Metadaten
Herausforderung IIGängige Discovery-Systeme basieren auf dem String-Match-Algorithmus;
unscharfe bzw. thematische Suchen werden daher nur begrenzt unterstützt
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
SLUBsemantics
24. Oktober 2013 | Seite 7
Wie funktioniert es?
Wikipedia: die größte Wissensbasis der Welt, die “nach dem Prinzip des kollaborativen Schreibens fortwährend gemeinschaftlich korrigiert, erweitert und aktualisiert” wird
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
SLUBsemantics
24. Oktober 2013 | Seite 8
Phase 1: Anreicherung der Katalogdaten
• (Stapelweise) Verarbeitung bibliografischer Daten auf der Grundlage von Data- und Text-Mining-Algorithmen sowie Wikipedia-Dumps
• Katalog-Sätze werden mit Wikipedia-Konzepten durch stabile URIs aus dbpedia verbunden
• Speicherung angereicherter Indexdaten in einem Search Server
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.de
SLUBsemantics
24. Oktober 2013 | Seite 9 Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
Phase 1: Anreicherung der Katalogdaten
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
SLUBsemantics
24. Oktober 2013 | Seite 10
Phase 2a: Retrieval-Prozess
1. Suchanfrage wird an einen lokalen vorprozessierten Wikipedia-Korpus gesendet
2. Ursprüngliche Suchanfrage wird erweitert durch IDs der für diese Anfrage als relevant eingeschätzten Wikipedia-Artikel
3. Erweiterte Suchanfrage wird gegen den in Phase 1 angereicherten Katalogindex gesendet (Metadaten & mehrsprachige Wikipedia-Konzepte)
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
SLUBsemantics
24. Oktober 2013 | Seite 11
Phase 2b: Facetten-ErzeugungDisambiguierung des Begriffes „chicken game“ mithilfe des Facettenbaumes, der on the fly aus dem Wikipedia-Kategoriensystem generiert wird:
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
SLUBsemantics
24. Oktober 2013 | Seite 12
Demonstration
• Search demonstrator für die British Library:http://sem.avantgarde-labs.de/
• Suche im SLUB-Katalog:http://www.slub-dresden.de:
− Multilingualität: Suche nach „steamboat paddlewheel“− Disambiguierung: Suche nach „python“− Semantik: Suche nach „gra w cykora“ (i.e. chicken game)
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
Projekt Datenmanagement-Plattform
24. Oktober 2013 | Seite 13
Zweiter Schritt zu neuartiger Discovery
• Datenmanagement-Plattform als Middleware-Lösung
• Verarbeitung sämtlicher bibliothekarischer Daten
• Existierender technologische Infrastrukturen einer Bibliothek können beibehalten werden
• Alle internen und extern relevanten Datenquellen werden in kontinuierlich laufenden Datenverarbeitungsprozess integriert
• Daten werden zusammengeführt, dedupliziert, semantisiert, FRBRisiert und normalisiert
• Bereitstellung einer Single Version of the Truth (SVOT)
• SVOT wird in einem RDF-Format im Sinne von Linked Open Data publiziert
• SVOT ist Basis für verschiedene Datenpräsentationsanwendungen der Bibliothek
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
Frontend: …
Frontend: …
Mid
dle
war
e-S
chic
ht
Projekt Datenmanagement-Plattform: Architekturkonzept
24. Oktober 2013 | Seite 14
App: Resource Management
Datenhaltung Ereignisgesteuerte Verarbeitung
Parallelisierte Massendatenverarbeitung
Datenintegrationstools
Zentrales Job Repository
Datenquellen (interne und externe Datenbestände)
Frontend: Web-Katalog
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
Projekt Datenmanagement-Plattform: Web-Applikation
24. Oktober 2013 | Seite 15
Zweiter Schritt zu neuartiger Discovery
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
Projekt Datenmanagement-Plattform: Agiles Entwicklen
24. Oktober 2013 | Seite 16
Zweiter Schritt zu neuartiger Discovery
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
Projekt Datenmanagement-Plattform
24. Oktober 2013 | Seite 17
Entwicklung und Finanzierung
Aus Mitteln des Europäischen Fonds für Regionale Entwicklung (EFRE) Gemeinschaftsprojekt der SLUB Dresden (Plattform Datenmanagement) und
der UB Leipzig (Frontend-Applikation Electronic Resource Management-System)
Zusammenarbeit mit Avantgarde Labs und der Research Group Agile Knowledge Engineering and Semantic Web (AKSW) (Softwareentwicklung, Marketing)
Kollaboration mit der Community Bevorzugung von quelloffenen Werkzeugen Agile Softwareentwicklung (möglichst wenig bürokratischer Aufwand, klare
Rollenverteilung, iteratives Vorgehen) Begleitendes Marketingkonzept Ausführliche Projektbeschreibung erhältlich
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
Discovery und die neue Rolle von Bibliotheken
24. Oktober 2013 | Seite 18
The British Library
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
Discovery und die neue Rolle von Bibliotheken
24. Oktober 2013 | Seite 19
„Knowledge is of two kinds: We know a subject ourselves, or we know where we can find information on it.“ Samuel Johnson
Das ist nicht unser Ansatz:
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
Discovery und die neue Rolle von Bibliotheken
24. Oktober 2013 | Seite 20
Das digitale Zeitalter
• Bereitsteller von Convenient Services statt bloßem Zugang zu Ressourcen
• Beförderer von Wissenschaft und Forschung statt Wächter des Wissens
• Technological Stewards statt Skeptiker des Kulturwandels
Erwerbung
Verarbeitung
Verwertung Lebe
nsw
isse
nsch
afte
n
Nat
urw
isse
nsch
afte
n
Gei
stes
wis
sens
chaf
ten
…
Erzeugung, Selektion, Verarbeitung, Speicherung
Management, Wissensextraktion,
Metadaten, Ontologien
Analyse, Publikation, Portale, ARchivierung
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
Discovery und die neue Rolle von Bibliotheken
24. Oktober 2013 | Seite 21
Semantic Resource Discovery als Service
• Überwindung traditioneller Konzepte von Discovery
• Zusammenführen von Informationen statt Reduzierung auf kleinste gemeinsame Nenner
• Big Data statt sorgfältiger Auswahl und partieller Genauigkeit bei der Behandlung von Bibliotheksdaten
• Automatische Anreicherung, Crowd sourcing und Games with a Purpose statt exklusive Sacherschließung durch Experten
• Semantisches, graph-basiertes Retrieval statt String-Suche
• Möglichkeit zur intuitiven Entdeckung und Exploration von Wissen statt Vermittlung von Suchexpertenwissen
• Wissen statt Information
Wissensexploration und neuartiges Resource Discovery als Service
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
Discovery und die neue Rolle von Bibliotheken
24. Oktober 2013 | Seite 22
Weitere Services in Bibliotheken
• Digitalisierung und Digitalisierungs-Support (s. www.goobi.org)
• Digitale Forschung: Text-Mining-Plattformen und Virtuelle Forschungsumgebungen
• Informations-Services: Wissenschaftskartografie und Alerting Aervices
• Akademisches Community Building: Profilseiten für Wissenschaftler (FIS), Campus-Community-Plattformen, Experten-Informationssysteme
• Wissenschaftliches Schreiben und Publizieren: Bibliometrie, Publikations-Support, Open Access (s. Wissensbar der SLUB Dresden)
• Konzept der “blended library”, die physische und digitale Dienstleistungen wieder integriert (s. Gebäudeinformationssystem der SLUB und mapongo)
Die Perspektive:Digitale Services in einer digitalen Kultur für eine digitale Community
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.deDr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information
Discovery und die neue Rolle von Bibliotheken
24. Oktober 2013 | Seite 23
Weitere Services in Bibliotheken
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden© by SLUB Dresden
slub-dresden.de
Danke für Ihre Aufmerksamkeit!
24.10.2013Dr. Jens Mittelbach, SLUB Dresden
Resource Discovery neu definiert