Open Access Fortbildung WGL: Berlin 25-AUG-2009
Offene Repositorien für wissenschaftliche Inhalte
Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Viele neue Fragen …
Was machen Sie als Bibliothek oder Informationseinrichtung, wenn Sie um Hilfe gebeten werden …… bei einer Bibliographie für die Webseiten einer Fakultät
/ eines Institutes… bei einer elektronischen Fachzeitschrift für einen
Professor als Herausgeber… bei einem Primärdatendienst für eine Forschergruppe … bei der Verknüpfung des
Forschungsinformationssystems und dem Repositorium ???
Open Access Fortbildung WGL: Berlin 25-AUG-2009
… viele neue Lösungen!
Digitale Dienste in Bibliotheken und Informationseinrichtungen werden spezifischer und komplexer und entsprechend auch die Lösungen>> „Informationsinfrastrukturen“
Digitale Dienste in Bibliotheken sind fast alle Daten-zentriert und heute Internet-basiert > keine reine IT
>> „Repositorien“ als Rückgrat
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Informationsinfrastrukturen: Sicht der EU
Linking at the speed of the lightLinking at the speed of the lightSharing computers, instruments and applicationsSharing computers, instruments and applications
Sharing and federating scientific dataSharing and federating scientific data
Astrophysics
community
WeatherForecast
community
Biomedics
community
Connecting the finest mindsSharing and federating the best scientific
resourcesBuilding global virtual communities
. . . . . .
. http://www.driver-repository.eu/Summit1/Campolargo%20MCAM%20Driver%20event.ppt
EU: e
-Infr
astr
uctu
res
Nets
Grids
Repos.
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Informationsinfrastrukturen: USA
http://www.dlib.org/dlib/july05/griffin/07griffin.html
USA
: cyb
erin
fras
truc
ture
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Eine (sehr) kurze Geschichte der Repositorien
Eigentlich bekannt aus der Software-Entwicklung
In deutschen Bibliotheken zunächst Dokumentenserver für Dissertationen
Dann en vogue durch „Open Access“
Heute weitere Trends erkennbar:Primär- und SekundärdatenForschungsinformationssystemeVirtuelle Forschungsumgebungen… (zurück zu Software-Repositories?)
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Repositorien sind ein Symbol geworden…
… für: Open Access – Inhalte im Fokus – Verteilte Systeme
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Repositorien: Situation OAI-PMH
~ 7,5 Mio records~ 550 repositories~ quality selection
Scholarly Texts
~ 10 Mio records~ 800 repositories~ loose selection
~ number unknown~ repositories indirectly~ mixed contents
~ 1000 Journals
~ 1000 Repositories
1300
4000
19 1200
20 1100
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Repositorien: Eine Erfolgsstory?
Publikationenserver im RegelbetriebNeue bibliothekarische AufgabeBeinhalten wichtige Daten der Institution Zuverlässiger, dauerhafter BetriebGuter Ausgangspunkt für neue Aufgaben
Aber: verteilte Infrastrukturwenig lokale und globale Einbettung ‚Nur‘ Suche dank Crawling und OAI-PMH Noch eine Silo-artige Struktur
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Fokus: lokale Einbettung
CRIS
z.B. z.B.
z.B.
z.B.
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Lokal / National / International
Nicht alles geht lokal
Nationale und internationale Projekte helfen, Anforderungen zu entsprechen
Weiterverarbeitung von lokalen DatenVerknüpfung von Mehrwertdiensten…
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Verteilte Systeme sind mächtig aber komplex
Humpty Dumpty sat on a wall,
Humpty Dumpty had a great fall.
All the king's horses,
And all the king's men,
Couldn't put Humpty together again.
Es fehlt Infrastruktur:Organisation – Dateninteroperabilität – Diensteinteroperabilität
Open Access Fortbildung WGL: Berlin 25-AUG-2009
DRIVER-Infrastruktur: Ziele
1. Organisatorische Struktur für Repositorien„Confederation“
2. Verbesserung von Datenqualität und -standards„Guidelines“ und Validierung
3. Verteilte Laufzeitumgebung für Dienste z.B. gemeinsame Nutzung von Technik & Diensten
Zielgruppen1. Entscheider 2. Repositorienmanager3. Diensteanbieter
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Was meint DRIVER mit Infrastruktur?
Keine InfrastrukturEinzelnes Institutionelles RepositoriumEinzelne Anwendung (z.B. Suche; BASE) Lokale Operation Keine strukturelle Rückwirkung auf Repositorien
Vielleicht eine InfrastrukturVerteilte Repositorienlandschaft als Ganzes Hat das Potential „emergente“ Eigenschaften zu entwickeln Kann zu einer Entwicklung von Diensteanbietern führen
Sicher eine InfrastrukturMehrere Diensteanbieter in einer gemeinsamen organisatorischen und technischen UmgebungGeteilt geschulterter Betrieb und Datenaustausch
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Der DRIVER-Ansatz ist inkrementell
Publikationsmetadaten als StartpunktVerteiltes, lose gekoppeltes System existiert bereitsBeträchtliche Homogenität durch OAI-PMH
Ausbau nach LändernVon 5 Ländern über 10 und 27 nach ???
Ausbau zu anderen InhaltstypenVon Publikationsmetadaten zu „enhanced publications“, also Representationen von Text & Daten
Ausbau zu fachlichen DienstenDaten bedingen disziplinäre Sichtweise
Open Access Fortbildung WGL: Berlin 25-AUG-20091616
Der DRIVER-Fahrplan
DRIVER-I 6/2006 – 11/2007
Organisationelle Modelle and technisches “Test-Bed”
DRIVER-II 12/2007 – 11/2009
Laufende Organisation and Produktionssysteme
DRIVER-Confederation 2010ff
Geschäftsstelle und technischer Betrieb
NB: DRIVER ist kein “Ordnungsamt” – es ist eine liberale Versammlung von Interessenvertretern
Open Access Fortbildung WGL: Berlin 25-AUG-2009
DRIVER-Partner and Netzwerke
Networking, Support, Policy, StudienGöttingen, Nottingham, SURF, Genth, Ljubiljana, Minho, Copenhagen
Technische Entwicklung und BetriebAthen, Bielefeld, Pisa, Warschau
Partner sind hochgradig vernetztOA-services: Sherpa-ROMEO, OpenDOAR, BASE…Projects: OA-Netzwerk, Europeana, PEER, DELOS, DL.org, D4Science, PARSE-Insight…Orgs: DINI, JISC, LIBER, SPARC, KE …Platforms: DSPACE/FEDORA/OPUS/ePrints
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Einige Ergebnisse: Studien
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Einige Ergebnisse: Ein Portal
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Einige Ergebnisse: Eine Suche
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Einige Ergebnisse: Repository Registration
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Einige Ergebnisse: GuidelinesBuild on knowledge from past & current IR projects (EU)26 actively involved contributors (experts and repository managers) from 8 countries.Practical answers on how to:
Improve full-text access Standardize metadata qualityCreate a reliable infrastructure for permanent identification, resolution, traceability and storageResolve semantic and classification issues
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Einige Ergebnisse: Support structures
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Einige Ergebnisse: Repositorien
200+ harvested repositories
21 countries
1.000.000+ documents
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Einige Ergebnisse: Verteilter Betrieb9 hosting nodes
25+ Functionality typologies(services)
36serviceInstances
3 applications: DRIVER Main, Belgium, Spain-Recolecta
Open Access Fortbildung WGL: Berlin 25-AUG-20092626
Einige Ergebnisse: Runtime-System
Enabling Layer
Data Layer
EU Open AccessRepositories
Functionality Layer
Adm
inis
trat
ors
End
user
s
Advanced User Interfaces National portals
Project Applications
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Einige Ergebnisse: Eine Software
NUr für große Service Provider!
Open Access Fortbildung WGL: Berlin 25-AUG-200928
Wo steht DRIVER-II?
Netzwerk“Confederation” mit “who-is-who” im BeiratNat: LIBER, SPARC, DINI, US, JAPAN etc…
Konsolidierungvon der Laufzeitumgebung in DRIVER-I Verteilte Dienste als Produktionssystem Nationale Knoten in Spanien, Portugal, China, Indien
ErweiterungDRIVER-I Services Verbesserte Indexierung und Aggregierung
DRIVER-II Services Management komplexer Objekte, z.B. “enhanced publications”
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Kritische Analyse
DRIVER-Infrastruktur behandelt Repositorien als verbindliche bibliothekarische Services
Aufgrund der hohen Standardisierung gerechtfertigtAber Repositorien werden zu offeneren Systemen Konvergenz mit Nachbarsystemen: CRIS, VREs, LTP,
Datendienste, Campus-Management, Web-CMS …
OAI-PMH hat seine GrenzenProtokoll für Austausch ist robust Aber keine interoperable semantische RepräsentationAber nicht integriert in Web-Architektur
Datenaustausch stark eingeschränkt DRIVER muss web-fähige semantische Beziehungen verarbeiten und herstellen können
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Problemstellung für DRIVER v2.0
Repositorien exponieren reiche Datenstrukturen„Pakete“: METS, MPEG21-DIDL, IMS-CP …„Umschläge“: OAI-ORE, Microformats …
Nachbarsysteme müssen verlinkt werdenGRID, CRIS, Long-Term-Preservation …
DRIVER muss vom Metadatenmanagement zum semantischen Datenmanagement kommen
Input/Ingest von diversen DatentypenTransformation zu neutralem ObjektmodellSpeicherung komplexer Datenstrukturen (Repositorium!)Zugriffssteuerung für Anreicherungsdienste Data Mining und Nutzer-generierte DatenExposition von diversen Datentypen
Open Access Fortbildung WGL: Berlin 25-AUG-2009
D-NET v2.0 – Der Plan
„Enhanced Publications“ als ParadigmaStudien und DemonstratorEntwicklung eines generischen Datenmodells
Infrastrukturdienste werden komplett erneuertD-NET v2.0 als Test-Bed im Sommer `09Tests mit „enhanced publications“Fähigkeit zur Verarbeitung komplexer Daten Ende `09Sichtbarkeit erwartet für `10ff
Open Access Fortbildung WGL: Berlin 25-AUG-2009
D-NET v2.0 – der Stand
StudienWas sind „Enhanced Publications“? >> PDFTechnologien für „Enhanced Publications“ >> PDFLangzeitarchivierung von „Enhanced Publications“„Technology Watch“: die Zukunft >> PDF
Demonstratoren „Enhanced Publications“ >> Live„Enhanced Publications“ Langzeitarchivierung >> Film
InfrastrukturSpezifikationen fertig, Entwicklung im Gange >> WIKI D-NET v1.1: Java-Portierung und Build-System D-NET v1.2: Neuer Aggregator, Installer D-NET v2.0: Compound Object Management
Open Access Fortbildung WGL: Berlin 25-AUG-2009
DRIVER v2.0 – Perspektiven
Geograph. (oder fachliche) Knoten bilden ein verteiltes Hardware- & Softwarenetz
Load-balancing, Shared Costs, Redundanz …Andere Datentypen werden integriert und gebunden
Diensteanbieter bauen auf InfrastrukturVernetzung von Mehrwertdiensten z.B. Integration von BASE, RoMEO, OpenDOAR etc. Terminologiedienste (i.w.S.): Zeitschriftendatenbanken,
Ontologien, Autorenidentifikation, Objektidentifikation… Endnutzerdienste werden ausgebaut
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Die Zukunft von DRIVER
Mit DRIVER-II wird einen robuster und mächtiger Werkzeugkasten zur Vernetzung von Repositorien zur Verfügung gestellt
Verstetigung der Organisation >> ConfederationTechnischer Betrieb gewährleistetSchwerpunkt auf „Uptake“ Nationale Knoten und weitere Projekte
OpenAIRE als Support-Projekt für OA-Mandat zu europ. Förderprogrammen plant mit DRIVER
Infrastruktur für Nachweis der DokumenteDisziplinenspezifische Studien zu Informationsinfrastr.Weiterentwicklung der Nutzungsstatistiken u.v.m.
Open Access Fortbildung WGL: Berlin 25-AUG-2009
„Offene Repositorien für wiss. Inhalte“
Lokale Repositorien als eingebettete SystemeLokale Wissensspeicher – eng mit CRIS, VREs, Campus-Management, LMS, LTP … verknüpft Workflows sind eine StandardanforderungWeg von Menschenlesbarkeit, hin zu Maschinenlesbarkeit/Schnittstellen
Lokale Repositorien als semantische InfrastrukturNahtlose Integration in Web-ArchitekturWeltweit verteiltes Netz in WWW-Manier
Repositorien entwickeln sich vom einzelnstehenden Publikationenserver zur Datenbasis der verteilten
wissenschaftlichen Informationsarchitektur
Open Access Fortbildung WGL: Berlin 25-AUG-2009
Vernetzung im europ. Forschungsraum
Zahlreiche Förderprogramme für RepositorienDRIVER ist ein (kleines) Projekt unter vielen DG-INFSO mit vielen ProgrammlinienESFRI-EntwicklungsaktivitätenStarker fachlicher SchwerpunktDFG mit Repositorienprogrammen (>> OA-Netzwerk)+ USA, Australien, Japan, China, Indien …
Fragmentierung durch lokale und disziplinäre Ausdifferenzierung muss umso mehr durch Vernetzung
begleitet werden >> „Interoperability rules“