auf du und du mit dublin core & co. - berufsfeld metadaten-management im kontext der bibliothek...

147
Die ZBW ist Mitglied der Leibniz-Gemeinschaft Auf Du und Du mit Dublin Core & Co. – Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft Kirsten Jeude 12.04.2013 Metadaten-Management im Leibniz-Informationszentrum Wirtschaft metadata“ Shira Golding, https://secure.flickr.com/photos/boojee/3743753784/in/photostream

Upload: suvanni

Post on 18-Dec-2014

1.255 views

Category:

Education


4 download

DESCRIPTION

1. Was sind Metadaten? Welche Typen gibt es? Wo sind sie zu finden? Welche Aufgaben haben sie? 2. Bestandteile und den Aufbau von Metadatenstandards. Beispiele für Metadatenstandards Ausflug zu XML. 3. Unterschied zwischen Metadaten-Standards und Metadaten-Schemas. Application Profiles 4. Mappings und Crosswalk. Typische Mappingprobleme 5. Austausch von Metadaten: Schnittstellen. 6. Metadaten im Semantic Web 7. Metadaten-Management in der ZBW 8. Thesen zur Zukunft der Bibliothek und welche Rolle das Berufsfeld Metadaten-Management dort spielen kann Erweiterter Foliensatz einer Fortbildung für Studierenden / BibliothekarInnen an der UB Graz, April 2013

TRANSCRIPT

Page 1: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Die ZBW ist Mitglied der Leibniz-Gemeinschaft

Auf Du und Du mit Dublin Core & Co. – Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Kirsten Jeude 12.04.2013

Metadaten-Management im Leibniz-Informationszentrum Wirtschaft

„metadata“ Shira Golding, https://secure.flickr.com/photos/boojee/3743753784/in/photostream

Page 2: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Seite 2

Auf Du und Du mit Dublin Core & Co. – Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

1. Was sind Metadaten? 2. Metadatenstandards (inkl. Exkurs XML) 3. Application Profiles und Interoperabilität 4. Mapping 5. Schnittstellen 6. Metadaten im Semantic Web 7. Metadaten-Management in der ZBW 8. Berufsfeld Metadaten-Management im Kontext der Bibliothek der

Zukunft

Gliederung

Page 3: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

1. Was sind Metadaten?

Seite 3

Page 4: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Was sind Metadaten? Definitionen über Definitionen • „… are (structured) data about data.“ Miller, Eric: An introduction to the resource description framework. In: D-Lib Magazine, (May) 1998; Foulonneau, Muriel; Riley Jenn

(2008): Metadata for Digital Resources; u.v.m.

• „Unter Metadaten ("Daten über Daten") versteht man strukturierte Daten, mit deren Hilfe eine Informationsressource beschrieben und dadurch besser auffindbar gemacht wird.“

SUB Göttingen Metadata Server

• „… structured, encoded data that describe characteristics of information-bearing entities to aid in their identification, discovery, assessment, and management of the described entities“

American Library Association´s Committee on Cataloguing

• „… is any type of formal description of a resource, regardless of format“ Mitchell, Nicole: Metadata Basics (The Southeastern Librarian, Fall 2006)

• „…is cataloging done by men“ Delsey, Tom, National Library of Canada

• „… is machine understandable information about web resources or other things.“ Berners-Lee, Tim: Design Issues. Architectural and philosophical points, 6. Januar 1997.

• „An item of metadata is a relationship that someone claims to exist between two entities.“ Foulonneau, Muriel; Riley Jenn (2008): Metadata for Digital Resources • „I like to think of metadata as data which removes from a user (human or machine) the need

to have full advance knowledge of the existence or characteristics of things of potential interest in the environment“

Lorcan Dempsey, zit. in: Foulonneau, Muriel; Riley Jenn (2008): Metadata for Digital Resources

Seite 4

Page 5: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Metadata “is machine understandable information about web resources or other things.“ (Tim Berners-Lee)

Web-Ressourcen:

Seite 5

Page 6: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Andere Dinge:

Bücher und Zeitschriften etc.:

Museums-Objekte: Bilder:

Tonträger:

Personen:

Metadata “is machine understandable information about web resources or other things.“(Tim Berners-Lee)

Seite 6

Page 7: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Karteikarte im Zettelkatalog

Metadaten – getrennt vom Objekt Metadaten – im Objekt enthalten

CIP (Cataloging in Publication)

Datensatz in bibliographischer Datenbank

Header einer HTML-Seite mit Metadaten

Metadata „is any type of formal description of a resource, regardless of format“ (Nicole Mitchell)

Metadaten in Form von COinS (Mikroformat) in HTML-Seite

Seite 7

Page 8: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Metadata „are (structured) data about data“ (Eric Miller)

Metadaten sind „Daten über Daten“

Daten - Buch „Daten über Daten“

Metadata / Marcia Lei Zeng and Jian Qin

Zeng, Marcia Lei *1956-*

Qin, Jian *1956-*

London : Facet, 2008

xvii, 365 p. : ill. ; 23cm

Includes bibliographical references and index

1-85604-655-9, 978-1-85604-655-8 (pbk)

Metadaten

STRUKTURIERTE

Metadaten-Schema

Titel

Verfasser

Sonstige beteil. Person

Erschienen:

Umfang

Anmerkung

ISBN

Schlagwörter

Seite 8

Page 9: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Metadata „are (structured) data about data“ (Eric Miller)

Metadatenformate (maschinen-lesbar)

Bezeichner eines Merkmals (Menschen-lesbar)

4000 Suchen mithilfe semantischer Metadaten (PICA3)

021A $a Suchen mithilfe semantischer Metadaten (PICA+)

331Suchen mithilfe semantischer Metadaten (MAB)

245 00 $a Suchen mithilfe semantischer Metadaten (MARC21)

<titleInfo><title>Suchen mithilfe semantischer Metadaten</title></titleInfo>

(MODS)

Grundsätzlich und pragmatisch

Seite 9

Page 10: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

PPN: Titel: Verfasser: Sonst. Personen: Erschienen: Umfang: Anmerkung: ISBN: Schlagwörter: Mehr zum Thema:

Zeng, Marcia Lei Verfasser: Metadaten-Element

Metadatensatz

folgt Regeln (z.B. Nachname Komma Leerzeichen Vorname)

Element-Wert

571230652 Metadata / Marcia Lei Zeng and Jian Qin Zeng, Marcia Lei *1956-* Qin, Jian *1956-* London : Facet, c2008 xvii, 365 p. : ill. ; 23cm Includes bibliographical references and index 1-85604-655-9, 978-1-85604-655-8 (pbk) : £39.95 *Metadaten / *Metadata Dewey-Dezimalklassifikation: 025.3

Metadata „are (structured) data about data“

Seite 10

Page 11: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Metadata is „[…] to aid in their identification, discovery, assessment, and management of the described entities“

AUFGABEN von Metadaten (FRBR User Tasks)

1. Verlässliches FINDEN ermöglichen: Recherche nach vom Benutzer festgelegten Kriterien.

2. IDENTIFIZIEREN: Unterscheiden, was verschieden ist, z.B. Unterscheidung von zwei Texten oder Aufnahmen, die mit demselben Titel veröffentlicht wurden.

3. AUSWÄHLEN: Zusammenführen, was zusammengehört, den Benutzerbedürfnissen entsprechend : z.B. Auswahl eines Texts in einer Sprache, die der Benutzer versteht

4. Zu Gewähltem ZUGANG ERHALTEN: z.B. Bestellung für eine Publikation abgeben

FRBR: Functional Requirements for Bibliographic Records

Seite 11

Page 12: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Metadata is „[…] to aid in their identification, discovery, assessment, and management of the described entities“

TYPEN von Metadaten

Deskriptive Metadaten : Beschreiben eine Ressource zum Zweck der Entdeckung, der Identifikation, der Auswahl und des Zugangs

Strukturelle Metadaten: Beschreiben die interne Organisation einer Ressource. Beschreiben, wie miteinander verbundene Objekte miteinander in Beziehung stehen, z.B. wie Seiten geordnet werden müssen, damit ein Kapitel entsteht.

Administrative Metadaten: „meta-metadata“; Informationen, die helfen eine Ressource zu verwalten:

Technische Metadaten: Enthalten Informationen über Format und Dateityp

Metadaten für das Rechtemanagement: Enthalten Informationen, die für die Berechtigung des Zugriffs und Informationen über das geistige Eigentum dienen

Herkunfts-Metadaten (Provenienz-Metadaten): Metadaten über die Herkunft der Ressource: Feststellung der Vertrauenswürdigkeit; Bewahrung der Nutzbarkeit

Seite 12

Page 13: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

• Formale Beschreibung einer Ressource • Strukturierte „Daten über Daten“ • Ein Metadatensatz besteht aus Metadaten-Elementen und den dazugehörigen

Werten • Für eine Vielzahl an Dingen (Texte, Bilder, Objekte, Personen, etc.) • Getrennt vom beschriebenen Objekt oder enthalten im Objekt • menschen-lesbar, maschinen-lesbar (und maschinen-interpretierbar) • Aufgaben von Metadaten sind die Unterstützung beim Finden, Identifizieren,

Auswählen einer Ressource, sowie Zugang zu ihr erhalten • Es gibt verschiedene Typen von Metadaten: deskriptive, administrative,

technische Metadaten, Struktur- und Provenienz-Metadaten, Metadaten für das Rechtemanagement

Seite 13

Zusammenfassung: Was sind Metadaten?

Page 14: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

2. Metadatenstandards

Seite 14

Page 15: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Metadatenstandards

Standards? "The nice thing about standards is that you have so many to

choose from. Furthermore, if you do not like any of them, you can just wait for next year's model."

Quelle: Andrew Tanenbaum, Computer Networks, 2nd edn., p. 254

Ein Metadatenstandard • sorgt für: Konsistenz der Metadaten • verbessert: Metadatennutzung • erlaubt: Austausch von Metadaten und die Verlinkung von

Objekten anwendungsübergreifend

Seite 15

Page 16: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Metadatenstandards „A content metadata standard is defined as an open specification that itemizes a set

of elements and their meanings. Each element is tagged with an identifier (e.g., "Title", "Author") that distinguishes the element from other elements within the standard. In addition, each element has a set of constraints or rules specifying the allowable content of the element and its relationship to other elements within the standard.“ (http://www.niso.org/publications/white_papers/crosswalk/ )

"A metadata schema provides a formal structure designed to identify the knowledge

structure of a given discipline and to link that structure to the information of the discipline through the creation of an information system that will assist the identification, discovery, and use of information within that discipline" . American Library Association Committee on Cataloging: Description and Access (CC:DA) Task Force on Metadata

Seite 16

Page 17: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Aufbau eines Metadaten-Standards am Beispiel Dublin Core

Dublin Core Metadata Initiative (DCMI)

Zunächst für die Beschreibung von Webressourcen

15 Kern-Elemente (“Core”): Title, Creator, Subject, Description, Publisher, Contributor, Date, Type, Format, Identifier, Source, Language, Relation, Coverage, and Rights

Alle optional und wiederholbar

Reihenfolge der Elemente beliebig

http://dublincore.org/documents/dces/

Title ”Metadata Demystified”

Creator ”Brand, Amy”

Creator ”Daly, Frank”

Creator ”Meyers, Barbara”

Subject ”metadata”

Description ”Presents an overview of metadata conventions in publishing.”

Publisher ”NISO Press”

Publisher ”The Sheridan Press”

Date ”2003-07"

Type ”Text”

Format ”application/pdf”

Identifier ”http://www.niso.org/standards /resources/Metadata_Demystified.pdf”

Language ”en”

Seite 17

Page 18: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Dublin Core Metadata Element Set Dublin Core Simple: 15 Elemente:

titel Titel creator Verfasser oder Urheber contributor Mitarbeiter publisher Verlag subject Thema des Inhalts (Sacherschließung) date Datum coverage Abdeckung description Beschreibung language Sprache type Art, Gattung format Format identifier Eindeutige Identifizierung relation Beziehung source Quelle rights Rechte

Seite 18

Page 19: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Dublin Core - Metadatenelemente

Element (property): Merkmal / Eigenschaft einer Ressource, wie Titel, Autor etc.

„An Element is a property of a resource. As intended here, "properties" are attributes of resources – characteristics that a resource may "have", such as a Title, Publisher, or Subject.“ (DCMI Glossary)

Seite 19

Page 20: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Dublin Core Element Set - Übung

DC element value title creator contributor publisher subject date coverage

DC element value description language type format identifier relation rights

Sprache: rumänisch, englisch

Seite 20

Page 21: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Dublin Core Element Set - Übung: Lösung

Sprache: rumänisch, englisch

DC element value title Intelectuali Români implicati în

dezvoltarea civilizatiei economice title Romanian intellectuals inolved in

the development of the economic civilization

creator Saizu, Ioan contributor ----- publisher Ed. Acad. Romane subject Wirtschaftsgeschichte subject Rumänien date 2003 coverage Rumänien

DC element value description -------------- language rumänisch language englisch type Buch / Book format 308 S. identifier 973-270983-9 relation --------------- rights ---------------

Seite 21

Page 22: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Dublin Core Metadata Terms

15 Elemente bieten wenig Differenzierung. Was tun?

Dublin Core Metadata Terms

Element Refinement: Verfeinerung der Bedeutung eines Elements

Die Refinements können als Unterbegriff des Elements verstanden werden.

Beispiel: Element „Description“ mit den Refinements „Abstract“ oder „Table of Contents“

55 Terms: http://dublincore.org/documents/dcmi-terms/

dc.description Kann jegliche Art von Beschreibung enthalten

dcterms.abstract Hier sind nur Abstracts zulässig dcterms.tableOfContents Hier sind nur Inhaltsverzeichnisse zulässig

Seite 22

Page 23: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Encoding Schemes Weitere semantische und syntaktische Differenzierung bieten Encoding Schemes

Wie, in welcher Form wird das Element beschrieben?

Kodierungs-Schema, kontextabhängige Informationen oder Parsing-Regeln (Syntax-Analyse-Regeln), die dazu beitragen, den Wert eines Elements zu interpretieren.

Semantics is about meaning; syntax is about form Weibel, S. et.al. (2002)

Semantik: Semantik (von Altgriechisch σημαίνειν sēmaínein ‚bezeichnen‘, ‚zum Zeichen gehörig‘), auch Bedeutungslehre, nennt man die Theorie oder Wissenschaft von der Bedeutung der Zeichen. Zeichen können in diesem Fall Wörter, Phrasen oder Symbole sein. Die Semantik beschäftigt sich typischerweise mit den Beziehungen zwischen Zeichen und Bedeutungen dieser Zeichen. [http://de.wikipedia.org/wiki/Semantik]

Syntax: die rein formalen Beziehungen zwischen (sprachlichen) Zeichen, z.B. Datumsangabe: soll in der Syntax YYYY-MM-DD erfolgen.

Seite 23

Page 24: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Vocabulary Encoding Schemes

Vocabulary Encoding Scheme (VES):

Beschreibt, dass der Wert eine Bezeichnung aus einem kontrollierten Wortschatz ist, z.B. Wert = Klasse (Notation) aus der DDC, Deskriptor aus dem Standard Thesaurus Wirtschaft (STW), etc.

Bsp. Element „subject“ mit dem Encoding Scheme „DDC“

<dcterms:subject xsi:type „dcterms:DDC“>330</dcterms:subject>

Achtung! Jetzt kommt ein Thema, und zudem stammt

der Wert aus der DDC

Seite 24

Page 25: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Vocabulary Encoding Schemes: Klassifikationen – Thesauri – Schlagwörter und mehr

Klassifikationen DDC Dewey Decimal Classification UDC Universelle Dezimalklassifikation BK Basisklassifikation LCC Library of Congress Classification RVK Regensburger Verbundklassifikation JEL: Klassifikation des Journal of Economic Literature

Thesauri STW Standard Thesaurus Wirtschaft TGN Getty Thesaurus of Geographic Names TheSoz Theaurus Sozialwissenschaften IBLK Europäischer Thesaurus Internationale Beziehungen und Länderkunde MeSH Medical Subject Headings AGROVOC Agrarwissenschaften, Forstwirtschaft, Fischerei, Nahrungsmittel und verwandter Gebiete INFODATA Thesaurus Informationswissenschaft

Normdateien (authority files) GND Gemeinsame Normdatei (Personen, Körperschaften , Schlagwörter) LCSH Library of Congress Subject Headings Rameau Normdatei der BnF VIAF Virtual International Authority File

Sonstiges kontrolliertes Vokabular IMT Internet Media Type (auch MIME- Type ) klassifiziert den Dateityp z.B. für DC-Element „format“ DCMIType Vocabulary Ressourcentype z.B. für DC-Element „type“

Seite 25

Page 26: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Syntax Encoding Schemes

Syntax Encoding Scheme (SES):

Gibt an, wie die Zeichenketten, die bei der Beschreibung eines Objekts verwendet werden, aufgebaut sein müssen und regelt damit die syntaktische Struktur der Beschreibung, z.B. „JJJJ-MM-TT" als Standardausdruck eines Datums.

Bsp. Element „Date“ mit Encoding Scheme „JJJJ-MM-TT“

<dcterms:date xsi:type dcterms:W3CDTF>2007-12-04</dcterms:date>

Achtung! Jetzt kommt ein Datum und außerdem hat

es das Format JJJJ-MM-TT

Seite 26

Page 27: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Syntax Encoding Schemes Normen und weitere Standards ISO 8601 Data elements and interchange formats - Information interchange - Representation of dates and times W3C-DTF „defines a profile of ISO 8601, the International Standard for the representation of dates and times „ DCMI Period Encoding Scheme (Zeiträume): „for identifying a single time interval using its limits „ DCMI BOX Encoding Scheme (geographische Räume): „method for identifying a region of space using its geographic limits and representing that information as a value string.“ DCMI Point Encoding Scheme (geographischer Punkt): „a mechanism for indicating a point in space using its geographic coordinates and representing that information as a value string. „

URIs (Uniform Resource Identifier) URL Uniform Resource Locator URN Uniform Resource Name Handle Handle DOI Digital Objekt Identifier PURL Persistent Uniform Resource Locator

Weitere Identifier ISBN International Standard Book Number: ISBN 978-3-7657-2781-8 ISSN International Standard Serial Number: ISSN 4177-0815 BICI Book Item and Component Identifier SICI Serial Item and Contribution Identifier (ANSI/NISO standard Z39.56). ISMN International Standard Music Number Seite 27

Page 28: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Syntax and Vocabulary Encoding Schemes

RFC 3066: Vorläufer der ISO-639 ISO 639 Sprachen (Sprachcodes):

ISO 639-1 (Alpha-2 Code) ISO 639-2 (Alpha-3 Code) ISO 639-3 (Alpha-3 Code for comprehensive coverage of languages)

Semantisch im Hinblick auf das enthaltene Vokabular. Syntaktisch im Hinblick auf die Kodierung in bestimmter Anzahl Zeichen automatisch prüfbar (Plausibilitätsprüfung).

http://upload.wikimedia.org/wikipedia/commons/thumb/9/95/ISO_639_Schematische_Darstellung.svg/700px-ISO_639_Schematische_Darstellung.svg.png

Seite 28

Page 29: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Metadaten-Standards und -Schemas definieren zulässige Elemente und ihre Bedeutung (Semantik), sowie ihre Form (Syntax):

• Sachliche Definition des Inhalts (content rules). Diese besagen, wie die Werte für das Datenelement ausgewählt und repräsentiert werden.

• Regeln über die Form des Feldinhalts (representation rules): z.B. Regeln über die Groß- und Kleinschreibung

• Regeln über die Syntax des Inhalts, also wie der Inhalt codiert werden muss: z.B. ein Datum muss immer in der Form YYYY-MM-TT eingegeben werden (syntax encoding scheme)

• Regeln über die zulässig Inhalte (content values), z.B. der Inhalt des Feldes muss aus einem kontrollierten Vokabular, wie z.B. dem STW, der DDC, der UDC, der BK, etc. stammen (vocabulary encoding scheme)

• Angaben zur Wiederholbarkeit und Verpflichtung eines Elements

• Angaben wie verschiedene Elemente miteinander in Beziehung stehen

Zusammenfassung: Aufbau eines Metadatenstandards

Seite 29

Page 30: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Zusammenfassung: Aufbau von Dublin Core

• Dublin Core Metadata Element Set = 15 Elemente (Dublin Core Simple)

• Dublin Core Metadata Terms (Dublin Core Qualified)

• Element Refinements = 55 Elemente

• Encodings Schemes und Refinements sind „Qualifier“ • Dublin Core Qualifier: http://dublincore.org/documents/usageguide/qualifiers.shtml

• Dublin Core auf Deutsch: KIM - Kompetenzzentrum Interoperable Metadaten

Seite 30

Page 31: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Prinzipien von Dublin Core One-to-One-Principle - Das 1:1-Prinzip: Jede Beschreibung (decription) steht für ein und nur ein Objekt (Ressource), z.B.

eine Beschreibung für einen gedruckten Text, eine weitere für die elektronische Ausgabe.

Dumb-Down-Principle – Prinzip der Vereinfachung: Die Bedeutung eines Elements kann verfeinert, aber nicht erweitert werden. Beispiel: Element „description“ mit den refinements „ToC“ oder „Abstract“ (dumb

down der Eigenschaft und des Wertes) Appropriate Values – Angemessene / entsprechende Inhalte: „Best Practice“ : menschen- und maschinelesbar.

Seite 31

Page 32: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Prinzipien von Dublin Core

1. Simplicity: Einfachheit der Beschreibung

2. Semantic interoperability: Semantische Interoperabilität

3. International consensus: Internationale Übereinkunft über Standard

4. Interdisziplinary: Interdisziplinär einsetzbar

5. Extensibility: Erweiterbarkeit, keine Beschränkung auf DC-Elemente

6. Modularity: Modular, im Baukasten-Prinzip verwendbar

7. Modifiability: Jedes Element kann durch die Angabe eines Attributs verändert werden

8. Optionality: keine Pflichtfelder

9. Repeatability: Alle Elemente können mehrmals in einem Datensatz auftreten 10. Independency: Unabhängigkeit von einer spezifischen Syntax

Seite 32

Page 33: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Metadatenformate

bibliographisch / deskriptiv

Metadatenstandard ist nicht gleich Metadatenformat Dublin Core Metadatenstandard • als .txt-Datei • als .html- oder .xhtml-Datei • als .xml-Datei • als .rdf-Statements Syntax Guidelines für die korrekte Konstruktion von DC-Datensätzen in diese Formate: http://dublincore.org/specifications/ Grundsätzlich: • Metadatenstandards als Text-Standard entwickelt und nachträglich weitere Repräsentationen • Originäre XML-Standards • Proprietäre Formate, z.B. .mrc für MARC

Metadatenformat, z.B. DC-DS-XML

Seite 33

Page 34: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Exkurs XML

Extensible Markup Language = erweiterbare Auszeichnungs-Sprache

Beispiele für Auszeichnungssprachen: HTML (Hypertext Markup Language), SGML (Standard Generalized Markup Language), XML

Standard zur Erstellung von maschinen- und menschenlesbaren Dokumenten

Der Standard wurde vom World Wide Web Consortium (W3C) definiert

Befehle in Form von semantischen tags: <titel> </titel>, <date> </date>, <creator></creator>

<befehl>Information</befehl>

Seite 34

Page 35: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Unterschiede zwischen HTML und XML Unterschied zu HTML Tags sind nicht festgelegt. Sie werden für

spezielle Anwendung definiert: Datenbank 1: <autor>Marx, Karl<autor/> Datenbank 2: <verfasser>Marx, Karl<verfasser/> HTML „Kann man sehen“ = Auszeichnung der

Strukturierung von Inhalten XML transportiert Semantik = logische

Auszeichnung der Inhalte

Gemeinsamkeiten Auszeichnungssprachen Stammen von SGML ab Befehle in Form von tags Textformat (im Sinne von

Nicht-binär)

<h1>Metadaten für Einsteiger</h1>

Jetzt kommt eine Überschrift: 20 pt., fett

Ende Überschrift: Absatz-schriftart

HTML

<titel>Metadaten für Einsteiger</titel>

Hier kommt der Titel der Ressource

Hier endet der Titel der Ressource

XML

Prä

sent

atio

n Bedeutung

Seite 35

Page 36: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

XML - Eigenschaften • Trennt strikt zwischen Daten und Verarbeitung der Daten: Welche Software für

die Verarbeitung verwendet wird, ist nicht festgelegt. • XML = Textformat: erleichtert es Menschen die enthaltene Information zu verstehen

und macht unabhängig von bestimmten technischen Implementierungen • Für hoch-strukturierte Daten (aus relationalen Datenbanken) und semi-

strukturierte Daten (von Menschen verfasste Texte) • Einfach: leichter zu erlernen und leichter zu implementieren als Vorfahren (SGML)

.csv vs. .xml

Seite 36

Page 37: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

XML - Eigenschaften

• Flexibel: da „tags“ (Bezeichner) in XML nicht festgelegt sind, kann jeder Betreiber sein eigenes Format entsprechende seiner Bedürfnisse erstellen.

• Flexible vs. Interoperabel: DB1: <verfasser>, DB2: <autor>, aber identische Semantik

• Metadatenformate ausgedrückt in XML:

100 1 $aSchultz, Theodore Paul,$0(DE-601)060006277.

245 10 $aChanging world prices, women's wages, and the fertility transition :$bSweden, 1860 - 1910 /$cT. Paul Schultz.

MARC21

MARC21 in XML

Seite 37

Page 38: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Metadatenstandards in XML Metadata Object and Description Schema

• Originärer XML-Standard

• Entwickelt als Kompromiss zwischen dem komplexen MARC21 und dem einfachen Dublin Core

• Für elektronische Ressourcen

• Entwickelt vom Network Development and MARC Standards Office der LoC

• Bildet Teile der MARC21-Elemente ab, bei Standard-Konvertierung Informationsverlust

Seite 38

Page 39: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Machine-Readable Cataloging - MARC21 Internationales Austausch- und Speicherformat • für bibliographische Nachweise

in Bibliothekskatalogen • Entwickelt von der LoC • ANSI/NISO Z39.2 • Viele Dialekte

1000 Elemente mit Unterfeldern und Indikatoren • ca. 60 am häufigsten

verwendete • Fixed Fields (00X) Kat.-Regelwerk: AARC2 Format: .mrc / .marc Tools: Marc-Editor „MarcEdit“

xxxxxnaa a22yyyyy c 4500 001 592906469 003 DE-601 005 20090728100724.0 008 090304s2008 000 0 eng d 016 7 $a7153508$2DE-600 040 $aGBVCP$bger$erakwb 041 0 $aeng 100 1 $aMerkl, Christian$0(DE-601)533312205$0(DE-588)133059545 245 10$aEscaping the unemployment trap :$bthe case of East Germany /$cChristian Merkl; Dennis J. Snower 300 $bgraph. Darst. 650 7$81.1\x$aLangzeitarbeitslosigkeit$0(DE-601)091374367$0(DE-STW)18124-6$2stw 650 7$81.2\x$aArbeitsproduktivität$0(DE-601)091347742$0(DE-STW)10440-1$2stw […] 700 1 $aSnower, Dennis J.$eAuthor$4aut$0(DE-601)366752960$0(DE-588)124825109 773 08$iIn: $tJournal of comparative economics$dAmsterdam : Elsevier$gVol. 36, No. 4 (2008), p. 542-556$q36:4<542-556$w(DE-601)130445541$x0147-5967 773 08$iIn: 900 $aGBV$bZBW Kiel <206> 952 $d36$j2008$e4$c12$h542-556 954 $a26$b923675930$c01$x0206

http://www.loc.gov/marc/ Seite 39

Page 40: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

650 = Sachschlagwort Indikator 1 = undefiniert Indikator 2 = Quelle des Vokabular wird spezifiziert in Unterfeld 2 Unterfeld a = Deskriptor Unterfeld 0 = Identifier der Ressource in der Datenbank „DE-601“ (GBV) Unterfeld 2 = Deskriptor stammt aus dem STW

Unterfelder und Indikatoren

Seite 40

Page 41: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Project of Integrated Catalogue Automation - PICA

PICA+: Datenbank-Format

PICA3: Katalogisierungssicht

u.a. GBV, SWD, HEBIS, DNB

für bibliographische Nachweise in Bibliothekskatalogen

ca. 1300 Informationseinheiten: Elemente mit Unterfeldern

Verschiedene Satztypen, die miteinander verknüpft sind (Hierarchische Datensätze)

Kat.-Regelwerk: RAK (D)

001@ $026$aU 001A $00206:04-03-09 001B $00206:10-03-09$t10:42:23.000 001D $00206:04-03-09 001U $0utf8 001X $00 002@ $0Asu 003@ $0592906469 010@ $aeng 011@ $a2008 021A $aEscaping the unemployment trap$dthe case of East Germany$hChristian Merkl; Dennis J. Snower 027D/00 $aJournal of comparative economics$pAmsterdam$nElsevier$00147-5967$z7153508 028A $dChristian$aMerkl$9533312205$8Christian@Merkl ; PND-ID: 133059545 028B/01 $dDennis J.$aSnower$9366752960$8Dennis J.@Snower ; PND-ID: 124825109 031A $d36$j2008$e4$c12$h542-556 034M $agraph. Darst. 039B $cIn$9130445541$8Journal of comparative economics. - Amsterdam : Elsevier$x200800000360004458 039B $cIn$7!562253327! 045D/00 $9091374367$8Langzeitarbeitslosigkeit 045D/00 $9091347742$8Arbeitsproduktivität 045D/00 $9091384966$8Qualifikation 045D/49 $b49 101B $004-03-09$t09:15:56.000

Seite 41

Page 42: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Pica3 - Pica+

Katalogisierungssicht Pica3

Datenbanksicht PICA+

Seite 42

Page 43: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

43

Pica3 - Pica+ Steuerzeichen in Pica3 sind Unterfelder (subfields) in Pica+ Subfield Eine individuelle Informationseinheit in einer strukturierten Datei. Eine Untergliederung eines Feldes. Beispiel: ein Feld für Titelangaben hat mehrere Unterfelder: HST, Zusatz, Verfasserangabe

Seite 43

Page 44: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Beispiele für Metadatenstandards Metadatenstandards 1. für bibliographische Ressourcen: z.B. Pica+, MODS, DC 2. für den Datentausch: z.B. MAB 2, MARC21, ONIX 3. für Multimedia-Objekte: z.B. MIX (Bilder), MPEG-7/21 (Video) 4. für digitale Sammlungen: z.B. METS (Wrapper) 5. für sozialwiss. Forschungsdaten: z.B. DDI, SDMX 6. für Archive (Findbücher): z.B. EAD 7. für die Langzeitarchivierung: z.B. PREMIS 8. für die Strukturauszeichnung von Dokumenten: z.B. TEI 9. für Museumsobjekte: z.B. LIDO

Seite 44

Page 45: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Seeing Standards: A Visualization of the Metadata Universe (Jenn Riley)

http://www.dlib.indiana.edu/~jenlrile/metadatamap/seeingstandards.pdf Seite 45

Page 46: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

DOKUMENTATION eines Metadaten-Standards • „Uses and Features“ • „Usage Guidelines“ • „Implementation Guidelines“ • „Schemas and Outline“ • „Data Dictionary“ • “Specification” • Encoding Guidelines • Code Lists • Beispiel-Datensätze • Tutorials • Mailinglisten und Foren

• Einsatzgebiet und –möglichkeiten • Anwendungsregelwerk • Aufzählung und genaue Definition

der Elemente • Kodierungs-Regeln • Kodierungs-Listen • Beispiel-Datensätze • Anleitungen mit Übungen • Mailinglisten und Foren

Metadatenstandards kennenlernen

100 1 $aMerkl, Christian$0(DE-601)533312205$0(DE-588)133059545

Seite 46

Page 47: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

• Metadatenstandards sorgen für die Konsistenz der Metadaten und verbessern damit Nutzung und Austausch

• Ein Metadatenstandard ist aufgebaut aus Metadaten-Elementen (Eigenschaft / Merkmal einer Ressource; property)

• Metadatenelemente werden definiert hinsichtlich ihrer Bedeutung (Semantik) und hinsichtlich der Form (Syntax)

• Es gibt Vocabulary Encoding Schemes (Klassifikationen, Thesauri, kontrolliertes Vokabular, Normdateien, Schlagwortlisten)

• und Syntax Encoding Schemes (Normen, URIs, weitere Identifier) zur genaueren Definition von Metadatenelementen

• Zur Definition eines Elements gehört auch eine Aussage über die Wiederholbarkeit und Verpflichtung eines Elements, sowie darüber, wie einzelne Elemente miteinander in Beziehung stehen.

Seite 47

Zusammenfassung: Metadatenstandards

Page 48: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

• Metadatenstandard ist nicht gleich Metadatenformat: ein Standard (z.B. Dublin Core) kann in verschiedenen Formaten auftreten: z.B. DC-HTML, DC-XML, DC-RDF

• XML eignet sich, weil es menschenlesbar und gleichzeigt maschinelesbar ist, weil es gut für hoch-strukturierte Daten einsetzbar ist und weil es flexibel ist, da die Tags nicht festgelegt sind.

• Einige Standards weisen spezielle strukturelle Besonderheiten auf: Subfields, Indikatoren, externe und interne Sichten.

• Es gibt eine Vielzahl von Standards je nach Einsatzzweck und/oder Typ der Ressource

• Wenn man Standards kennenlernen möchte, bedient man sich der Standard-Dokumentationen

Seite 48

Zusammenfassung: Metadatenstandards

Page 49: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

3. Application Profile

Seite 49

Page 50: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

PPN

Titel

Verfasser Sonst. Beteil.Person

Umfang

ISBN

Schlagwörter

Fussnoten Verwandte Ressourcen

URL

Metadaten-Standard einer „Community“ / Domain, z.B. PICA, Dublin Core, DDI etc.

DOI Tongeschlecht

Epoche

Bildformat

Anzahl Pixel

Primärkörperschaft

Format

URN

Kompression

Handle

Regie

Metadatenstandard und Metadatenschema Metadatenformat /-Schema einer bestimmten Anwendung, z.B. Repository für Publikationen

Metadaten-Elemente einer realen Informations-einheit

Titel: Verfasser: Sonst. Personen: Körperschaft: Erschienen: Umfang: Anmerkung: ISBN: Schlagwörter: URL:

Seite 50

Page 51: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Metadaten-Dokumentation für individuelle Anwendungen: Application Profiles “In DCMI usage, an application profile is a declaration of the metadata terms an organization, information resource, application, or user community uses in its metadata. In a broader sense, it includes the set of metadata elements, policies, and guidelines defined for a particular application or implementation. […] An application profile is not considered complete without documentation that defines the policies and best practices appropriate to the application.” (DCMI Glossary)

Application Profile (AP): Metadaten-Profil, -schema einer bestimmten Anwendung, das Elemente aus einem oder mehreren Standards enthält Festlegung der • Elemente • Unterfelder/Refinements • Encoding Schemes • Wiederholbarkeit • Pflichtfelder

Dokumentation der • Struktur • Richtlinien • Best Practice

http://www.dlib.org/dlib/june06/chan/06chan.html

Seite 51

Page 52: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

AP - Grundsätzliche Überlegungen Welchen Zweck hat die Anwendung? • Verwaltung von Daten für den

“Hausgebrauch”? • Organisations-übergreifender

Datenaustausch? • Integration der Daten in

Webdienste? • … Welche Funktionen soll die

Anwendung unterstützten? • Erweiterte Suche? • Browsing? • Facetten? • …

Was für Objekte werden beschrieben? • Text, Personen, Filme …? • … Welche Beziehungen gibt es zwischen

den Objekten? • Ist Urheber von … • Ist Teil von … • … Was brauche ich, um meine Ziele und

Anforderungen umzusetzen? • Welche Metadatenterme? • Was für Encoding Schemas? • Was für Einschränkungen?

Seite 52

Page 53: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Praxis – Kriterien für die Formatauswahl

Erst prüfen • Gibt es für meine Anwendung

bereits einen Standard? • Welcher Standard wird in meiner

Community genutzt? • Welcher Standard passt zu meiner

Anwendung / in meinem Kontext? • Welcher Standard entspricht am

ehesten meinen Anforderungen?

– “Use elements and qualifiers to meet the needs of your local context, but ... – remember that your metadata may be interpreted by machines and people, so ... – consider whether the values you use will aid discovery outside your local context.“ Greenberg, J. “Dublin Core History and Basics”, Tutorial ASIST DC 2008 (http://dc2008.de/wpcontent/uploads/2008/09/tutorial-1.pdf)

Seite 53 Metadata Madness wheel, Musebrarian, http://www.flickr.com/photos/musebrarian/3289649684/

Page 54: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Praxis – Kriterien für die Auswahl des/der Standard(s)

– “Use elements and qualifiers to meet the needs of your local context, but ... – remember that your metadata may be interpreted by machines and people, so ... – consider whether the values you use will aid discovery outside your local context.“ Greenberg, J. “Dublin Core History and Basics”, Tutorial ASIST DC 2008 (http://dc2008.de/wpcontent/uploads/2008/09/tutorial-1.pdf)

Daran denken • Auswahlkriterien: Anforderungen und Nachnutzbarkeit der Anwendung • Dokumentation ist wichtig

• Verletze niemals die semantischen Grenzen eines Standards

Ja! zur semantischen Verfeinerung Nein! zur semantischen Erweiterung

Seite 54

Page 55: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

dcterms.creator

Application Profile - Namensräume

DCMI namespace: "a collection of DCMI terms URIs“ (DCMI term URI: "The URI that identifies a term..“)

„The purpose of an application profile is to adapt or combine existing schemas into a package that is tailored to the functional requirements of a particular application, while retaining interoperability with the original base schemas.“ Weibel, S. et.al. (2002)

55

dc.creator

Seite 55

Page 56: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Application Profile - Namensräume

Namensräume: können für spezifische Anwendungen definiert werden Die Deklaration von Namensräumen erlaubt Designern von Metadaten-Schemas den

Kontext, in dem ein bestimmtes Element verwendet wird, genau zu benennen und sichert zu, dass dieses Element im Namensraum eindeutig ist.

dc dc.titel dc.creator dc.subject dc.description

dcterms dcterms.dateIssued dcterms.abstract dcterms.coverage dcterms.spatial

vascoda vap.placeOfPublicationvap.edition vap.thematic vap.ddc

meinAP dc.titel dc.creator dc.Subject dcterms.dateIssued dcterms.abstract dcterms.coverage vap.placeOfPublicationvap.edition vap.thematic vap.ddc

Namensräume

Namespace Policy for the Dublin Core Metadata Initiative (DCMI) http://www.dublincore.org/documents/dcmi-namespace/

Seite 56

Page 57: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Application-Profile - Singapore Framework „...a framework for designing metadata applications for maximum interoperability and for documenting such applications for maximum reusability.“

(http://dublincore.org/architecturewiki/SingaporeFramework/)

• Das Singapore Framework für Dublin-Core-Anwendungsprofile nennt die Rahmenbedingungen um Metadatenanwendungen möglichst interoperabel zu gestalten und so zu dokumentieren, dass sie nachnutzbar sind.

• Es definiert die Komponenten, die erforderlich und hilfreich sind, um ein Anwendungsprofil (Application Profile) zu dokumentieren.

• Das Singapore Framework ist die Grundlage für die Beurteilung von Anwendungsprofilen in Hinblick auf Vollständigkeit der Dokumentation und auf Übereinstimmung mit den Prinzipien der Web-Architektur.

Seite 57

Page 58: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Application Profiles - Singapore Framework

http://www.dublincore.org/documents/singapore-framework/ http://www.kim-forum.org/Subsites/kim/SharedDocs/Downloads/DE/Uebersetzungen/singaporeFramework.pdf?__blob=publicationFile (deutsch)

• Funktionale Anforderungen (verpflichtend)

• Domain-Modell (verpflichtend)

• Beschreibungssatz-Profil (verpflichtend)

• Nutzungsrichtlinien (fakultativ)

• Richtlinien für die syntaktische Kodierung (fakultativ)

Seite 58

Page 59: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Zusammenfassung: Application Profile

• Metadatenschemas, bzw. -profile bestehen aus Elementen aus einem oder mehreren Metadatenstandards

• Ein Applikation Profile ist die Festlegung der einsetzbaren Elemente und deren Bedingungen (Encoding Schemes, Wiederholbarkeit, Verpflichtung, etc.) sowie der zu nutzenden Richtlinien.

• Grundsätzliche Überlegungen: Zweck der Anwendung, Funktionen der Anwendung, beschriebene Objekte und Beziehungen zwischen Ihnen.

• Man sollte eingeführte Standards nachnutzen und kann auch mehrere Standards kombinieren.

• Um Elemente aus verschiedenen Standards eindeutig benennen zu können werden Namenräume (namespaces) verwendet.

• Eine Handreichung zur Erstellung optimaler Application Profiles bietet das Singapore Framework der DCMI.

Seite 59

Page 60: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Application Profile

„The main goal of application profiles is to increase the "semantic interoperability" of the resulting metadata instances within a community of practice, by going beyond the universal consensus of a single standard, without compromising the basic interoperability that the standard enables across the boundaries of these communities.“

[Special section on semantic interoperability in global information systems, ACM SIGMOD Record, Vol. 28, No. 1, March 1999.]

Seite 60

Page 61: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Interoperabilität

Interoperabilität ist die Fähigkeit unterschiedlicher Informationssysteme miteinander zu kommunizieren und so Metadaten möglichst effizient und sinnvoll und mit einem minimalen Verlust an Information auszutauschen.

systemübergreifender Austausch von Metadaten unter möglichst geringem Aufwand.

Problem: Austausch oder Integration von Daten, die in verschiedenen Standards vorliegen

Seite 61

Page 62: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

62

Interoperabilität Strukturelle Interoperabilität

• gegeben, wenn unterschiedlichen Metadatenschemas ein gemeinsa-mes Datenmodell zugrunde liegt (z. B. DCMI Abstract Model, FRBR).

Syntaktische Interoperabilität

• gegeben, wenn unterschiedliche Metadaten-Schemas in einer gemeinsamen Kodierungssyntax (z. B. XML, RDF) wiedergegeben werden.

Semantische Interoperabilität

• gegeben, wenn unterschiedliche Metadatenschemas ein gemeinsames Vokabular (Metadatenstandard) verwenden

Seite 62

Page 63: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Interoperabilität - Übung 001@ $026$aU 001A $00206:04-03-09 001B $00206:10-03-09$t10:42:23.000 001D $00206:04-03-09 001U $0utf8 001X $00 002@ $0Asu 003@ $0592906469 010@ $aeng 011@ $a2008 021A $aEscaping the unemployment trap$dthe case of East Germany$hChristian Merkl; Dennis J. Snower 027D/00 $aJournal of comparative economics$pAmsterdam$nElsevier$00147-5967$z7153508 028A $dChristian$aMerkl$9533312205$8Christian@Merkl ; PND-ID: 133059545 028B/01 $dDennis J.$aSnower$9366752960$8Dennis J.@Snower ; PND-ID: 124825109 031A $d36$j2008$e4$c12$h542-556 034M $agraph. Darst. 039B $cIn$9130445541$8Journal of comparative economics. - Amsterdam : Elsevier$x200800000360004458 039B $cIn$7!562253327! 045D/00 $9091374367$8Langzeitarbeitslosigkeit 045D/49 $b49 101B $004-03-09$t09:15:56.000

Pica+

MODS

Seite 63

Frage: Sind diese beiden Metadatenschemas in irgendeiner Hinsicht interoperabel?

Page 64: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Interoperabilität - Lösung 001@ $026$aU 001A $00206:04-03-09 001B $00206:10-03-09$t10:42:23.000 001D $00206:04-03-09 001U $0utf8 001X $00 002@ $0Asu 003@ $0592906469 010@ $aeng 011@ $a2008 021A $aEscaping the unemployment trap$dthe case of East Germany$hChristian Merkl; Dennis J. Snower 027D/00 $aJournal of comparative economics$pAmsterdam$nElsevier$00147-5967$z7153508 028A $dChristian$aMerkl$9533312205$8Christian@Merkl ; PND-ID: 133059545 028B/01 $dDennis J.$aSnower$9366752960$8Dennis J.@Snower ; PND-ID: 124825109 031A $d36$j2008$e4$c12$h542-556 034M $agraph. Darst. 039B $cIn$9130445541$8Journal of comparative economics. - Amsterdam : Elsevier$x200800000360004458 039B $cIn$7!562253327! 045D/00 $9091374367$8Langzeitarbeitslosigkeit 045D/49 $b49 101B $004-03-09$t09:15:56.000

Pica+ (text)

MODS (xml)

Seite 64

Frage: Sind diese beiden Metadatenschemas in irgendeiner Hinsicht interoperabel?

Page 65: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

4. Mapping

Seite 65

Page 66: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Was bedeutet „Mapping“? Aufgabe: Integration heterogener Metadaten in einem System: EconBiz

Dublin Core (XML)

PICA 3

Titel=4000

Titel=<title>

• Metadaten verschiedener Provenienz, die in verschiedenen Formaten vorliegen

• Mittels Suchmaschine-Technologie unter einer Oberfläche durchsuchen

• Verfeinerung per Drill-Down

Seite 66

Page 67: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

• „Übersetzen“ der Elemente und Regeln von einem Standard (Schema / Format) in einen anderen

• Mapping: die sich entsprechenden Bestandteile zweier unterschiedlicher Metadaten-Standards oder -schemata miteinander in Beziehung setzen samt Regeln

• Metadata "mapping" refers to a formal identification of equivalent or nearly equivalent metadata elements or groups of metadata elements from different metadata schemas, carried out in order to facilitate semantic interoperability (Getty Glossary)

Element DB2 – MAB (Ziel) DB1 – PICA (Quelle) Anmerkungen

Bezeichner Syntax Bezeichner Syntax Anweisung für Transformation

Verfasser 100 Nachname, Vorname 3000 Vorname@Nachname

Quell-Wert vor Klammeraffen in Zielformat mit Komma Leerzeichen hinter Quell-Wert nach Klammeraffen schreiben, […]

[…]

Seite 67

Was bedeutet „Mapping“?

Page 68: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Seite 68

Crosswalk

“A table that maps the relationships and equivalencies between two or more metadata schemes. Crosswalks or metadata mapping support the ability of search engines to search effectively across heterogeneous databases”. http://dublincore.org/documents/usageguide/glossary.shtml#C

Page 69: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Crosswalk

A crosswalk ist "a mapping of the elements, semantics, and syntax from one metadata scheme to those of another„. (http://www.niso.org/publications/press/UnderstandingMetadata.pdf ).

Crosswalks sind laterale Mappings, d.h. sie sind Einbahnstrassen von einem Schema in das andere.

Seite 69

Page 70: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Einige Problemfelder beim Mappen:

• Mapping zwischen zwei unterschiedlich mächtigen Standards / Schemas: fehlende Felder im Zielformat / mehr als ein Feld im Zielformat

• Unterschiedliche Eigenschaften: Einige Felder können als obligatorisch (Pflichtfeld) und andere als optional deklariert werden. Das wiederholte Vorkommen eines Elements kann zulässig sein oder nicht (Wiederholfähigkeit).

• Unterschiedliche Syntax der Felder (unterschiedliche syntax encoding schemes): (z.B. A: „Vorname“, „Nachname“ und B: „Name“ (Nachname, Vorname) und C: „Vorname@Nachname“)

• Verschiedene terminologische Vokabulare (unterschiedliche vocabulary encoding schemes): Werden unterschiedliche Vokabulare (z.B. Klassifikationen) verwendet müssen, diese ebenfalls „übersetzt“ werden (Cross-Konkordanz).

Mapping in der Praxis - Problemfelder

Seite 70

Page 71: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Mapping in der Praxis In welcher Beziehung stehen die zu mappenden Elemente zueinander? Grad der strukturellen Übereinstimmung: • 1:1 one-to-one • 1:n one-to-many • n:1 many-to-one • 1:0 one-to-none Grad der semantischen Übereinstimmung: • = äquivalent • > Oberbegriff • < Unterbegriff • ≈

Seite 71

Page 72: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Mapping in der Praxis = "is the same as„ Semantik des Quell- und des Zielformats stimmen überein.

Einfaches Element-to-Element-Mapping (Aber: Encoding Scheme beachten!)

<dcterms:abstract> DC-Definition: A summary of the resource <mods:abstract> MODS-Def.: a summary of the content of the resource

Quelle Ziel

Seite 72

<dc:language>Deutsch</dc:language> <mods:languageTerm type= "code" authority="iso639-2b"> ger</mods:languageTerm>

Page 73: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

< Quell-Element ist „Unterbegriff“ des Zielelements Semantik des Quellelements ist enger gefasst, als die des möglichen Zielelements.

Quelle Ziel

<mods:relatedItem type=„isReferencedBy> </relatedItem>

<dc:relation></dc:relation> DC-Definition: A related resource.

MODS-Definition: Citations or references to published bibliographic descriptions, reviews, abstracts, or indexes of the content of the resource

Mapping in der Praxis

Seite 73

Page 74: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Mapping in der Praxis > Quell-Element ist „Oberbegriff“ von Ziel-Element Semantik des Quellelements ist breiter gefasst, als die des Zielelements.

<dc:subject> DC-Def.: „The topic of the resource.“ (nicht eingeschränkt; Geographika, Sachschlagwörter, Zeitschlagwörter etc.)

<mods:subject> MODS-Def: "topic" is used as the tag for any topical subjects <mods:topic> that are not appropriate in the <geographic>, <temporal>, <titleInfo>, or <name> subelements

nicht zulässig!

Quelle Ziel

Seite 74

Page 75: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Mapping in der Praxis

Quellformat: MIX <Compression>

<CompressionScheme>1</CompressionScheme>

<CompressionLevel>10</CompressionLevel>

</Compression>

Zielformat: Dublin Core: ?

nicht möglich Informationsverlust!

http://commons.wikimedia.org/wiki/File:Rotten_apple.jpg

Seite 75

1:0 Im Zielstandard gibt es kein Feld, das mit der Semantik des Quellelements übereinstimmt.

Page 76: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Mapping in der Praxis 1:n Quell-Element muss auf zwei oder mehrere Ziel-Elemente verteilt werden / Nur Teil eines Quellelements kann auf Ziel-Element gemappt werden <gils:ContactName> The name of the person acting as contact for the information resource.

<name type="personal"> <namePart type="given"></namePart> <namePart type="family"></namePart> </name>

Transformationsregel angeben: anhand Syntax der Werte nach möglichen Trennzeichen (Steuerzeichen) suchen

http://commons.wikimedia.org/wiki/File:Apfelteiler_fcm.jpg

Seite 76

Page 77: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

n:1 Mehrere Quell-Elemente entsprechen Ziel-Element Nur zwei oder mehr verschiedene Informationen gemeinsam ergeben die Zielsemantik

Mapping in der Praxis

<part> <detail type="volume"> <number>24</number> Band </detail> <detail type="issue"> Heft <number>2</number> </detail> <extent unit="page"> Seitenangabe

<start>23</start> <end>45</end>

</extent> </part>

<dc:bibliographicCitation> Definition: A bibliographic reference for the resource. Comment: Recommended practice is to include sufficient bibliographic detail to identify the resource as unambiguously as possible.

Seite 77

Regel mit welchen Steuerzeichen die einzelnen Werte im Ziel-Element zusammen-gesetzt werden sollen

http://commons.wikimedia.org/wiki/File:Fruit_salad_%281%29.jpg

Page 78: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Mapping in der Praxis Wiederholbarkeit

Quell-Element ist wiederholbar, Ziel-Element nicht Alle Werte des Quell-Elements in Ziel-Element mappen. Dabei Trennzeichen als

Regel angeben

Seite 78

Quell-Element ist nicht wiederholbar, Ziel-Element ist wiederholbar Trennzeichen im Quell-Elements als Steuerzeichen für Zerlegung des Feldwerts nutzen

dc:subject: Begriff1 dc:subject: Begriff2 dc:subject: Begriff3

<ex:theme> Begriff1 ; Begriff2 ; Begriff3</ex:theme> Regel: alle Begriffe aus dc:subject in <ex:theme> mit Leerzeichen Semikolon Leerzeichen getrennt

<ex:theme> Begriff1 ; Begriff2 ; Begriff3</ex:theme> dc:subject: Begriff1 dc:subject: Begriff2 dc:subject: Begriff3 Regel: Trenne die Begriffe in <ex:theme> anhand

Steuerzeichen (Leerzeichen Semikolon Leerzeichen)

Page 79: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Mapping in der Praxis

Verpflichtung Quell-Element ist Pflichtfeld, Ziel-Element nicht Kein Problem Quell-Element ist nicht verpflichtend; Zielelement ist Pflichtfeld Versuchen passende Werte aus einer Kombination von Quell-

Elementen zu generieren. Wenn nicht möglich , Mapping nicht möglich.

Seite 79

Page 80: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Mapping in der Praxis Probleme mit den Daten: 1. Missing data: Werte sind nicht vorhanden 2. Incorrect data: Werte entsprechen nicht den Konventionen 3. Confusing data: unzulässige / fehlende Trennzeichen, eingebettete HTML-Tags 4. Insufficient data: fehlende Angabe welches kontrollierte Vokabular, Format etc.

verwendet wird.

Iterativer Prozess

Daten-analyse

Mapping

Konver-tierung

Kontrolle

Seite 80

Page 81: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Zusammenfassung: Mapping und Crosswalks

• Beim Mappen wird semantische, syntaktische und strukturelle Interoperabilität hergestellt.

• Voraussetzung für ein korrektes Mapping ist die klare und präzise Definition der Elemente in den jeweiligen Standards.

• Das Mapping sollte das Erstellen von Transformationsregeln ermöglichen, mit denen sich die Daten aus dem einen Schema möglichst vollständig in das andere Schema überführen lassen.

• Eigentliches Konvertieren der Daten mittels programmiertem Script

• Mapping ist der erste Schritt zur Integration heterogener Daten in einem System

Seite 81

Page 82: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Mapping - Übung

Seite 82

Quelle: MODS-Schema: Element language mit encoding scheme

Soll nach PICA (GBV) gemappt werden!

Aus der GBV-Katalogisierungsrichtlinie:

<language> <languageTerm type="code" authority="iso639-1"> de </languageTerm> </language>

Die Kategorie 1500 enthält Angaben zur Sprache des vorliegenden Textes in codierter Form. Die Codierungen erfolgen nach ISO 639-2, vgl. Anhang 2. Bei Neuaufnahmen im System ist die Angabe der Sprachbezeichnung verbindlich.

Fragen: Was muss man beim Mapping beachten? Ist ein Mapping möglich?

Page 83: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Mapping - Lösung

Seite 83

Antwort: Ja, ein Mapping ist möglich: die Semantik der Felder in den beiden Schemas stimmen überein. Aber: das Vokabular muss „übersetzt“ werden. Anhand einer Konkordanz zwischen ISO 639-1 und ISO 639-2 müssen die Werte konvertiert werden. de ger

Page 84: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Zusammenfassung: Mapping und Crosswalks

Seite 84

“A crosswalk is a specification for mapping one metadata standard to another. Crosswalks provide the ability to make the contents of elements defined in one metadata standard available to communities using related metadata standards. Unfortunately, the specification of a crosswalk is a difficult and error-prone task requiring in-depth knowledge and specialized expertise in the associated metadata standards. Obtaining the expertise to develop a crosswalk is particularly problematic because the metadata standards themselves are often developed independently, and specified differently using specialized terminology, methods and processes. Furthermore, maintaining the crosswalk as the metadata standards change becomes even more problematic due to the need to sustain a historical perspective and ongoing expertise in the associated standards.” http://www.niso.org/publications/white_papers/crosswalk/

Page 85: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

5. Schnittstellen

Seite 85

Page 86: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Schnittstellen Softwareschnittstellen / softwareseitige Datenschnittstellen : • definieren, wie Kommandos und Daten zwischen verschiedenen Prozessen und

Komponenten ausgetauscht werden • Z39.50:

• Netzwerkprotokoll, das • im Bibliothekswesen Standard zur Abfrage von bibliographischen

Informationssystemen • Mit dem Zusammenführen der Daten hat die Bedeutung der Abfrage von

verteilten Informationssystemen mit Z39.50 abgenommen

• SRU: • Nachfolger von Z39.50 • HTTP-basierte Protokoll Search/Retrieve via URL (SRU/SRW), • Techniken basieren auf etablierten Internet-Standards wie URI und XML

Seite 86

Page 87: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

87

Linkresolver • System zur Verfügbarkeitsanzeige wissenschaftlicher Publikationen. • HTTP-basierter Service • Metadaten der Quelle (Source) + gespeicherte Informationen über lokale Bestände

und Lizenzen • Links auf "passende" Dienste wie elektronische Volltexte, Dokumentenlieferdienste,

den lokalen OPAC und den Buchhandel

Link-Resolver

http://www3.interscience.wiley.com/resolve/openurl? genre=article &issn=0022-2380 &volume=30 &issue=6 &spage=1017

OpenURL

Seite 87

Page 88: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

openURL „The OpenURL is a protocol for interoperability between an information resource and a service component that offers localized services in an open linking environment. It is in effect an actionable URL that transports metadata or keys to access metadata for the object for which the OpenURL is provided. „ (http://www.oclc.org/research/projects/openurl/default.htm)

• Standard ANSI/NISO Z39.88 • ANSI/NISO Z39.88 - The OpenURL Framework for Context-Sensitive Services • Pflege und Entwicklung OCLC • Key-Encoded Value Guidelines:

http://epub.mimas.ac.uk/openurl/KEV_Guidelines-200706.html

Seite 88

Page 89: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

openURL

Standard für die Übermittlung von bibliographischen Metadaten (Context-Sensitive Linking)

http://openurlgw.hbz-nrw.de/gw ?aulast=Clark &aufirst=Timothy &au=Wright%2C+Mike &atitle=So%2C+Farewell+Then+.+.+.+Reflections+on+Editing+the+Journal+of+M anagement+Studies &jtitle=Journal+of+management+studies+%3A+JMS &stitle=J.+Manage.+Stud.+(GB) &date=2009 &volume=46 &issue=1 &pages=1-9 &issn=00222380 &coden=JMASB2 &genre=article

Seite 89

Page 90: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

OAI-PMH - OAI Protocol for Metadata Harvesting

Open Archives Initiative (OAI):

• Initiative von Betreibern von Dokumentenservern, um die abgelegten elektronischen Publikationen besser auffindbar und nutzbar zu machen

• OAI Protocol for Metadata Harvesting (OAI-PMH) zum Einsammeln (Harversting) und Weiterverarbeiten von Metadaten

• Metadaten werden von Data Providern bereitgestellt • Geharvestete Datensätze werden von Service Providern aufbereitet und

bereitgestellt • kleinster gemeinsamer Nenner: Dublin-Core-Datenmodell • Erweiterung mit zusätzlichen Standards (z.B. MODS, MARC mittels MARCXML)

empfohlen • http://www.openarchives.org/pmh/

Seite 90

Page 91: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

OAI-PMH - OAI Protocol for Metadata Harvesting

OAI-Anfrage an EconStor

http://www.econstor.eu/dspace-oai/request? verb=GetRecord&metadataPrefix=didl&identifier=oai:econstor.eu:10419/41393

Seite 91

Page 92: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

92

OAI-PMH - OAI Protocol for Metadata Harvesting http://www.econstor.eu/dspace-oai/request? verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:econstor.eu:10419/41393

Seite 92

Page 93: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

93

OAI-PMH - OAI Protocol for Metadata Harvesting

6 verbs um ein Repository abzufragen: • GetRecord: individuellen Datensatz abfragen • Identify: Information über Repository

abfragen • ListRecords: um Datensätze zu harvesten • ListIdentifiers: Abkürzung von ListRecords: man bekommt nur header; nicht Datensätze

• ListMetadataFormats: die zur Verfügung stehen Metadatenformate abfragen

• ListSets: Kollektionen eines Repositorys abfragen

Seite 93

Page 94: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

OAI-Explorer

Schnittstelle um Repositories interaktiv auf ihre Übereinstimmung mit dem OAI-PMH zu testen. http://re.cs.uct.ac.za/

Seite 94

Page 95: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Schnittstellen für Literaturverwaltung

Seite 95

Page 96: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

COinS (ContextObjects in Spans) • Methode zur Einbindung von bibliographischen Metadaten in HTML-Seiten • Basiert auf OpenURL • Browser-Plugins / weitere Programme können aus den „unsichtbaren“ COinS im

Quelltext einer Webseite • OpenURL-Links für einen Linkresolver erzeugen • Metadaten auslesen (Literaturverwaltung)

• Prinzip: Mikroformat

Schnittstellen für Literaturverwaltung

Seite 96

Page 97: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Zusammenfassung: Schnittstellen

Seite 97

• Schnittstellen definieren, wie Kommandos und Daten zwischen verschiedenen Prozessen und Komponenten ausgetauscht werden

• Ein Linkresolver ist eine "Allround-Schnittstelle" zur Anzeige von Verfügbarkeits-informationen.

• OpenURL nutzt für jedes Dokument einen abstrakten Namen, der durch einen Mechanismus zu einer URL aufgelöst wird (Actionable URL)

• Key-Encoded-Values: einem Schlüssel (Element) wird ein Wert zugeordnet • OAI-PMH: OAI Protocol for Metadata Harvesting: Schnittstelle zum Harvesten

von Metadaten von Dokumentenservern • Dublin-Core-Datenmodell • häufig zusätzliche Standards

• Metadaten für die Literaturverwaltung: • RIS, BibTeX, EndNote, Mikroformat COinS

Page 98: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

6. Metadaten für das Semantic Web

Seite 98

Page 99: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Metadaten für das Semantic Web Problem heutiger Suchmaschinen 1. Unpassende Suchergebnisse

Suchanfrage ist mehrdeutig (Homonymie / Polysemie)

2. Fehlende Suchergebnisse

Synonyme werden bei Suche nicht berücksichtigt

z.B. Suche nach „Zukunftsforschung“ findet nicht „Futorologie“, „future studies“

Ursache • Mangel an expliziter Semantik

Seite 99

Page 100: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

100

Mikroformate: semantische Annotation • Formate zur »Feinstrukturierung« von Webseiten. • (X)HTML-Dokumente menschen- und maschinenlesbar mit Infos ergänzt • Mikroformate nutzen vorhandene XHTML-Attribute • Informationen lassen sich aus einer Website extrahieren und anderen

Programmen zugänglich machen • Domain-spezifische Vokabulare: Termine, Kontaktinformationen, soziale

Beziehungen. • http://microformats.org/

Seite 100

BEGIN:VCALENDAR VERSION:2.0 PRODID:http://www.example.com/calendarapplication/ METHOD:PUBLISH BEGIN:VEVENT UID:[email protected] ORGANIZER;CN="Alice Balder, Example Inc.":MAILTO:[email protected] LOCATION:Somewhere SUMMARY:Eine Kurzinfo DESCRIPTION:Beschreibung des Termines CLASS:PUBLIC DTSTART:20060910T220000Z DTEND:20060919T215900Z DTSTAMP:20060812T125900Z END:VEVENT END:VCALENDAR

Page 101: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

• Microdata erweiterte Microformats und überwindet deren Schwächen (z.B. unflexibel) • Ausdruckstärkere semantische Annotation von Webseiten • Specification: http://www.w3.org/TR/microdata/ • Attributerweiterung für HTML5: itemprop, itemref, itemtype, itemscope, ..

Microdata: Schema.org

Seite 101

• 2011: Initiative der Suchmaschinenbetreiber Google, Bing, Yahoo, Yandex: schema.org

• “create and support a common set of schemas for structured data markup on web pages.”

• Nutzen für Fachportal EconBiz: Verbesserte Verbreitung der Meta-daten

Page 102: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Microdata: Schema.org

Seite 102

Google Structured Data Testing Tool: http://www.google.com/webmasters/tools/richsnippets

Page 103: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Semantic Web Tim Berners Lee (1998): Semantic Web Roadmap: “The web was designed as an information space, with the goal that it should be useful not only for human-human communication, but also that machines would be able to participate and help.” http://www.w3.org/DesignIssues/Semantic.html

Nur möglich, wenn die Information von Maschinen gelesen und interpretiert werden kann

Heute: • Versuch die Bedeutung einer Information zu extrahieren • Fehleranfällig

Semantic Web: • Web Content in natürlicher Sprache wird explizit mit

semantischen Metadaten ausgezeichnet • Semantische Metadaten kodieren die Bedeutung des Inhalts in

maschinen-interpretierbarer Art

Seite 103

Tim Berners-Lee at Campus Party Brasil, 2009, http://commons.wikimedia.org/wiki/File%3ATim_Berners-Lee_CP.jpg

Page 104: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Semantic Web Erweiterung des World Wide Web:

Seite 104

„Im Web werden immer mehr veröffentlichte Daten in RDF (s.u.) vorliegen, d.h. sie folgen denselben Standards und können daher frei miteinander kombiniert und verlinkt werden. So entsteht das Semantic Web als eine verteilte Datenbank, die komplexe Abfragen und Schlussfolgerungen über dezentral vorliegende Daten ermöglicht.“ Linked Data und die Bibliothekswelt Adrian Pohl (Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen) http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2011_linked-data_ODOK.pdf

Page 105: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

formale Sprache für die Bereitstellung von Metadaten im WWW Umgesetzt werden diese Beschreibungen nach dem RDF-Modell entweder als

Graph oder nach der RDF-Syntax als XML. Eine Ressource (z.B. eine Monographie) wird durch eine bestimmte Eigenschaft

(property) bzw. Relation beschrieben. Diese Eigenschaft kann einen bestimmten Wert annehmen.

Das Kapital „Marx, Karl“ hatAutor

Ressource Eigenschaft Wert

RDF - Resource Description Framework

Subjekt Prädikat Objekt http://d-nb.info/gnd/4099309-7 dc.creator „Marx, Karl“ http://d-nb.info/gnd/4099309-7 dc.creator http://d-nb.info/gnd/118578537

Subjekt muss URI (Uniform Resource Identifier) sein, Objekt kann eine weitere URI oder ein String (Zeichenkette) sein

Seite 105

Tripel

Page 106: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Ressource - URI - Repräsentation

Seite 106

Repräsentation: Webseite über St. Michaelis

http://dbpedia.org/resource/ St._Michaelis_Church,_Hamburg URI: Identifier für St. Michaelis

Ressource: St. Michaelis

http://commons.wikimedia.org/wiki/File:Michel_-_Noord.jpg

• Uniform Resource Identifier (URI): Zeichenfolge, die zur Identifizierung einer abstrakten oder physischen Ressource dient

• eindeutiger dauerhafter Identifikator einer Ressource

Page 107: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Ressource - URI - Repräsentation

Seite 107

« Ceci n'est pas une pipe » « Das ist keine Pfeife »

René Magritte: La trahison des images, 1928–29

Richtig! Das ist ein Bild einer Pfeife = Repräsentation

Page 108: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Bedeutung für Beschreibung von Bibliotheksressourcen: verschiedene Metadatenstandards können in RDF integriert werden

„The Resource Description Framework (RDF) of the World Wide Web Consortium (W3C) is another model that "provides a mechanism for integrating multiple metadata schemes" [NISO, 2004] for the description of Web resources. It is a data model that provides a framework within which independent communities can develop vocabularies that suit their specific needs and share vocabularies with other communities. It utilizes the XML namespace to effectively allow RDF statements to reference a particular RDF vocabulary or schema. „Zeng, M.L.; Chang, L.M. , http://www.dlib.org/dlib/june06/zeng/06zeng.html

Beispiel DC-RDF: Die Ressource ‚http://ilrt.bristol.ac.uk/people/cmdjb/‘ hat den Titel ‚Dave Beckett´s Homepage‘ und hat den Autor ‚Dave Beckett‘, hat Herausgeber ‚ILRT; University of Bristol‘ und hat das Erstellungsdatum ‚31.7.2002‘

RDF - Resource Description Framework

Seite 108

Page 109: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

1. Übersetzen Sie die Information „Harry Potter wird bei Carlsen verlegt“ in RDF und ordnen Sie die Bestandteile Subjekt, Prädikat und Objekt zu:

RDF - Resource Description Framework - Übung

Seite 109

Subjekt Prädikat Objekt Harry Potter wird verlegt bei Carlsen

2. Übersetzen Sie die Informationen in RDF und visualisieren Sie die Tripel (URI = Ellipse, Relation = Pfeil, Quadrat = Literal, „einfacher Text“)

dc:date dc:creator

dc:title dc:identifier dc:contibutor

Eigenschaften

ID: http://d-nb.info/990563480 Titel: Metadata for semantic and social applications Verfasser: Greenberg, Jane (http://d-nb.info/gnd/136971857) Jahr: 2008

Page 110: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

1. Übersetzen Sie die Information „Harry Potter wird bei Carlsen verlegt“ in RDF und ordnen Sie die Bestandteile Subjekt, Prädikat und Objekt zu:

RDF - Resource Description Framework - Lösung

Seite 110

Subjekt Prädikat Objekt Harry Potter wird verlegt bei Carlsen

http://d-nb.info/990563480

http://d-nb.info/990563480

http://d-nb.info/990563480

http://d-nb.info/gnd/136971857

“Metadata for semantic and social applications”

Greenberg, Jane

ID: http://d-nb.info/990563480 Titel: Metadata for semantic and social applications Verfasser: Greenberg, Jane (http://d-nb.info/gnd/136971857) Jahr: 2008

dc:date

dc:creator

dc:title

http://d-nb.info/990563480 „2008“

dc:creator

2. Übersetzen Sie die Informationen in RDF und visualisieren Sie die Tripel (URI = Ellipse, Relation = Pfeil, Quadrat = Literal, „einfacher Text“)

Page 111: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Meta-Modell: RDF-Schema

Seite 111

http://d-nb.info/gnd/4099309-7 dc:creator „Marx, Karl“

dc:Bibliographic Resource dc:Agent dc:creator

rdfs:class rdfs:class rdfs:property

rdfs:class

rdf:type

rdf:type

rdf:type

rdf:type rdf:type

rdfs:subClassOf rdfs:subClassOf rdfs:subClassOf

domain range

RDFS

RDF

Page 112: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

112

SKOS – Simple Knowledge Organisation System • formale Sprache zur Kodierung von

Wissensorganisationssystemen wie Ontologien, Thesauri, Klassifikationen, Taxonomien, andere Arten von kontrolliertem Vokabular

• baut auf dem Resource Description Framework (RDF) und RDF-Schema auf • skos:broader (Oberbegriffe) • skos:narrower (Unterbergiffe) • skos:related (verwandte Begriffe) • …

Seite 112

Page 113: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Web of Linked Data

RDF + Sprache zur Auszeichnung der Beziehungen (z.B. SKOS) + URIs für Entitäten = Web of Data

Cool URIs don't change What makes a cool URI?

A cool URI is one which does not change.

What sorts of URI change?

URIs don't change: people change them. http://www.w3.org/Provider/Style/URI

Seite 113

Semantic Web Stack

http://commons.wikimedia.org/wiki/File:Semantic_Web_Stack.png

Page 114: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

114

Daten für das Semantic Web veröffentlichen: Linked (Open) Data Grundsätze von Linked Data 1. Verwende URIs als Name für Objekte. 2. Verwende http-URIs, so dass andere den Namen nachschlagen können. 3. Wenn jemand einen Namen nachschlägt, stelle hilfreiche Informationen zur

Verfügung und benutze Standards (RDF, SPARQL). 4. Stelle Links zu anderen URIs bereit, so das man Weiteres entdecken kann.

On the Web

Machine-readable data

Non-proprietary format

RDF standards

Linked RDF

Linked Open Data (LOD) ist Linked Data, welche unter einer offenen Lizenz veröffentlicht wird, die eine freie Nachnutzung nicht behindert. 5 Stars of Linked Open Data:

Seite 114

Page 115: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Web of Linked Data

Seite 115

2007

2009

2011

Page 116: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Linked Data in Bibliotheken

Seite 116

Warum? • Sichtbarkeit im Web

maximieren • Bestände leichter auffindbar

machen • Nachnutzbarkeit

sicherstellen: insbesondere durch nichtbibliothekarische Domänen

• Bibliographische Nachweise durch die Verknüpfung mit anderen Informationen anreichern

• Recherchemöglichkeiten optimieren

EconStor goes LOD

Page 117: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Linked Data in Bibliotheken Bereitstellen und Nutzen von kontrollierten Vokabularen und Ontologien in RDF

• DBPedia: • Projekt der Universität Leipzig, FU Berlin und OpenLink Software • strukturierte Informationen aus Wikipedia extrahieren und in RDF bereitstellen • Dreh- und Angelpunkt der Linked Data Cloud • http://dbpedia.org/

• Standard Thesaurus Wirtschaft: http://zbw.eu/beta/econ-ws/about • Gemeinsame Normdatei der Deutschen Nationalbibliothek:

http://www.dnb.de/DE/Service/DigitaleDienste/LinkedData/linkeddata_node.html • ….

Bereitstellen und Nutzen von Titeldaten in RDF • hbz: http://lobid.org/about • B3Kat (BSB, KOBV): http://lod.b3kat.de/doc • …

Seite 117

Page 118: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Linked Data in Bibliotheken Bereitstellen von Tools

• Culturegraph: Plattform für Dienste und Projekte rund um die Themen Datenvernetzung, Persistent Identifier und Linked Open Data für kulturelle Entitäten

• http://www.culturegraph.org/

Internationalisierung der bibliothekarischen Regelwerke • Resource Description and Access (RDA)

• Umsetzung geplant in D für 2015 • Format-unabhängig • Entwicklung ausgerichtet auf Nutzung im Semantic Web

• FRBR- und RDA-Vokabular

Seite 118

Page 119: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

119

Metadata Registries • Identifikation existierender Elemente verschiedener Schemas und Application Profiles • Zur Nachnutzung und Konsultation bereitstellen • Ermöglichen automatische Anfragen von Anwendungen, die die URIs, die einem

Schema enthalten sind, auflösen können. “The presence of a metadata registry application promotes the wider adoption, standardization and interoperability of metadata by facilitating its discovery, and reuse, across diverse disciplines and communities of practice" [Dublin Core Metadata Registry].

http://rdvocab.info/ Seite 119

Page 120: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Metadata Registries

Cross-Domian http://metadataregistry.org/

Domian-specific http://dcmi.kc.tsukuba.ac.jp/dcregistry/

Seite 120

Page 121: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Linked Data Anwendungen

Seite 121

Page 122: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Zusammenfassung: Semantic Web

• Semantic Web: das „verstehende Web“: Informationen werden auf der Ebene ihrer Bedeutung miteinander verknüpft.

• Voraussetzung: • Maschinen-Interpretierbarkeit der Information RDF • Eindeutigkeit eines Konzepts (einer Person, einer Körperschaft, eines

Themas) URI: Zeichenfolge, die zur dauerhaften Identifizierung einer abstrakten oder physischen Ressource dient

• Vokabular zu Modellierung einer Ontologie: RDFS, OWL, SKOS • RDF + Sprache zur Auszeichnung der Beziehungen (z.B. SKOS) + URIs für

Entitäten = Web of Data • Bibliotheken nutzen und veröffentlichen Linked Open Data • Recherche über Daten verschiedener Domänen • Verbessert Nachnutzbarkeit • Microformats und Microdata: „Semantic Web light“

Seite 122

Page 123: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

7. Metadaten-Management in der ZBW

Seite 123

Page 124: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

• Unterstützung beim Aufbau und Pflege der

Informationssysteme des Informationszentrums

• Koordination der Datenlieferungen

• Hilfestellung in allen Fragen zu Metadaten-Formaten und Standards

Metadaten-Management in der ZBW

Querschnittsaufgabe

Metadaten-Management

Seite 124

Page 125: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

• Mitarbeit in Abteilungs-übergreifende Teams der ZBW

• Mitarbeit in Drittmittel-Projekten

• Enge Zusammenarbeit mit der Abteilung „Innovative Informations- systeme & Publikationstechnologien“

• Mitarbeit in Kooperation und (internationalen) Arbeitgruppen

Metadaten-Management in der ZBW

Metadaten-Management

Seite 125

Page 126: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Aufgaben des Metadaten-Managements Metadatenstandards und Mapping

• Expertise bzgl. Metadaten-Standards und Regelwerken

• Erarbeiten von Crosswalks

Entwicklung und Weiterentwicklung von Metadatenformaten

Neue Systeme:

• Auswahl geeigneter Metadatenstandards gemäß der Anforderungen an das System, Ggf. Kombination mehrerer Standards

• Entwicklung eines interoperablen Schemas

• Erstellung von Application Profiles (Dokumentation)

Bestehende Systeme, Z.B. EconStor, da|ra:

• Kontinuierliche Weiterentwicklung angepasst an sich wandelnde Anforderungen

Seite 126

Page 127: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Koordination von Datenlieferungen Weitere Aufgaben des Metadaten-Managements

• Bereitstellung / Auswertung von Testdaten und Dokumentationen

• Dokumentation von eingehend und ausgehenden Datenlieferungen

• Ansprechpartnerin für alle Fragen bzgl. Metadatenformat, Katalogisierung und Bereitstellung

Seite 127

Page 128: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Qualitätsmanagement und Weiteres Weitere Aufgaben des Metadaten-Managements

• Mitarbeit System-Entwicklung: Funktionen, die auf Metadaten aufbauen, z.B. „Ähnliche Titel“, Merkliste, Exporte in Literaturverwaltungsprogramme

• Weitere Fragestellungen:

• Heterogene Sacherschließung in EconBiz

• Dublettenproblematik: Wie erkennen wir Dubletten?

• Qualitätsmanagement:

• Erstellen von Statistiken

• Datenanalysen: z. B. Prüfung einzelner Kategorien auf zulässige Inhalte

• Datenanalysen: z.B. Stand der Normierung: hohe Bedeutung für das Zusammenführen von Beständen mit gleichen Merkmalen und Zukunftsfähigkeit der Metadaten

Seite 128

Page 129: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Anforderungen an Metadaten-Managerinnen und -Manager

bibliothekarische Metadatenstandards

Regelwerke und Frameworks

Vokabulare und Normen

Normdateien

RAK-WB

Seite 129

Page 130: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

• Analytisches Denken

• Spaß daran, sich ständig mit neuen

Aufgaben (Standards, Technologien)

zu beschäftigen und weiterzubilden

Methoden Best Practices

Auszeichnungs-sprachen

Technologien

Hochspezialisierter Arbeitsbereich im Bibliothekswesen

Anforderungen an Metadaten-Managerinnen und -Manager

Seite 130

Page 131: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

8. Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Seite 131

Page 132: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

I LOVE META DATA

• Querschnittsaufgabe • Kooperationen und Projekte • Hoch-spezialisierter Arbeitsbereich • Wissenschaftliche Bibliotheken: Zentrale Fachbibliotheken, Universitäts-

bibliotheken, Nationalbibliotheken, Verbundzentrale • One-Person-Librarians

„Metadaten-Management? Wer muss das wissen?“

Bibliothek der Zukunft

Seite 132

l

Verweisung vom zweiten Bestandteil des zusammengesetzten Namens (§ 319) Ist nach den Regeln ein zusammengesetzter Name in der Ordnungsgruppe des Familiennamens anzusetzen, so wird vom zweiten und von allen weiteren Hauptbestandteilen des zusammengesetzten Namens verwiesen. Die bei der Verweisung übergangenen Teile des zusammengesetzten Namens werden an das Ende der Ordnungsgruppe der Vornamen gestellt (319,1).

l

RAK

Page 133: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Seite 133

Ausbildungsinhalte (2011/2012), untersucht v. A. Schafrick

Bibliothek der Zukunft Metadatenstandards

41

44

2

12

11

0

011

1

10

31

0

00

111

100

0

0 1 2 3 4 5 6 7

Nicht spezifizierte bibliothekarischeMetadatenformate

PICA +PICA3MAB2

MABMABxmlMarc21

ISBDDCTEI

VRAISAD G

EAD

Nicht spezifizierte archivarischeMetadatenformate

Wahlpflichtmodul

Pflichtmodul

Auswertung der Inhalte aus den jeweils aktuellsten öffentlich zugänglichen Modulhandbüchern der grundständigen Studiengänge in Deutschland im Bereich Bibliothekswesen mit dem Bildungsziel Bachelor of Arts (7 Hochschulen). Ergänzt um Inhalte aus den Vorlesungsverzeichnissen WS 2011/2012 und SS 2012.

3

1

3

4

3

7

1

2

1

1

2

1

2

1

2

0

1

0

1

0

0

0

0 1 2 3 4 5 6 7

Forschungsdatenmanagement

Semantic Web (Linked Data,Vokabulare, semantische

Persistent Identifer(Systembeispiele, Aufgaben)

Digitale Langzeitarchivierung(Archivierungsformate, ...)

Normierte Datenübergabe und -integration in verteilten Systemen

Datenmodellierung/Datenmodelle

Aktuelle Entwicklungen beiStandards zum Datenaustauch

Kommunikationsprotokolle (OAHPMH, Z39.50)

Crosskonkordanzen, TerminologieMapping

Metdata-Crosswalks

Unterschiede Austauschformat,Internformat …

Wahlpflichtmodul

Pflichtmodul

Seite 133

„Woher soll ich das wissen?“

Page 134: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Seite 134

„Metadaten-Management? Chancen?“

Bibliothek der Zukunft

Stellenanzeigen für Bibliothekarinnen und -Bibliothekare (Dipl. und B.A.) in Bibliotheken des spezialisierten und hochspezialisierten im deutschsprachigen Bereich vom 01.11.2011-30.04.2012 aus inetbib und Bibliojobs

Seite 134

Page 135: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Automatisierung • Automatische Indexierung und Klassifizierung • Automatische Strukturerkennung von elektronischen Dokumenten • Automatische Formalerschließung von elektronischen Dokumenten • Schließen von Lücken bei Formal- und Sacherschließung • Ergebnisse reichen derzeit nicht an intellektuelle Ergebnisse heran • Semi-automatische Verfahren • „Automatische Verfahren funktionieren nicht automatisch“ Entwickeln und Betreuen von automatischen Verfahren

„In der Bibliothek arbeiten bald nur noch Informatiker“

Bibliothek der Zukunft

Seite 135

Page 136: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Seite 136

„Wer geht denn in die Bibliothek? Ist doch alles im Internet“

Bibliothek der Zukunft

Seite 136 „Zur Bibliothek“, bmgnrs, http://www.flickr.com/photos/gigl/4807897633/

http

://w

ww.

wer

-wei

ss-w

as.d

e/th

eme1

99/a

rticl

e709

8730

.htm

l

Page 137: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Buchlose Bibliothek wächst und gedeiht

Bibliothek der Zukunft

Seite 137

Page 138: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

What is our role?

Bibliothek der Zukunft

http://thinklinks.files.wordpress.com/2013/03/beyondthepdf2_day1_hires.jpg

Metadaten: • (semi-)automatisch erstellte

Metadaten • Metadaten für das Semantic Web • RDF, RDFS • OWL • SKOS • Ontologien statt Schlagwortlisten • Modellierung

Seite 138

Page 139: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

What is our role?

Bibliothek der Zukunft

http://thinklinks.files.wordpress.com/2013/03/beyondthepdf2_day1_hires.jpg

Forschungsdaten: • Mitarbeit bei der Entwicklung von

Forschungsumgebungen • Entwicklung von

Publikationsplattformen • Unterstützung / Beratung der

Forscher • Langzeitarchivierung, Dokumentation

und Verbreitung • ganz praktisch: z.B. Normierung von

Entitäten • Data Librarian: unterstützt bei

Recherche nach FD und bei der Erstellung von Metadaten

Seite 139

Page 140: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

What is our role?

Bibliothek der Zukunft

http://thinklinks.files.wordpress.com/2013/03/beyondthepdf2_day1_hires.jpg

Informationssysteme: • Integration von Metadaten aus

verschiedenen Domänen: Bibliotheken, Museen, Archive, …, Internet

• Erleichterte Verfügbarkeit für elektronische Dokumente (Rechtemanagement)

• Dienst dort bereitstellen, wo die Nutzer sind: von Facebook bis Forschungsumgebung

Seite 140

Page 141: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

What is our role?

Bibliothek der Zukunft

Seite 141

Page 142: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Auf Du und Du mit Dublin Core & Co.

[email protected]

„Metadata is a love note to the future”, Cea., https://secure.flickr.com/photos/centralasian/8071729256/in/photostream/ Seite 142

Page 143: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Seite 143

Literatur

Seite 143

Berners-Lee, Tim: Design Issues. Architectural and philosophical points, 6. Januar 1997 http://www.w3.org/DesignIssues/ Brand, A., Daly, F., Meyers, B., & National Information Standards Organization (U.S.)(2003):Metadata demystified: A guide for publishers. Bethesda, Md: NISO Press. (www.niso.org/standards/resources/Metadata_Demystified.pdf ) Caplan, Priscilla: Metadata Fundamentals for All Librarians. Chicago, 2003, ALA Editions Dublin Core Metadata Initiative: DCMI Glossary. http://dublincore.org/documents/usageguide/glossary.shtml Foulonneau, Muriel; Riley, Jenn (2008): Metadata for digital resources: implementation, systems design and interoperability. Oxford: Chandos. Greenberg, J. (2008): Dublin Core History and Basics. Tutorial ASIST DC 2008 http://dc2008.de/wp-content/uploads/2008/09/tutorial-1.pdf Harper, Corey (2010): Dublin Core Metadata Initiative: Beyond the Element Set – NISO Information Standards Quarterly, v.22, no. 1, Winter 2010. http://www.niso.org/publications/isq/2010/v22no1 Hillman, D. I., & Westbrooks, E. L. (2004). Metadata in Practice. Chicago: ALA Editions. In Baca, M., & Getty Research Institute. (2008). Introduction to metadata. Los Angeles (Calif.: Getty Research Institute. Miller, Eric (1998): An introduction to the resource description framework. In: D-Lib Magazine, Volume 4 Issue 5, May 1998. http://www.dlib.org/dlib/may98/miller/05miller.html Mitchell, Nicole: Metadata Basics (2066): In: The Southeastern Librarian, Vol. 54: Iss. 3, Article 6 . http://digitalcommons.kennesaw.edu/seln/vol54/iss3/6/

Page 144: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Literatur National Information Standards Organization (U.S.). (2004): Understanding metadata. Bethesda, MD: NISO Press. (http://www.niso.org/publications/press/UnderstandingMetadata.pdf ) Pohl, Adrian (2011): Linked Data und die Bibliothekswelt. Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen). http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2011_linked-data_ODOK.pdf Riley, Jenn (2008-2010): Seeing Standards: A Visualization of the Metadata Universe. http://www.dlib.indiana.edu/~jenlrile/metadatamap Söllner, Konstanze (2008):„Academic Librarian of the Future“-Woher kommen die Spezialisten für die neuen Aufgaben in den Bibliotheken?. 102. Deutscher Bibliothekartag <Leipzig, 2013> http://nbn-resolving.de/urn:nbn:de:0290-opus-14644 St. Pierre, Margaret; LaPlant, William P. (1998): Issues in Crosswalking Content Metadata Standards.(NISO White Papers). Bethesda, MD: NISO. http://www.niso.org/publications/white_papers/crosswalk/ Weibel, S. et.al. (2002): Metadata Principles and Practicalities. In: D-Lib-Magazin, Vol. 8, No. 4, April 2002 Zeng, M.L.; Chang, L.M. (2006): Metadata Interoperability and Standardization – A Study of Methodology Part I: Achieving Interoperability at the Schema Level. In: D-Lib-Magazin, Vol. 12, No. 6, June 2006. http://www.dlib.org/dlib/june06/chan/06chan.html Zeng, M.L.; Chang, L.M. (2006): Metadata Interoperability and Standardization – A Study of Methodology Part II: Achieving Interoperability at the Record and Repository Levels. In: D-Lib-Magazin, Vol. 12, No. 6, June 2006. http://www.dlib.org/dlib/june06/zeng/06zeng.html Zeng, Marcia Lei, Jian Qin (2008): Metadata. New York: Neal-Schuman Publishers.

Seite 144

Page 145: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Webressourcen

K.I.M. Kompetenzzentrum Interoperable Metadaten: http://www.kim-forum.org/

Blogs Metadata Matters: Bloggerin: Diane Hillmann: http://managemetadata.com/blog/

Coyle's InFormation: Bloggerin: Karen Coyle: http://kcoyle.blogspot.de/

Managing Metadata: Bloggerin: Laura Smart: http://library.caltech.edu/laura/

Metadata Discussion Group (Indiana University Libraries): https://blogs.libraries.iub.edu/metadata/

Fachjournale Journal of library metadata. 2008. New York, NY: Haworth Press. http://www.informaworld.com/smpp/title~db=all~content=t792306902 .

D-Lib-Magazin (frei): http://www.dlib.org/

Seite 145

Page 146: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Webressourcen

Fortbildung K.I.M. Kompetenzzentrum Interoperable Metadaten: http://www.kim-forum.org/

Hyperlinked Library MOOC: http://slisweb.sjsu.edu/about-slis/news/detail/free-online-course-extends-learning-individuals-across-globe

OpenHPI: (Hasso-Plattner-Institut für Informatik) https://openhpi.de/

Tools Dublin Core Tools zur Erstellung / Bearbeitung: http://www.dublincore.org/tools/ Marc-Tools, wie z.B. MarcEdit: http://www.loc.gov/marc/marctools.html Notepad++: Freier Text-Editor für große Dateien. Suchen und Ersetzen mit regulären Ausdrücken möglich Firefox-AddOns: Dublin Core Viewer, Operator (Mikroformaterkennung) Chrome-AddOn: Schema Explorer (Mikrodata), OpenLink Data Explorer

Seite 146

Page 147: Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Metadatenstandards

• Dublin Core: www.dublincore.org • Pica3/Pica+: (Katalogisierungsrichtlinie des Gemeinsamen Bibliotheksverbunds):

http://www.gbv.de/vgm/info/mitglieder/02Verbund/01Erschliessung/02Richtlinien/01KatRicht/inhalt.shtml

• MARC21: http://www.loc.gov/marc/ • MODS: http://www.loc.gov/standards/mods/ • METS: http://www.loc.gov/standards/mets/ • Library of Congress Standards: http://www.loc.gov/standards/ • ONIX: http://www.editeur.org/83/Overview/ • TEI: http://www.tei-c.org/index.xml • DDI: http://www.ddialliance.org/ • BibTeX: http://www.bibtex.org/ • RIS: http://www.refman.com/support/risformat_intro.asp • COinS (KEV): http://epub.mimas.ac.uk/openurl/KEV_Guidelines-200706.html

Seite 147