erschließungskonzept beschreibungs- / erfassungskonzept indexierungskonzept retrievalkonzept

87
Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Upload: gertrud-jaeger

Post on 06-Apr-2015

102 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Erschließungskonzept

Beschreibungs- / ErfassungskonzeptIndexierungskonzept

Retrievalkonzept

Page 2: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Geordnetes Speichernder

Inhaltsrepräsentationen

DokumenteMedien, Objekte

Inhalts-analyseInhalts-

erschließung

Retrieval

Suchenund

Findenoder

nicht Finden

InformationssystemInformationssystem

KlassifikationssystemeSchlagwortsprachen

ThesauriAbstracts

Automatisches IndexierenAutomatisches Klassifizieren

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

IE

Erschließungskonzept

BeschreibungAuswahl

IndexierungsspracheIndexierung

Retrieval-konzept

Page 3: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

• Analyse des Inhalts von Dokumenten

• Repräsentation des Ergebnisses der Analyse in einer Dokumentationssprache

• Herstellen von Voraussetzungen für ein effizientes Retrieval

Aufgaben der InhaltserschließungFa

chh

och

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Inhaltser-schließung

Das geht nicht ohne die Vorgabe eines Rasters von Kriterien, die

• bei der Analyse als Fragen gestellt werden

• im Erschließungskonzept als Kategorien zur Beschreibung der Dokumente genutzt werden

• im Retrievalkonzept zur Gestaltung der Suchumgebung führenZu berücksichtigen ist, dass die einzelnen Punkte

miteinander wechselwirken und dementsprechend aufeinander abgestimmt werden müssen. Hierzu sind Vorgaben hilfreich, die als Regeln formuliert werden können.

Page 4: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

Bilddokumente Beispiel Bilddokumente

● Wie beschreibt man ein Bild formal ?

● Was ist der Inhalt des Bildes ?

● Wie repräsentiert man diesen Inhalt ?

● Wann ist ein anderes Bild dem Bild ähnlich ?

● Wie sorgt man dafür, dass man alles findet, was man als Inhalt des Bildes beschrieben hat ?

● Wie sorgt man dafür, dass man alle ähnlichen Bilder findet ?

Für die Erschließung zu lösende Probleme

Bilddokumente stellen ein wichtiges Beispiel für nicht-textuelle Dokumente dar und finden in allen Lebensbereichen (Alltag, Wissenschaft, Medien) große Aufmerksamkeit, die sich auch in wirtschaftlichen Interessen niederschlägt. Beispiele sind:

• Fotos in ihren medialen Varianten (Papier, digital, Negativ, Dia, ...)• Gemälde• Grafik, Druckgrafik• Zeichnungen• Pläne und Technische Zeichnungen

Page 5: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

Bilddokumente Unterschiedliche Bilddokumente:

Foto

Ein Foto einer realweltlichen Situation

Page 6: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

Bilddokumente Unterschiedliche Bilddokumente:

FotoEin Foto einerrealweltlichen

Situation

Formal: Dateiname, Dateiformat, Dateigröße, Farbtiefe, Aufnahmedatum, technische Daten der Aufnahme (Kameratyp, Blende, Zeit, ...),Urheber, Inhaber der Verwertungsrechte, Aufbewahrungsort, ...

Inhaltlich: Dargestellte Objekte (hier: Tierart: Bären (welche (?)), Zahl der Objekte (?)Verhalten (?)Ort (Land, See (?), Fluss (?), Ufer (?), Insel (?)),Zeit (Jahres-, Tages-), Perspektive, Vorder-, Hintergrund

Vermarktung:Erworben von ..., Verkauft an ..., Preis

Mögliche Beschreibungskategorien:

Page 7: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

Bilddokumente

Unterschiedliche Bilddokumente:

Foto

Ein Foto einer realweltlichen Situation

Weitere Beschreibungskategorien:

• Stimmung ?• Eindruck ?

Inhalt:

• Dargestelltes ?• Enthaltenes ?• Wahrgenommenes ?• Interpretiertes ?• Assoziiertes ?

• Wesentliches ?• Nebensächliches ?

Wie und wodurch unter-scheidet man 1.000 Bilder mit Sonnenuntergängen ?

Page 8: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

Bilddokumente:Shatford

Ein Beispiel für ein Raster zur inhaltlichen Bildanalyse

Lebrecht, H.: Methoden und Probleme der Bilderschließung am Beispiel des verteilten digitalen Bildarchivs Prometheus. Köln: Fakultät für Informations- und Kommunikationswissenschaften 2003. 90 S.

Page 9: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Zusammenfassung Inhaltsanalyse bezogen auf Textdokumente

Erkennen des Dokumenteninhaltes in seinen wesentlichen inhaltlichen Kategorien (Aspekten) = Aussagen über ...:

• Personenaspekt (Aussagen über Leben oder Werk von Personen)• Geographischer Bezug• Zeitliche Eingrenzung• Formaspekt• Sachaspekte

- Behandelte / dargestellte Objekte (Eigennamen)- Eingesetzte Methoden, Verfahren oder HilfsmittelFür letzteres ist die Bestimmung der fundamentalen

Wissensform für das einzelne Thema interessant (nicht mit Fachgebiet zu verwechseln, sondern zu verstehen als disziplinäre Sichtweise):

- Philosophie - Religion, Theologie- Naturwissenschaften, Medizin - Sozialwissenschaften, Politik- Geschichte - Kunst- Technik, Ingenieurwissenschaften- Persönliche Erfahrung

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Inhaltsanalyse

Page 10: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Zum Erschließungskonzept gehört die Vereinbarung von

Indexierungsregeln (Indexierungskonzept)

Page 11: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Erschließung von Dokumenten mit mehreren abgebildeten Gegenständen

Wirbeltiere- Säugetiere- Beutelsäuger- - Kängurus

Blumen- Stechwindengewächse- Liliengewächse- - Tulpen

-> Kängurus nicht Känguru, nicht Beutelsäuger

-> Tulpen nicht Tulpe, nicht Liliengewächse

Ein GegenstandNormiertes

und strukturiertes Vokabular

Page 12: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Erschließung von Dokumenten mit mehreren abgebildeten Gegenständen

-> Kängurus, Tulpen

Mehrere Gegenstände

Page 13: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Erschließung von Dokumenten mit mehreren abgebildeten Gegenständen

-> Kängurus, Tulpen, Sonne

Mehrere Gegenstände

Je nach Zweckbindung können weitere Aspekte berücksichtigt werden, vgl. die Shatford-Tabelle

Page 14: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Schwieriger Teil:

Auswahl eines Indexierungsprinzips:

•Gleichordnendes Indexieren•Syntaktisches Indexieren

Im Rahmen des Einsatzes von Thesauri für die Indexierung und des postkoordinierenden Booleschen Retrievals beschäftigen wir uns nur mit dem Gleichordnenden Indexieren.

Weitere Details zum Syntaktischen Indexieren bleiben dem Selbststudium überlassen. Das Buch enthält in den Abschnitten 2.9 und in Kapitel 7 weitere Hinweise.

Wichtige allgemeine Gestaltungs- und Bewertungskriterien sind die Konsistenz und die Homogenität – insbesondere im Indexierungsvorgang – zur Unterstützung einer optimalen Filterfunktion im Such- und Findevorgang.

Page 15: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Zusammenfassung

Das Erschließungskonzept umfasst die Summe aller Vereinbarungen, die zur Beschreibung des Inhalts von Dokumenten getroffen werden:

•Kategorien, Eingabefelder für zentrale und periphere Objekte, Inhalte, Aussagen•Vordergründe, Hintergründe, Kontext•Stimmungen, Konnotationen, Filter

Hinzu kommen Vereinbarungen über die Art der einzusetzenden Indexierungssprache:

•Freitext, Abstract•Auswahlliste•Normiertes Vokabular, Thesaurus

Das Indexierungskonzept umfasst alle Regeln, die die Zuteilung der inhaltskennzeichnenden Merkmalen betreffen.

Für den Fall, dass mehrere Sprachen vorkommen, kann – insbesondere bei Anwendung von Verfahren der Automatischen Indexierung – eine Verein-barung zur Behandlung unterschiedlicher Sprachen erforderlich sein.

Page 16: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Thesaurus: Startseite

Freies VokabularAuswahllisten

Thesaurus

Prinzipien der Erstellung und Anwendung

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

Hilfsmittel zur Indexierung

Page 17: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

• Festlegung von Beschreibungs- und Erfassungskategorien, die für die Beschreibung des Dokumentinhals als wichtig erachtet werden und die für eine Suche als Suchkategorien genutzt werden können

• Eigene Kategorien immer dann, wenn für einen Suchvorgang eine Kombination der Suchfelder (Filterfunktion) unterstützt werden soll (Aspektorientierung), z.B.:

- Sache + Geo- Sache + Zeit- Sache + Zeit + Geo

• Trennung von:

- Vordergrund – Hintergrund- Hauptaspekt – Nebenaspekt

• Benutzung unterschiedlicher Normierungsgrade des Vokabulars

- Freier Text (z.B. Abstracts)- Auswahllisten, Wortlisten (bei begrenzter Optionenzahl)- Thesauri

Page 18: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Möglichkeiten zur Formulierung inhaltlicher Aussagen über Dokumente

Frei gewählte Wörter, Abstracts

Wortlisten

Thesauri, normiertes und strukturiertes Vokabular

Vorteile Bei Verwendung ganzer Sätze starke inhaltliche Ausdrucksfähigkeit mit Differenzierungsmöglichkeiten

Nachteile Homogenität für gleiche Sachverhalte schwer herstellbarKontexte werden durch Aufbereitung für das Suchvokabular zerstört

Vorteile Einfache Normierung und Vermeidung von Inkonsistenzen durch Copy und Paste

Nachteile Geringer Umfang, sonst UnübersichtlichkeitKeine Möglichkeiten, begriffliche Strukturen durch Relationen zwischen den Wörtern darzustellen

Vorteile Eindeutigkeit der inhaltlichen BedeutungVermeidung von MehrdeutigkeitenBei Verwendung als Normdatei gute VokabularkonsistenzVerwendung spezifischer Deskriptoren mit Möglichkeit zur hierarchischen Suche

Nachteile Aufwand zur Erstellung

Page 19: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Ein Beispielzur

fehlerhaften Gestaltungeines

Thesauruseintrags

Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot

Butterbrot Stulle

OB BackwarenKuchen

UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot

VB TortenPlätzchenBerliner Holzofenbrot

Fragen und Aufgaben

•Welche Fehler wurden in dem Eintrag gemacht?

•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.

•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?

Page 20: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot

Butterbrot Stulle

OB BackwarenKuchen

UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot

VB TortenPlätzchenBerliner Holzofenbrot

Fragen und Aufgaben

•Welche Fehler wurden in dem Eintrag gemacht?

•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.

•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?

Page 21: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot

Butterbrot Stulle

OB BackwarenKuchen

UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot

VB TortenPlätzchenBerliner Holzofenbrot

Fragen und Aufgaben

•Welche Fehler wurden in dem Eintrag gemacht?

•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.

•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?

Page 22: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot

Butterbrot Stulle

OB BackwarenKuchen

UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot

VB TortenPlätzchenBerliner Holzofenbrot

Fragen und Aufgaben

•Welche Fehler wurden in dem Eintrag gemacht?

•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.

•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?

Page 23: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot

Butterbrot Stulle

OB BackwarenKuchen

UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot

VB TortenPlätzchenBerliner Holzofenbrot

Fragen und Aufgaben

•Welche Fehler wurden in dem Eintrag gemacht?

•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.

•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?

Page 24: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot

Butterbrot Stulle

OB BackwarenKuchen

UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot

VB TortenPlätzchenBerliner Holzofenbrot

Fragen und Aufgaben

•Welche Fehler wurden in dem Eintrag gemacht?

•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.

•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?

Page 25: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot

Butterbrot Stulle

OB BackwarenKuchen

UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot

VB TortenPlätzchenBerliner Holzofenbrot

A-Z

Fragen und Aufgaben

•Welche Fehler wurden in dem Eintrag gemacht?

•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.

•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?

Page 26: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot

Butterbrot Stulle

OB BackwarenKuchen

UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot

VB TortenPlätzchenBerliner Holzofenbrot

A-Z

A-ZSyn.

Fragen und Aufgaben

•Welche Fehler wurden in dem Eintrag gemacht?

•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.

•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?

Page 27: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit und anderen Zutaten hergestellt. BF Butterbrot

Stulle OB BackwareUB Baguette

Bergische Kruste Holzofenbrot RoggenbrotSauerteigbrot VollkornbrotWeißbrot Weizenbrot

VB TorteGebäck

Eine stimmigere Variante

Fragen und Aufgaben

•Welche Fehler wurden in dem Eintrag gemacht?

•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.

•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?

Page 28: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit und anderen Zutaten hergestellt. BF Butterbrot

Stulle OB BackwareUB (nach Rohstoff)

RoggenbrotVollkornbrotWeizenbrot

UB (nach Backart)BaguetteBergische Kruste Sauerteigbrot Holzofenbrot Weißbrot

VB TorteGebäck

Fragen und Aufgaben

•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?

Page 29: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit und anderen Zutaten hergestellt. BF Butterbrot

Stulle OB BackwareUB (nach Rohstoff)

RoggenbrotVollkornbrotWeizenbrot

UB (nach Backart)BaguetteBergische Kruste Sauerteigbrot Holzofenbrot Weißbrot

VB TorteGebäck

Fragen und Aufgaben

•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?

Page 30: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Prinzip Thesaurus

Unter einem Thesaurus versteht man eine

Begrenzte Sammlung von Begriffen für ein (in der Regel begrenztes) Fachgebiet, die zur inhaltlichen Beschreibung von Dokumenten Verwendung finden sollen. Die Begriffe werden durch Deskriptoren (terminologisch kontrollierte Benennungen) repräsentiert. Zum Zwecke der Orientierung werden die Beziehungen zwischen den Begriffen durch eine eigene Nomenklatur ausgewiesen. Die Erstellung eines Thesaurus beinhaltet als zentrale Aufgabe, die für die inhaltliche Beschreibung der Dokumente eines Gebietes wichtigen Begriffe

• zu sammeln• sprachlich eindeutig zu repräsentieren• einer terminologischen Kontrolle zu unterwerfen• zu relationieren, d.h. (semantische oder a priori) Beziehungen zwischen den Begriffen auszuweisen• Thesaurus spezifische Definitionen anzugebenDIN 1463 Erstellung und Weiterentwicklung von Thesauri: Teil 1: Einsprachige Thesauri; Teil 2:

Mehrsprachige Thesauri. Berlin: 1987-1993.Wersig, G.: Thesaurus Leitfaden. 2. Aufl. München: Saur 1985Aitchison, J., A. Gilchrist u. D. Bawden: Thesaurus construction and use: a practical manual. 4th ed. London: Aslib 2000.

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

Thesauri

Page 31: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Bei der so gebildeten - möglichst für das Gebiet vollständigen - Sammlung von Begriffen mitsamt ihren Beziehungen handelt es sich um ein Kunst-produkt, das sich für die Darstellungen von Begriffsbedeutungen zwar der natürlichen Sprache bedient, in dem die Bedeutung einzelner Wörter jedoch von einer umgangssprachlichen Bedeutung abweichen können. Die Bedeutung der Deskriptoren ist Thesaurus-spezifisch und kann dement-sprechend von Thesaurus zu Thesaurus unterschiedlich sein. Sie erschließt sich nur innerhalb eines Thesaurus aus den verwendeten Hilfsmitteln.Angaben zu einem Deskriptor

• Definitionen, Erläuterungen• Verwendungshinweise• Angabe von Notationen einer Referenzsystematik• Relationen zu anderen Thesaurus-Begriffen• Daten der Erfassung, Änderung, Löschung

Im Unterschied zu sprachlich oder rein terminologisch orientierten Thesauri (z.B. Synonym-Wörterbüchern), die Wortfeldsammlungen anstreben und genutzt werden können, um einen Sachverhalt stilistisch durch verschiedene sprachliche Wendungen auszudrücken, dient ein dokumentationsprachlicher Thesaurus der Reduzierung der Sprachvielfalt. Er soll - auch um den Preis der Bedeutungsveränderung einzelner Wörter - eine Verengung des Wortschatzes sein (Terminologische Kontrolle).

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

Thesauri

Page 32: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Idealtypische Eigenschaften der Deskriptoren

Semantische Abgeschlossenheit, d.h. die Bedeutung des Deskriptors muss ausschließlich aus seiner sprachlichen Gestalt erschlossen werden können, ohne dass bei seiner Verwendung Teile einer Bedeutung aus anderen Deskriptoren übertragen werden müssen.

Für den semantischen Gehalt nimmt man in der Regel eine Orientierung an der Fachsprache des entsprechenden Gebietes vor.Aufgaben der terminologischen Kontrolle:

• Beseitigen von synonymen Wortformen durch Bestimmung von Deskriptoren und Nicht-Deskriptoren

• Eliminierung von Quasi-Synonymen durch Behandlung als:- Synonym oder- Verwandter Begriff

• Bereinigen von Homonymen oder Polysemen (z.B. durch Zusätze, wenn die Fachgebietseingrenzung allein nicht ausreicht)

• Aufstellen von Regeln für das Umgehen mit.- Adjektiv-Substantiv-Verbindungen- Komposita- Phrasen etc.

• Herstellung von Relationen zu den anderen Begriffen

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

Thesauri

Page 33: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Deskriptoren im Thesaurus-Format

MeisenD Familie der Singvögel in offenen Land-

schaften und Wäldern der Nordhalbkugel und Afrikas; meist in Höhlen brütende Standvögel oder Teilzieher. Sie ernähren sich v.a. von Insekten, zeitweise auch nur von Pflanzen

BF MeisenvögelParidae

OB SingvögelUB Blaumeise

HaubenmeiseKohlmeiseSchwanzmeiseSumpfmeiseTannenmeiseWeidenmeise

VB FinkenKleiber

BlaumeiseD Etwa 11 cm lang, besonders hellblau

und gelbBF Parus caeruleusOB Meisen

FinkenD Bis starengroße Singvögel in Amerika,

Eurasien und Afrika; vorwiegend Körner-fresser mit Kegelschnabel

BF FinkenvögelFringillidae

OB SingvögelUB Buchfink

GrünfinkVB Meisen

ParidaeBS Meisen

D DefinitionBF Benutzt fürBS Benutze SynonymOB OberbegriffUB UnterbegriffVB Verwandter Begriff

KleiberD Den Meisen verwandte Familie der Sing-

vögel, die an Baumstämmen (auch kopf-abwärts) klettern und einen kräftigen, zum Hämmern geeigneten Schnabel haben.

BF SittidaeOB SingvögelVB Meisen

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

Thesaurus-Format

Page 34: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Die Angabe von Relationen ist eine wichtige eigene Aufgabe, die thesaurus-spezifisch ist und verschiedenen Zwecken dient.

Sinn der Relationierung:

• Hilfsmittel zur Festlegung des begrifflichen Verständnisses des Deskriptors

• Hilfsmittel zur Orientierung innerhalb der Begriffsstruktur für- Indexierer- Recherchierenden

• Grundlage für die Gestaltung spezifischer Suchmöglichkeiten(Suche im semantischen Umfeld, Search Down, Expand,

Explode)

Welche Relationen es geben soll, welche Bedeutung sie haben und welche Rolle sie spielen sollen, bzw. in welchem Umfang sie Verwendung finden, ist eine der zentralen Festlegungen bei der

Erstellung eines Thesaurus, die vorab geklärt werden müssen. Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

Thesauri

Page 35: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Ein Beispielzur

fehlerhaften Gestaltungeiner

Systematischen Struktur

Wirbeltiere Säugetiere

Säugetiere Afrikas Bären

Grizzly-Bären Grizzly-Bären in Alaska Bildband amerikanischer Bären

Vögel Singvögel

Bildband europäischer Singvögel Meisen

Blaumeisen Brutverhalten von

Blaumeisen Wirbellose Tiere

Insekten Insekten Europas

Handbuch amerikanischer InsektenSchmetterlinge

Bildband europäischer Schmetterlinge

Fragen und Aufgaben

•Welche Fehler enthält die abgebildete „systematische Struktur“ ?

•Geben Sie Möglichkeiten zur Verbesserung der vorstehenden Struktur an.

•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?

Page 36: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Wirbeltiere Säugetiere

Säugetiere Afrikas Bären

Grizzly-Bären Grizzly-Bären in Alaska Bildband amerikanischer Bären

Vögel Singvögel

Bildband europäischer Singvögel Meisen

Blaumeisen Brutverhalten von

Blaumeisen Wirbellose Tiere

Insekten Insekten Europas

Handbuch amerikanischer InsektenSchmetterlinge

Bildband europäischer Schmetterlinge

Fragen und Aufgaben

•Welche Fehler enthält die abgebildete „systematische Struktur“ ?

•Geben Sie Möglichkeiten zur Verbesserung der vorstehenden Struktur an.

•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?

Page 37: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Wirbeltiere Säugetiere

Bären Grizzly-Bären

Vögel Singvögel

Meisen Blaumeisen

Brutverhalten von Blaumeisen Wirbellose Tiere

Insekten Schmetterlinge

Hierarchie der Sachbegriffe

BildbandHandbuch

Afrika Amerika

AlaskaEuropa

Hierarchie der Geografika

Hierarchie der Formbegriffe

Eine erste Behandlung

Eine zweiter Blick . . .

Bären Alaska Bildband

für einen Bildband mit Bären in Alaska

Zur Erinnerung: Ein komplexes Thema mit mehreren Aspekten wird durch eine kombinierte Zuteilung mehrerer Deskriptoren repräsentiert:

Page 38: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Wirbeltiere Säugetiere

Bären Grizzly-Bären

Vögel Singvögel

Meisen

Blaumeisen

Brutverhalten von Blaumeisen Wirbellose Tiere

Insekten Schmetterlinge

Hierarchie der Sachbegriffe

BildbandHandbuch

Afrika Amerika

AlaskaEuropa

Hierarchie der Geografika

Hierarchie der Formbegriffe

. . . ein zweiter Blick

Page 39: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Wirbeltiere Säugetiere

Bären Grizzly-Bären

Vögel Singvögel

Meisen Blaumeisen

Wirbellose Tiere Insekten

Schmetterlinge

Taxonomische Begriffe

BildbandHandbuch

Afrika Amerika

AlaskaEuropa

Hierarchie der Geografika

Hierarchie der Formbegriffe

Hierarchie der Verhaltensaspekte

Brutverhalten

Blaumeisen

Brutverhalten

Europa

Bildband

Repräsentation des Dokumentinhalts:Bildband zum Brutverhalten europäischer Blaumeisen

Page 40: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Grenzen der Merkmalsbestimmung

Grenzen der Merkmalsbestimmung

Nicht alle Vorgehensweisen der Merkmalsbestimmung im wissenschaftlichen Kontext eignen sich für eine Übertragung auf allgemeine, nutzen- oder interessenorientierte (Alltags-) Sachverhalte. Insbesondere die gemeinsame Berücksichtigung in einem Ordnungskontext bereitet Schwierigkeiten.Beispiel

Baum

Obstbaum

Laubbaum

Kirschbaum

Apfelbaum

Taxonomischer Oberbegriff

Taxonomischer Oberbegriff

Page 41: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Zurück zum Erschließungs- und Indexierungskonzept

Ein für alle Daten und Anwendungen gleichartiges Erschließungs- und Indexierungskonzept kann es nicht geben.

Unterschiedliche Daten und insbesondere verschiedene Zweckbindungen erfordern unterschiedliche Beschreibungskategorien, den Einsatz unterschiedlichen strukturierten und normierten Vokabulars sowie den Einsatz unterschiedlicher Indexierungskonzepte.

Wichtige allgemeine Gestaltungs- und Bewertungskriterien sind die Konsistenz und die Homogenität – insbesondere im Indexierungsvorgang – zur Unterstützung einer optimalen Filterfunktion im Such- und Findevorgang.

Unterschiedliche Konzepte können zu Lösungen mitunterschiedlichen Filterfunktionen führen, diejeweils eigene Alleinstellungsmerkmale besitzen.

Beispiel Musicbox . . .

Page 42: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

SpracheSpracheundund

BedeutungBedeutung

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Sprache und Bedeutung

Konsequenzen für die Gestaltung

von Dokumentationssprachen

Krach

Streit

Lärm

Page 43: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Einleitung

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Einleitung

Dokumentationssprachen haben die Aufgabe, den Inhalt von Dokumenten eindeutig zu repräsentieren und in einer sinnvollen Ordnung für das Auffinden bereitzustellen.

Die angestrebte Eindeutigkeit erzwingt Maßnahmen, die Vielfalt der Erscheinungsformen der Sprache zu reduzieren. Damit sollte jedoch möglichst keine Einbuße in der Ausdrucksmöglichkeit einhergehen.

In Klassifikationssystemen mit ihrer Repräsentation von Bedeutungen durch Notationen besteht keine Gefahr, einem dokumentationssprachlichen Ausdruck eine Alltagsbedeutung zu unterlegen. In verbalen Dokumentationssprachen muss man jedoch immer damit rechnen, dass die Bedeutung der dokumentationssprachlichen Repräsentation mit einer vertrauten Verwendung verglichen wird, obwohl innerhalb der Dokumentationssprache möglicherweise eine veränderte Bedeutungsgebung vorgenommen wurde.

Es muss also dem Verhältnis von Sprache zu Bedeutung und den Möglichkeiten von Bedeutungsgebung in Dokumentationssprachen nachgegangen werden.

Page 44: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Sprache Bedeutung

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Verhältnis von Sprache und Bedeutung

In der menschlichen Kommunikation ist Sprache der Träger und Vermittler von Bedeutung.

Sprache ist jedoch nicht in dem Sinne mit Bedeutung identisch, daß jeder sprachliche Ausdruck eine und nur eine Bedeutung hätte. Bedeutungsgebung ist ein individueller kognitiver Vorgang, der von Personen ausgeführt wird und an Situationen gebunden ist. Ein und derselbe Reiz, eine Sinneswahrnehmung, kann so zu unterschiedlichen Zeiten, unter verschiedenen Begleitumständen unterschiedliche kognitive Bedeutungsgebungen auslösen. Im Laufe der Entwicklung einzelner Personen und sozio-kultureller Gemeinschaften erwirbt man durch die Auseinandersetzung mit seiner Umgebung Kompetenz für den Umgang mit Konzepten und lernt es, sich mit anderen über diese Konzepte zu verständigen. Dabei kommt Sprache durchaus eine normierende Funktion zu, damit man sich überhaupt über bestimmte Konzepte verständigen kann. Trotzdem macht früher oder später jeder die Erfahrung, daß ein Konzept und erst recht ein komplexer Sachverhalt in der Regel durch eine größere Zahl sprachlicher Varianten repräsentiert werden kann.

Page 45: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Sprach-varianten

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Beispiel

Ein Sachverhalt wie Bibliotheksautomatisierung kann sprachlich auch durch

● Automation in Bibliotheken● Automatisierung in Bibliotheken● Automatisierung von Bibliotheken● Einsatz der Datenverarbeitung für bibliothekarische Arbeitsabläufe● Einsatz der elektronischen Datenverarbeitung in Bibliotheken● Einsatz von Personalcomputern in Bibliotheken● Mikrocomputer-Anwendung in Bibliotheken

zum Ausdruck gebracht werden.

Daneben ist noch zu klären, ob mit Bibliotheken ausschließlich das Gesamtphänomen Bibliothek gemeint ist, oder ob auch die Automatisierung in einzelnen Bibliothekstypen (Öffentliche Bibliotheken, Spezialbibliotheken, etc.) bzw. spezifischer Tätigkeiten (Ausleihe, Erwerbung, etc.) gemeint ist.

Page 46: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Sprach-varianten

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Dies würde zu Aussagen wie

Einsatz der elektronischen Datenverarbeitung für die Automatisierung der Ausleihverbuchung in Öffentlichen Bibliotheken

oder

Einsatz der Datenverarbeitung zur Automatisierung von Erwerbungsabläufen in Spezialbibliotheken

führen.

Man sieht, dass um ein Thema herum ein Umfeld kontextbezogener Sachverhalte existiert, die je nach individueller oder situationsbedingter Interpretation dem Thema gleichgesetzt werden oder nicht.

Es läßt sich leicht vorstellen, welche weiteren Varianten des genannten Beispiels denkbar sind.

Solche Phänome bedürfen zum Zwecke der Einheitlichkeit und Eindeutigkeit beim Wiederauffinden einer klaren Regelung innerhalb einer Dokumentationssprache.

Page 47: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Begriffstheorie

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Begriffstheorie

Unter einer Begriffstheorie versteht man das Bemühen, einen theoretischen Rahmen für die Frage zu finden, was Begriffe sind und welche Eigenschaften sie haben. Man muss sich von vornherein darüber klar sein, daß dies eine schwierige Aufgabenstellung sein muss, da man über ein der Sprache zugrunde liegendes Phänomen in Sprache reden will. Aus der Logik weiß man, daß dies prinzipiell die Gefahr von Widersprüchen in sich trägt, die allenfalls durch Verwendung einer Metasprache vermieden werden können. Da jedoch keine der natürlichen Sprache vergleichbare allgemein verbindliche Verständigungsmöglichkeit gleicher Aussagekraft vorhanden ist,

muss man diesen Weg gehen.

Page 48: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Begriffe

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Das heute für den Kontext von Dokumentationssprachen üblicherweise benutzte begriffstheoretische Modell geht von folgenden Annahmen aus:

Kognitive Vorstellungen von realweltlichen oder abstrakten Objekten lassen sich in Form von Begriffen fixieren, die zum Zwecke der Kommunikation mit anderen Menschen in Zeichensystemen als Bezeichnungen oder Benennungen (Bezeichnungen in Sprache) formuliert werden können. Man kann also ein Beziehung der folgenden Art sehen:

Objekt

Begriff

Benennung

Vorstellung oder Konzeptualisierungdes Objekts

Katze Mikesch Cat Maunzi

Page 49: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Begriffsdreieck

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Katze

Begriffsdreieck

Objekt

Begriff

Bezeichnung,Zeichen

Mikesch

Catrealoder

abstrakt

Dies wird häufig auch als sog. Begriffsdreieck formuliert. Damit soll zum Ausdruck gebracht werden, dass es sich um eine dreiwertige Abhängigkeit handelt, in der alle 3 Ecken aufeinander bezogen sind und aus der man keines der 3 Elemente entfernen kann.

Maunzi

Page 50: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Definitionen

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Die Begriffe werden dabei gewonnen, indem man Aussagen über die realweltlichen oder abstrakten Objekte macht. Dies geschieht z.B. dadurch, daß man an ihnen Eigenschaften oder Merkmale feststellt z.B.:• Ein Tisch hat eine Platte und in der Regel Beine; das Material,

aus dem er hergestellt wird, ist Holz, Glas, Stein, Kunststoff; sein Verwendungszweck ist vielfältig, in der Regel stellt man zeitweise Gegenstände darauf, sitzt davor, daran oder darum herum.

• Eine Blume ist eine Pflanze; sie hat meist einen Stiel, Blätter und Blüten; der Stiel dient der Wasser- und Nährstoffaufnahme, die Blätter der Photosynthese, die Blüte der Fortpflanzung.

Aus derartigen Beschreibungen versucht man Begriffsdefinitionen abzuleiten, die den als wesentliche betrachteten Gehalt eines Begriffes charakterisieren und festhalten sollen. Dabei werden sog. intensionale Definitionen von den extensionalen Definitionen unterschieden.

Intensional heißt eine Definition, wenn für einen Begriff die Summe seiner charakterisierenden Merkmale angegeben wird (vgl. genannte Beispiele).

Page 51: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Definitionen

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Extensional heißt die Definition eines Begriffs, wenn alle Objekte angegeben werden, die durch den Begriff beschrieben werden.

Ein Beispiel wäre

Planeten unseres Sonnensystems = {Merkur, Venus, Erde, Mars, Jupiter, Saturn, Neptun, Uranus, Pluto}

Nicht alle Begriffe sind intensional oder extensional beschreibbar. Begriffsdefinitionen kommt insbesondere eine Rolle für die Bedeutungsgebung von Fachtermini zu, für die es kein alltags weltliches Verständnis gibt, z.B.:

• Turmdrehkran• hypoelliptischer Differentialoperator

Man kann überdies an vielen Beispielen sehen, dass insbesondere intensionale Definitionen nur eine Annäherung darstellen, die durch individuelle kognitive Fähigkeiten erweitert wird, damit sich das individuelle Begriffsverständnis entwickelt.

Page 52: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Eco

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Eine schöne literarische Beschreibung dieser Vorstellung von sprachlichen Zeichen und ihren Referenzsystemen in der Wirklichkeit sowie in der kognitiven Bedeutungsgebung findet man in nachstehendem Text von Umberto Eco (aus: Der Name der Rose):

"Mich beschäftigte immer noch die Geschichte mit dem Rappen Brunellus, und so fragte ich William, kaum daß wir allein waren: »Als Ihr die Spuren im Schnee und an den Zweigen laset, kanntet Ihr doch Brunellus noch nicht. In gewisser Weise sprachen doch diese Spuren nur ganz allgemein von Pferden, oder jedenfalls von einem Pferd dieser Art und Rasse. Könnte man daher nicht sagen, daß uns das Buch der Natur lediglich abstrakte Wesenheiten verkündet, wie zahlreich ehrwürdige Theologe lehren?«

»Keineswegs, lieber Adson«, erwiderte mir der Meister. »Gewiß gaben mir jene Spuren für sich genommen nur das Pferd als verbum mentis in den Sinn, und als solches hätten sie es mir überall in den Sinn gegeben. Doch an diesem Ort und zu dieser Stunde des Tages lehrten sie mich, daß zumindest eines von allen denkbaren Pferden dort vorbeigekommen sein mußte. Also befand ich mich bereits auf halbem Wege zwischen der Vorstellung des Begriffes >Pferd< und der Erkenntnis eines einzelnen Pferdes. Und in jedem Fall war mir das, was ich vom Pferd im allgemeinen wußte, durch eine besondere Spur ins Bewußtsein gerufen worden.

Page 53: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Eco

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Ich war also in diesem Augenblick sozusagen gefangen zwischen der Besonderheit jener Spur und meiner Unkenntnis, die gerade erst angefangen hatte, die noch recht blasse Gestalt einer allgemeinen Vorstellung anzunehmen. Wenn du etwas von weitem siehst und nicht weißt, was es ist, wirst du dich damit begnügen, es als einen Körper von ungewisser Ausdehnung zu definieren. Bist du näher herangekommen, so wirst du es vielleicht als ein Tier definieren, wenn du auch noch nicht weißt, ob es ein Pferd oder ein Esel ist. Hast du dich ihm noch mehr genähert, so wirst du sagen können, daß es ein Pferd ist, wenn du auch noch nicht weißt, ob es Brunellus oder Flavellus ist. Erst wenn du nahe genug herangekommen bist, wirst du erkennen, daß es Brunellus ist (beziehungsweise dies bestimmte und kein anderes Pferd, wie immer du es nennen willst). Und das ist dann schließlich die volle Erkenntnis, die Wahrnehmung des Einmaligen. So war ich vor einer Stunde noch darauf gefaßt, jedem denkbaren Pferd zu begegnen, aber nicht etwa aufgrund der Weiträumigkeit meines Geistes, sondern aufgrund der Beschränktheit meiner Wahrnehmung. Und der Wissensdurst meines Geistes wurde erst in dem Augenblick gestillt, als ich das einzelne Pferd erblickte, das die Mönche am Zügel führten. Da erst wußte ich wirklich, daß meine vorausgegangenen Überlegungen mich der Wahrheit nahegebracht hatten. Die Ideen, mit deren Hilfe ich mir bis zu diesem Moment ein Pferd vorgestellt hatte, das ich noch niemals zuvor gesehen, waren mithin reine Zeichen, wie die Spuren im Schnee nur Zeichen der allgemeinen Idee des Pferdes waren - und Zeichen oder Zeichen von Zeichen benutzen wir nur, solange wir keinen Zugang zu den Dingen selbst haben.«

Page 54: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Abstraktion

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Menschen besitzen dabei üblicherweise erstaunliche Fähigkeiten zur Abstraktion, dem wohl wichtigsten Mittel zur kognitiven Begriffsbildung. So erscheint zunächst eine Charakterisierung wie rundes Viereck widersprüchlich zu sein.

Betrachtet man jedoch nachstehende Figur, bekommt diese Charakterisierung einen Inhalt, vielleicht einen Sinn:

Die ebenso widersprüchliche Bezeichnung rundes Dreieck begegnet uns im Alltag sehr häufig in Form von Verkehrsschildern:

Interessant ist auch das Metonymie genannte Phänomen: ein Teil oder eine Eigenschaft wird mit dem Ganzen gleich gesetzt; Erläuterung und Verständnis ergeben sich häufig erst durch Angabe des Kontextes, z.B.:

Das Schnitzel geht, ohne zu bezahlen.

Gemeint ist eine Gasthaus-Situation: Der Gast, der das Schnitzel bestellt und verzehrt hat, verlässt das Lokal, ohne zu bezahlen.

Page 55: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Einleitung

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Interessanterweise ist der Schlüsselreiz für das Verständnis eines Konzeptes, der von den reinen Benennungen ausgeht, manchmal größer als der einer Definition.

Vgl. als Beispiele etwa die folgenden Definitionen:

• Gerät zur Messung von Winkelabständen zwischen Gestirnen und

von Gestirnshöhen (Winkelabstände der Gestirne vom Horizont)

• Schwankungen von Wirtschaftsdaten innerhalb eines Zyklus (Zeitraum, der einen konjunkturellen Auf- u. Abschwung

umfaßt)

• Langfristige, festverzinsliche Schuldverschreibung der Bodenkredit- anstalten; durch Hypotheken gesichert u. börsengängig; kündbar nur durch die Hypothekenbank

• Flugkörper, der im Gegensatz zum Flugzeug keine Atmosphäre benötigt und alle zum Antrieb notwendigen Mittel mit sich

führt. Besteht aus Zelle und Triebwerk. In der Zelle befinden sich die Treibstoffvorräte, die Steuerungsgeräte, die Nutzlast und ggf. die Besatzung. Das Triebwerk erzeugt durch Rückstoß den Vortrieb oder Schub

Diese Erläuterungen versteht man teilweise erst, wenn man die Benennung kennt, die den zu definierenden Begriff bezeichnet: ...

Sextant

Konjunktur

Pfandbrief

Rakete

Page 56: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Einleitung

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Auch noch längere Erklärungen müssen dem Verständnis nicht immer förderlich sein, obwohl man jeden Satz der Erklärung durchaus meint verstanden zu haben; man vergleiche beispielsweise den nachstehenden Text:

Das Vorgehen ist wirklich ziemlich einfach. Zuerst sortieren Sie die Sachen je nach Aussehen in verschiedene Gruppen. Natürlich kann ein Stapel ausreichend sein, je nachdem, wieviel es zu tun gibt. Wenn Sie aus Mangel an Möglich-keiten irgendwo anders hingehen müssen, dann ist dies der nächste Schritt; ansonsten sind Sie ziemlich gut ausgerüstet. Es ist wichtig, irgendein bestimm-tes Vorhaben nicht zu übertreiben. Das heißt, es ist besser, zu wenige Dinge auf einmal zu tun als zu viele. Fürs nächste mag das nicht wichtig erscheinen, aber aus der Erledigung von zu vielen Aufgaben gleichzeitig können leicht Komplikationen entstehen. Ein Fehler kann außerdem teuer kommen. Die Handhabung der angemessenen Technik sollte ohne weitere Erläuterungen verständlich sein, und wir brauchen hier nicht näher darauf einzugehen. Am Anfang wird wohl das gesamte Vorgehen verwickelt erscheinen. Bald aber wird es einfach zu einem weiteren Aspekt des Alltags. Es ist schwierig, das Ende der Notwendigkeit dieser Aufgabe für die unmittelbare Zukunft vorauszusehen, aber über das was danach kommt, weiß man überhaupt nichts.

Worum handelt es sich ?

Wäsche waschen

Page 57: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Einleitung

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Nicht immer haben wir für begriffliche Konzepte eine sprachliche Repräsentation entwickelt. Beispielsweise kennen wir das Gegensatzpaar (Antonyme) hungrig und satt.

Eine sprachliche Repräsentation für den Gegensatz von durstig ist jedoch nicht in gleicher Weise vorhanden.

Der Vorschläge, hierfür schmöll, sitt, oder blubb zu sagen, haben sich bis heute nicht im Sprachgebrauch durchsetzen können.

Andere Benennungen entwickeln und verbreiten sich blitzschnell, ohne dass dafür eine klare Grundlage auszumachen ist (z.B. Handy statt Mobiltelefon).

Viele Benennungen erfahren eine Bedeutungsveränderung (z.B. geil) oder eine – häufig gruppenspezifische – Nebenbedeutung (Konnotation).

In der Regel kann man davon ausgehen, dass Wörter der Alltags- und Umgangssprache stärker derartigen Veränderungsprozessen unterliegen als Wörter von Fachsprachen.

Page 58: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Wortformen u. -

bestandteileFa

chh

och

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Substantive Tisch Baum- Kasus Tisches- Numerus Tische, Tischen Bäume, Bäumen- Pluraliatantum ElternAdjektive böse, aber: Das BöseVerben schieben, aber SchiebungKomposita Bibliothekskatalog Klammeraffe

LandkreiskrankenhausbibliotheksangestelltenjackenknopfMehrwortgruppen- Adjektiv-Substantiv-Verbindungen Öffentliche Bibliothek

lineare partielle Differentialgleichung- Phrasen- Wort-Bindestrich-Auslassung Dokumentations- und Ordnungslehre

Wortformen und -bestandteileArtikel der, die, dasPräpositionen in, aufKonjunktionen und, oderZahlwörter ein, eineetc.

Wortformen und -bestandteile

Page 59: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Wortformen u. -

bestandteileFa

chh

och

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Morphologie

Bestimmung der textlichen Grundelemente von Wörtern

● Wortstämme (oder Kerne)● Affixe, Präfixe, Infixe sowie die Suffixe

Affixe und Präfixe stehen vor den Kernen, Infixe zwischen mehreren Kernen, Suffixe am Ende des Wortes.Zu den Infixen zählt man Wortverbindungselemente - z.B. das Fugen-s - die zur Kompositumsbildung erforderlich sind.

Bibliothek(s)katalogBibliothekar(s)tag

Auch Flexionsendungen zählen hierzu wie auch zu den Suffixen. Alle diese Elemente werden zu den Morphemen gerechnet

Phonologie

Bestimmung und Systematisierung der Grundelemente der gesprochenen Sprache (Phoneme) sowie ihrer Funktion.

Dokumentationssprachlich nur interessant im Zusammenhang mit

● Homophonen Ähre - Ehre, Bären - Beeren, Säle - Seele, Lehre - Leere● Homographen Ténor bzw. Tenór

Wortformen und -bestandteile

Page 60: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Ambiguitäten

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

1. Synonymie

Beim Synonym liegen verschiedene verbale Repräsentationen für einen Begriff vor. In dokumentationssprachlichen Betrachtungen fordert man völlige Bedeutungsidentität der verschiedenen Verbalisierungen. Damit grenzt man sich von der Bedeutung des Synonyms in den sog. Synonymen-Wörterbüchern ab. Diese geben in der Regel zu einem Wort bedeutungs-verwandte Begriffsfelder an.

Vgl. die folgende Eintragung aus einem Synonymen-Wörterbuch:

Mehrdeutigkeiten (Ambiguitäten)

Page 61: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Ambiguitäten

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Dieses allgemeinere Verständnis von Synonymen wird dokumentations-sprachlich als Quasi-Synonym bezeichnet und impliziert, daß die entsprechenden Wörter in einem Kontext, einem durch den Text geschaffenen Zusammenhang, bedeutungsmäßig austauschbar sind. Fälle des strengen Synonym-Verständnisses werden gegeben durch:

● Abkürzungen und ihre Auflösung

OPAC - Online Public Access Catalog(ue)Public Access Online Catalog(ue)

● Schreibweise-Unterschiede

Fotografie – Photographie● Regional unterschiedlicher Sprachgebrauch

Fleischer - Metzger

Manchmal können auch durch die Wahl der verschiedenen Wortarten Synonyme entstehen; z.B. Berufliche Ausbildung und Berufsausbildung.

Schwächer wird die Bedeutungsidentität bereits in den Fällen

● Umgangssprache bzw. Fachsprache

Krebs - Karzinom, Bücherei- Bibliothek● Übersetzungen aus einer Fremdsprache

Öffentliche Bibliothek - Public library

Page 62: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Ambiguitäten

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Die kontextbezogene Austauschbarkeit von Quasi-Synonymen kann etwa konkret so aussehen, dass in einem Fachaufsatz über Online-Publikumskataloge ohne Einbußen für das Verständnis zwischen Online-Katalog und Online-Publikumskatalog gewechselt werden kann, obwohl zwischen beiden Begriffen durchaus inhaltliche Unterschiede festgestellt werden können.

In intellektuell bearbeiteten Dokumentationssprachen können Quasi-Synonyme nicht erhalten bleiben, dort soll jede sprachliche Repräsentation für die angestrebte Präzision im Retrievalvorgang hinsichtlich der gemeinten Bedeutung möglichst kontextfrei eindeutig verstehbar sein. Allgemeiner gesprochen ist es Grund-Aufgabe der Gestaltung einer Dokumentationssprache, die Quasi-Synonyme zu eliminieren und durch Synonym-Vereinbarungen oder Verwandte Begriffe zu ersetzen.

Verwandte Begriffe stehen in einer assoziativen Beziehung zueinander. Das Feld assoziativer Beziehungen kann sehr weitläufig sein, vgl. etwa:

Mehl - Bäcker - Backen - BrotSchiff - GletscherGummibärchen – Dampfbügeleisen

Page 63: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Ambiguitäten

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

2. Homonymie – Polysemie

Wörter, die mehrere Bedeutungen besitzen, also für mehrere Begriffe stehen

Schloss, Ball, Knie

In manchen Fällen ist den verschiedenen Bedeutungen anzusehen, welche Bedeutungskomponente bei der gleichen Namensgebung eine Rolle gespielt haben mag; solche Fälle werden als Polyseme bezeichnet.

Bei der intellektuellen Gestaltung einer Dokumentationssprache ergibt sich als Aufgabe die sog. Disambiguierung, d.h. in der Regel wird durch Anfügen eines geeigneten Zusatzes die jeweils gemeinte Bedeutung eindeutig klargestellt; z.B.

Schloss [Gebäude], Schloss [Schließvorrichtung]

Bei Personen werden gerne Lebensdaten oder (berufs-)fachliche Einordnungen vorgenommen.

Beide Elemente einer solchen Verbindung - das homonyme Wort und der erläuternde Zusatz - müssen als eine dokumentationssprachliche Einheit aufgefasst und verwendet werden und sollten auch in einem Retrieval-vorgang als eine bedeutungsmäßige Einheit zur Verfügung gestellt werden.

Page 64: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Begriffs-beziehungen

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Begriffsbeziehungen

Neben einem Verständnis für einzelne Begriffe ist ein Verständnis für Beziehungen zwischen Begriffen wichtig (statt Beziehung wird häufig auch das Wort Relation verwendet).

Das Ausweisen von Beziehungen in Dokumentationssprachen soll sowohl eine Hilfe für die Wahl der besten inhaltskennzeichnenden Ausdrücke im Indexierungsprozess sein als auch im Suchprozess eine Unterstützung für die Auswahl der bestpassenden Ausdrücke bieten.

Solche Beziehungen können z.B. sein:• Vogel - Singvogel - Meise - Blaumeise• Motor - Zylinder - Kolben• Mehl - Bäcker - Bäckerei - Backen - Brot

Bei der Beziehung

Vogel - Singvogel - Meise - Blaumeise

handelt es sich um eine sog. Abstraktionsbeziehung (auch generische oder logische Relation genannt). Die beteiligten Begriffe nennt man Oberbegriffe und Unterbegriffe. Ein Unterbegriff ist dabei definitionsgemäß ein Begriff, der alle Merkmale des Oberbegriffs sowie mindestens ein zusätzliches Merkmal besitzt.

Page 65: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Begriffs-beziehungen

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Bei der Beziehung

Motor - Zylinder - Kolben

handelt es sich um eine sog. Bestandsbeziehung (auch Ganzes-Teil-Beziehung genannt) mit Verbandsbegriffen und Teilbegriffen. Wichtigster Anwendungsfall derartiger Beziehungen sind materielle technische Objekte, z.B. Maschinen und ihre Teile.

Beide Beziehungen faßt man auch als hierarchische Beziehungen zusammen, da sich mit ihnen besonders gut Über- und Unterordnungen herstellen lassen.

Bei der Beziehung

Mehl - Bäcker - Bäckerei - Backen - Brot

handelt es sich um sog. assoziative Beziehungen, auch Verwandtschafts-beziehung genannt. Hierbei sind eine Vielzahl von Typen unterscheidbar. Besonders wichtige Beispiele sind:

● Rohstoff – Produkt ● Institution - Tätigkeit● Produzent – Produkt ● Institution - Ausübende der Tätigkeit● Tätigkeit – Produkt ● Genetische Beziehung

Page 66: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Themen-Beziehungen

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Beziehungen zwischen Themen

Betrachtet man den Inhalt von Dokumenten, so kommen darin meist nicht isolierte Begriffe vor, sondern Themen, d.h. komplexe Aussagen, die aus mehreren begrifflichen Komponenten bestehen, z.B.:

• Deutsche Literatur des 19. Jahrhunderts• Das Brutverhalten von Blaumeisen beim Füttern ihrer Jungen• Schüler werden durch Lehrer beurteilt• Lehrer werden von Schülern beurteilt

In der Wirklichkeit haben diese Themen ihre Widerspiegelung in Ereignissen, so daß wir in Analogie zum Begriffsdiagramm nun folgende Darstellung angeben können:

Ereignis

Thema

Phrase

Das Ereignis ist also wie das realweltliche oder abstrakte Objekt der Objektwelt zugehörig. Das Thema unterscheidet sich vom Begriff dadurch, daß es in der Regel aus mehreren begrifflichen Komponenten zusammengesetzt ist. Die Phrase ist die sprachliche Repräsentation des Themas, indem neben Benennungen für die Begriffe in der Regel auch Mittel der Syntax verwendet werden.

Page 67: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Semantik - Syntax

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Damit sind bereits 2 verschiedene Möglichkeiten angesprochen, wie sprachlich Bedeutungen repräsentiert werden: erstens durch Benennungen, zweitens durch zusätzliche syntaktische Elemente.

Die Beispiele

• Schüler werden durch Lehrer beurteilt• Lehrer werden von Schülern beurteilt

machen deutlich, daß die syntaktischen Mittel für das Verständnis einer Phrase bei Gleichheit der vorkommenden Begriffe eine wichtige Rolle spielen können.

Neben sinnlosen, d.h. noch nicht mit einem Sinn belegte Wörter (z.B. Boselstumpfel, Humreill), sind so auch sinnlose Sätze denkbar, die z.B. bedeutungstragende Wörter in einen syntaktisch unsinnigen Zusammenhang stellen. Man nehme als Beispiel etwa:

Grüne Gedanken rupfen Leichtmetallfelgen unbarmherzig vor Tagesanbruch mit Frequenzsalat

Page 68: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Semantik - Syntax

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Semantik und Syntax kommt so bei der sprachlichen Verständigung eine gemeinsame Funktion zu, indem durch beide Elemente Wort-, Satz- und Bedeutungsfelder aufgebaut werden. Gleichsam jeder in einem Thema verwendete Begriff steht in einem semantischen Umfeld, das innerhalb einer syntaktischen Phrase variiert werden kann. Man betrachte folgendes Beispiel:

VögelSingvögel füttern ihre JungvögelMeisen füttern ihre Jungmeisen mit InsektenBlaumeisen füttern ihre Jungen mit grünen RaupenSchweine säugen ihre FrischlingeSäugetiere säugen ihre JungtiereTiere ernähren ihren Nachwuchs

Die Bedeutungsvielfalt entlang der semantischen Achse wird auch paradigmatisch, die Benutzung einer konkreten syntaktischen Reihenfolge zum Ausdrücken eines konkreten Kontexts syntagmatisch genannt.

Page 69: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Semantik - Syntax

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Der Kontext - das Syntagma - kann dabei Einfluß auf den paradigmatischen Aspekt bekommen. So würde man im obigen Beispiel einen Zusammenhang zwischen den verschiedenen Nahrungsstoffen sehen (Insekten - Raupen - Muttermilch), den man nicht als zwingende begriffliche Beziehung im Sinne der zuvor diskutierten Beziehungsarten sehen würde (allenfalls eine spezielle Form einer assoziativen Beziehung könnte man heranziehen) und den man nicht in einer Dokumentationssprache zum Ausdruck bringen würde.

Aus gleichen semantischen Bausteinen können jedoch verschiedene Syntagmen erzeugt werden, z.B.:

• Lehrer beurteilen Schüler• Schüler beurteilen Lehrer

Für die Gestaltung einer Dokumentationssprache muss vor dem Hinter-grund des beabsichtigten Nutzens und der einzusetzenden Ressourcen geprüft werden, ob derartige Syntagmen in der Dokumentationssprache unterscheidbar repräsentiert werden sollen oder nicht.

Page 70: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Komposita

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Komposita und das Problem ihrer Zerlegung

Komposita stellen für Dokumentationssprachen ein besonderes Problem dar. Formal handelt es sich um Substantive, d.h. sie werden auch im Retrieval als ganze Wörter behandelt. Andererseits gehen sie häufig aus einer Komposition mehrerer begrifflicher Bestandteile hervor, die zwar zu einer neuen Begrifflichkeit verschmelzen, die aber auch als eine Art Boolescher und-Verbindung der Bestandteile gedacht werden können. Diese Bestandteile sind häufig dem Kompositum über seine Wortbestandteile noch anzusehen

Unternehmensorganisation, Informationswirtschaft, Wissensmanagement

Manchmal stellt ein Kompositum einen Individualnamen dar und repräsen-tiert keine begriffliche Verknüpfung

Schuhschnabel, Klammeraffe

In anderen Fällen repräsentieren auch einfache Nomen begriffliche Verschmelzungen

Schiff (= wassergebundenes Transportmittel)

für die in analogen Fällen Komposita verwendet werden

Eisenbahn (schienengebundenes Transportmittel)

Page 71: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Komposita Morphologie

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Morphologie der Komposita

Beispiel für eine morphologische Analyse

Ermüdungserscheinung

Morphologische Zerlegung (nicht zu verwechseln mit Silbentrennung)

Er|müd|ung|s|er|schein|ung

In einer solchen Zerlegung kommen Elemente vor, denen man einen semantischen Sinn, einen Inhalt, eine Bedeutung unterlegen kann, z.B.

müd für müde, Müdigkeit u.a.Schein für Anschein u.a.

Derartige Elemente kann man sich als Einträge ein einem bedeutungserläuternden Lexikon vorstellen. Um sie von den Morphemen zu unterscheiden, die nur eine Funktion für die Wortbildung und keine eigene semantische Bedeutung besitzen, werden sie Lexeme genannt.

Page 72: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Komposita Zerlegung

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Für eine intellektuelle Zerlegung eines Kompositums fordert man die Herstellung begrifflicher Einheiten in Form von 2 Zerlegungskomponenten mit jeweils eindeutiger Benennung, die in Kombination die ursprüngliche Bedeutung reproduzieren:

„Eisenbahn“ <Eisenbahn>≈

<Überlandverkehr>

<Schienenbahn> „Schienenbahn“

„Überlandverkehr“

„Eisenbahn“Nach: Wersig, G.: Thesaurus-Leitfaden. 2. Aufl. 1985, S.59.

=

„Eisenbahn“ = Begriff Eisenbahn<Eisenbahn> = Wort Eisenbahn

und

1. Zerlegungskomponente

2. Zerlegungskomponente

Die Bestimmung der Zerlegungskomponenten ist nicht eindeutig; ausschlaggebendes Kriterium ist, dass die 2. Komponente die semantische Differenz der ersten Komponente zum ursprünglichen Kompositum beinhalten muss.

Im Allgemeinen wird man sich für die Festlegung der Zerlegungs-komponenten an den morphologischen Bestandteilen des Kompositums orientieren, das Erreichen einer guten Lösung ist damit jedoch nicht garantiert, vgl. z.B.:

Topfblume oder MilchkuhBlumentopf Kuhmilch

In diesem Fall liefern beide Reihenfolgen ein sinnvolles Ergebnis, die rein morpho-logische Zerlegung ist also nicht eindeutig.

Page 73: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Komposita Zerlegung

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Ein weiteres intuitives Kriterium zur Bestimmung inhaltlicher Bedeutungsbestandteile ist die Vorstellung einer Komposition im Sinne einer gleichordnenden Verschränkung, d.h. jeder Bestandteil steuert einen Teil zur Semantik bei, der auch als selbständiges abgeschlossenes begriffliches Element vorkommt, z.B.:

Ledersofa DachrinneGummireifen Laichgewässer

Daneben kann die Komposition auch als begriffliche Merkmalsspezifizierung durch Bestandteile erfolgen, die für ihre konkrete Bedeutung einen zweiten Bedeutungsbestandteil benötigen, z.B.

Singvogel Feinzucker

Die letztgenannte Variante findet sich häufig bei Kompositionsbildungen mit Adjektiven für die sprachliche Repräsentation von Unterbegriffen.

Durch Kompositionsbildung wird häufig die Mehrdeutigkeit einzelner Kompositionskomponenten aufgehoben, z.B.

Frequenzsalat Türschloss Abflussknie

Die Spannbreite der Mehrdeutigkeiten erstreckt sich dabei über alle Formen der Homonyme, Polyseme und Konnotationen.

Page 74: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Komposita Zerlegung

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Ein weiteres Problem wird sichtbar, wenn die Sachgebiete der Kompositionsbestandteile nicht mit dem Sachgebiet des Kompositums identisch sind. Man vergleiche z.B.:

MangelerscheinungEisenmangel

Man sieht vielleicht keinen Anlass, über eine Zerlegung nachzudenken.Anders denkt man möglicherweise über das Kompositum:

Eisenmangelerscheinung

Es gibt 3 Kompositionsbestandteile auf morphologischer Ebene:

Eisen Mangel Erscheinung

Diese Bestandteile sind durch folgende Eigenschaften charakterisiert: Das Wort Mangel kann mit dem Begriff Heißmangel assoziiert werden, was im vorliegenden Kontext völlig abwegig wäre. Das Wort Erscheinung kann weglassen oder durch Symptom ersetzt werden.

Die Zerlegung kann auch durch Wiederholung von Komponenten erfolgen: Eisenmangel + Mangelerscheinung. Eine solche Zerlegung mit sich wiederholenden (begrifflichen) Bestandteilen wird als pleonastisch bezeichnet und manchmal als Gestaltungsmittel für präkombinierte Dokumentationssprachen abgelehnt. Der Vorteil einer solchen Vorgehensweise für ein postkoordinierendes Retrieval liegt auf der Hand.

Page 75: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Komposita aspekt-

orientierte Zerlegung

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Eine weitere Möglichkeiten für eine Zerlegung besteht in der Analyse der begrifflichen Komponenten anhand vorgebener Kategorien oder Aspekte, z.B.: Insektenhaut

Dieses Kompositum enthält die eindeutig bestimmbaren Aspekte Tier (für des Bestandteil Insekt) und physiologischer Prozeß des Tiers (für den Bestandteil Haut). Solche Kategorien können zu einer gut handbaren Zerlegung von Komposita führen, sofern sie vor der Entwicklung des Vokabulars einer Dokumentationssprache fixiert werden (am deutlichsten zu sehen in der Beispielwelt der Facettenklassifikation).

Die kategoriale Analyse kann einhergehen mit der Analyse, ob es sich um eine paradigmatische oder eine syntagmatische Verschmelzung handelt. Im Beispiel der beiden Komposita

• Schülerbeurteilung• Lehrerbeurteilung

kann man zunächst in jedem von beiden eine Handlung feststellen. Des weiteren erkennt man, daß jeweils eine ausführende Instanz bzw. eine Objekt-Instanz beteiligt ist, ohne dass dies aus der Komposition klar hervorgeht. Allein die statistisch häufigere Situation, dass die Beurteilung von Schülern durch Lehrer erfolgt, schließt ja die Möglichkeit nicht aus, daß die Beurteilung von Lehrern auch einmal durch Schüler erfolgt.

Erst der Einsatz der Präpositionen sorgt hier für eine eindeutige Aussage.

Page 76: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Einsatz von Präpositionen

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Der Einsatz von Präpositionen ist jedoch nicht immer ausreichend, die Satzbedeutung eindeutig zum Ausdruck zu bringen, man vgl. z.B. die folgenden Sätze:

• Flying planes can be dangerous• Ein fixer Ober zerbrach einem Mädchen mit einem Tablett einen

Pokal• Nach seiner Wahl zum Bundeskanzler wurde Helmut Schmidt

von der SPD vereidigt• Nach seiner Wahl zum Fußballer des Jahres wurde Mario Kicker

vom FC Tretmich die Auszeichnung überreichtaber• Nach seiner Wahl zum Fußballer des Jahres wurde Mario Kicker

vom Vorsitzenden des FC Tretmich die Auszeichnung überreichtIm ersten Satz ist nicht eindeutig, ob fliegende Flugzeuge gefährlich sind oder Das Fliegen von Flugzeugen (etwa für den Piloten) gefährlich ist.

Für den zweiten Satz kann man ebenfalls 2 mögliche Bedeutungen angeben: Mit einem Tablett zerbrach ein fixer Ober einem Mädchen einen Pokal oder Einem Mädchen mit einem Tablett wurde von einem fixen Ober ein Pokal zerbrochen.In nachfolgenden Sätzen ist durch die Verwendung der Präposition vom strukturell nicht klar, ob damit ein Attribut ausgedrückt werden soll (vom FC Tretmich) oder ob damit ein handelndes Agens eingeleitet wird (vom Vorsitzenden).

Page 77: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Sonstige Phänomene der Sprache

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Phänomene dieser Art werden in der Linguistik unter der Überschrift Satzsemantik diskutiert. Für die Gestaltung von Dokumentationssprachen muss in diesem Zusammenhang geprüft werden, ob die Dokumentations-sprache Hilfsmittel zur Disambiguierung derartiger Syntagmen bereit-stellen soll oder ob man darauf verzichten will.

Eine Bereitstellung erhöht den Aufwand in der Anwendung der Dokumentationssprache, kann andererseits in manchen Situationen jedoch zu einer Verfeinerung der Recherchemöglichkeiten beitragen.

Es ist schon erwähnt worden, daß Komposita nicht immer aus mehreren begrifflichen Komponenten aufgebaut sein müssen. In der Sprache entwickeln sich immer wieder Wörter aus einer gewissen Analogie oder einem zeitgebundenen Kontext, die nur im Sinne von Eigennamen verstanden werden können, obwohl sie rein sprachlich die Form von Komposita besitzen, z.B.:

● Stiefelknecht ● Klammeraffe ● Geldwaschanlage ● Falzbein ● Schuhschnabel ● Wirtschaft

Derartige Wörter lassen sich nicht einer sinnvollen begrifflichen Zerlegung unterwerfen und müssen als Eigennamen in das Vokabular einer Dokumentationssprache (bzw. auch in die Wörterbücher für Verfahren des Automatischen Indexierens) integriert werden.

Page 78: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Sonstige Phänomene der Sprache

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Eine besondere Wortform stellen noch die sog. Wort-Bindestrich-Verbindungen dar, z.B.:

• Buch- und Bibliothekswesen• Bibliotheks- und Informationswissenschaft• Markt- und Medienforschung• Kommunikationsbedingungen und -strukturen• Hals- Nasen- Ohren-Arzt

Diese Verbindungen repräsentieren zwei oder mehr Begriffe in einer verkürzten sprachlichen Form. Für Dokumentationssprachen kann hier sowohl die verkürzte Form (HNO-Arzt) als auch die Trennung in verschiedene Komponenten (Marktforschung, Medienforschung) relevant werden. Dies bleibt in der Regel einer Einzelfallprüfung vorbehalten, zumal manchmal eine sprachliche Transformation einzelner Komponenten erforderlich werden kann.

Page 79: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Vorhersag-barkeit

Wiedergabe-treue

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

Konsequenzen für die Gestaltung von Dokumentationssprachen Dokumentationssprachen haben eine mehrfache Aufgabe; sie

sollen • den Inhalt von Dokumenten repräsentieren • die Repräsentationen für Suchprozesse zur Verfügung stellen

ohne dabei die in der natürlichen Sprache unvermeidbaren Mehrdeutig-keiten zu beinhalten. Eindeutigkeit versucht man, durch Maßnahmen der sog. terminologischen Kontrolle für die oben dargestellten Probleme der Mehrdeutigkeiten zu erreichen. Das ideale Element einer Dokumentations-sprache ist semantisch abgeschlossen, d.h. nur aus sich heraus vollständig und ohne Mehrdeutigkeiten verstehbar.

Die genannten abstrakten Anforderungen an die Eigenschaften des Vokabulars lassen sich anhand verschiedener Kriterien präzisieren. Hierzu gehören zentral• die Wiedergabetreue in der Repräsentation des Begriffs oder

Sachverhaltes durch die Dokumentationssprache;

• die Vorhersagbarkeit, welche Ausdrücke der Dokumentationssprache einen gesuchten Begriff oder Sachverhalt repräsentieren.

Man betrachte die nachstehende Wortliste und wähle die Ausdrücke aus, die man für eine Frage nach dem Thema Organisation von Bibliotkeken für geeignet hält.

Page 80: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Komposita Organisation

Fach

hoch

sch

ule

Köln

Inst

itut

für

Info

rmati

onsw

isse

nsc

haft

W. Gödert

OrganisationsfilterOrganisationsformOrganisationsformenOrganisationsforschungOrganisationsfrageOrganisationsfragenOrganisationsfreiheitOrganisationsfunktionOrganisationsfunktionenOrganisationsgeflechtOrganisationsgeflechtesOrganisationsgefügeOrganisationsgeschehenOrganisationsgeschichteOrganisationsgeschichtenOrganisationsgeschichtlichenOrganisationsgeschichtlicherOrganisationsgesetzOrganisationsgesetzeOrganisationsgesetzenOrganisationsgesetzesOrganisationsgestaltungOrganisationsgläubigkeitOrganisationsgliederungOrganisationsgradOrganisationsgradeOrganisationsgrades

OrganisationsgradsOrganisationsgrenzeOrganisationsgrenzenOrganisationsgrößeOrganisationsgründungOrganisationsgründungenOrganisationshandbücherOrganisationshandelnOrganisationshemmendeOrganisationshemmendenOrganisationsheteronomieOrganisationshierarchieOrganisationshierarchienOrganisationshöheOrganisationsinterneOrganisationsinternenOrganisationsinternerOrganisationskapazitätOrganisationskapazitätenOrganisationskategorienOrganisationskatholizismusOrganisationsklimaOrganisationsklimakonzeptsOrganisationsklimasOrganisationskontextOrganisationskonzeptOrganisationskonzepte

OrganisationskonzeptenOrganisationskonzeptionOrganisationskriseOrganisationskulturOrganisationslebenOrganisationslehreOrganisationsleitungOrganisationslogischeOrganisationslosenOrganisationsloyalitätOrganisationsmachtOrganisationsmängelOrganisationsmangelOrganisationsmasseOrganisationsmerkmalOrganisationsmerkmaleOrganisationsmerkmalenOrganisationsmethodeOrganisationsmethodenOrganisationsmethodischenOrganisationsmitgliederOrganisationsmitgliedernOrganisationsmitgliedesOrganisationsmitgliedsOrganisationsmitgliedschaftOrganisationsmittelOrganisationsmobilität

OrganisationsmodellOrganisationsmodelleOrganisationsmodellenOrganisationsmodellsOrganisationsmonopolsOrganisationsmusterOrganisationsmusternOrganisationsnetzOrganisationsnetzwerkesOrganisationsniveauOrganisationsniveausOrganisationsnotwendigkeitOrganisationsobjektOrganisationsorientiertemOrganisationsorientiertenOrganisationsphänomensOrganisationspläneOrganisationsplanOrganisationspolitikOrganisationspolitischOrganisationspolitischeOrganisationspolitischenOrganisationspolitischerOrganisationspostulatenOrganisationspotentialeOrganisationspraktikernOrganisationspraxis

OrganisationsprinzipOrganisationsprinzipienOrganisationsprinzipsOrganisationsproblemOrganisationsproblematikOrganisationsproblemeOrganisationsproblemenOrganisationsprozessOrganisationsprozessenOrganisationsprozessesOrganisationspsychologieOrganisationspsychologischOrganisationspsychologischeOrganisationspsychologischenOrganisationsqualitätOrganisationsrechteOrganisationsrechtlichenOrganisationsrechtsOrganisationsreformOrganisationsreformenOrganisationsregelnOrganisationsregelungenOrganisationsrelevantemOrganisationsrelevantenOrganisationsschemaOrganisationsschemataOrganisationsschwierigkeiten

Page 81: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Thesaurus: Startseite

ThesaurusBeispiel: ERIC Thesaurus

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

Page 82: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Beispiel: ERIC Thesaurus in gedruckter Form

Beispiel für einen

Thesaurus-Eintrag aus

dem Alphabetischen

Teil

D - SNBF - UFBS -USEOB - BTUB - NTVB - RT

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

ERIC Thesaurus

Page 83: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

ERIC Thesaurus

Scope Note Definition

Relationen

Systematik

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

ERIC Thesaurus

Beispielseite

Beispieleintrag

Page 84: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

ERIC Thesaurus

Alphabetische Anordnung

KWIC = KeyWord in Context= Aufführen der Deskriptoren in ihrer natürlichen ReihenfolgeFach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

ERIC Thesaurus

Beispiel für das

“Rotated Descriptor display”

Page 85: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

ERIC Thesaurus

Beispiel für Einträge aus dem“Two-way hierarchical term

display”

Hierarchie aufwärts

Hierarchie

abwärts

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

ERIC Thesaurus

Page 86: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

ERIC Thesauru

s

Systematisches Umfeld des

Deskriptors

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

ERIC Thesaurus

Beispiel aus dem “Descriptor Group Display”

Page 87: Erschließungskonzept Beschreibungs- / Erfassungskonzept Indexierungskonzept Retrievalkonzept

Strukturierung von Thesauri: Zusammenfassung

Zur Strukturierung eines Thesaurus gehören verschiedene Teilaufgaben:

Fachgebietsorientierte Sammlung von Begriffen, die als inhaltskenn-zeichnende Beschreibungen von Dokumenten geeignet sind (Deskriptoren)

Angaben zu einem Deskriptor

• Definitionen, Erläuterungen• Verwendungshinweise• Angabe von Notationen einer Referenzsystematik• Relationen zu anderen Thesaurus-Begriffen• Daten der Erfassung, Änderung, Löschung

Konzeption der verschiedenen Teile eines Thesaurus

• Alphabetischer Teil• Systematischer Teil• Grafische Übersichten und Visualisierung• Diverse Register und Deskriptor-Übersichten (vgl. Beispiele)• Einleitung, Hinweise zur Benutzung für Indexierung und Recherche

Fach

hoch

sch

ule

Köln

Faku

ltät

für

Info

rmati

ons-

und K

om

munik

ati

onsw

isse

nsc

haft

en

W. Gödert

Strukturierung