erschließungskonzept beschreibungs- / erfassungskonzept indexierungskonzept retrievalkonzept
TRANSCRIPT
Erschließungskonzept
Beschreibungs- / ErfassungskonzeptIndexierungskonzept
Retrievalkonzept
Geordnetes Speichernder
Inhaltsrepräsentationen
DokumenteMedien, Objekte
Inhalts-analyseInhalts-
erschließung
Retrieval
Suchenund
Findenoder
nicht Finden
InformationssystemInformationssystem
KlassifikationssystemeSchlagwortsprachen
ThesauriAbstracts
Automatisches IndexierenAutomatisches Klassifizieren
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
IE
Erschließungskonzept
BeschreibungAuswahl
IndexierungsspracheIndexierung
Retrieval-konzept
• Analyse des Inhalts von Dokumenten
• Repräsentation des Ergebnisses der Analyse in einer Dokumentationssprache
• Herstellen von Voraussetzungen für ein effizientes Retrieval
Aufgaben der InhaltserschließungFa
chh
och
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Inhaltser-schließung
Das geht nicht ohne die Vorgabe eines Rasters von Kriterien, die
• bei der Analyse als Fragen gestellt werden
• im Erschließungskonzept als Kategorien zur Beschreibung der Dokumente genutzt werden
• im Retrievalkonzept zur Gestaltung der Suchumgebung führenZu berücksichtigen ist, dass die einzelnen Punkte
miteinander wechselwirken und dementsprechend aufeinander abgestimmt werden müssen. Hierzu sind Vorgaben hilfreich, die als Regeln formuliert werden können.
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
Bilddokumente Beispiel Bilddokumente
● Wie beschreibt man ein Bild formal ?
● Was ist der Inhalt des Bildes ?
● Wie repräsentiert man diesen Inhalt ?
● Wann ist ein anderes Bild dem Bild ähnlich ?
● Wie sorgt man dafür, dass man alles findet, was man als Inhalt des Bildes beschrieben hat ?
● Wie sorgt man dafür, dass man alle ähnlichen Bilder findet ?
Für die Erschließung zu lösende Probleme
Bilddokumente stellen ein wichtiges Beispiel für nicht-textuelle Dokumente dar und finden in allen Lebensbereichen (Alltag, Wissenschaft, Medien) große Aufmerksamkeit, die sich auch in wirtschaftlichen Interessen niederschlägt. Beispiele sind:
• Fotos in ihren medialen Varianten (Papier, digital, Negativ, Dia, ...)• Gemälde• Grafik, Druckgrafik• Zeichnungen• Pläne und Technische Zeichnungen
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
Bilddokumente Unterschiedliche Bilddokumente:
Foto
Ein Foto einer realweltlichen Situation
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
Bilddokumente Unterschiedliche Bilddokumente:
FotoEin Foto einerrealweltlichen
Situation
Formal: Dateiname, Dateiformat, Dateigröße, Farbtiefe, Aufnahmedatum, technische Daten der Aufnahme (Kameratyp, Blende, Zeit, ...),Urheber, Inhaber der Verwertungsrechte, Aufbewahrungsort, ...
Inhaltlich: Dargestellte Objekte (hier: Tierart: Bären (welche (?)), Zahl der Objekte (?)Verhalten (?)Ort (Land, See (?), Fluss (?), Ufer (?), Insel (?)),Zeit (Jahres-, Tages-), Perspektive, Vorder-, Hintergrund
Vermarktung:Erworben von ..., Verkauft an ..., Preis
Mögliche Beschreibungskategorien:
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
Bilddokumente
Unterschiedliche Bilddokumente:
Foto
Ein Foto einer realweltlichen Situation
Weitere Beschreibungskategorien:
• Stimmung ?• Eindruck ?
Inhalt:
• Dargestelltes ?• Enthaltenes ?• Wahrgenommenes ?• Interpretiertes ?• Assoziiertes ?
• Wesentliches ?• Nebensächliches ?
Wie und wodurch unter-scheidet man 1.000 Bilder mit Sonnenuntergängen ?
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
Bilddokumente:Shatford
Ein Beispiel für ein Raster zur inhaltlichen Bildanalyse
Lebrecht, H.: Methoden und Probleme der Bilderschließung am Beispiel des verteilten digitalen Bildarchivs Prometheus. Köln: Fakultät für Informations- und Kommunikationswissenschaften 2003. 90 S.
Zusammenfassung Inhaltsanalyse bezogen auf Textdokumente
Erkennen des Dokumenteninhaltes in seinen wesentlichen inhaltlichen Kategorien (Aspekten) = Aussagen über ...:
• Personenaspekt (Aussagen über Leben oder Werk von Personen)• Geographischer Bezug• Zeitliche Eingrenzung• Formaspekt• Sachaspekte
- Behandelte / dargestellte Objekte (Eigennamen)- Eingesetzte Methoden, Verfahren oder HilfsmittelFür letzteres ist die Bestimmung der fundamentalen
Wissensform für das einzelne Thema interessant (nicht mit Fachgebiet zu verwechseln, sondern zu verstehen als disziplinäre Sichtweise):
- Philosophie - Religion, Theologie- Naturwissenschaften, Medizin - Sozialwissenschaften, Politik- Geschichte - Kunst- Technik, Ingenieurwissenschaften- Persönliche Erfahrung
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Inhaltsanalyse
Zum Erschließungskonzept gehört die Vereinbarung von
Indexierungsregeln (Indexierungskonzept)
Erschließung von Dokumenten mit mehreren abgebildeten Gegenständen
Wirbeltiere- Säugetiere- Beutelsäuger- - Kängurus
Blumen- Stechwindengewächse- Liliengewächse- - Tulpen
-> Kängurus nicht Känguru, nicht Beutelsäuger
-> Tulpen nicht Tulpe, nicht Liliengewächse
Ein GegenstandNormiertes
und strukturiertes Vokabular
Erschließung von Dokumenten mit mehreren abgebildeten Gegenständen
-> Kängurus, Tulpen
Mehrere Gegenstände
Erschließung von Dokumenten mit mehreren abgebildeten Gegenständen
-> Kängurus, Tulpen, Sonne
Mehrere Gegenstände
Je nach Zweckbindung können weitere Aspekte berücksichtigt werden, vgl. die Shatford-Tabelle
Schwieriger Teil:
Auswahl eines Indexierungsprinzips:
•Gleichordnendes Indexieren•Syntaktisches Indexieren
Im Rahmen des Einsatzes von Thesauri für die Indexierung und des postkoordinierenden Booleschen Retrievals beschäftigen wir uns nur mit dem Gleichordnenden Indexieren.
Weitere Details zum Syntaktischen Indexieren bleiben dem Selbststudium überlassen. Das Buch enthält in den Abschnitten 2.9 und in Kapitel 7 weitere Hinweise.
Wichtige allgemeine Gestaltungs- und Bewertungskriterien sind die Konsistenz und die Homogenität – insbesondere im Indexierungsvorgang – zur Unterstützung einer optimalen Filterfunktion im Such- und Findevorgang.
Zusammenfassung
Das Erschließungskonzept umfasst die Summe aller Vereinbarungen, die zur Beschreibung des Inhalts von Dokumenten getroffen werden:
•Kategorien, Eingabefelder für zentrale und periphere Objekte, Inhalte, Aussagen•Vordergründe, Hintergründe, Kontext•Stimmungen, Konnotationen, Filter
Hinzu kommen Vereinbarungen über die Art der einzusetzenden Indexierungssprache:
•Freitext, Abstract•Auswahlliste•Normiertes Vokabular, Thesaurus
Das Indexierungskonzept umfasst alle Regeln, die die Zuteilung der inhaltskennzeichnenden Merkmalen betreffen.
Für den Fall, dass mehrere Sprachen vorkommen, kann – insbesondere bei Anwendung von Verfahren der Automatischen Indexierung – eine Verein-barung zur Behandlung unterschiedlicher Sprachen erforderlich sein.
Thesaurus: Startseite
Freies VokabularAuswahllisten
Thesaurus
Prinzipien der Erstellung und Anwendung
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
Hilfsmittel zur Indexierung
• Festlegung von Beschreibungs- und Erfassungskategorien, die für die Beschreibung des Dokumentinhals als wichtig erachtet werden und die für eine Suche als Suchkategorien genutzt werden können
• Eigene Kategorien immer dann, wenn für einen Suchvorgang eine Kombination der Suchfelder (Filterfunktion) unterstützt werden soll (Aspektorientierung), z.B.:
- Sache + Geo- Sache + Zeit- Sache + Zeit + Geo
• Trennung von:
- Vordergrund – Hintergrund- Hauptaspekt – Nebenaspekt
• Benutzung unterschiedlicher Normierungsgrade des Vokabulars
- Freier Text (z.B. Abstracts)- Auswahllisten, Wortlisten (bei begrenzter Optionenzahl)- Thesauri
Möglichkeiten zur Formulierung inhaltlicher Aussagen über Dokumente
Frei gewählte Wörter, Abstracts
Wortlisten
Thesauri, normiertes und strukturiertes Vokabular
Vorteile Bei Verwendung ganzer Sätze starke inhaltliche Ausdrucksfähigkeit mit Differenzierungsmöglichkeiten
Nachteile Homogenität für gleiche Sachverhalte schwer herstellbarKontexte werden durch Aufbereitung für das Suchvokabular zerstört
Vorteile Einfache Normierung und Vermeidung von Inkonsistenzen durch Copy und Paste
Nachteile Geringer Umfang, sonst UnübersichtlichkeitKeine Möglichkeiten, begriffliche Strukturen durch Relationen zwischen den Wörtern darzustellen
Vorteile Eindeutigkeit der inhaltlichen BedeutungVermeidung von MehrdeutigkeitenBei Verwendung als Normdatei gute VokabularkonsistenzVerwendung spezifischer Deskriptoren mit Möglichkeit zur hierarchischen Suche
Nachteile Aufwand zur Erstellung
Ein Beispielzur
fehlerhaften Gestaltungeines
Thesauruseintrags
Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot
Butterbrot Stulle
OB BackwarenKuchen
UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot
VB TortenPlätzchenBerliner Holzofenbrot
Fragen und Aufgaben
•Welche Fehler wurden in dem Eintrag gemacht?
•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.
•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?
Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot
Butterbrot Stulle
OB BackwarenKuchen
UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot
VB TortenPlätzchenBerliner Holzofenbrot
Fragen und Aufgaben
•Welche Fehler wurden in dem Eintrag gemacht?
•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.
•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?
Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot
Butterbrot Stulle
OB BackwarenKuchen
UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot
VB TortenPlätzchenBerliner Holzofenbrot
Fragen und Aufgaben
•Welche Fehler wurden in dem Eintrag gemacht?
•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.
•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?
Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot
Butterbrot Stulle
OB BackwarenKuchen
UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot
VB TortenPlätzchenBerliner Holzofenbrot
Fragen und Aufgaben
•Welche Fehler wurden in dem Eintrag gemacht?
•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.
•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?
Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot
Butterbrot Stulle
OB BackwarenKuchen
UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot
VB TortenPlätzchenBerliner Holzofenbrot
Fragen und Aufgaben
•Welche Fehler wurden in dem Eintrag gemacht?
•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.
•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?
Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot
Butterbrot Stulle
OB BackwarenKuchen
UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot
VB TortenPlätzchenBerliner Holzofenbrot
Fragen und Aufgaben
•Welche Fehler wurden in dem Eintrag gemacht?
•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.
•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?
Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot
Butterbrot Stulle
OB BackwarenKuchen
UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot
VB TortenPlätzchenBerliner Holzofenbrot
A-Z
Fragen und Aufgaben
•Welche Fehler wurden in dem Eintrag gemacht?
•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.
•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?
Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit (z.B. Wasser oder Milch) und anderen Zutaten (z.B. Salz, Gewürze, Aromastoffe, Kartoffeln, Hefe) hergestellt. Brot muss weniger als 10% Fett und/oder Zucker enthalten.BF Weizenbrot
Butterbrot Stulle
OB BackwarenKuchen
UB RoggenbroteBrötchenHolländisches WeißbrotKölner Baguette Bergische KrusteSauerteigbrot Vollkornbrot
VB TortenPlätzchenBerliner Holzofenbrot
A-Z
A-ZSyn.
Fragen und Aufgaben
•Welche Fehler wurden in dem Eintrag gemacht?
•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.
•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?
Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit und anderen Zutaten hergestellt. BF Butterbrot
Stulle OB BackwareUB Baguette
Bergische Kruste Holzofenbrot RoggenbrotSauerteigbrot VollkornbrotWeißbrot Weizenbrot
VB TorteGebäck
Eine stimmigere Variante
Fragen und Aufgaben
•Welche Fehler wurden in dem Eintrag gemacht?
•Erstellen Sie für die genannten Begriffe eine sinnvollere Thesaurus-Struktur und erläutern Sie die angewendeten Prinzipien zur Relationierung.
•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?
Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit und anderen Zutaten hergestellt. BF Butterbrot
Stulle OB BackwareUB (nach Rohstoff)
RoggenbrotVollkornbrotWeizenbrot
UB (nach Backart)BaguetteBergische Kruste Sauerteigbrot Holzofenbrot Weißbrot
VB TorteGebäck
Fragen und Aufgaben
•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?
Brot D Brot gehört zu den Backwaren und wird aus Getreide, meist durch Zugabe von Flüssigkeit und anderen Zutaten hergestellt. BF Butterbrot
Stulle OB BackwareUB (nach Rohstoff)
RoggenbrotVollkornbrotWeizenbrot
UB (nach Backart)BaguetteBergische Kruste Sauerteigbrot Holzofenbrot Weißbrot
VB TorteGebäck
Fragen und Aufgaben
•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?
Prinzip Thesaurus
Unter einem Thesaurus versteht man eine
Begrenzte Sammlung von Begriffen für ein (in der Regel begrenztes) Fachgebiet, die zur inhaltlichen Beschreibung von Dokumenten Verwendung finden sollen. Die Begriffe werden durch Deskriptoren (terminologisch kontrollierte Benennungen) repräsentiert. Zum Zwecke der Orientierung werden die Beziehungen zwischen den Begriffen durch eine eigene Nomenklatur ausgewiesen. Die Erstellung eines Thesaurus beinhaltet als zentrale Aufgabe, die für die inhaltliche Beschreibung der Dokumente eines Gebietes wichtigen Begriffe
• zu sammeln• sprachlich eindeutig zu repräsentieren• einer terminologischen Kontrolle zu unterwerfen• zu relationieren, d.h. (semantische oder a priori) Beziehungen zwischen den Begriffen auszuweisen• Thesaurus spezifische Definitionen anzugebenDIN 1463 Erstellung und Weiterentwicklung von Thesauri: Teil 1: Einsprachige Thesauri; Teil 2:
Mehrsprachige Thesauri. Berlin: 1987-1993.Wersig, G.: Thesaurus Leitfaden. 2. Aufl. München: Saur 1985Aitchison, J., A. Gilchrist u. D. Bawden: Thesaurus construction and use: a practical manual. 4th ed. London: Aslib 2000.
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
Thesauri
Bei der so gebildeten - möglichst für das Gebiet vollständigen - Sammlung von Begriffen mitsamt ihren Beziehungen handelt es sich um ein Kunst-produkt, das sich für die Darstellungen von Begriffsbedeutungen zwar der natürlichen Sprache bedient, in dem die Bedeutung einzelner Wörter jedoch von einer umgangssprachlichen Bedeutung abweichen können. Die Bedeutung der Deskriptoren ist Thesaurus-spezifisch und kann dement-sprechend von Thesaurus zu Thesaurus unterschiedlich sein. Sie erschließt sich nur innerhalb eines Thesaurus aus den verwendeten Hilfsmitteln.Angaben zu einem Deskriptor
• Definitionen, Erläuterungen• Verwendungshinweise• Angabe von Notationen einer Referenzsystematik• Relationen zu anderen Thesaurus-Begriffen• Daten der Erfassung, Änderung, Löschung
Im Unterschied zu sprachlich oder rein terminologisch orientierten Thesauri (z.B. Synonym-Wörterbüchern), die Wortfeldsammlungen anstreben und genutzt werden können, um einen Sachverhalt stilistisch durch verschiedene sprachliche Wendungen auszudrücken, dient ein dokumentationsprachlicher Thesaurus der Reduzierung der Sprachvielfalt. Er soll - auch um den Preis der Bedeutungsveränderung einzelner Wörter - eine Verengung des Wortschatzes sein (Terminologische Kontrolle).
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
Thesauri
Idealtypische Eigenschaften der Deskriptoren
Semantische Abgeschlossenheit, d.h. die Bedeutung des Deskriptors muss ausschließlich aus seiner sprachlichen Gestalt erschlossen werden können, ohne dass bei seiner Verwendung Teile einer Bedeutung aus anderen Deskriptoren übertragen werden müssen.
Für den semantischen Gehalt nimmt man in der Regel eine Orientierung an der Fachsprache des entsprechenden Gebietes vor.Aufgaben der terminologischen Kontrolle:
• Beseitigen von synonymen Wortformen durch Bestimmung von Deskriptoren und Nicht-Deskriptoren
• Eliminierung von Quasi-Synonymen durch Behandlung als:- Synonym oder- Verwandter Begriff
• Bereinigen von Homonymen oder Polysemen (z.B. durch Zusätze, wenn die Fachgebietseingrenzung allein nicht ausreicht)
• Aufstellen von Regeln für das Umgehen mit.- Adjektiv-Substantiv-Verbindungen- Komposita- Phrasen etc.
• Herstellung von Relationen zu den anderen Begriffen
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
Thesauri
Deskriptoren im Thesaurus-Format
MeisenD Familie der Singvögel in offenen Land-
schaften und Wäldern der Nordhalbkugel und Afrikas; meist in Höhlen brütende Standvögel oder Teilzieher. Sie ernähren sich v.a. von Insekten, zeitweise auch nur von Pflanzen
BF MeisenvögelParidae
OB SingvögelUB Blaumeise
HaubenmeiseKohlmeiseSchwanzmeiseSumpfmeiseTannenmeiseWeidenmeise
VB FinkenKleiber
BlaumeiseD Etwa 11 cm lang, besonders hellblau
und gelbBF Parus caeruleusOB Meisen
FinkenD Bis starengroße Singvögel in Amerika,
Eurasien und Afrika; vorwiegend Körner-fresser mit Kegelschnabel
BF FinkenvögelFringillidae
OB SingvögelUB Buchfink
GrünfinkVB Meisen
ParidaeBS Meisen
D DefinitionBF Benutzt fürBS Benutze SynonymOB OberbegriffUB UnterbegriffVB Verwandter Begriff
KleiberD Den Meisen verwandte Familie der Sing-
vögel, die an Baumstämmen (auch kopf-abwärts) klettern und einen kräftigen, zum Hämmern geeigneten Schnabel haben.
BF SittidaeOB SingvögelVB Meisen
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
Thesaurus-Format
Die Angabe von Relationen ist eine wichtige eigene Aufgabe, die thesaurus-spezifisch ist und verschiedenen Zwecken dient.
Sinn der Relationierung:
• Hilfsmittel zur Festlegung des begrifflichen Verständnisses des Deskriptors
• Hilfsmittel zur Orientierung innerhalb der Begriffsstruktur für- Indexierer- Recherchierenden
• Grundlage für die Gestaltung spezifischer Suchmöglichkeiten(Suche im semantischen Umfeld, Search Down, Expand,
Explode)
Welche Relationen es geben soll, welche Bedeutung sie haben und welche Rolle sie spielen sollen, bzw. in welchem Umfang sie Verwendung finden, ist eine der zentralen Festlegungen bei der
Erstellung eines Thesaurus, die vorab geklärt werden müssen. Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
Thesauri
Ein Beispielzur
fehlerhaften Gestaltungeiner
Systematischen Struktur
Wirbeltiere Säugetiere
Säugetiere Afrikas Bären
Grizzly-Bären Grizzly-Bären in Alaska Bildband amerikanischer Bären
Vögel Singvögel
Bildband europäischer Singvögel Meisen
Blaumeisen Brutverhalten von
Blaumeisen Wirbellose Tiere
Insekten Insekten Europas
Handbuch amerikanischer InsektenSchmetterlinge
Bildband europäischer Schmetterlinge
Fragen und Aufgaben
•Welche Fehler enthält die abgebildete „systematische Struktur“ ?
•Geben Sie Möglichkeiten zur Verbesserung der vorstehenden Struktur an.
•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?
Wirbeltiere Säugetiere
Säugetiere Afrikas Bären
Grizzly-Bären Grizzly-Bären in Alaska Bildband amerikanischer Bären
Vögel Singvögel
Bildband europäischer Singvögel Meisen
Blaumeisen Brutverhalten von
Blaumeisen Wirbellose Tiere
Insekten Insekten Europas
Handbuch amerikanischer InsektenSchmetterlinge
Bildband europäischer Schmetterlinge
Fragen und Aufgaben
•Welche Fehler enthält die abgebildete „systematische Struktur“ ?
•Geben Sie Möglichkeiten zur Verbesserung der vorstehenden Struktur an.
•Welche Rolle spielt dabei die Aspektorientierung (Geografika, Sache)?
Wirbeltiere Säugetiere
Bären Grizzly-Bären
Vögel Singvögel
Meisen Blaumeisen
Brutverhalten von Blaumeisen Wirbellose Tiere
Insekten Schmetterlinge
Hierarchie der Sachbegriffe
BildbandHandbuch
Afrika Amerika
AlaskaEuropa
Hierarchie der Geografika
Hierarchie der Formbegriffe
Eine erste Behandlung
Eine zweiter Blick . . .
Bären Alaska Bildband
für einen Bildband mit Bären in Alaska
Zur Erinnerung: Ein komplexes Thema mit mehreren Aspekten wird durch eine kombinierte Zuteilung mehrerer Deskriptoren repräsentiert:
Wirbeltiere Säugetiere
Bären Grizzly-Bären
Vögel Singvögel
Meisen
Blaumeisen
Brutverhalten von Blaumeisen Wirbellose Tiere
Insekten Schmetterlinge
Hierarchie der Sachbegriffe
BildbandHandbuch
Afrika Amerika
AlaskaEuropa
Hierarchie der Geografika
Hierarchie der Formbegriffe
. . . ein zweiter Blick
Wirbeltiere Säugetiere
Bären Grizzly-Bären
Vögel Singvögel
Meisen Blaumeisen
Wirbellose Tiere Insekten
Schmetterlinge
Taxonomische Begriffe
BildbandHandbuch
Afrika Amerika
AlaskaEuropa
Hierarchie der Geografika
Hierarchie der Formbegriffe
Hierarchie der Verhaltensaspekte
Brutverhalten
Blaumeisen
Brutverhalten
Europa
Bildband
Repräsentation des Dokumentinhalts:Bildband zum Brutverhalten europäischer Blaumeisen
Grenzen der Merkmalsbestimmung
Grenzen der Merkmalsbestimmung
Nicht alle Vorgehensweisen der Merkmalsbestimmung im wissenschaftlichen Kontext eignen sich für eine Übertragung auf allgemeine, nutzen- oder interessenorientierte (Alltags-) Sachverhalte. Insbesondere die gemeinsame Berücksichtigung in einem Ordnungskontext bereitet Schwierigkeiten.Beispiel
Baum
Obstbaum
Laubbaum
Kirschbaum
Apfelbaum
Taxonomischer Oberbegriff
Taxonomischer Oberbegriff
Zurück zum Erschließungs- und Indexierungskonzept
Ein für alle Daten und Anwendungen gleichartiges Erschließungs- und Indexierungskonzept kann es nicht geben.
Unterschiedliche Daten und insbesondere verschiedene Zweckbindungen erfordern unterschiedliche Beschreibungskategorien, den Einsatz unterschiedlichen strukturierten und normierten Vokabulars sowie den Einsatz unterschiedlicher Indexierungskonzepte.
Wichtige allgemeine Gestaltungs- und Bewertungskriterien sind die Konsistenz und die Homogenität – insbesondere im Indexierungsvorgang – zur Unterstützung einer optimalen Filterfunktion im Such- und Findevorgang.
Unterschiedliche Konzepte können zu Lösungen mitunterschiedlichen Filterfunktionen führen, diejeweils eigene Alleinstellungsmerkmale besitzen.
Beispiel Musicbox . . .
SpracheSpracheundund
BedeutungBedeutung
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Sprache und Bedeutung
Konsequenzen für die Gestaltung
von Dokumentationssprachen
Krach
Streit
Lärm
Einleitung
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Einleitung
Dokumentationssprachen haben die Aufgabe, den Inhalt von Dokumenten eindeutig zu repräsentieren und in einer sinnvollen Ordnung für das Auffinden bereitzustellen.
Die angestrebte Eindeutigkeit erzwingt Maßnahmen, die Vielfalt der Erscheinungsformen der Sprache zu reduzieren. Damit sollte jedoch möglichst keine Einbuße in der Ausdrucksmöglichkeit einhergehen.
In Klassifikationssystemen mit ihrer Repräsentation von Bedeutungen durch Notationen besteht keine Gefahr, einem dokumentationssprachlichen Ausdruck eine Alltagsbedeutung zu unterlegen. In verbalen Dokumentationssprachen muss man jedoch immer damit rechnen, dass die Bedeutung der dokumentationssprachlichen Repräsentation mit einer vertrauten Verwendung verglichen wird, obwohl innerhalb der Dokumentationssprache möglicherweise eine veränderte Bedeutungsgebung vorgenommen wurde.
Es muss also dem Verhältnis von Sprache zu Bedeutung und den Möglichkeiten von Bedeutungsgebung in Dokumentationssprachen nachgegangen werden.
Sprache Bedeutung
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Verhältnis von Sprache und Bedeutung
In der menschlichen Kommunikation ist Sprache der Träger und Vermittler von Bedeutung.
Sprache ist jedoch nicht in dem Sinne mit Bedeutung identisch, daß jeder sprachliche Ausdruck eine und nur eine Bedeutung hätte. Bedeutungsgebung ist ein individueller kognitiver Vorgang, der von Personen ausgeführt wird und an Situationen gebunden ist. Ein und derselbe Reiz, eine Sinneswahrnehmung, kann so zu unterschiedlichen Zeiten, unter verschiedenen Begleitumständen unterschiedliche kognitive Bedeutungsgebungen auslösen. Im Laufe der Entwicklung einzelner Personen und sozio-kultureller Gemeinschaften erwirbt man durch die Auseinandersetzung mit seiner Umgebung Kompetenz für den Umgang mit Konzepten und lernt es, sich mit anderen über diese Konzepte zu verständigen. Dabei kommt Sprache durchaus eine normierende Funktion zu, damit man sich überhaupt über bestimmte Konzepte verständigen kann. Trotzdem macht früher oder später jeder die Erfahrung, daß ein Konzept und erst recht ein komplexer Sachverhalt in der Regel durch eine größere Zahl sprachlicher Varianten repräsentiert werden kann.
Sprach-varianten
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Beispiel
Ein Sachverhalt wie Bibliotheksautomatisierung kann sprachlich auch durch
● Automation in Bibliotheken● Automatisierung in Bibliotheken● Automatisierung von Bibliotheken● Einsatz der Datenverarbeitung für bibliothekarische Arbeitsabläufe● Einsatz der elektronischen Datenverarbeitung in Bibliotheken● Einsatz von Personalcomputern in Bibliotheken● Mikrocomputer-Anwendung in Bibliotheken
zum Ausdruck gebracht werden.
Daneben ist noch zu klären, ob mit Bibliotheken ausschließlich das Gesamtphänomen Bibliothek gemeint ist, oder ob auch die Automatisierung in einzelnen Bibliothekstypen (Öffentliche Bibliotheken, Spezialbibliotheken, etc.) bzw. spezifischer Tätigkeiten (Ausleihe, Erwerbung, etc.) gemeint ist.
Sprach-varianten
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Dies würde zu Aussagen wie
Einsatz der elektronischen Datenverarbeitung für die Automatisierung der Ausleihverbuchung in Öffentlichen Bibliotheken
oder
Einsatz der Datenverarbeitung zur Automatisierung von Erwerbungsabläufen in Spezialbibliotheken
führen.
Man sieht, dass um ein Thema herum ein Umfeld kontextbezogener Sachverhalte existiert, die je nach individueller oder situationsbedingter Interpretation dem Thema gleichgesetzt werden oder nicht.
Es läßt sich leicht vorstellen, welche weiteren Varianten des genannten Beispiels denkbar sind.
Solche Phänome bedürfen zum Zwecke der Einheitlichkeit und Eindeutigkeit beim Wiederauffinden einer klaren Regelung innerhalb einer Dokumentationssprache.
Begriffstheorie
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Begriffstheorie
Unter einer Begriffstheorie versteht man das Bemühen, einen theoretischen Rahmen für die Frage zu finden, was Begriffe sind und welche Eigenschaften sie haben. Man muss sich von vornherein darüber klar sein, daß dies eine schwierige Aufgabenstellung sein muss, da man über ein der Sprache zugrunde liegendes Phänomen in Sprache reden will. Aus der Logik weiß man, daß dies prinzipiell die Gefahr von Widersprüchen in sich trägt, die allenfalls durch Verwendung einer Metasprache vermieden werden können. Da jedoch keine der natürlichen Sprache vergleichbare allgemein verbindliche Verständigungsmöglichkeit gleicher Aussagekraft vorhanden ist,
muss man diesen Weg gehen.
Begriffe
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Das heute für den Kontext von Dokumentationssprachen üblicherweise benutzte begriffstheoretische Modell geht von folgenden Annahmen aus:
Kognitive Vorstellungen von realweltlichen oder abstrakten Objekten lassen sich in Form von Begriffen fixieren, die zum Zwecke der Kommunikation mit anderen Menschen in Zeichensystemen als Bezeichnungen oder Benennungen (Bezeichnungen in Sprache) formuliert werden können. Man kann also ein Beziehung der folgenden Art sehen:
Objekt
Begriff
Benennung
Vorstellung oder Konzeptualisierungdes Objekts
Katze Mikesch Cat Maunzi
Begriffsdreieck
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Katze
Begriffsdreieck
Objekt
Begriff
Bezeichnung,Zeichen
Mikesch
Catrealoder
abstrakt
Dies wird häufig auch als sog. Begriffsdreieck formuliert. Damit soll zum Ausdruck gebracht werden, dass es sich um eine dreiwertige Abhängigkeit handelt, in der alle 3 Ecken aufeinander bezogen sind und aus der man keines der 3 Elemente entfernen kann.
Maunzi
Definitionen
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Die Begriffe werden dabei gewonnen, indem man Aussagen über die realweltlichen oder abstrakten Objekte macht. Dies geschieht z.B. dadurch, daß man an ihnen Eigenschaften oder Merkmale feststellt z.B.:• Ein Tisch hat eine Platte und in der Regel Beine; das Material,
aus dem er hergestellt wird, ist Holz, Glas, Stein, Kunststoff; sein Verwendungszweck ist vielfältig, in der Regel stellt man zeitweise Gegenstände darauf, sitzt davor, daran oder darum herum.
• Eine Blume ist eine Pflanze; sie hat meist einen Stiel, Blätter und Blüten; der Stiel dient der Wasser- und Nährstoffaufnahme, die Blätter der Photosynthese, die Blüte der Fortpflanzung.
Aus derartigen Beschreibungen versucht man Begriffsdefinitionen abzuleiten, die den als wesentliche betrachteten Gehalt eines Begriffes charakterisieren und festhalten sollen. Dabei werden sog. intensionale Definitionen von den extensionalen Definitionen unterschieden.
Intensional heißt eine Definition, wenn für einen Begriff die Summe seiner charakterisierenden Merkmale angegeben wird (vgl. genannte Beispiele).
Definitionen
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Extensional heißt die Definition eines Begriffs, wenn alle Objekte angegeben werden, die durch den Begriff beschrieben werden.
Ein Beispiel wäre
Planeten unseres Sonnensystems = {Merkur, Venus, Erde, Mars, Jupiter, Saturn, Neptun, Uranus, Pluto}
Nicht alle Begriffe sind intensional oder extensional beschreibbar. Begriffsdefinitionen kommt insbesondere eine Rolle für die Bedeutungsgebung von Fachtermini zu, für die es kein alltags weltliches Verständnis gibt, z.B.:
• Turmdrehkran• hypoelliptischer Differentialoperator
Man kann überdies an vielen Beispielen sehen, dass insbesondere intensionale Definitionen nur eine Annäherung darstellen, die durch individuelle kognitive Fähigkeiten erweitert wird, damit sich das individuelle Begriffsverständnis entwickelt.
Eco
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Eine schöne literarische Beschreibung dieser Vorstellung von sprachlichen Zeichen und ihren Referenzsystemen in der Wirklichkeit sowie in der kognitiven Bedeutungsgebung findet man in nachstehendem Text von Umberto Eco (aus: Der Name der Rose):
"Mich beschäftigte immer noch die Geschichte mit dem Rappen Brunellus, und so fragte ich William, kaum daß wir allein waren: »Als Ihr die Spuren im Schnee und an den Zweigen laset, kanntet Ihr doch Brunellus noch nicht. In gewisser Weise sprachen doch diese Spuren nur ganz allgemein von Pferden, oder jedenfalls von einem Pferd dieser Art und Rasse. Könnte man daher nicht sagen, daß uns das Buch der Natur lediglich abstrakte Wesenheiten verkündet, wie zahlreich ehrwürdige Theologe lehren?«
»Keineswegs, lieber Adson«, erwiderte mir der Meister. »Gewiß gaben mir jene Spuren für sich genommen nur das Pferd als verbum mentis in den Sinn, und als solches hätten sie es mir überall in den Sinn gegeben. Doch an diesem Ort und zu dieser Stunde des Tages lehrten sie mich, daß zumindest eines von allen denkbaren Pferden dort vorbeigekommen sein mußte. Also befand ich mich bereits auf halbem Wege zwischen der Vorstellung des Begriffes >Pferd< und der Erkenntnis eines einzelnen Pferdes. Und in jedem Fall war mir das, was ich vom Pferd im allgemeinen wußte, durch eine besondere Spur ins Bewußtsein gerufen worden.
Eco
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Ich war also in diesem Augenblick sozusagen gefangen zwischen der Besonderheit jener Spur und meiner Unkenntnis, die gerade erst angefangen hatte, die noch recht blasse Gestalt einer allgemeinen Vorstellung anzunehmen. Wenn du etwas von weitem siehst und nicht weißt, was es ist, wirst du dich damit begnügen, es als einen Körper von ungewisser Ausdehnung zu definieren. Bist du näher herangekommen, so wirst du es vielleicht als ein Tier definieren, wenn du auch noch nicht weißt, ob es ein Pferd oder ein Esel ist. Hast du dich ihm noch mehr genähert, so wirst du sagen können, daß es ein Pferd ist, wenn du auch noch nicht weißt, ob es Brunellus oder Flavellus ist. Erst wenn du nahe genug herangekommen bist, wirst du erkennen, daß es Brunellus ist (beziehungsweise dies bestimmte und kein anderes Pferd, wie immer du es nennen willst). Und das ist dann schließlich die volle Erkenntnis, die Wahrnehmung des Einmaligen. So war ich vor einer Stunde noch darauf gefaßt, jedem denkbaren Pferd zu begegnen, aber nicht etwa aufgrund der Weiträumigkeit meines Geistes, sondern aufgrund der Beschränktheit meiner Wahrnehmung. Und der Wissensdurst meines Geistes wurde erst in dem Augenblick gestillt, als ich das einzelne Pferd erblickte, das die Mönche am Zügel führten. Da erst wußte ich wirklich, daß meine vorausgegangenen Überlegungen mich der Wahrheit nahegebracht hatten. Die Ideen, mit deren Hilfe ich mir bis zu diesem Moment ein Pferd vorgestellt hatte, das ich noch niemals zuvor gesehen, waren mithin reine Zeichen, wie die Spuren im Schnee nur Zeichen der allgemeinen Idee des Pferdes waren - und Zeichen oder Zeichen von Zeichen benutzen wir nur, solange wir keinen Zugang zu den Dingen selbst haben.«
Abstraktion
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Menschen besitzen dabei üblicherweise erstaunliche Fähigkeiten zur Abstraktion, dem wohl wichtigsten Mittel zur kognitiven Begriffsbildung. So erscheint zunächst eine Charakterisierung wie rundes Viereck widersprüchlich zu sein.
Betrachtet man jedoch nachstehende Figur, bekommt diese Charakterisierung einen Inhalt, vielleicht einen Sinn:
Die ebenso widersprüchliche Bezeichnung rundes Dreieck begegnet uns im Alltag sehr häufig in Form von Verkehrsschildern:
Interessant ist auch das Metonymie genannte Phänomen: ein Teil oder eine Eigenschaft wird mit dem Ganzen gleich gesetzt; Erläuterung und Verständnis ergeben sich häufig erst durch Angabe des Kontextes, z.B.:
Das Schnitzel geht, ohne zu bezahlen.
Gemeint ist eine Gasthaus-Situation: Der Gast, der das Schnitzel bestellt und verzehrt hat, verlässt das Lokal, ohne zu bezahlen.
Einleitung
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Interessanterweise ist der Schlüsselreiz für das Verständnis eines Konzeptes, der von den reinen Benennungen ausgeht, manchmal größer als der einer Definition.
Vgl. als Beispiele etwa die folgenden Definitionen:
• Gerät zur Messung von Winkelabständen zwischen Gestirnen und
von Gestirnshöhen (Winkelabstände der Gestirne vom Horizont)
• Schwankungen von Wirtschaftsdaten innerhalb eines Zyklus (Zeitraum, der einen konjunkturellen Auf- u. Abschwung
umfaßt)
• Langfristige, festverzinsliche Schuldverschreibung der Bodenkredit- anstalten; durch Hypotheken gesichert u. börsengängig; kündbar nur durch die Hypothekenbank
• Flugkörper, der im Gegensatz zum Flugzeug keine Atmosphäre benötigt und alle zum Antrieb notwendigen Mittel mit sich
führt. Besteht aus Zelle und Triebwerk. In der Zelle befinden sich die Treibstoffvorräte, die Steuerungsgeräte, die Nutzlast und ggf. die Besatzung. Das Triebwerk erzeugt durch Rückstoß den Vortrieb oder Schub
Diese Erläuterungen versteht man teilweise erst, wenn man die Benennung kennt, die den zu definierenden Begriff bezeichnet: ...
Sextant
Konjunktur
Pfandbrief
Rakete
Einleitung
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Auch noch längere Erklärungen müssen dem Verständnis nicht immer förderlich sein, obwohl man jeden Satz der Erklärung durchaus meint verstanden zu haben; man vergleiche beispielsweise den nachstehenden Text:
Das Vorgehen ist wirklich ziemlich einfach. Zuerst sortieren Sie die Sachen je nach Aussehen in verschiedene Gruppen. Natürlich kann ein Stapel ausreichend sein, je nachdem, wieviel es zu tun gibt. Wenn Sie aus Mangel an Möglich-keiten irgendwo anders hingehen müssen, dann ist dies der nächste Schritt; ansonsten sind Sie ziemlich gut ausgerüstet. Es ist wichtig, irgendein bestimm-tes Vorhaben nicht zu übertreiben. Das heißt, es ist besser, zu wenige Dinge auf einmal zu tun als zu viele. Fürs nächste mag das nicht wichtig erscheinen, aber aus der Erledigung von zu vielen Aufgaben gleichzeitig können leicht Komplikationen entstehen. Ein Fehler kann außerdem teuer kommen. Die Handhabung der angemessenen Technik sollte ohne weitere Erläuterungen verständlich sein, und wir brauchen hier nicht näher darauf einzugehen. Am Anfang wird wohl das gesamte Vorgehen verwickelt erscheinen. Bald aber wird es einfach zu einem weiteren Aspekt des Alltags. Es ist schwierig, das Ende der Notwendigkeit dieser Aufgabe für die unmittelbare Zukunft vorauszusehen, aber über das was danach kommt, weiß man überhaupt nichts.
Worum handelt es sich ?
Wäsche waschen
Einleitung
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Nicht immer haben wir für begriffliche Konzepte eine sprachliche Repräsentation entwickelt. Beispielsweise kennen wir das Gegensatzpaar (Antonyme) hungrig und satt.
Eine sprachliche Repräsentation für den Gegensatz von durstig ist jedoch nicht in gleicher Weise vorhanden.
Der Vorschläge, hierfür schmöll, sitt, oder blubb zu sagen, haben sich bis heute nicht im Sprachgebrauch durchsetzen können.
Andere Benennungen entwickeln und verbreiten sich blitzschnell, ohne dass dafür eine klare Grundlage auszumachen ist (z.B. Handy statt Mobiltelefon).
Viele Benennungen erfahren eine Bedeutungsveränderung (z.B. geil) oder eine – häufig gruppenspezifische – Nebenbedeutung (Konnotation).
In der Regel kann man davon ausgehen, dass Wörter der Alltags- und Umgangssprache stärker derartigen Veränderungsprozessen unterliegen als Wörter von Fachsprachen.
Wortformen u. -
bestandteileFa
chh
och
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Substantive Tisch Baum- Kasus Tisches- Numerus Tische, Tischen Bäume, Bäumen- Pluraliatantum ElternAdjektive böse, aber: Das BöseVerben schieben, aber SchiebungKomposita Bibliothekskatalog Klammeraffe
LandkreiskrankenhausbibliotheksangestelltenjackenknopfMehrwortgruppen- Adjektiv-Substantiv-Verbindungen Öffentliche Bibliothek
lineare partielle Differentialgleichung- Phrasen- Wort-Bindestrich-Auslassung Dokumentations- und Ordnungslehre
Wortformen und -bestandteileArtikel der, die, dasPräpositionen in, aufKonjunktionen und, oderZahlwörter ein, eineetc.
Wortformen und -bestandteile
Wortformen u. -
bestandteileFa
chh
och
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Morphologie
Bestimmung der textlichen Grundelemente von Wörtern
● Wortstämme (oder Kerne)● Affixe, Präfixe, Infixe sowie die Suffixe
Affixe und Präfixe stehen vor den Kernen, Infixe zwischen mehreren Kernen, Suffixe am Ende des Wortes.Zu den Infixen zählt man Wortverbindungselemente - z.B. das Fugen-s - die zur Kompositumsbildung erforderlich sind.
Bibliothek(s)katalogBibliothekar(s)tag
Auch Flexionsendungen zählen hierzu wie auch zu den Suffixen. Alle diese Elemente werden zu den Morphemen gerechnet
Phonologie
Bestimmung und Systematisierung der Grundelemente der gesprochenen Sprache (Phoneme) sowie ihrer Funktion.
Dokumentationssprachlich nur interessant im Zusammenhang mit
● Homophonen Ähre - Ehre, Bären - Beeren, Säle - Seele, Lehre - Leere● Homographen Ténor bzw. Tenór
Wortformen und -bestandteile
Ambiguitäten
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
1. Synonymie
Beim Synonym liegen verschiedene verbale Repräsentationen für einen Begriff vor. In dokumentationssprachlichen Betrachtungen fordert man völlige Bedeutungsidentität der verschiedenen Verbalisierungen. Damit grenzt man sich von der Bedeutung des Synonyms in den sog. Synonymen-Wörterbüchern ab. Diese geben in der Regel zu einem Wort bedeutungs-verwandte Begriffsfelder an.
Vgl. die folgende Eintragung aus einem Synonymen-Wörterbuch:
Mehrdeutigkeiten (Ambiguitäten)
Ambiguitäten
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Dieses allgemeinere Verständnis von Synonymen wird dokumentations-sprachlich als Quasi-Synonym bezeichnet und impliziert, daß die entsprechenden Wörter in einem Kontext, einem durch den Text geschaffenen Zusammenhang, bedeutungsmäßig austauschbar sind. Fälle des strengen Synonym-Verständnisses werden gegeben durch:
● Abkürzungen und ihre Auflösung
OPAC - Online Public Access Catalog(ue)Public Access Online Catalog(ue)
● Schreibweise-Unterschiede
Fotografie – Photographie● Regional unterschiedlicher Sprachgebrauch
Fleischer - Metzger
Manchmal können auch durch die Wahl der verschiedenen Wortarten Synonyme entstehen; z.B. Berufliche Ausbildung und Berufsausbildung.
Schwächer wird die Bedeutungsidentität bereits in den Fällen
● Umgangssprache bzw. Fachsprache
Krebs - Karzinom, Bücherei- Bibliothek● Übersetzungen aus einer Fremdsprache
Öffentliche Bibliothek - Public library
Ambiguitäten
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Die kontextbezogene Austauschbarkeit von Quasi-Synonymen kann etwa konkret so aussehen, dass in einem Fachaufsatz über Online-Publikumskataloge ohne Einbußen für das Verständnis zwischen Online-Katalog und Online-Publikumskatalog gewechselt werden kann, obwohl zwischen beiden Begriffen durchaus inhaltliche Unterschiede festgestellt werden können.
In intellektuell bearbeiteten Dokumentationssprachen können Quasi-Synonyme nicht erhalten bleiben, dort soll jede sprachliche Repräsentation für die angestrebte Präzision im Retrievalvorgang hinsichtlich der gemeinten Bedeutung möglichst kontextfrei eindeutig verstehbar sein. Allgemeiner gesprochen ist es Grund-Aufgabe der Gestaltung einer Dokumentationssprache, die Quasi-Synonyme zu eliminieren und durch Synonym-Vereinbarungen oder Verwandte Begriffe zu ersetzen.
Verwandte Begriffe stehen in einer assoziativen Beziehung zueinander. Das Feld assoziativer Beziehungen kann sehr weitläufig sein, vgl. etwa:
Mehl - Bäcker - Backen - BrotSchiff - GletscherGummibärchen – Dampfbügeleisen
Ambiguitäten
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
2. Homonymie – Polysemie
Wörter, die mehrere Bedeutungen besitzen, also für mehrere Begriffe stehen
Schloss, Ball, Knie
In manchen Fällen ist den verschiedenen Bedeutungen anzusehen, welche Bedeutungskomponente bei der gleichen Namensgebung eine Rolle gespielt haben mag; solche Fälle werden als Polyseme bezeichnet.
Bei der intellektuellen Gestaltung einer Dokumentationssprache ergibt sich als Aufgabe die sog. Disambiguierung, d.h. in der Regel wird durch Anfügen eines geeigneten Zusatzes die jeweils gemeinte Bedeutung eindeutig klargestellt; z.B.
Schloss [Gebäude], Schloss [Schließvorrichtung]
Bei Personen werden gerne Lebensdaten oder (berufs-)fachliche Einordnungen vorgenommen.
Beide Elemente einer solchen Verbindung - das homonyme Wort und der erläuternde Zusatz - müssen als eine dokumentationssprachliche Einheit aufgefasst und verwendet werden und sollten auch in einem Retrieval-vorgang als eine bedeutungsmäßige Einheit zur Verfügung gestellt werden.
Begriffs-beziehungen
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Begriffsbeziehungen
Neben einem Verständnis für einzelne Begriffe ist ein Verständnis für Beziehungen zwischen Begriffen wichtig (statt Beziehung wird häufig auch das Wort Relation verwendet).
Das Ausweisen von Beziehungen in Dokumentationssprachen soll sowohl eine Hilfe für die Wahl der besten inhaltskennzeichnenden Ausdrücke im Indexierungsprozess sein als auch im Suchprozess eine Unterstützung für die Auswahl der bestpassenden Ausdrücke bieten.
Solche Beziehungen können z.B. sein:• Vogel - Singvogel - Meise - Blaumeise• Motor - Zylinder - Kolben• Mehl - Bäcker - Bäckerei - Backen - Brot
Bei der Beziehung
Vogel - Singvogel - Meise - Blaumeise
handelt es sich um eine sog. Abstraktionsbeziehung (auch generische oder logische Relation genannt). Die beteiligten Begriffe nennt man Oberbegriffe und Unterbegriffe. Ein Unterbegriff ist dabei definitionsgemäß ein Begriff, der alle Merkmale des Oberbegriffs sowie mindestens ein zusätzliches Merkmal besitzt.
Begriffs-beziehungen
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Bei der Beziehung
Motor - Zylinder - Kolben
handelt es sich um eine sog. Bestandsbeziehung (auch Ganzes-Teil-Beziehung genannt) mit Verbandsbegriffen und Teilbegriffen. Wichtigster Anwendungsfall derartiger Beziehungen sind materielle technische Objekte, z.B. Maschinen und ihre Teile.
Beide Beziehungen faßt man auch als hierarchische Beziehungen zusammen, da sich mit ihnen besonders gut Über- und Unterordnungen herstellen lassen.
Bei der Beziehung
Mehl - Bäcker - Bäckerei - Backen - Brot
handelt es sich um sog. assoziative Beziehungen, auch Verwandtschafts-beziehung genannt. Hierbei sind eine Vielzahl von Typen unterscheidbar. Besonders wichtige Beispiele sind:
● Rohstoff – Produkt ● Institution - Tätigkeit● Produzent – Produkt ● Institution - Ausübende der Tätigkeit● Tätigkeit – Produkt ● Genetische Beziehung
Themen-Beziehungen
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Beziehungen zwischen Themen
Betrachtet man den Inhalt von Dokumenten, so kommen darin meist nicht isolierte Begriffe vor, sondern Themen, d.h. komplexe Aussagen, die aus mehreren begrifflichen Komponenten bestehen, z.B.:
• Deutsche Literatur des 19. Jahrhunderts• Das Brutverhalten von Blaumeisen beim Füttern ihrer Jungen• Schüler werden durch Lehrer beurteilt• Lehrer werden von Schülern beurteilt
In der Wirklichkeit haben diese Themen ihre Widerspiegelung in Ereignissen, so daß wir in Analogie zum Begriffsdiagramm nun folgende Darstellung angeben können:
Ereignis
Thema
Phrase
Das Ereignis ist also wie das realweltliche oder abstrakte Objekt der Objektwelt zugehörig. Das Thema unterscheidet sich vom Begriff dadurch, daß es in der Regel aus mehreren begrifflichen Komponenten zusammengesetzt ist. Die Phrase ist die sprachliche Repräsentation des Themas, indem neben Benennungen für die Begriffe in der Regel auch Mittel der Syntax verwendet werden.
Semantik - Syntax
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Damit sind bereits 2 verschiedene Möglichkeiten angesprochen, wie sprachlich Bedeutungen repräsentiert werden: erstens durch Benennungen, zweitens durch zusätzliche syntaktische Elemente.
Die Beispiele
• Schüler werden durch Lehrer beurteilt• Lehrer werden von Schülern beurteilt
machen deutlich, daß die syntaktischen Mittel für das Verständnis einer Phrase bei Gleichheit der vorkommenden Begriffe eine wichtige Rolle spielen können.
Neben sinnlosen, d.h. noch nicht mit einem Sinn belegte Wörter (z.B. Boselstumpfel, Humreill), sind so auch sinnlose Sätze denkbar, die z.B. bedeutungstragende Wörter in einen syntaktisch unsinnigen Zusammenhang stellen. Man nehme als Beispiel etwa:
Grüne Gedanken rupfen Leichtmetallfelgen unbarmherzig vor Tagesanbruch mit Frequenzsalat
Semantik - Syntax
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Semantik und Syntax kommt so bei der sprachlichen Verständigung eine gemeinsame Funktion zu, indem durch beide Elemente Wort-, Satz- und Bedeutungsfelder aufgebaut werden. Gleichsam jeder in einem Thema verwendete Begriff steht in einem semantischen Umfeld, das innerhalb einer syntaktischen Phrase variiert werden kann. Man betrachte folgendes Beispiel:
VögelSingvögel füttern ihre JungvögelMeisen füttern ihre Jungmeisen mit InsektenBlaumeisen füttern ihre Jungen mit grünen RaupenSchweine säugen ihre FrischlingeSäugetiere säugen ihre JungtiereTiere ernähren ihren Nachwuchs
Die Bedeutungsvielfalt entlang der semantischen Achse wird auch paradigmatisch, die Benutzung einer konkreten syntaktischen Reihenfolge zum Ausdrücken eines konkreten Kontexts syntagmatisch genannt.
Semantik - Syntax
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Der Kontext - das Syntagma - kann dabei Einfluß auf den paradigmatischen Aspekt bekommen. So würde man im obigen Beispiel einen Zusammenhang zwischen den verschiedenen Nahrungsstoffen sehen (Insekten - Raupen - Muttermilch), den man nicht als zwingende begriffliche Beziehung im Sinne der zuvor diskutierten Beziehungsarten sehen würde (allenfalls eine spezielle Form einer assoziativen Beziehung könnte man heranziehen) und den man nicht in einer Dokumentationssprache zum Ausdruck bringen würde.
Aus gleichen semantischen Bausteinen können jedoch verschiedene Syntagmen erzeugt werden, z.B.:
• Lehrer beurteilen Schüler• Schüler beurteilen Lehrer
Für die Gestaltung einer Dokumentationssprache muss vor dem Hinter-grund des beabsichtigten Nutzens und der einzusetzenden Ressourcen geprüft werden, ob derartige Syntagmen in der Dokumentationssprache unterscheidbar repräsentiert werden sollen oder nicht.
Komposita
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Komposita und das Problem ihrer Zerlegung
Komposita stellen für Dokumentationssprachen ein besonderes Problem dar. Formal handelt es sich um Substantive, d.h. sie werden auch im Retrieval als ganze Wörter behandelt. Andererseits gehen sie häufig aus einer Komposition mehrerer begrifflicher Bestandteile hervor, die zwar zu einer neuen Begrifflichkeit verschmelzen, die aber auch als eine Art Boolescher und-Verbindung der Bestandteile gedacht werden können. Diese Bestandteile sind häufig dem Kompositum über seine Wortbestandteile noch anzusehen
Unternehmensorganisation, Informationswirtschaft, Wissensmanagement
Manchmal stellt ein Kompositum einen Individualnamen dar und repräsen-tiert keine begriffliche Verknüpfung
Schuhschnabel, Klammeraffe
In anderen Fällen repräsentieren auch einfache Nomen begriffliche Verschmelzungen
Schiff (= wassergebundenes Transportmittel)
für die in analogen Fällen Komposita verwendet werden
Eisenbahn (schienengebundenes Transportmittel)
Komposita Morphologie
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Morphologie der Komposita
Beispiel für eine morphologische Analyse
Ermüdungserscheinung
Morphologische Zerlegung (nicht zu verwechseln mit Silbentrennung)
Er|müd|ung|s|er|schein|ung
In einer solchen Zerlegung kommen Elemente vor, denen man einen semantischen Sinn, einen Inhalt, eine Bedeutung unterlegen kann, z.B.
müd für müde, Müdigkeit u.a.Schein für Anschein u.a.
Derartige Elemente kann man sich als Einträge ein einem bedeutungserläuternden Lexikon vorstellen. Um sie von den Morphemen zu unterscheiden, die nur eine Funktion für die Wortbildung und keine eigene semantische Bedeutung besitzen, werden sie Lexeme genannt.
Komposita Zerlegung
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Für eine intellektuelle Zerlegung eines Kompositums fordert man die Herstellung begrifflicher Einheiten in Form von 2 Zerlegungskomponenten mit jeweils eindeutiger Benennung, die in Kombination die ursprüngliche Bedeutung reproduzieren:
„Eisenbahn“ <Eisenbahn>≈
<Überlandverkehr>
<Schienenbahn> „Schienenbahn“
„Überlandverkehr“
„Eisenbahn“Nach: Wersig, G.: Thesaurus-Leitfaden. 2. Aufl. 1985, S.59.
≈
≈
=
„Eisenbahn“ = Begriff Eisenbahn<Eisenbahn> = Wort Eisenbahn
und
1. Zerlegungskomponente
2. Zerlegungskomponente
Die Bestimmung der Zerlegungskomponenten ist nicht eindeutig; ausschlaggebendes Kriterium ist, dass die 2. Komponente die semantische Differenz der ersten Komponente zum ursprünglichen Kompositum beinhalten muss.
Im Allgemeinen wird man sich für die Festlegung der Zerlegungs-komponenten an den morphologischen Bestandteilen des Kompositums orientieren, das Erreichen einer guten Lösung ist damit jedoch nicht garantiert, vgl. z.B.:
Topfblume oder MilchkuhBlumentopf Kuhmilch
In diesem Fall liefern beide Reihenfolgen ein sinnvolles Ergebnis, die rein morpho-logische Zerlegung ist also nicht eindeutig.
Komposita Zerlegung
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Ein weiteres intuitives Kriterium zur Bestimmung inhaltlicher Bedeutungsbestandteile ist die Vorstellung einer Komposition im Sinne einer gleichordnenden Verschränkung, d.h. jeder Bestandteil steuert einen Teil zur Semantik bei, der auch als selbständiges abgeschlossenes begriffliches Element vorkommt, z.B.:
Ledersofa DachrinneGummireifen Laichgewässer
Daneben kann die Komposition auch als begriffliche Merkmalsspezifizierung durch Bestandteile erfolgen, die für ihre konkrete Bedeutung einen zweiten Bedeutungsbestandteil benötigen, z.B.
Singvogel Feinzucker
Die letztgenannte Variante findet sich häufig bei Kompositionsbildungen mit Adjektiven für die sprachliche Repräsentation von Unterbegriffen.
Durch Kompositionsbildung wird häufig die Mehrdeutigkeit einzelner Kompositionskomponenten aufgehoben, z.B.
Frequenzsalat Türschloss Abflussknie
Die Spannbreite der Mehrdeutigkeiten erstreckt sich dabei über alle Formen der Homonyme, Polyseme und Konnotationen.
Komposita Zerlegung
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Ein weiteres Problem wird sichtbar, wenn die Sachgebiete der Kompositionsbestandteile nicht mit dem Sachgebiet des Kompositums identisch sind. Man vergleiche z.B.:
MangelerscheinungEisenmangel
Man sieht vielleicht keinen Anlass, über eine Zerlegung nachzudenken.Anders denkt man möglicherweise über das Kompositum:
Eisenmangelerscheinung
Es gibt 3 Kompositionsbestandteile auf morphologischer Ebene:
Eisen Mangel Erscheinung
Diese Bestandteile sind durch folgende Eigenschaften charakterisiert: Das Wort Mangel kann mit dem Begriff Heißmangel assoziiert werden, was im vorliegenden Kontext völlig abwegig wäre. Das Wort Erscheinung kann weglassen oder durch Symptom ersetzt werden.
Die Zerlegung kann auch durch Wiederholung von Komponenten erfolgen: Eisenmangel + Mangelerscheinung. Eine solche Zerlegung mit sich wiederholenden (begrifflichen) Bestandteilen wird als pleonastisch bezeichnet und manchmal als Gestaltungsmittel für präkombinierte Dokumentationssprachen abgelehnt. Der Vorteil einer solchen Vorgehensweise für ein postkoordinierendes Retrieval liegt auf der Hand.
Komposita aspekt-
orientierte Zerlegung
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Eine weitere Möglichkeiten für eine Zerlegung besteht in der Analyse der begrifflichen Komponenten anhand vorgebener Kategorien oder Aspekte, z.B.: Insektenhaut
Dieses Kompositum enthält die eindeutig bestimmbaren Aspekte Tier (für des Bestandteil Insekt) und physiologischer Prozeß des Tiers (für den Bestandteil Haut). Solche Kategorien können zu einer gut handbaren Zerlegung von Komposita führen, sofern sie vor der Entwicklung des Vokabulars einer Dokumentationssprache fixiert werden (am deutlichsten zu sehen in der Beispielwelt der Facettenklassifikation).
Die kategoriale Analyse kann einhergehen mit der Analyse, ob es sich um eine paradigmatische oder eine syntagmatische Verschmelzung handelt. Im Beispiel der beiden Komposita
• Schülerbeurteilung• Lehrerbeurteilung
kann man zunächst in jedem von beiden eine Handlung feststellen. Des weiteren erkennt man, daß jeweils eine ausführende Instanz bzw. eine Objekt-Instanz beteiligt ist, ohne dass dies aus der Komposition klar hervorgeht. Allein die statistisch häufigere Situation, dass die Beurteilung von Schülern durch Lehrer erfolgt, schließt ja die Möglichkeit nicht aus, daß die Beurteilung von Lehrern auch einmal durch Schüler erfolgt.
Erst der Einsatz der Präpositionen sorgt hier für eine eindeutige Aussage.
Einsatz von Präpositionen
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Der Einsatz von Präpositionen ist jedoch nicht immer ausreichend, die Satzbedeutung eindeutig zum Ausdruck zu bringen, man vgl. z.B. die folgenden Sätze:
• Flying planes can be dangerous• Ein fixer Ober zerbrach einem Mädchen mit einem Tablett einen
Pokal• Nach seiner Wahl zum Bundeskanzler wurde Helmut Schmidt
von der SPD vereidigt• Nach seiner Wahl zum Fußballer des Jahres wurde Mario Kicker
vom FC Tretmich die Auszeichnung überreichtaber• Nach seiner Wahl zum Fußballer des Jahres wurde Mario Kicker
vom Vorsitzenden des FC Tretmich die Auszeichnung überreichtIm ersten Satz ist nicht eindeutig, ob fliegende Flugzeuge gefährlich sind oder Das Fliegen von Flugzeugen (etwa für den Piloten) gefährlich ist.
Für den zweiten Satz kann man ebenfalls 2 mögliche Bedeutungen angeben: Mit einem Tablett zerbrach ein fixer Ober einem Mädchen einen Pokal oder Einem Mädchen mit einem Tablett wurde von einem fixen Ober ein Pokal zerbrochen.In nachfolgenden Sätzen ist durch die Verwendung der Präposition vom strukturell nicht klar, ob damit ein Attribut ausgedrückt werden soll (vom FC Tretmich) oder ob damit ein handelndes Agens eingeleitet wird (vom Vorsitzenden).
Sonstige Phänomene der Sprache
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Phänomene dieser Art werden in der Linguistik unter der Überschrift Satzsemantik diskutiert. Für die Gestaltung von Dokumentationssprachen muss in diesem Zusammenhang geprüft werden, ob die Dokumentations-sprache Hilfsmittel zur Disambiguierung derartiger Syntagmen bereit-stellen soll oder ob man darauf verzichten will.
Eine Bereitstellung erhöht den Aufwand in der Anwendung der Dokumentationssprache, kann andererseits in manchen Situationen jedoch zu einer Verfeinerung der Recherchemöglichkeiten beitragen.
Es ist schon erwähnt worden, daß Komposita nicht immer aus mehreren begrifflichen Komponenten aufgebaut sein müssen. In der Sprache entwickeln sich immer wieder Wörter aus einer gewissen Analogie oder einem zeitgebundenen Kontext, die nur im Sinne von Eigennamen verstanden werden können, obwohl sie rein sprachlich die Form von Komposita besitzen, z.B.:
● Stiefelknecht ● Klammeraffe ● Geldwaschanlage ● Falzbein ● Schuhschnabel ● Wirtschaft
Derartige Wörter lassen sich nicht einer sinnvollen begrifflichen Zerlegung unterwerfen und müssen als Eigennamen in das Vokabular einer Dokumentationssprache (bzw. auch in die Wörterbücher für Verfahren des Automatischen Indexierens) integriert werden.
Sonstige Phänomene der Sprache
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Eine besondere Wortform stellen noch die sog. Wort-Bindestrich-Verbindungen dar, z.B.:
• Buch- und Bibliothekswesen• Bibliotheks- und Informationswissenschaft• Markt- und Medienforschung• Kommunikationsbedingungen und -strukturen• Hals- Nasen- Ohren-Arzt
Diese Verbindungen repräsentieren zwei oder mehr Begriffe in einer verkürzten sprachlichen Form. Für Dokumentationssprachen kann hier sowohl die verkürzte Form (HNO-Arzt) als auch die Trennung in verschiedene Komponenten (Marktforschung, Medienforschung) relevant werden. Dies bleibt in der Regel einer Einzelfallprüfung vorbehalten, zumal manchmal eine sprachliche Transformation einzelner Komponenten erforderlich werden kann.
Vorhersag-barkeit
Wiedergabe-treue
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
Konsequenzen für die Gestaltung von Dokumentationssprachen Dokumentationssprachen haben eine mehrfache Aufgabe; sie
sollen • den Inhalt von Dokumenten repräsentieren • die Repräsentationen für Suchprozesse zur Verfügung stellen
ohne dabei die in der natürlichen Sprache unvermeidbaren Mehrdeutig-keiten zu beinhalten. Eindeutigkeit versucht man, durch Maßnahmen der sog. terminologischen Kontrolle für die oben dargestellten Probleme der Mehrdeutigkeiten zu erreichen. Das ideale Element einer Dokumentations-sprache ist semantisch abgeschlossen, d.h. nur aus sich heraus vollständig und ohne Mehrdeutigkeiten verstehbar.
Die genannten abstrakten Anforderungen an die Eigenschaften des Vokabulars lassen sich anhand verschiedener Kriterien präzisieren. Hierzu gehören zentral• die Wiedergabetreue in der Repräsentation des Begriffs oder
Sachverhaltes durch die Dokumentationssprache;
• die Vorhersagbarkeit, welche Ausdrücke der Dokumentationssprache einen gesuchten Begriff oder Sachverhalt repräsentieren.
Man betrachte die nachstehende Wortliste und wähle die Ausdrücke aus, die man für eine Frage nach dem Thema Organisation von Bibliotkeken für geeignet hält.
Komposita Organisation
Fach
hoch
sch
ule
Köln
Inst
itut
für
Info
rmati
onsw
isse
nsc
haft
W. Gödert
OrganisationsfilterOrganisationsformOrganisationsformenOrganisationsforschungOrganisationsfrageOrganisationsfragenOrganisationsfreiheitOrganisationsfunktionOrganisationsfunktionenOrganisationsgeflechtOrganisationsgeflechtesOrganisationsgefügeOrganisationsgeschehenOrganisationsgeschichteOrganisationsgeschichtenOrganisationsgeschichtlichenOrganisationsgeschichtlicherOrganisationsgesetzOrganisationsgesetzeOrganisationsgesetzenOrganisationsgesetzesOrganisationsgestaltungOrganisationsgläubigkeitOrganisationsgliederungOrganisationsgradOrganisationsgradeOrganisationsgrades
OrganisationsgradsOrganisationsgrenzeOrganisationsgrenzenOrganisationsgrößeOrganisationsgründungOrganisationsgründungenOrganisationshandbücherOrganisationshandelnOrganisationshemmendeOrganisationshemmendenOrganisationsheteronomieOrganisationshierarchieOrganisationshierarchienOrganisationshöheOrganisationsinterneOrganisationsinternenOrganisationsinternerOrganisationskapazitätOrganisationskapazitätenOrganisationskategorienOrganisationskatholizismusOrganisationsklimaOrganisationsklimakonzeptsOrganisationsklimasOrganisationskontextOrganisationskonzeptOrganisationskonzepte
OrganisationskonzeptenOrganisationskonzeptionOrganisationskriseOrganisationskulturOrganisationslebenOrganisationslehreOrganisationsleitungOrganisationslogischeOrganisationslosenOrganisationsloyalitätOrganisationsmachtOrganisationsmängelOrganisationsmangelOrganisationsmasseOrganisationsmerkmalOrganisationsmerkmaleOrganisationsmerkmalenOrganisationsmethodeOrganisationsmethodenOrganisationsmethodischenOrganisationsmitgliederOrganisationsmitgliedernOrganisationsmitgliedesOrganisationsmitgliedsOrganisationsmitgliedschaftOrganisationsmittelOrganisationsmobilität
OrganisationsmodellOrganisationsmodelleOrganisationsmodellenOrganisationsmodellsOrganisationsmonopolsOrganisationsmusterOrganisationsmusternOrganisationsnetzOrganisationsnetzwerkesOrganisationsniveauOrganisationsniveausOrganisationsnotwendigkeitOrganisationsobjektOrganisationsorientiertemOrganisationsorientiertenOrganisationsphänomensOrganisationspläneOrganisationsplanOrganisationspolitikOrganisationspolitischOrganisationspolitischeOrganisationspolitischenOrganisationspolitischerOrganisationspostulatenOrganisationspotentialeOrganisationspraktikernOrganisationspraxis
OrganisationsprinzipOrganisationsprinzipienOrganisationsprinzipsOrganisationsproblemOrganisationsproblematikOrganisationsproblemeOrganisationsproblemenOrganisationsprozessOrganisationsprozessenOrganisationsprozessesOrganisationspsychologieOrganisationspsychologischOrganisationspsychologischeOrganisationspsychologischenOrganisationsqualitätOrganisationsrechteOrganisationsrechtlichenOrganisationsrechtsOrganisationsreformOrganisationsreformenOrganisationsregelnOrganisationsregelungenOrganisationsrelevantemOrganisationsrelevantenOrganisationsschemaOrganisationsschemataOrganisationsschwierigkeiten
Thesaurus: Startseite
ThesaurusBeispiel: ERIC Thesaurus
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
Beispiel: ERIC Thesaurus in gedruckter Form
Beispiel für einen
Thesaurus-Eintrag aus
dem Alphabetischen
Teil
D - SNBF - UFBS -USEOB - BTUB - NTVB - RT
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
ERIC Thesaurus
ERIC Thesaurus
Scope Note Definition
Relationen
Systematik
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
ERIC Thesaurus
Beispielseite
Beispieleintrag
ERIC Thesaurus
Alphabetische Anordnung
KWIC = KeyWord in Context= Aufführen der Deskriptoren in ihrer natürlichen ReihenfolgeFach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
ERIC Thesaurus
Beispiel für das
“Rotated Descriptor display”
ERIC Thesaurus
Beispiel für Einträge aus dem“Two-way hierarchical term
display”
Hierarchie aufwärts
Hierarchie
abwärts
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
ERIC Thesaurus
ERIC Thesauru
s
Systematisches Umfeld des
Deskriptors
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
ERIC Thesaurus
Beispiel aus dem “Descriptor Group Display”
Strukturierung von Thesauri: Zusammenfassung
Zur Strukturierung eines Thesaurus gehören verschiedene Teilaufgaben:
Fachgebietsorientierte Sammlung von Begriffen, die als inhaltskenn-zeichnende Beschreibungen von Dokumenten geeignet sind (Deskriptoren)
Angaben zu einem Deskriptor
• Definitionen, Erläuterungen• Verwendungshinweise• Angabe von Notationen einer Referenzsystematik• Relationen zu anderen Thesaurus-Begriffen• Daten der Erfassung, Änderung, Löschung
Konzeption der verschiedenen Teile eines Thesaurus
• Alphabetischer Teil• Systematischer Teil• Grafische Übersichten und Visualisierung• Diverse Register und Deskriptor-Übersichten (vgl. Beispiele)• Einleitung, Hinweise zur Benutzung für Indexierung und Recherche
Fach
hoch
sch
ule
Köln
Faku
ltät
für
Info
rmati
ons-
und K
om
munik
ati
onsw
isse
nsc
haft
en
W. Gödert
Strukturierung