optimierung, konsolidierung und anreicherung einer ... · Über das projekt termterm 7 zweiten...
TRANSCRIPT
„Optimierung, Konsolidierung und
Anreicherung
einer Terminologiedatenbank
für das TermTerm-Projekt“
Masterarbeit
im Studiengang Terminologie und Sprachtechnologie
angefertigt an der Fachhochschule Köln-Institut für Translation und
Mehrsprachige Kommunikation
Betreuer: Prof. Dr. Klaus-Dirk Schmitz
vorgelegt von: Matilda-Iuliana Soare
Matrikelnummer: 11078537
Datum der Abgabe: 18.12.2012
Inhaltsverzeichnis
0 Einleitung......................................................................................................... 4
1 Über das Projekt TermTerm ........................................................................ 6
1.1 Beteiligte .............................................................................................. 6
1.2 Datenbestände ..................................................................................... 8
2 Theoretischer Rahmen ................................................................................ 9
2.1 Terminologielehre, Terminologiearbeit und Terminologiemanagement 9
2.1.1 Arten und Funktion der Terminologiearbeit ................................... 11
2.1.2 Gegenstand, Begriff, Benennung.................................................. 17
2.1.3 Definitionen ................................................................................... 21
2.2 Terminologiedatenbank und Terminologieverwaltungssystem ........... 26
2.2.1 Terminologischer Eintrag .............................................................. 28
2.2.2 Datenkategorien ........................................................................... 29
2.2.3 Grundprinzipien der Modellierung terminologischer Einträge ....... 34
2.2.4 Bereitstellung von Daten ............................................................... 36
2.2.5 Austausch von Daten .................................................................... 37
2.2.6 Qualitätssicherung und Validierung von Terminologieeinträgen ... 43
3 Optimierung der TermTerm- und der ELETO-Datenbank ......................... 47
3.1 Datenbankanalyse ............................................................................. 47
3.1.1 Auswertung der TermTerm-Datenbank ........................................ 47
3.1.2 Auswertung der ELETO-Datenbank ............................................. 53
3.2 Vorschlag für die Optimierung der TermTerm- Datenbankstruktur .... 55
3.3 Konzept für die Zusammenführung der TermTerm- mit der ELETO-
Datenbank .................................................................................................... 56
3.3.1 Export der Access-Datenbank ...................................................... 56
3.3.2 Konvertierung mit MultiTerm Convert ........................................... 57
3.3.3 Import in MultiTerm ....................................................................... 60
3.4 Konsolidierung des Datenbestandes.................................................. 61
3.4.1 Doubletten bereinigen ................................................................... 62
3.4.2 Inhalte konsolidieren und optimieren ............................................ 64
3.5 Bereitstellung der TermTerm-Datenbank ........................................... 68
3.6 Exemplarische TBX-konforme Exportdefinition .................................. 74
4 Zusammenfassung und Ausblick .............................................................. 80
5 Abkürzungsverzeichnis ............................................................................. 82
6 Abbildungsverzeichnis............................................................................... 83
7 Literaturverzeichnis ................................................................................... 85
0 Einleitung
4
0 Einleitung
Terminologie ist in aller Munde. Viele haben ihre Bedeutung erkannt und versu-
chen, sich in diesem Bereich zu spezialisieren, einzelne Begrifflichkeiten blei-
ben jedoch oftmals im Halbdunkel. Sagt man jetzt Terminus, Benennung, Be-
griff oder Bezeichnung oder redet man über Terminologiearbeit oder
Terminologiemanagement? Immer wieder hört man in den Fragerunden bei Ta-
gungen, die sich unter anderem mit Terminologie beschäftigen, Teilnehmer, die
die Begrifflichkeiten des Fachbereichs Terminologie noch nicht beherrschen.
Aus diesem Grund entstanden die Idee und der Wunsch die Terminologie der
Terminologie in einer Datenbank zu sammeln und zu verwalten und Terminolo-
gieinteressierten zur Verfügung zu stellen.
Nach der aktiven Mitarbeit bei der Erstellung der ersten Einträge für die Termi-
nologie der Terminologie im Rahmen des obligatorischen Terminologieprojekts
im 2. Semester des Masterstudiengangs Terminologie und Sprachtechnologie,
stellten sich die Studierenden die Frage, was jetzt weiter mit ihrer Arbeit passie-
ren würde. Es war eine große Freude zu erfahren, dass dieser terminologische
Bestand später in das TermTerm-Projekt übernommen wurde und dass ich die
Möglichkeit haben würde, mich mit der Optimierung dieser Datenbank zu be-
schäftigen.
Sehr bemerkenswert ist auch, dass der Bedarf nach einer einheitlichen Termi-
nologie der Terminologie auch von anderen Fachverbänden in anderen Län-
dern erkannt wurde. So wurde dem TermTerm-Projekt eine griechische Termi-
nologie der Terminologie zur Verfügung gestellt und in der Zukunft werden auch
andere dazu kommen.
Da die Datenbestände von verschiedenen Organisationen stammten und in un-
terschiedlicher Qualität vorhanden waren, war die fachliche Zielsetzung meiner
Arbeit die Optimierung und Konsolidierung der Terminologie der Terminologie
sowie die Anreicherung des deutschen Datenbestands mit den von ELETO er-
stellten Daten.
Auch wenn in der TermTerm-Datenbank selbst die wichtigsten Begrifflichkeiten
der Terminologie bereits dokumentiert wurden, wurde mit dieser Arbeit ange-
strebt, ein Grundkonzept zur Terminologiearbeit zu erarbeiten. Ein mögliches
Zielpublikum der Arbeit könnte aus Interessierten bestehen, die schnell und zu-
0 Einleitung
5
sammengefasst Informationen zu den wichtigsten Aspekten der Terminologie
erfahren möchten.
So werden im ersten Kapitel allgemeine Informationen zu dem TermTerm-
Projekt, zu den Beteiligten und Datenbeständen, vorgestellt. Das nächste Kapi-
tel gibt eine kurze Einführung in die wichtigsten Aspekte der Terminologielehre,
Terminologiearbeit und des Terminologiemanagements. Dazu wurde eine
gründliche Literaturrecherche betrieben, um die wichtigsten Themen der Termi-
nologie auszufiltern. Berücksichtigt bei ihrer Auswahl wurde zusätzlich die Re-
levanz, die diese Themen für den praktischen Teil haben. So wurden Themen
wie die Grundsätze der Terminologiearbeit, die Modellierung und Validierung
von terminologischen Einträgen oder der Datenaustausch detaillierter ausge-
führt.
Im praktischen Teil dieser Arbeit wurden zunächst die bestehenden Daten ana-
lysiert und ausgewertet und dann Vorschläge für die Verbesserung der Daten-
bankstruktur ausgearbeitet. Im nächsten Schritt wurde ein Konzept für die Zu-
sammenführung der terminologischen Bestände aus den in Access und den in
MultiTerm verwalteten Daten erstellt und implementiert. Nach der Zusammen-
führung der Daten wurde eine Bereinigung vorgenommen, deren wichtigste
Schritte in Kapitel 3.4 vorgestellt werden.
Da diese Datenbank später Terminologieinteressierten zur Verfügung gestellt
werden soll, wird im vorletzten Kapitel eine Vorlage für den TBX-konformen Ex-
port dargestellt. Außerdem wird im letzten Kapitel eine mögliche technische Lö-
sung für eine kooperative Weiterarbeit an dieser Datenbank präsentiert.
Die im Rahmen dieser Masterarbeit bereinigten terminologischen Daten befin-
den sich auf der beiliegenden CD.
Über das Projekt TermTerm
6
1 Über das Projekt TermTerm
Obwohl in Deutschland vielfältige terminologische Aktivitäten in der Industrie, im
Ausbildungsbereich und auf Verbandsebene und auch die Auseinandersetzung
mit den Grundlagen und Prinzipien der Terminologie eine lange Tradition haben,
hat die Terminologiewelt ihre Hausaufgaben im Bereich der Terminologie der
Terminologie selbst noch nicht so gründlich gemacht. Selbst auf Terminologie-
und anderen Fachkongressen werden mitunter Begriff und Benennung falsch
bzw. synonym verwendet. So wird z. B. die Abkürzung TMS von vielen Men-
schen unterschiedlich verstanden. TMS steht für drei unterschiedliche Begriffe:
Translation Management System, Translation Memory System oder Terminolo-
gy Management System.
Ein weiteres Beispiel ist die Verwendung von Term, Terms oder Termen. Diese
Bezeichnungen sind falsch. Richtig ist laut DIN 2342 Benennung, Fachwort o-
der Terminus. Die Pluralform von Terminus lautet Termini. Ähnlich ist es mit
Begriff, für das im Deutschen häufig Konzept verwendet wird, was ebenso
falsch ist. Korrekt ist im Deutschen Begriff und im Englischen concept.
So werden auch bei manchen TVS-Anbietern verschiedene Benennungen für
identische Optionen verwendet, z.B. werden die Masken für die Erstellung ter-
minologischer Einträge bei einem als Eingabemodell bezeichnet, beim anderen
als Eintragsvorlage.
Die meisten Begriffe der Terminologielehre werden zwar in der DIN 2342 ge-
normt, sind aber nicht für alle Benutzer bekannt oder einfach abzurufen. Des-
wegen hat es sich im Rahmen mehrerer Projekte oder bei manchen Institutio-
nen als notwendig erwiesen, die Terminologie der Terminologie zu klären und
diese in einer Terminologiedatenbank aufzubereiten.
1.1 Beteiligte
Die Fachhochschule Köln bietet an der Fakultät für Informations- und Kommu-
nikationswissenschaften den Masterstudiengang Terminologie und Sprachtech-
nologie an. Nach einer wissenschaftlichen Vorlesung zum Thema Terminologie-
lehre erfolgt im 2. Semester auch ein praktisches Projekt. Wenn sich die
Studierenden im ersten Semester nicht im Klaren darüber waren, was Termino-
logie bedeutet, durften sie unter der Betreuung von Prof. Dr. K.-D. Schmitz im
Über das Projekt TermTerm
7
zweiten Semester die Begriffe der Terminologie der Terminologie klären und in
einer Datenbank dokumentieren. Die entstandene Datenbank soll später inte-
ressierten Nutzern zur Verfügung gestellt werden.
Das Internationale Terminologienetz TermNet hat im Jahr 2011 erfolgreich elcat
- ein innovatives E-Learning System für Terminologie - auf dem Markt gebracht.
elcat ist ein nach dem Baukastenprinzip entwickeltes E-Learning System, das
elf Lerneinheiten zum Thema Terminologie umfasst. Die Inhalte von elcat orien-
tieren sich an den einschlägigen Normen zur Terminologie. In der didaktischen
Aufbereitung wurde viel Wert auf Verständlichkeit und Anschaulichkeit gelegt
und alle Inhalte wurden mit Darstellungen und Abbildungen illustriert. Für die
Entwicklung der einzelnen Module benutzte man normenkonforme Terminologie
der Terminologie. Ein umfangreiches Glossar wurde erstellt, um das Verständ-
nis der in elcat verwendeten Terminologie zu erleichtern und um einen Über-
blick über die zentralen Begrifflichkeiten der Terminologie zu liefern (elcat-
Projekt beendet, Lernsystem für Terminologie verfügbar, 2012). Dieser termino-
logische Datenbestand ist Eigentum des TermNet- Internationales Terminolo-
gienetz, wurde aber für das TermTerm-Projekt zur Verfügung gestellt.
Für die Verwaltung und Pflege dieser Datenbestände benötigt man natürlich
auch ein Projekt und eine organisationale Einheit.
So wurde entschieden, ein TermTerm-Konsortium zu gründen, das sich um die
Bereitstellung und Pflege der Daten kümmert. Mitglieder des Konsortiums sind
Prof. Dr. Klaus-Dirk Schmitz von der Fachhochschule Köln, Stefan Gentz von
TRACOM OHG, Dr. Gabriele Sauberer von TermNet – Internationales Termino-
logienetz, Hans Pich von Document Service Center GmbH und Diana Brändle
von dbterm.
Für die Bereitstellung und Pflege der Daten wurde eine Online-Lösung ausge-
arbeitet. Dafür wurde vorgeschlagen, dass die Datenbestände bei mehreren
Online-TVS Anbieter in einer Datenbank zur Verfügung gestellt werden. Dazu
kommen Klaus Fleischmann von Kaleidoscope GmbH, Petra Dutz von SDL plc
und Wolfgang Zenk von acolada ins Konsortium für die technische Umsetzung.
(Informationen aus dem E-Mail-Verkehr mit Diana Brändle vom 07.09.2012)
Die Terminologen in Deutschland nehmen immer zur Kenntnis, was sich in an-
deren Ländern im Bereich Terminologie entwickelt. So bekam Prof. Dr. Schmitz
Über das Projekt TermTerm
8
einen Newsletter der Griechischen Gesellschaft für Terminologie-Ελληνικής
Εταιρείας Ορολογίας-Hellenic Society for Terminology (ELETO)- indem u.a. auch
über die neu erstellte griechische Terminologie der Terminologie berichtet wur-
de. So nahm Diana Brändle Kontakt mit Vertretern der ELETO auf und holte die
Erlaubnis ein, die griechischen Datenbestände mit den deutschen zusammen-
zuführen. Herausgeber und gleichzeitig Ansprechpartner für die griechische
TermTerm Datenbank ist der Geschäftsführer der ELETO, Kostas Valeontis.
1.2 Datenbestände
Bei den von den Studierenden im Master Terminologie und Sprachtechnologie
erstellten Datenbeständen handelt es sich um allgemeine Begrifflichkeiten der
Terminologie, die meistens aus Internetquellen oder aus dem Skript für die Vor-
lesung Grundlagen der Terminologie stammen. Die zu dokumentierenden Be-
griffe wurden erstmals im Seminar nach einem Brainstorming gesammelt und
dann alphabetisch jedem Studierenden zur Dokumentation zugeteilt. Deswegen
ist die Qualität dieser Daten sowohl inhaltlich als terminologisch sehr unter-
schiedlich. Im Seminar entstand ein Datenbestand von 241 Einträgen in
Deutsch, Englisch und teilweise auch Französisch. Die Datenbestände wurden
in dem TVS Trados Multiterm verwaltet und liegen als XML-Datei vor.
Von elcat gab es einen Datenbestand von 709 Einträgen, der die meistgenutz-
ten und bekannten Begriffe der Terminologie enthält, die nützlich und relevant
für die Arbeit und das Verständnis des E-Learning-Systems elcat sind. Auch
hier sind die Einträge meistens zweisprachig, Deutsch und Englisch und teil-
weise auch Französisch. Die Datenbestände von elcat wurden auch in dem
TVS Trados MultiTerm verwaltet und liegen auch in XML vor.
Die Datenbestände der griechischen Terminologie der Terminologie wurden
von dem Technischen Komitee 21 „Grundlagen der Terminologie“ (ELOT/TE21)
angelegt, das der griechischen Ingenieurskammer (TEE) untergeordnet ist. Es
sind insgesamt 1219 allgemeine und spezifische Begriffe der Terminologie auf-
gelistet. Die Datenbank ist aber nur in Form eines dreisprachigen Glossars vor-
handen (Griechisch, Englisch und Französisch). Quellen der Daten sind sowohl
die ISO Normen 1087-1: 2000, 1087-2: 2000, 704: 2000, ISO 860:2007 als
auch die übersetzten und angepassten griechischen Normen zu diesen Aspek-
ten.
Theoretischer Rahmen
9
2 Theoretischer Rahmen
Gemäß DIN 2342 Teil 1 wird Terminologie wie folgt definiert: „Terminologie ist
der Gesamtbestand der Begriffe und ihrer Benennungen in einem Fachge-
biet.“ (DIN 2342, 2011).
Terminologie ist aber viel mehr als das; Manche benutzen das Wort Terminolo-
gie entweder für Terminologiearbeit, -verwaltung oder-management.
Da die Grundbegriffe der Terminologie schon in der zu bereinigenden Daten-
bank dokumentiert werden, werden in diesem Kapitel die Zusammenhänge zwi-
schen den verschiedenen Bereichen der Terminologie erläutert.
2.1 Terminologielehre, Terminologiearbeit und Terminolo-
giemanagement
Terminologielehre
„Terminologie“ ist in der Regel sehr zeitaufwendig und damit kostenintensiv.
Deshalb ist es erforderlich, mit den richtigen Methoden, Verfahren und Werk-
zeugen zu arbeiten. Dazu gehört auch, dass in verschiedenen Fachbereichen
nach einheitlichen Grundsätzen Terminologie erstellt wird, weil nur dann eine
gemeinsame Bearbeitung der Datenbestände und ein Austausch terminologi-
scher Daten möglich werden. Solche Grundlagen wurden von der Terminologie-
lehre etabliert.
Das wissenschaftliche Fundament der Terminologiearbeit, -normung und –
verwaltung sowie des Terminologiemanagements ist die Terminologielehre. Die
Terminologielehre wird in der Norm DIN 2342 als " Wissenschaft von den Be-
griffen und ihren Bezeichnungen in den Fachsprachen" bezeichnet. Die Benen-
nung Terminologie wird als Synonym für Terminologielehre abgelehnt, da sie im
Sinne von Fachwortschatz eingeführt ist (DIN 2342, 2011).
Auch wenn die ersten Schritte in der Terminologiearbeit in der Technik und den
Naturwissenschaften erfolgten, ist die Terminologielehre fachübergreifend kon-
zipiert. Die Grundsätze der Terminologielehre sind auf alle Fächer anwendbar.
Theoretischer Rahmen
10
Die Terminologielehre ist ein interdisziplinär orientiertes Fach und ist mit der
Sprachwissenschaft, Normung und Sprachplanung, Philosophie, Information
und Dokumentation, Computerlinguistik und Wissenstechnik verbunden.
Im Bereich der Sprachwissenschaft spielt für die Terminologielehre die aktive
Beeinflussung der Sprachentwicklung, der aktuelle Wortschatz eine große Rol-
le.
Auch andere Zweige der Sprachwissenschaft wie Lexikologie, Lexikographie,
Semantik und Fachsprachenforschung sind für die Terminologielehre von gro-
ßer Bedeutung.
Mit der Fragestellung nach dem Wesen des Begriffs beschäftigt sich unter an-
derem auch die Philosophie, was auch für die Terminologie, bei der der Begriff
als Denk- und Wissenseinheit im Mittelpunkt steht, wichtig ist.
Mit der Bildung von Begriffen, ihrer Verknüpfungen und ihrer Zusammenfas-
sung in Systemen beschäftigt sich die philosophische Teildisziplin Logik. Die
Terminologielehre hat Symbole zur Bezeichnung von Begriffsbeziehungen aus
der formalen Logik übernommen und weitere Symbole analog zu diesen entwi-
ckelt.
Für die Information und Dokumentation ist die Anwendung terminologischer
Prinzipien beim Aufbau von Klassifikationssystemen und Thesauri besonders
wichtig. Diese Quellen werden aber auf der anderen Seite für die Informations-
suche in der Terminologiearbeit eingesetzt, zum Beispiel für die Zusammenstel-
lung von Dokumentationsmaterial zur Ausarbeitung von Terminologiebeständen
und deren Strukturierung.
Fragestellungen zu dem Begriff als Wissens- oder Denkeinheit, zu Beziehungs-
arten und Begriffsstrukturen, sowie Formen des Wissenserwerbs und der Wis-
sensrepräsentation beschäftigen sowohl die Terminologielehre als auch die
Computerlinguistik und Wissenstechnik (Arnzt/Picht/Mayer, 2009: S. 5 ff.).
Vor diesem Hintergrund kann Terminologielehre wie folgt definiert werden:
Theoretischer Rahmen
11
„Interdisziplinär entwickelte Wissenschaft, deren Forschungsgegenstand einer-
seits der Gegenstand und der Begriff mit ihren Darstellungsformen sowie die
Beziehungen zwischen ihnen und andererseits deren systematische Darstel-
lung und die Anwendung derselben innerhalb vieler verschiedener Wissensge-
biete ist.“ (Arnzt/Picht/Mayer, 2009: S. 8).
Terminologiearbeit
Terminologiearbeit ist laut DIN 2342 die "auf der Terminologielehre aufbauende
Planung, Erarbeitung, Bearbeitung oder Verarbeitung, Darstellung oder Verbrei-
tung von Terminologie ".
Zur Terminologiearbeit gehört somit auch das Extrahieren von Termini, das Er-
stellen von Begriffssystemen, das Einpflegen von Termini in Texte sowie das
Veröffentlichen von Terminologien. Terminologiearbeit kann auch Normung um-
fassen und kann sich auf eine oder mehrere Sprachen und auf ein oder mehre-
re Fachgebiete beziehen (vgl. DIN 2342, 2011).
Terminologiemanagement
Terminologiemanagement oder die Terminologieverwaltung ist laut DIN 2342
der "Teil der Terminologiearbeit, der sich mit der Erfassung, Verarbeitung, Pfle-
ge und Bereitstellung von terminologischen Daten befasst" (DIN 2342, 2011).
Terminologiemanagement soll demnach ein Teil der Terminologiearbeit sein. In
der Praxis hat sich inzwischen jedoch der Gebrauch von Terminologiemanage-
ment als Synonym zu Terminologiearbeit etabliert.
2.1.1 Arten und Funktion der Terminologiearbeit
Die Form der Terminologiearbeit hängt von der jeweiligen Zielsetzung, dem Un-
tersuchungsgegenstand und dem Zeitpunkt der Erstellung ab.
Nach der Zielsetzung wird zwischen präskriptiver und deskriptiver oder nor-
mender Terminologiearbeit unterschieden.
Ziel der deskriptiven Terminologiearbeit ist es, den Ist-Zustand der Terminologie
in einem Text oder Fachbereich zu ermitteln und den Gebrauch von Begriffen,
Theoretischer Rahmen
12
Benennungen und Definitionen zu beschreiben. In diesem Fall werden nur die
sprachliche Korrektheit und die Häufigkeit berücksichtigt, es werden aber keine
Empfehlungen für eine bestimmte Benennung gemacht.
Ziel der präskriptiven Terminologiearbeit ist es, den verwendeten Fachwort-
schatz zu vereinheitlichen und Benennungen vorzuschreiben. In diesem Fall
werden Benennungen, Begriffe und Definitionen festgelegt (vgl. Bauer, 2010: S.
M2-1).
Diese Art von Terminologiearbeit ist zu empfehlen, da dadurch die Corporate
Language im Unternehmen gepflegt wird und so zu einer besseren Kommuni-
kation innerhalb und außerhalb des Unternehmens beigetragen wird.
Mayer (Mayer, 1998) unterscheidet auch zwischen deskriptiver und präskripti-
ver Terminologiearbeit. Dabei werden unter der deskriptiven Terminologiearbeit
die punktuelle und die systematische Terminologiearbeit eingeordnet. Die sys-
tematische Terminologiearbeit kann dann spezifisch in sachgebiet- oder textbe-
zogene Terminologiearbeit unterteilt werden (vgl. Mayer, 1998: S.8).
Felber/Budin (Felber/Budin, 1989) unterscheiden nach Ziel der Terminologiear-
beit zwischen einer terminologischen Ist-Erhebung, feststellender Terminologie
und einer Herbeiführung eines terminologischen Soll-Zustandes, festlegender
Terminologiearbeit (vgl. Felber/Budin, 1989: S. 214 ff.).
Zu der feststellenden Terminologiearbeit gehört unter anderem auch die über-
setzungsbezogene Terminologiearbeit aber auch die von Terminologen, Lexi-
kographen oder Sprachdienstleistern betriebene Terminologie. Diese Termino-
logieart braucht trotzdem die Mitwirkung von Fachleuten aus dem
dokumentierten Gebiet, da diese sonst eine Terminologie aus zweiter Hand wä-
re, die sich nur auf Texte stützt und nicht auf Fachwissen.
Die festlegende Terminologie wird in Grundsatzarbeit und Terminologie-
Regelung bzw. –Normung eingeteilt. Die Grundsatzarbeit zielt auf eine einheitli-
che Behandlung der Terminologien. Die Terminologie-Regelung wird von inter-
nationalen oder nationalen Fachorganisationen betrieben. Die ausgearbeiteten
Terminologien werden dann als Empfehlung ausgegeben, können aber später
Theoretischer Rahmen
13
auf einem technischen Gebiet als Norm übernommen werden (Felber/Budin,
1989: S. 214 ff).
Die Unterteilung in deskriptive und normende Terminologiearbeit greifen auch
Arnzt/Picht/Mayer (Arnzt/Picht/Mayer, 2009) auf. Sie verstehen unter deskripti-
ver Terminologiearbeit die Erfassung des bestehenden Sprachzustandes und
bewerten diese als stark übersetzungs- und zielsprachenorientiert
(Arnzt/Picht/Mayer, 2009: S. 216 ff.).
In der normenden Terminologie werden dann Definitionen und Benennungen
festgelegt und so die einheitliche Verwendung der Sprache gesichert.
Normende Terminologie wird aber nicht nur in den Normungsgremien geleistet,
sondern auch in Unternehmen, deren firmeneigene Terminologie in der Praxis
und über den Grenzen des Unternehmens hinaus eine wichtige Rolle spielt
(vgl. Arnzt/Picht/Mayer, 2009: S. 216 ff.). Als Beispiel einer im Unternehmen
betriebenen normenden Terminologie kann man die Terminologiedatenbank
von IBM oder Microsoft nennen.
Die normende Terminologiearbeit setzt aber die deskriptive Bearbeitung voraus,
da der aktuelle Sprachzustand bekannt sein muss.
Bei Arnzt/Picht/Mayer werden als Formen der Terminologiearbeit die punktuelle
und die systematische Terminologiearbeit erwähnt.
Von systematischer Terminologiearbeit spricht man, wenn ein Fachgebiet oder
ein Teilgebiet terminologisch erschöpfend untersucht und dokumentiert wird
und dann in einer Terminologiedatenbank zur Verfügung gestellt wird.
Da heutzutage wirtschaftliche und zeitliche Faktoren im Sprachendienst eine
enorm wichtige Rolle spielen, werden meistens Kompromisslösungen gefunden
und häufig für die Terminologieausarbeitung die punktuelle Untersuchung an-
gewendet. Das heißt, dass Termini gesucht, belegt oder geschaffen werden,
um nur ad hoc terminologische Fragen zu klären (vgl. Bauer, 2010: S. M2-1).
Theoretischer Rahmen
14
So greifen S.E.Wright/ D.Wright (vgl. Wright., 1997: S. 147-160) die
Unterteilung in systematische Terminologiearbeit und ad hoc Terminologiearbeit
auf.
Die Arbeitsschritte bei der ad hoc Terminologiearbeit sind wie folgt: Termini
werden in einzelnen Texten identifiziert, danach werden Einträge erstellt und,
wenn es sich ergibt, die Benennungen mit Kontexten dokumentiert. Sollte die
Zeit ausreichen, werden auch auf dem Text basierende Begriffssysteme erstellt
(vgl. Wright, 1997: S. 150).
Für die systematische Terminologiearbeit werden von Arntz/Picht/Mayer fol-
gende Arbeitsschritte vorgeschlagen:
Organisatorische Vorüberlegungen (Festlegung der Arbeitssprachen,
Wahl des Fachgebiets, Zielsetzung und Zielgruppe, Veröffentlichung von
Daten, Lektüre, Kooperation mit Experten)
Abgrenzung und Aufteilung des Fachgebiets
Beschaffung und Analyse des Dokumentationsmaterials nach Mutter-
sprachenprinzip, Fachkompetenz und Aktualität
Suche nach existierenden Terminologiebeständen
Sammlung der gefundenen Benennungen; Erstellung einer einsprachi-
gen Fachwortliste, dabei Bestimmung der zu bearbeitenden Begriffe
Sammlung von Sekundärinformationen (Benennungen in anderen Spra-
chen, Definitionen, Kontexte usw.)
Erarbeitung der Begriffssysteme (ein Begriffssystem je Sprache)
Bearbeitung des Materials; terminologische Analyse:
o Überprüfung der Äquivalenten
o Abklärung von Synonymen, Abkürzungen usw.
o Ergänzung oder Anpassung der Definitionen
o Benennungsvorschläge (wenn eine Benennung fehlt)
o Dokumentation der Benennungen (Grammatik usw.)
o Graphische Darstellungen, Abbildungen usw.
o Anmerkungen zu Synonymie, Äquivalenz, Gebrauch usw.
Überprüfung (durch Experten) und Endredaktion
Theoretischer Rahmen
15
Bereitstellung für Benutzer (in TVS) (vgl. Schmitz/Kaukonen, 2012)/
(Arnzt/Picht/Mayer, 2009: S. 216 ff.).
Die beschriebenen Arbeitsschritte gelten nach Schmitz (Schmitz/Kaukonen,
2012) sowohl für die deskriptive (beschreibende) wie auch für die präskriptive
(normende) Terminologiearbeit. Im Fall der präskriptiven Terminologiearbeit
werden nach der Überprüfung durch Experten noch bevorzugte, erlaubte sowie
abzulehnende Benennungen festgelegt.
Außerdem unterscheidet man je nach Zeitpunkt der Bearbeitung des terminolo-
gischen Datenbestandes zwischen nachgeschalteter und vorgeschalteter Ter-
minologiearbeit.
Die Erstellung und Konsolidierung des terminologischen Datenbestandes im
Fall der nachgeschalteten Terminologiearbeit erfolgt nach der Erstellung des zu
untersuchenden Textes, während bei der vorgeschalteten Terminologiearbeit
die terminologischen Datenbestände vor der Verwendung festgelegt werden.
(vgl. Bauer, 2010: S. M2-1).
Sowohl für die präskriptive als auch für die deskriptive Terminologiearbeit wird
je nach Untersuchungsgegenstand zwischen thematischer, textbezogener und
punktueller Terminologiearbeit differenziert.
Welche Art oder Methode der Terminologiearbeit in einem Unternehmen oder
einer Institution angewendet wird, hängt immer von der Zielsetzung und dem
erwünschten Umfang der Terminologiearbeit ab. Außerdem bestimmt die
Zielgruppe, für die Terminologie zur Verfügung gestellt wird, auch die Art der
Terminologiearbeit. Eine wichtige Rolle spielen auch die verfügbaren
Ressourcen wie Zeit, Geld, Mitarbeiterverfügbarkeit oder technische
Infrastruktur.
Einsatz von Terminologiearbeit
Das Betreiben von Terminologiearbeit im Unternehmen erleichtert die allgemei-
nen Abläufe in vielen Bereichen wie z. B. in der technischen Dokumentation, für
die Übersetzer oder in der Lokalisierung. Terminologiebestände werden von
vielen Experten in der Produktentwicklung, in der Dokumentation, Kundenbera-
Theoretischer Rahmen
16
tung oder im Marketing verwendet und in verschiedene Tools eingebunden, wie
zum Beispiel maschinelle Übersetzungssysteme, Content Management Syste-
me, Translation Memorys, Lokalisierungstools oder Sprachprüfungstools.
Eine qualitative Terminologiearbeit wirkt sich positiv auf den Übersetzungspro-
zess, die Produkthaftung und Normenkonformität, die Kundenzufriedenheit, das
Produktmanagement, auf die Usability der Produkte usw. aus.
Terminologiearbeit ist zeit- und kostenaufwendig. Aber je mehr Personen oder
Anwendungen die Ergebnisse der Terminologiearbeit nutzen und je früher diese
in den Gesamtprozess der Terminologiearbeit eingebunden werden, desto eher
rechnet sich der Aufwand.
In der technischen Kommunikation steigt der Bedarf an technischer Informa-
tion und Dokumentation. Terminologiedatenbanken dienen als zentrale Wis-
sensplattform für technische Redakteure, wo sie knappe Präsentationen zu ei-
nem Begriff finden, ohne Zeit mit unendlichen Recherchen verbringen zu
müssen. Durch die Festlegung von bevorzugten und unerwünschten Benen-
nungen wird ein korrekter Sprachgebrauch seitens der technischen Redakteure
gewährleistet und dadurch die Normenkonformität und Rechtssicherheit ermög-
licht.
Außerdem verringert die Terminologie den Aufwand für die Qualitätskontrolle
der erstellten Dokumentation.
Wissenschaft und Technik haben in den letzten Jahrzehnten immer mehr an
Bedeutung gewonnen. Daher kommt der fachbezogenen Kommunikation heute
eine entscheidende Bedeutung zu. Die Globalisierung der Märkte erfordert
Kommunikation in der Landsprache, dafür werden auch Fachübersetzungen
angefertigt.
Das Übersetzen eines Fachtextes ist nur dann möglich, wenn man über den
Wortschatz des betreffenden Fachgebietes, d. h. seine Terminologie, verfügt.
Der Übersetzer muss sich deshalb vor dem eigentlichen Übersetzen mit der
Terminologie vertraut machen. Diese Vorarbeit kann sehr viel Zeit in Anspruch
nehmen. Für den Fachübersetzer ist es daher notwendig, sich mit den
Theoretischer Rahmen
17
Grundsätzen der Terminologielehre, den terminologischen Arbeitsmethoden
und den Werkzeugen zur Verwaltung der Terminologie vertraut zu machen.
Eine qualitativ einheitliche Terminologie beschleunigt jedoch den Überset-
zungsprozess, da der Anzahl der Varianten in Texten reduziert werden, der Re-
chercheaufwand sinkt sowie die Verständlichkeit durch Ermittlung von Synony-
men oder Abkürzungen erhöht wird. Außerdem wird die Qualitätskontrolle nach
der Übersetzung weniger aufwendig.
Die Lokalisierung von Software umfasst meistens innovative Fachgebiete und
Themen. Durch eine einheitliche Benennung der Textelemente einer Software-
oberfläche wird eine stimmige Menüführung, Indexierung und dazu passende
Online-Hilfe gewährleistet und beschleunigt dadurch die Einarbeitung sowie die
Nutzung der Software, die Benutzerfreundlichkeit der Software steigt und so
auch die Usability des Produkts (vgl. Schmitz/Kaukonen., 2012).
Terminologie kann auch als ein Marketinginstrument betrachtet werden, da es
durch publizierte Terminologie die Möglichkeit gibt, sich von der Konkurrenz
abzugrenzen und Vorreiter in dem Fachgebiet zu sein.
2.1.2 Gegenstand, Begriff, Benennung
Wie oben erwähnt bezieht sich die klassische Methode der Terminologiearbeit
auf die Terminologielehre von Eugen Wüster (Wüster, 1991). Die
Terminologiearbeit befasst sich mit Begriffen und Benennungen in der
Fachsprache.
Der fachlichen Wortschatz wird nach dem semiotischen Dreieck von Ogden und
Richards in drei Elemente unterteilt: Begriff, Benennung und Gegenstand.
Abbildung 1: Semitoisches Dreieck
Theoretischer Rahmen
18
Die Relationen zwischen Begriff, Benennung und Gegenstand wurden unter
unterschiedlichen Gesichtspunkten von mehreren Wissenschaftlern erweitert
und veranschaulicht.
So geht Wüster eher von einem statischen Sprachkonzept aus und veranschau-
licht die Zusammenhänge in zwei Ebenen: die langue-Ebene repräsentiert die
Welt der Begriffe und die parole-Ebene repräsentiert sowohl die sprachliche
Realität, die gesprochenen Wörter, als auch die außersprachlichen Phänome-
ne.
Abbildung 2: Wüsters Modell (Wüster, 1991)
Der Philosoph Oeser entwickelte in Anlehnung an das Modell von Wüster eine
Veranschaulichung auf vier Ebenen: Die erste Ebene ist eine erschöpfende
Sammlung von Gegenständen innerhalb eines Gebietes, auf der zweiten Ebene
geschieht eine Verdichtung von Merkmalen zu abstrahierten Denkeinheiten,
denen auf der dritten Ebene Denkeinheiten zugeordnet werden. Im vierten Feld
werden die Begriffe in verbaler oder nicht-verbaler Art repräsentiert (vgl.
Arnzt/Picht/Mayer, 2009:S.37 ff).
Abbildung 3: Oesers Modell (Schmitz K.-D., 2011)
Theoretischer Rahmen
19
In der ISO-Norm 704 wird das Konzept von Wüster um ein viertes Element, die
Definition, erweitert. Diese Erweiterung wird in Anlehnung an Suonuuti modifi-
ziert, der begründet, dass Gegenstände in Begriffe abstrahiert werden, die dann
in Bezeichnungen repräsentiert und in Definitionen beschrieben werden (vgl.
Arnzt/Picht/Mayer, 2009: S. 39).
Abbildung 4:ISO-Norm Modell (Schmitz, 2011)
Außerdem wurde von Prof. Dr. Klaus Dirk Schmitz das Modell an die aktuellen
Methoden der Terminologiearbeit angepasst. Anstelle der Beziehung zu der
Definition wird bei Schmitz eine Beziehung zu dem terminologischen Eintrag
gesamt anderen terminologischen Informationen angedeutet (vgl. Schmitz K.-
D., 2011).
Abbildung 5:Schmitz-Modell (Schmitz, 2011)
Theoretischer Rahmen
20
Begriff, Benennung und Gegenstand stehen in Bezug zueinander und werden
in der DIN 2342 wie folgt definiert:
Gegenstand oder Objekt: „beliebiger Ausschnitt aus der wahrnehmbaren oder
vorstellbaren Welt“ (DIN 2342, 2011).
In der Norm wird angemerkt, dass auch Geschehnisse, Sachverhalte und Be-
griffe Gegenstände sein können.
Benennung/Terminus/Fachausdruck: „sprachliche Bezeichnung eines Allge-
meinbegriffs aus einem Fachgebiet“ (DIN 2342, 2011).
Die Verbindung zwischen Benennung und Gegenstand ist eine Abstraktion,
eine Verallgemeinerung, deswegen sind Benennungen sprachunabhängig,
werden aber von dem gesellschaftlichen und kulturellen Hintergrund einer
Sprachgemeinschaft beeinflusst.
Ferner wird unterschieden zwischen Einwortbenennungen (z. B. "Dieselmotor")
und Mehrwortbenennungen (z. B. "Drehmomentwandler mit Wandlerüberbrü-
ckung").
Begriff: „Denkeinheit, die aus einer Menge von Gegenständen unter Ermittlung
der diesen Gegenständen gemeinsamen Eigenschaften mittels Abstraktion ge-
bildet wird.“ (DIN 2342, 2011).
Darüber hinaus wird in der DIN 2342 zwischen "Allgemeinbegriff" und
"Individualbegriff" unterschieden:
Individualbegriff: „Begriff, der ausgehend von einem einzelnen Gegenstand
durch Abstraktion gebildet wird.“ (DIN 2342, 2011).
Die Individualbegriffe werden normalerweise mit Namen bezeichnet und für den
einzelnen repräsentierten Gegenstand kann eine Position in Raum und Zeit an-
gegeben werden. Beispiel: "Eiffelturm"
Allgemeinbegriff: „Begriff, der ausgehend von mehr als einem Gegenstand
durch Abstraktion gebildet wird.“ (DIN 2342, 2011).
Beispiel: Turm
Einen Turm, den man nie zuvor gesehen hat, erkennt man anhand bestimmter
Merkmale, die alle Türme gemeinsam haben. Der Begriff "Turm" ist also eine
Abstraktion der bisherigen Erfahrungen mit Türmen.
Für die Einordnung von Begriffen in einem Begriffssystem spielen der Begriffs-
inhalt und –umfang eine entscheidende Rolle. Damit man den Begriffsinhalt und
Theoretischer Rahmen
21
–umfang bestimmen kann, muss man die unterschiedlichen Merkmale eines
Begriffes erkennen.
Die DIN 2342 definiert Merkmal als eine "durch Abstraktion gewonnene Denk-
einheit, die eine Eigenschaft von Gegenständen wiedergibt, welche zur Be-
griffsbildung und -abgrenzung dient."(DIN 2342, 2011).
Die Gesamtheit der Merkmale, die ein Begriff hat - also sein Begriffsinhalt o-
der seine Intention -, entspricht dem Wissen über diesen Begriff. Die DIN 2330
unterteilt Merkmale in Beschaffenheitsmerkmale und Relationsmerkmale. Wäh-
rend Beschaffenheitsmerkmale Eigenschaften der unter einen Begriff fallenden
Gegenstände sind (so z. B. rot, quaderförmig, 10m hoch usw.), geben Relati-
onsmerkmale die Beziehung zwischen zwei Begriffen an, beispielsweise hin-
sichtlich Herkunft, Gebrauch, Vergleich und Bewertung. Beispiele: Hersteller
Siemens (Herkunftsmerkmal), leicht handhabbar (Gebrauchsmerkmal), klein
(Vergleichsmerkmal), teuer (Bewertungsmerkmal) (vgl. DIN 2330, 2011).
Die DIN 2342 unterscheidet zwischen dem wesentlichen Merkmal, das zum
Bestimmen eines Begriffs unverzichtbar ist und dem abgrenzenden Merkmal,
das zur Abgrenzung eines Begriffs von benachbarten Begriffen verwendet wird
(vgl. DIN 2342, 2011).
Der Begriffsumfang ist die Gesamtheit der einem Begriff "auf derselben Hie-
rarchiestufe untergeordneten Begriffe" (DIN 2342, 2011). Der Begriffsumfang
wird durch den Begriffsinhalt bestimmt: Je größer der Begriffsinhalt, also je
mehr Merkmale einen Begriff einschränken, desto geringer ist der Begriffsum-
fang, weil die Anzahl der Begriffe, die untergeordnet werden können, mit jedem
Merkmal abnimmt (vgl. DIN 2330, 2011). In der DIN 2342 wird außerdem an-
gemerkt: "Jeder Begriff auf dieser Hierarchiestufe ist dadurch mit seinem eige-
nen Begriffsumfang im Begriffsumfang des betrachteten Ausgangsbegriffs ent-
halten. Es ist zwischen dem Begriffsumfang und der Gesamtheit der
Unterbegriffe auf allen Hierarchiestufen zu unterscheiden" (DIN 2342, 2011).
2.1.3 Definitionen
Definitionen dienen dazu, einen möglichst eindeutigen Zusammenhang zwi-
schen Begriff und Benennung herzustellen. Sie grenzen einen Begriff ab, indem
Theoretischer Rahmen
22
er zu anderen in Beziehung in einem Begriffssystem gesetzt wird (vgl. DIN
2330, 2011).
Eine Definition ist „eine Begriffsbestimmung mit sprachlichen Mitteln“ (DIN
2342, 2011).
Für die Terminologiearbeit sind Definitionen besonders wichtig: Begriffe stehen
im Mittelpunkt und müssen mit sprachlichen Mitteln beschrieben bzw. einge-
grenzt werden.
Eine Definition hat zwei Komponenten: Definiendum (was wird definiert) und
Definiens (wie wird etwas definiert).Das Definiendum entspricht dem Begriff, der
definiert werden soll und wird meist durch eine den Begriff repräsentierende
Benennung ausgedrückt. Das Definiens stellt die sprachliche Beschreibung des
Begriffs dar und erläutert das Wesentliche des Begriffs (Schmitz, 2011).
Zu den häufigsten Definitionsarten zählen: die Inhaltsdefinition, die Umfangsde-
finition und die Bestandsdefinition.
Inhaltsdefinition (intensionale Definition)
„Definition, die von dem Oberbegriff ausgeht und die einschränkenden Merkma-
le angibt, die den zu definierenden Begriff von anderen Begriffen derselben
Abstraktionsstufe unterscheiden“ (DIN 2342, 2011).
Es werden Merkmale genannt, die den Begriff kennzeichnen. Häufig werden
ausgehend von dem Oberbegriff die zusätzlichen charakteristischen Merkmale
aufgeführt.
Die Inhaltsdefinition ist folgendermaßen aufgebaut: Benennung = Oberbegriff +
einschränkende Merkmale
Beispiel: „Eine Glühlampe ist eine Lampe, bei der feste Stoffe durch elektri-
schen Strom so hoch erhitzt werden, dass sie Licht aussenden.“
Die Inhaltsdefinition ist die wichtigste für die Terminologiearbeit, da dadurch die
Einordnung in das Begriffssystem und die Abgrenzung von anderen Begriffen
ermöglicht wird (Arnzt/Picht/Mayer, 2009: S. 62 ff).
Theoretischer Rahmen
23
Umfangsdefinition (extensionale Definition):
„Definition, bei der alle Unterbegriffe eines Begriffes aufgezählt werden, die
innerhalb des betreffenden Begriffssystems auf derselben Hierarchiestufe ste-
hen.“ (vgl. DIN 2342, 2011). Es werden alle unter einen Begriff fallenden Unter-
begriffe angegeben.
Beispiel: Bezeichnungen sind Benennungen, Ideogramme, Nummern und Nota-
tionen (DIN 2330, 2011).
Bestandsdefinition
„Definition, bei der alle auf derselben Hierarchiestufe stehenden Teilbegriffe
des Begriffs aufgezählt werden“ (vgl. DIN 2342,2011).
Es werden alle unter einen Begriff fallenden Gegenstände angegeben.
Beispiel: „Die Planeten des Sonnensystems sind Merkur, Venus, Erde, Mars,
Jupiter, Saturn, Uranus, Neptun.“ (DIN 2330, 2011).
Obwohl die Bestandsdefinitionen leichter verständlich sind, sind sie aber nur
zweckmäßig, wenn der Begriffsumfang eines Begriffs begrenzt ist.
Darüber hinaus werden in der Literatur folgende Definitionsarten erwähnt:
Kontextdefinition
Ein nicht ganz sinnloser Satz, der die Benennung enthält und etwas über den
Begriff aussagt (vgl. Schmitz, 2011).
Diese Definitionsart ist aber für die Terminologiearbeit nicht so relevant, da es
in einer Terminologiedatenbank eher geeignet ist, den Kontext in einer eigenen
Datenkategorie zu erfassen. Der Kontext stellt die sprachliche Verwendung des
Terminus dar, während die Definition über die Bedeutung des Terminus
informiert. Deswegen ist es sinnvoll, in einem terminologischen Eintrag eine
Inhaltsdefintion zu erfassen und den Kontext als extra Information anzugeben.
Nominaldefinition
In diesem Fall wird ein weniger bekanntes Wort durch ein besser verständliches
ersetzt. Eine solche Definition hat aber meistens keinen Mehrwert und liefert
keine konkreten Informationen über die Sache selbst.
Theoretischer Rahmen
24
Beispiel: „Opazität = Lichtundurchlässigkeit“ (Arnzt/Picht/Mayer, 2009: S. 64 ff.).
Fehlerhafte Definitionen
Da die Definitionen in der Terminologiearbeit eine sehr wichtige Rolle spielen
und ein korrektes Definieren nicht so einfach ist, werden in der DIN 2330 (DIN
2330, 2011) Empfehlungen gemacht, welche Fehler bei der Definitionenbildung
vermieden werden sollen.
Zu enge Definition
Durch die Nennung zu sehr einschränkender Angaben kann eine Definition zu
eng werden. So kann man eine oder mehrere Gegenstände ausschließen, die
auch unter den zu definierenden Begriff fallen.
Beispiel: „Medizinflaschen sind Flaschen, die aus Glas hergestellt sind und zur
Aufbewahrung von vorwiegend flüssigen Medikamenten bestimmt sind.“ (vgl.
Arnzt/Picht/Mayer, 2009: S. 71). In diesem Fall werden z. B. die Plastikflaschen
ausgeschlossen, die auch zum Aufbewahren von Medikamenten verwendet
werden.
Zu weite Definition
Eine Definition wird dann zu weit, wenn bestimmte Angaben weggelassen wer-
den und dadurch andere Gegenstände mitumfasst werden, die die gleichen
Merkmale aufweisen.
Beispiel: „Kupfer ist ein chemisches Element, das zur Gruppe der Metalle ge-
hört.“ Diese Definition ist zu weit, da auch andere Metalle unter diese Gruppe
fallen, also die Definitionsgleichung nicht aufgeht (vgl. Arnzt/Picht/Mayer, 2009:
S. 70).
Zirkeldefinition
Eine Zirkeldefinition kommt dann zustande, wenn ein Begriff durch ein Synonym
oder durch einen Begriff definiert wird, der wiederrum mit Hilfe des Ausgangs-
begriffs definiert wird (vgl. DIN 2330, 2011).
Beispiel: „Ein Vertrag ist in der Regel ein zweiseitiger Kontrakt, bei dem durch
mindestens zwei überstimmende Willenserklärungen ein rechtlicher Erfolg er-
zielt werden soll“. Diese Definition ist fehlerhaft, da Vertrag und Kontrakt syno-
nym sind. Besser ist wenn man Kontrakt durch den Oberbegriff „Rechtsge-
schäft“ ersetzt. (vgl. Arnzt/Picht/Mayer, 2009: S. 69 ff.)
Theoretischer Rahmen
25
Negativdefinition
Bei der Formulierung von Definitionen sollen nicht die Merkmale angegeben
werden, die ein Begriff nicht hat. Negative Merkmale können nur dann verwen-
det werden, wenn der Begriff selbst negativ ist.
Beispiel: „Ein Anhänger ist ein Fahrzeug ohne eigenen Antrieb.“
Negative Definitionen dürfen nur bei „negativen Begriffen“ verwendet werden,
Beispiel: Ein unflektierbares Wort ist ein Wort, das seine Gestalt nicht verän-
dert.“ (vgl. DIN 2330, 2011).
In der DIN 2330 werden Grundsätze für das Erstellen von Definitionen darge-
stellt. In erster Linie wird für die Terminologiearbeit die Inhaltsdefinition empfoh-
len, da sie die größte definitorische Leistungsfähigkeit hat (vgl. 2330, 2011).
Sehr wichtig für die Erstellung von Definitionen ist auch die Auswahl der
Merkmale. Die ausgewählten Merkmale müssen zur Abgrenzung des Begriffs
zu anderen Begriffen beitragen.
Die einheitliche Verwendung von Begriffen und Benennungen in einer De-
finition ist auch ein wichtiger Punkt. Für die Definition sollen, soweit möglich,
Benennungen, die im gleichen System vorkommen genutzt werden und es soll
für denselben Begriff immer die gleiche Benennung verwendet werden.
Die Definition soll sich an Zweck und Geltungsbereich orientieren. Wenn die
Zielgruppe, für die die Definition verfasst wurde, nicht bekannt ist, könnte es für
das Verständnis der Definition notwendig sein, den Geltungsbereich anzugeben.
Die Fachbezogenheit der Definitionen ist auch sehr wichtig. Die in eine Defi-
nition aufzunehmenden Merkmale müssen für das jeweilige Fachgebiet wesent-
lich sein. Die ausgewählten Merkmale müssen die Einordnung in das entspre-
chende Begriffssystem ermöglichen.
Die Systembezogenheit von Definitionen spielt auch eine wichtige Rolle, da
die Position eines Begriffs in einem Begriffssystem durch die Definition eindeu-
tig festgelegt werden muss. So müssen in einer Inhaltsdefinition der Oberbegriff
und die einschränkende Merkmale angegeben werden.
Eine Umfangsdefinition muss die Systembezogenheit durch die Angabe der
Unterbegriffe zum Ausdruck bringen. Eine Bestandsdefinition muss die Sys-
tembezogenheit durch die Angabe der Teilbegriffe zum Ausdruck bringen.
Theoretischer Rahmen
26
Definitionen sollen so kurz wie möglich und so lang wie nötig sein. Beim Kürzen
sollte man darauf achten, dass nicht wesentliche Merkmale verloren gehen.
Eine Definition muss knapp und genau sein, also nur die Angaben enthalten,
die zur Beschreibung und Festlegung eines Begriffs in einem System nötig sind.
Außerdem müssen Definitionen regelmäßig aktualisiert werden, da sich das
menschliche Wissen ständig in Entwicklung befindet (vgl. DIN 2330, 2011/
Arnzt/Picht/Mayer, 2009: S. 68 ff.).
Bei der Erstellung von Definitionen sollte Folgendes beachtet werden: Im Ideal-
fall sollen existierende Definitionen (mit Angabe der Quelle) übernommen wer-
den (vor allem genormte Definitionen, z. B. nach DIN oder ISO). Definitionen
die selbst erstellt werden, sollten durch einen Experten des jeweiligen Fachge-
biets überprüft werden.
Für die Normung gelten zusätzliche Regeln für das Schreiben von Definitionen:
Sowohl die Benennung als auch die Definition sollen im Singular stehen, wenn
der Begriff selbst nicht im Plural ist. Die Definition soll nicht mit „Be-
griff/Benennung, der/die... bedeutet/bezeichnet/benutzt wird“ beginnen oder „...
ist...“ enthalten. Die Definition soll nicht (ohne besonderen Grund) mit einem
Artikel beginnen. Die Definition (bei Nicht-Substantiven) soll keinen Großbuch-
staben am Satzanfang und keinen Satzendepunkt haben (vgl. Schmitz/
Kaukonen, 2012).
2.2 Terminologiedatenbank und Terminologieverwaltungssys-
tem
Zur Dokumentation von Terminologie spielt die Terminologiedatenbank eine
sehr wichtige Rolle, unabhängig davon, ob für die technische Dokumentation,
die Übersetzung, Softwarelokalisierung oder Produktion.
Eine Terminologiedatenbank ist laut DIN 2342 die „Einheit aus terminologischer
Datenbasis und Terminologieverwaltungssystem“ (vgl. DIN 2342, 2011).
Die terminologische Datenbasis besteht aus dem terminologischen Datenbe-
stand in elektronischer Form. Die terminologischen Daten in einer Terminolo-
giedatenbank werden dann mit einem Terminologieverwaltungssystem, auch
Terminologieverwaltungsprogramm oder Terminologiemanagementssystem
genannt, verwaltet.
Theoretischer Rahmen
27
Solche Systeme dienen dazu, terminologische Daten zu erstellen, zu bearbei-
ten, zu pflegen, zu speichern und den Nutzern zur Verfügung zu stellen.
Für die Verwaltung von terminologischen Daten werden unterschiedliche Werk-
zeuge verwendet.
Unter diesen befinden sich auch die klassischen Textverarbeitungssysteme wie
MS Word oder Kalkulationssysteme wie MS Excel. Diese Systeme sind eine
günstige Alternative zu Terminologieverwaltungssystemen, aber in der Regel zu
langsam und ohne die Funktionalitäten einer Datenbank, wie z. B. Einbindung
in ein Translation Memory.
Außerdem werden in der Terminologieverwaltung auch universelle Datenbank-
systeme wie MS Access verwendet. Sie ermöglichen einen schnellen Zugriff,
haben aber meistens eine feste Feld- und Satzlänge, komplexe Zugangsbefeh-
le und schwierige Textsystemkommunikation (vgl. Schmitz/Kaukonen, 2012).
Mit der Zeit wurde deutlich, dass es für die Verwaltung von terminologischen
Daten spezielle Verwaltungssysteme nötig werden. So haben viele Institutionen
oder Konzerne ihre eigenen Systeme entwickelt. Später entwickelten auch
Unternehmen unter Beratung von Experten, die sich mit der Terminologielehre
oder –arbeit auseinandersetzten, spezielle Terminologieverwaltungssysteme.
Manche Systeme wurden zusammen mit den Translation Memory Tools
entwickelt und blieben eine Komponente in einem integrierten System, wie es z.
B. bei across der Fall ist. Manche Systeme sind eigenständige Systeme, die
nicht mit anderen Werkzeugen zusammen benutzt werden und andere Systeme
können entweder autonom oder als Teil eines integrierten System benutzt
werden z. B. TermStar oder MultiTerm.
Die speziellen Terminologieverwaltungssysteme können auf der einen Seite
eine definierte Eintragsstruktur haben. In diesem Fall lassen sich die
Datenkategorien nicht oder nur geringfügig verändern. Diese Systeme sind
entweder einfach strukturiert und sprachenpaarorientiert oder komplex
strukturiert und mehrsprachig. Die Möglichkeit, alle Benennungen gleichartig zu
dokumentieren, ist nicht in allen Systemen möglich.
Auf der anderen Seite gibt es Terminologieverwaltungssysteme mit
strukturierbarer Eintragsstruktur. In diesem Fall kann der
Terminologieverantwortliche die Datenkategorien selbst anlegen und an die
Theoretischer Rahmen
28
Bedürfnisse des Unternehmens anpassen. In diesen Systemen können
Einträge benennungsautonom und begriffsorientiert gestaltet werden.
Diese Terminologieverwaltungssysteme können für einzelne Anwender oder für
den Einsatz in einem Netzwerk vorgesehen sein. Es gibt aber auch Online-
Terminologieverwaltungsplattformen.
Für die Leistungsfähigkeit und Benutzerfreundlichkeit eines
Terminologieverwaltungssystems spielen mehrere Faktoren eine wichtige Rolle.
In einem Unternehmen ist es wichtig, dass die Dokumentation der Einträge
nach den Bedürfnissen des Unternehmens für alle Abteilungen angepasst wird.
So sollten in einem TVS die notwendigen Datenkategorien realisierbar oder
vorhanden sein.
Sehr wichtig ist auch die Anzahl der Sprachen, die in einem TVS verwaltet
werden können.
Ein weiterer wichtiger Aspekt ist das Rechtesystem, das besagt wer einen
Eintrag erfassen darf oder nicht.
Die Konsistenzkontrolle ist in einem TVS auch sehr wichtig, damit keine
redundanten Daten entstehen. Außerdem sind die Suche- und
Filtermöglichkeiten sehr wichtig. Auch die Kommunikation mit anderen
Systemen, wie Translation Memory Tools oder Textbearbeitungsprogrammen,
ist eine sehr wichtige Anforderung an ein TVS.
Die Bereitstellung von Daten sowie Export- und Import-Funktionalitäten und
Formate sind für die Verwaltung von terminologischen Daten auch von sehr
großer Bedeutung.
2.2.1 Terminologischer Eintrag
Der terminologische Eintrag wird in der DIN 2342 als „Teil eines terminologi-
schen Datenbestands, der terminologische Daten zu einem Begriff enthält“ de-
finiert (DIN 2342, 2011).
Ein terminologischer Eintrag enthält Datenelemente über den Begriff und
dessen Benennungen sowie Zusatzdaten für die Verwaltung und Pflege der
erfassten terminologischen Informationen.
In einem terminologischen Eintrag können Daten zu einem Begriff entweder in
einer Sprache oder in mehreren Sprachen erfasst werden. So wird von
Theoretischer Rahmen
29
Begriffsorientierung eines terminologischen Eintrags gesprochen, wenn alle
äquivalenten Benennungen in mehreren Sprachen unter einem einzigen Eintrag
zu finden sind.
Sehr wichtig ist, dass sich der terminologische Eintrag an die Bedürfnisse der
Nutzer anpassen lässt. So ist es von wesentlicher Bedeutung, dass die Struktur
des terminologischen Eintrags frei definierbar ist, dass die zu bearbeiteten
Sprachen nicht limitiert sind und dass Datenkategorien in einem
terminologischen Eintrag einheitlich verwendet werden sollen, was meistens
durch Picklisten erreicht werden kann.
Der Umfang der terminologischen Daten in einem Eintrag muss auch nach der
Zielgruppe angepasst werden, so sind z. B. das Fachgebiet oder eine
Abbildung für Ingenieure sehr wichtig, während für Sprachlehrende vielleicht
auch die grammatikalischen Angaben zu einer Benennung relevant sind.
Sehr wichtig für den Erfolg der Terminologiearbeit in einem Unternehmen ist die
Akzeptanz der Datenbank sowie ihre Verwendbarkeit für vielfältige
Nutzergruppen. Das kann aber nur erreicht werden, wenn in den
terminologischen Einträgen relevante Daten für jede Nutzergruppe erfasst
werden. Es gilt die Theorie, je mehr Daten die Einträge erhalten, desto größer
ist der Informationswert der Datenbank. Aber auch hier muss darauf geachtet
werden, dass nicht zu viele Daten die Abfrage der Datenbank und die
Erarbeitung von Einträgen erschweren.
Daher ist es sehr wichtig, dass passende Datenkategorien für den
terminologischen Eintrag ausgewählt werden und die Daten nach
terminologischen Prinzipien modelliert werden (KÜDES, 2002: S. 27 ff.).
2.2.2 Datenkategorien
Ein Eintrag in einer Terminologiedatenbank besteht aus Datenkategorien mit
terminologischen und verwaltungstechnischen Informationen.
Eine terminologische Datenkategorie ist die kleinste organisatorische Einheit
einer terminologischen Datensammlung, die nur eine Art von Informationen
enthalten darf. Diese Informationen werden als Datenelemente bezeichnet und
in der ISO 12620 als „result of the specification of a given data
field“ (Schmitz/Straub, 2010: S.37 ff.).
Theoretischer Rahmen
30
Die Auswahl von Datenkategorien sollte auf der Basis der ISO 12620 (Compu-
ter applications in terminology-Data Categories) erfolgen. Sie besteht aus ei-
nem Verzeichnis von mehr als 200 Datenkategorien für terminologische Daten-
bestände.
In der ISO 12620 werden die Datenkategorien in offene (open data categories),
geschlossene (closed data categories) und einfache oder erlaubte Datenkate-
gorien eingeteilt. Die Inhalte der offenen Datenkategorien sind frei formulierbar.
Diese können z. B. die Benennung, einen Kontext oder eine Anmerkung bein-
halten. Die geschlossenen Datenkategorien bestehen meistens aus vorher
festgelegten Werten, die in den meisten Fällen in Picklisten eingeordnet werden.
Die einfachen Datenkategorien sind Werte der geschlossenen Datenkategorien,
die mit „ja“ oder „nein“ wählbar sind.
In Arnzt/Picht/Mayer wird eine allgemeine Unterscheidung der Datenkategorien
in benennungsbezogenen, begriffsbezogenen und verwaltungsbezogenen
Datenkategorien, beschrieben (vgl. Arnzt/Picht/Mayer, 2009: S. 231 ff.).
In Schmitz/Straub wird zwischen Datenkategorien auf Eintrags-/Begriffsebene,
Sprach-, Benennungs- und Wortebene unterschieden (vgl. Schmitz/Straub,
2010: S. 37 ff.). Administrative Informationen können dann auf allen Ebenen
verwaltet werden. Schmitz erwähnt auch die speziellen Datenkategorien wie z.
B. strukturelle Elemente (Sprache,Benennung) oder „shared resources“ wie z. B.
der bibliographische Eintrag (Schmitz, 2011).
Außerdem wird in der ISO (ISO 26162, 2012) nach Eintragsart der
Datenkategorien zwischen „mandatory, optional, automatic, and default data
categories“ unterschieden.
Werden Datenkategorien wie z. B. Benennung oder Fachgebiet als
obligatorisch festgelegt, so kann ein Nutzer den terminologischen Eintrag ohne
Angabe dieser Datenkategorien nicht speichern.
Es ist aber nicht immer sinnvoll, komplexere Datenkategorien, wie Kontext oder
Definition als obligatorisch festzulegen, da die Recherche und Absprache mit
den Experten viel Zeit im Anspruch nehmen können und deswegen nicht
immer beim Anlegen eines Eintrags sofort verfügbar sind.
Manche Verwaltungsinformationen, wie z. B. Eintragsnummer,
Änderungsdatum oder Verfasser werden automatisch vom System vergeben.
Trotzdem werden diese Datenkategorien in den meisten TVS nur auf der
Theoretischer Rahmen
31
Begriffsebene automatisch eingefügt, obwohl diese auch auf der
Benennungsebene nötig wären.
In manchen TVS gibt es die Möglichkeit, Standardwerte für Datenkategorien
festzulegen. Diese Funktion ist von Bedeutung, wenn z. B. Terminologie für ein
bestimmtes Projekt erstellt wird oder wenn in einer Datenbank die Mehrheit der
Einträge Substantive sind.
In manchen TVS können Datenkategorien mit unterschiedlichen Zugriffsrechten
versehen werden. So wird in der ISO 26162 zwischen „read-only, read-write,
and hidden data categories“ unterschieden.
Diese Einschränkungen werden entweder über das Rechte-/Rollensystem oder
direkt in der Struktur der Datenbank festgelegt. So wird z. B. für einen
technischen Redakteur die Datenkategorie Status eine read-only Kategorie sein
während Kontext oder Definition eine read-write Kategorie wird, damit der
technische Redakteur auch Vorschläge für Definitionen oder Kontexte machen
kann.
Vor der Definition und Auswahl der Datenkategorien muss genau festgelegt
werden, welche terminologischen und administrativen Informationen in der Da-
tenbank verwaltet werden, wer die Nutzer und wer die Verwalter der Terminolo-
giedatenbank sind.
Ein einfaches Erarbeiten, Pflegen, Auswerten und Filtern von Daten wird auch
durch möglich fein definierte Datenkategorien erzielt.
Die definierten Datenkategorien werden dann, soweit das TVS dies erlaubt, in
einer bestimmten Reihenfolge angeordnet. Für die Verwaltung terminologischer
Einträge haben sich mehrere sinnvolle Ebenen herauskristallisiert: Eintrags-
bzw. Begriffsebene, Sprachebene, Benennungsebene und Wortebene
(Schmitz/Straub, 2010: S. 37 ff.).
So wird in ISO 16642 ein Metamodell für die Verwaltung terminologischer
Einträge vorgeschlagen. Das Modell sieht wie folgt aus:
Theoretischer Rahmen
32
Abbildung 6: terminologisches Metamodell ISO 16642
Ordnung der Datenkategorien
Eine der wichtigsten Eigenschaften in einem terminologischen Eintrag ist die
Begriffsorientierung. In einem terminologischen Eintrag wird ein Begriff meis-
tens mehrsprachig dokumentiert. Deswegen werden auf Eintrags- oder Be-
griffsebene eine Vielzahl von Datenkategorien, die sich auf den Begriff bezie-
hen, aber die sprachenunabhängig sind, wie z. B. Anlage- oder
Änderungsdatum, Verfasser, eingefügt. Diese Datenkategorien und eine fort-
laufende Eintragsnummer werden in den meisten TVS automatisch zugewie-
sen. Werden die Begriffe in einem Begriffssystem mit einer eindeutigen Notati-
on verwaltet, so wird zur Einordnung des Begriffs im entsprechenden
Begriffssystem die Datenkategorie Notation auf Begriffsebene erfasst.
Eine sinnvolle Datenkategorie auf Eintragsebene ist das Fachgebiet, in dem
der Begriff einzuordnen ist. Das Fachgebiet ist eine sehr wichtige Filterkategorie
z. B. beim Export einer Terminologie eines bestimmten Teilgebietes. Die Ein-
ordnung in Teilgebiete erfolgt entweder gemäß einer firmeninternen Einteilung
oder gemäß einer normierten Fachgebietsklassifikation.
Theoretischer Rahmen
33
Eine graphische Darstellung eines Begriffs ist auch auf der Eintragsebene ein-
zufügen, da sie vor allem in den technischen Gebieten zu einer besseren Ver-
ständlichkeit beiträgt. Sind aber die Abbildungen kulturabhängig, so müssen
diese auf die Sprachebene unter der passenden Sprache erfasst werden.
Die Definition ist eine der wichtigsten Datenkategorien in einem terminologi-
schen Eintrag. Die Definition beschreibt einen Begriff mit sprachlichen Mitteln,
deswegen müsste sie eigentlich auf Eintragsebene platziert werden. Aber da
heutzutage meistens nur mehrsprachige Terminologiedatenbanken verwaltet
werden, werden die Definitionen dementsprechend in mehreren Sprachen er-
fasst und, wenn dies das TVS erlaubt, auf die Sprachebene aufgenommen. Gibt
es in einem TVS keine Sprachebene, so wird die Definition auf Benennungs-
ebene angesiedelt. Gibt es in einer Sprache mehrere Benennungen zu einem
Begriff, so erweist sich diese Vorgehensweise als ungünstig, da alle Benennun-
gen gleich dokumentiert werden müssen und keine doppelten Definitionen er-
laubt sind.
Beim Aufbau einer Datenbank können auch andere Datenkategorien auf Ein-
trags- bzw. Begriffsebene hinzugefügt werden, wie z. B. Kunde oder Projekt,
wenn diese Angaben sich auf den gesamten Begriff beziehen.
Auf der Sprachebene werden alle Benennungen zu einem Begriff sowie andere
sprachspezifische Informationen verwaltet. Wie bereits erwähnt, ist es sinnvoll,
Definitionen auf der Sprachebene zu verwalten, wenn diese in mehreren Spra-
chen erfasst werden müssen. Die Definitionen müssen mit Quellen belegt wer-
den, die entweder in Form von vollständigen Literaturangaben oder als Quer-
verweis zu einer „shared resource“, wie z. B. einen bibliografischen Eintrag
gestaltet werden. Sind die grafischen Darstellungen eines Begriffes kulturab-
hängig, so können diese auch auf der Sprachebene eingefügt werden.
Auf der Benennungsebene werden Informationen zu allen Benennungen eines
Begriffs verwaltet. Die Benennung ist meistens der Ausgangspunkt einer termi-
nologischen Recherche und deswegen eine sehr wichtige Datenkategorie in
einem terminologischen Eintrag. So gilt die Benennung in einer Terminologieda-
tenbank als obligatorische Datenkategorie.
Theoretischer Rahmen
34
Die Dokumentation einer Benennung muss nach dem Prinzip der Benennungs-
autonomie erfolgen, d. h. alle Benennungen zu einem Begriff sollen als auto-
nome Blöcke von Datenkategorien verwaltet und mit allen notwendigen Daten-
kategorien dokumentiert werden können (ohne Bevorzugung einer bestimmten
Benennung).
Zu den Datenkategorien auf Benennungsebene zählen die Quelle der Benen-
nung, Kontext mit der entsprechenden Quelle; administrative Informationen wie
„Angelegt von“, „Geändert von“; Qualitätsstatus wie „freigegeben“, „abgelehnt“,
“veraltet“; Regionalcodes wie EN-UK, EN-US, Benennungstyp wie Vollform,
Kurzform, Abkürzung, Sprachebene wie umgangssprachlich, genormt.
Da Benennungen auch aus mehreren Wörtern bestehen können, ist es sinnvoll
in einem terminologischen Eintrag auch eine Wortebene einzubeziehen.
Auf Wortebene werden lexikalische und grammatikalische Angaben zu einzel-
nen Wörtern einer Benennung verwaltet. In der Praxis wird die Wortebene
meistens nicht implementiert und die wortbezogenen Informationen werden auf
der Benennungsebene verwaltet. Vor allem in den romanischen Sprachen, wo
Mehrwortbenennungen sehr verbreitet sind, ist eine Wortebene sehr sinnvoll
einzusetzen. Mögliche Datenkategorien auf der Wortebene sind Wortklasse,
Genus oder Numerus.
Für die Modellierung der terminologischen Einträge wurden in der Terminolo-
giearbeit Prinzipien festgelegt.
2.2.3 Grundprinzipien der Modellierung terminologischer Einträge
Bei der Konzeption und Einrichtung einer Terminologiedatenbank sollten die
Datenkategorien und die Modellierung des terminologischen Eintrags sehr sorg-
fältig geplant werden. Diese Überlegungen zur Konzeption einer Datenbank
müssen nicht abhängig von einem System gemacht werden. Jedoch ist in den
meisten Fällen festzustellen, dass die Art des TVS Auswirkungen auf die Aus-
wahl der Datenkategorien und auf die Modellierung der terminologischen Ein-
träge haben kann. Wenn man eine Lösung zur Terminologieverwaltung konzi-
Theoretischer Rahmen
35
piert und einrichtet, müssen aber vor allem die Prinzipien der Begriffsorientie-
rung und der Benennungsautonomie befolgt werden.
Nach dem Prinzip der Begriffsorientierung enthält ein terminologischer Ein-
trag alle Informationen zu einem Begriff, einschließlich aller Benennungen in
allen Sprachen mit ihren begriffsbezogenen Informationen (Abbildung 7).
Abbildung 7: Begriffsorientierung (Schmitz, 2012)
Unter Benennungsautonomie versteht man, dass alle Benennungen zu einem
Begriff als autonome Blöcke von Datenkategorien verwaltet und mit allen not-
wendigen Datenkategorien dokumentiert werden müssen, ohne die Bevorzu-
gung einer Benennung. Daher ist es wichtig, dass es in einem TVS keine Ein-
schränkungen in der Anzahl von Benennungen gibt.
Außerdem müssen bei der Erstellung von terminologischen Einträgen auch die
Prinzipien der Elementarität und Granularität der Datenkategorien beachtet
werden.
Nach dem Prinzip der Elementarität, darf jede Datenkategorie nur einen, der
Definition der Datenkategorie entsprechenden Wert enthalten. So darf z. B. die
Definitionsquelle nicht im Definitionsfeld erfasst werden.
Unter Granularität versteht man, dass Datenkategorien so fein wie möglich
definiert werden müssen. So dürfen z. B. Genus und Numerus nicht unter der
Theoretischer Rahmen
36
allgemeine Datenkategorie Grammatik erfasst werden (vgl. Schmitz/Straub,
2010: 36 ff./ Bauer, 2010: S. M2-6)
2.2.4 Bereitstellung von Daten
Die terminologischen Daten müssen einem möglichst weiten Interessentenkreis
zur Verfügung gestellt werden, damit alle von der Terminologiearbeit profitieren
können, d. h. sie werden entweder über eine Dantebank oder ein internes In-
formationsnetz verbreitet.
Neben den wichtigen terminologischen Grundsätzen der Datenmodellierung
von terminologischen Einträgen sollten die TVS auch über die unten beschrie-
benen zentralen Funktionen verfügen.
Die Datenerfassung wird vereinfacht, wenn die TVS über rollenabhängige Ein-
gabestrukturen verfügen, wie z. B. Eingabemodelle.
Die Daten in einem TVS sollten immer auf dem neuesten Stand sein, das heißt
die terminologischen Daten müssen ständig gepflegt, aktualisiert und verein-
heitlicht werden. Dafür müssen verschiedene Abteilungen an der Recherche
beteiligt werden, was eine kollaborative Terminologiearbeit voraussetzt. Dafür
eignen sich vor allem webbasierte Terminologieverwaltungssysteme, in denen
die Nutzer leicht über den Internet-Browser auf die Bestände auf einem zentra-
len Server zugreifen und diese kommentieren, aktualisieren oder pflegen kön-
nen.
Zwischen den einzelnen Einträgen sollte die Erstellung von Querverweisen und
Verweisen auf Ressourcen im Intranet/Internet ermöglicht werden.
Für die Bereitstellung der terminologischen Daten spielen auch die Such- und
Filterfunktionen eine wichtige Rolle. So müssen in den TVS komplexe Filter er-
laubt werden und die Suche im Volltext, mit Platzhaltern oder mit Booleschen
Operatoren (UND, ODER) möglich.
Für die verschiedenen Benutzergruppen sollte es auch die Möglichkeit geben,
unterschiedliche Layouts zu definieren, damit nur die benötigten Daten ohne
Filter angezeigt werden können.
In einer so komplexen Welt, in der Unternehmen weltweit Zweigstellen haben,
ist es sehr wichtig, dass aktuelle Daten über verschiedene Schnittstellen zur
Verfügung gestellt werden. Die Terminologie muss in anderen Umgebungen
oder über verschiedene Schnittstellen in den Textentstehungsprozess einge-
Theoretischer Rahmen
37
bunden werden. Besonders wichtig ist die Einbindung in die Translation-
Memory-Systeme der Übersetzer, in die Redaktionssysteme der technischen
Redakteure oder in die Programme zur Terminologiekontrolle. Nur so wird die
richtige Terminologie direkt bei der Erstellung von Texten geprüft oder automa-
tisch vorgeschlagen.
Für die Einbindung aller Nutzer in die Aktualisierung und Pflege der Terminolo-
giedatenbank spielt die Verteilung von rollenspezifischen Zugriffsrechten auch
eine wichtige Rolle. So wird z. B. die Datenbank der Entwicklungsabteilung aus
Vertraulichkeitsgründen nur für bestimmte Nutzergruppen freigeschaltet. Auch
verschiedene Kategorien wie „Status“ oder „Gebrauch“ sollten z. B. nur von den
Terminologieverantwortlichen geändert werden können.
Damit die Terminologie sich über die erwünschte Akzeptanz im Unternehmen
freuen kann, muss man Benutzer auf die vielfältigste Art und Weise an der
Terminologiearbeit beteiligen, sei es in einem Terminologiekreis oder durch be-
nutzerfreundliche Möglichkeiten für das Einholen von Feedback. So sollte z. B.
eine Datenbank immer entweder über ein Vorschlagformular oder eine Kom-
mentarfunktion verfügen.
Ein TVS muss auch die proprietären und standardisierten Austauschformate
unterstützen.
Terminologie ist eine wichtige Ressource in einem Unternehmen. Durch Bereit-
stellung von Terminologie findet auch eine Wissensverteilung und-nutzung statt,
welche wichtige Elemente des Wissensmanagement darstellen (vgl. KÜDES,
2002: S. 67 ff./ Bauer, 2010: S. M2-20/ Reinke, 2012: S. 101ff.).
2.2.5 Austausch von Daten
Neben der oben erwähnten Interaktion zwischen TVS und verschiedenen ande-
ren Redaktions-, Translation-Memory-Systemen usw. ist in vielen Anwen-
dungsumgebungen der Datenaustausch (Import und Export) zwischen TVS und
anderen Systemen notwendig. Das Phänomen des Terminologieaustausches
tritt meistens in heterogenen Umgebungen, wenn z. B. die Übersetzer andere
TVS verwenden als die Sprachabteilung des Unternehmens, oder bei der Um-
stellung von einem TVS auf ein anderes oder wenn terminologische Daten
übernommen oder für andere Applikationen zur Verfügung gestellt werden
müssen.
Theoretischer Rahmen
38
Mögliche Austauschformate, die von den meisten TVS-Herstellern angeboten
werden sind CSV (Comma Separated Values), MARTIF (Machine-readable
terminology interchange format), XML, OLIF (Open Lexicon Interchange Format)
oder das Standardformat TBX (Term Base eXchange).
Eine wichtige Rolle beim Terminologieaustausch spielt eine effektive und res-
sourcensparende Art der Terminologiearbeit, d. h. die Übernahme und Weiter-
gabe von Terminologiebeständen. Werden in einem Unternehmen die TVS oder
die Redaktionssysteme auf eine höhere Version upgedatet oder werden in den
unterschiedlichen Abteilungen eines Unternehmens mehrere TVS genutzt, so
muss der Übergang von einem System zu einem anderen angepasst werden.
Übernimmt das Unternehmen ein anderes Unternehmen, so können damit auch
neue terminologische Bestände entstehen. Wird der Übersetzungsdienstleister
gewechselt, so müssen die neuen Terminologiesammlungen harmonisiert und
allen anderen zur Verfügung gestellt werden. In diesen Fällen spielt der Daten-
austausch eine sehr wichtige Rolle.
Beim Terminologieaustausch können dennoch folgende Probleme auftreten:
Einhaltung der wirtschaftlichen und juristischen Aspekte (z. B. Information als
Kapital, Urheber- und Nutzungsrecht, Qualität der Terminologiebestände),
Hardware- und Software-Kompatibilität (z. B. Datenträger, Codierung und Zei-
chensätze). Wurden die Grundsätze der Terminologiearbeit beim Anlegen und
bei der Verwaltung der terminologischen Einträge nicht eingehalten, so können
auch Probleme bei der Anpassung der inhaltlichen Aspekte (z. B. Datenkatego-
rien, Eintragsstruktur, Datenfeldinhalte, Klassifikation) und bei der Einhaltung
der Integrationsaspekte (z. B. Philosophie des TVS (Begriffsorientierung, Be-
nennungsautonomie), Behandlung von Homographen, Synonymen, Doubletten
entstehen (vgl. Schmitz/Kaukonen, 2012).
Vor dem Einrichten von Schnittstellen für den Datenaustausch müssen
Vorüberlegungen bezüglich des Ziels des Datenaustausches, der zu
austauschenden Datenmengen und der Art der Daten angestellt werden.
So ist es wichtig zu wissen, ob die Daten zwecks Analyse zur
Qualitätssicherung oder zur Aktualisierung terminologischer Datenbanken
exportiert werden. Wichtig ist auch, ob nur ein Teil oder die ganze Datenbank,
ob ganze terminologischen Einträge oder nur Teile ausgetauscht werden. Für
Theoretischer Rahmen
39
die Definition des Austauschformates ist auch sehr wichtig zu wissen, ob die
terminologischen Datenelemente sich identifizieren lassen, so dass ein
Datenaustausch wirtschaftlich realisierbar ist. Wenn dies nicht der Fall ist, muss
die Datenbank unter Einhaltung der terminologischen Modellierungsprinzipien
neu strukturiert oder neu erstellt werden.
Für den Datenaustausch ist es außerdem von besonderer Bedeutung, dass die
Terminologieverantwortlichen in das Thema Datenaustausch eingearbeitet sind
und sich ständig weiterbilden (Herwartz, 2010: M4-25 ff.).
Der Einsatz standardisierter Austauschformate erweist sich in der
Terminologiearbeit als sinnvoll. Dies setzt aber voraus, dass bereits bei dem
Anlegen und der Verwaltung der Datenbank die Grundsätze der
Terminologiearbeit berücksichtigt werden. So müssen verfügbare
terminologische Ressourcen nicht neu für den Datenaustausch erarbeitet
werden und die neu geschaffenen Mittel können für die Pflege der Daten
eingesetzt werden. Terminologiebestände könnten dann systemunabhängig
bearbeitet, ausgetauscht und genutzt werden. Die Hersteller von TVS werden
nicht mehr so viele Ressourcen in die Entwicklung der Schnittstellen, Formate
oder Konvertierungsfilter investieren, sondern eher in die Verbesserung
wichtiger Funktionen.
TBX-Format
TBX ist eine in XML ausgedrückte terminologische Auszeichnungssprache für
die Darstellung, Analyse und den Austausch terminologischer Daten zwischen
verschiedenen TVS oder aber zwischen TVS und entweder Translation Memory
Systemen, Sprachprüfungstools oder Systemen für die maschninelle
Übersetzung. TBX gründet auf den Arbeitsergebnissen des SALT-
Projektes (Standards-based Access to Lexicographical &Terminological
multiligual resources) und des Technischen Komittees ISO TC 37/SC3
und wurde von der Arbeitsgruppe OSCAR (Open Standards for
Container/content AlllowingReuse) der LISA (Localization Industry
Standards Association) im Jahr 2002 veröffentlicht. LISA hat im Jahr
2011 Konkurs angemeldet und wird ab 2012 unter dem Namen
Theoretischer Rahmen
40
TerminOrgs (Terminology for Large Organizations) vertreten. Der TBX-
Standard entspricht der Norm ISO 30042, die im Jahr 2008 veröffentlicht wurde
und die TBX-Grundstruktur entspricht dem TMF Modell in der ISO 16642 (siehe
Abbildung 6). Die TBX-Grundstruktur wird in Abbildung 8 dargestellt.
Abbildung 8: TBX Grundstruktur ISO 30042
Das Wurzelelement eines TBX-Dokumentes ist das <martif>-Element, das dem
terminologischen Datenbestand in dem TMF-Metamodell entspricht. Dem <mar-
tif>-Element sind ein <text>-Element und ein <martifHeader>-Element unterge-
ordnet. Im <martifHeader>-Element werden allgemeine Informationen zur Ter-
minologiedatenbank abgelegt. Das <text>-Element enthält ein <back>-Element,
das dem Punkt zusätzliche Informationen (CI) im TMF-Metamodell entspricht,
und ein <body>-Element. Im <body>-Element werden die terminologischen Ein-
träge im jeweiligen <termEntry>-Element dokumentiert. Die terminologischen
Einträge entsprechen der Begriffsebene (TE) im TMF-Modell.
Theoretischer Rahmen
41
Jeder terminologische Eintrag muss mindestens eine Sprachebene (LS) und
jede Sprache mindestens eine Benennungsebene (TS) enthalten. Im
<langSet>-Element werden die sprachbezogenen Informationen beschrieben.
Die Benennungen werden in <tig>- oder <ntig>-Elementen beschrieben. Das
<ntig>-Element (nested term information group) wird als Elternelement für die
Beschreibung einzelner Teile einer Mehrwortbenennung verwendet. Die einzel-
nen Teile der Mehrwortbenennung werden dann in Kindelemente <termCom-
pList>-Elemente dokumentiert. Die <termCompList>-Elemente entsprechen der
Benennungskomponentenebene (TCS) im TMF-Modell.
Die TBX-Datei besteht aus einem Prolog und einer Dokumentinstanz. Der Pro-
log enthält eine XML-Deklaration und Informationen zur Zeichenkodierung und
einen Verweis auf die Dokumenttypdefinition (DTD). Die DTD definiert die
Struktur des TBX-Dokuments und wird von einem Parser zur Validierung des
Dokuments herangezogen. Die Dokumentinstanz enthält Informationen zu der
Terminologiedatenbank selbst, den Verweis auf das zulässige Datenkategorie-
verzeichnis (XCS) und die eigentlichen terminologischen Einträge.
Elemente, Attribute und Datentypen der TBX-Grundstruktur sind in der Stan-
dard-DTD definiert. Die Datenkategorien einer TBX-Datei werden in einer sepa-
raten XML-Datei beschrieben, deren Regeln wiederrum in einer DTD festgelegt
sind.
Als Datenkategorieverzeichnis kann entweder das in der TBX-Spezifikationen
mitgelieferte Standard-Datenkategorieverzeichnis verwendet werden, das eine
Teilmenge des ISO-Datenkategorieverzeichnisses enthält, oder man kann ein
eigenes normenkonformes Datenkategorieverzeichnis definieren.
Terminologische Datenkategorien werden bis auf wenige Ausnahmen (/term/,
/date/, /note/ usw.) nicht direkt als Knoten, sondern über sogenannte Metada-
tenkategorien (descrip, admin, termNote usw.) und über den Wert des entspre-
chenden type-Attributs in der Grundstruktur implementiert.
Beispiel:
<descrip type=“definition“>…</descrip>
Dieses Verfahren bietet Flexibilität, um TBX in vielen Anwendungsszenarien zu
realisieren (vgl. ISO 30042, 2008/ Reineke, 2012: S. 193 ff.)
Ein einfaches Beispiel einer TBX-Datei sieht folgendermaßen aus:
Theoretischer Rahmen
42
<text><body>
<termEntry id=`ID 007´>
<descrip type=´subjectField´>terminologyManagement</descrip>
<langSet lang=de>
<descrip type=´definition´>Dateiformat zum Austausch von Datei-
en, die von verschiendnen Translation-Memory-Systemen stam-
men</descrip>
<ntig>
<termGrp>
<term>TBX</term>
<termNote type=´partOfSpeech´>properNoun</termNote>
<termNote type=´grammaticalGender´>neuter</termNote>
<termNote type=´termType´>acronym</termNote>
</termGrp>
</ntig>
...
</langSet>
...
</termEntry>
...
</body></text>
Abbildung 9: TBX Beispiel
Validierung von TBX-Dateien
TBX-Dateien müssen wie alle anderen XML-Dateien gegen die DTD und gegen
die XCS-Datei validiert werden. Dazu empfiehlt sich das von LISA entwickelte
Validierungswerkzeug TBX Checker. Mit anderen XML-Validierungswerkzeugen
lassen sich nur Wohlgeformtheit und Strukturkonformität überprüfen. Eine Vali-
dierung gegen die separate XCS-Datei ist jedoch nicht möglich. Wenn die Ein-
tragsstruktur und die Datenkategorien in einem einzigen Schema zusammenge-
fasst werden, kann das TBX-Dokument auch mit anderen XML-
Validierungswerkzeugen überprüft werden.
TBX-Basic
TBX-Basic ist wie TBX eine in XML ausgedrückte terminologische Auszeich-
nungssprache und wird in der ISO 30042 als TBX konforme TML anerkannt.
TBX-Basic ist eine leichtere Version von TBX, die mit Rücksicht auf kleinere
und mittlere Unternehmen entwickelt wurde.
Die Grundstrukturen von TBX-Basic- und TBX-Dokumentinstanzen sind bis auf
die Benennungsebene identisch. Nicht zugelassen sind in TBX-Basic auf der
Theoretischer Rahmen
43
Benennungseben die <ntig>-Elemente, sowie die Elemente, die den <ntig>-
Elementen zugeordnet werden können.
Die Zahl der zugelassenen Datenkategorien wurde in TBX-Basic gekürzt. Be-
stimmte Datenkategorien werden im Vergleich zu TBX als geschlossene Daten-
kategorien definiert. Diese Einschränkungen sollen den „blinden Austausch“,
ohne vorherige Rücksprachen ermöglichen.
In TBX-Basic können in dem <back>-Element nur wenige Informationen zu den
terminologischen Einträgen gemacht werden, wie z. B. Namen und Kontaktin-
formationen zu Autoren.
Das <descripGrp>-Element kann in TBX-Basic nur für die Aufnahme der Daten-
kategorie zur Angabe der Quelle eines Kontextes oder einer Definition verwen-
det werden (vgl. ISO 30042, 2008/ Reineke, 2012: S. 193 ff.).
2.2.6 Qualitätssicherung und Validierung von Terminologieeinträ-
gen
Terminologiebestände, die inhaltlich und formal nicht den Entwicklungen in dem
Fachgebiet entsprechend gepflegt werden, veralten und werden lücken- und
fehlerhaft. Diese Datenbanken werden meistens dann für unzuverlässig und
unbrauchbar gehalten. Voraussetzung für die Qualitätskontrolle der terminologi-
schen Datenbestände ist eine gute Organisation der terminologischen Einträge
nach Themen oder Sachgebieten, sowie eine entsprechende Arbeitsplanung
und Ressourcen für die Bearbeitung der Daten. Neben der inhaltlichen ist aber
auch die formale Pflege des Datenbestands notwendig. Die formale Pflege wird
auch als Datenvalidierung bezeichnet (vgl. KÜDES, 2002: S. 68 ff.).
Die Datenvalidierung ist laut DIN 2342 der „Prozess zur Bestimmung, ob Daten
formal richtig, kohärent, korrekt, vollständig und plausibel sind“ (DIN 2342,
2011). Laut DIN 2342 sind für die Datenvalidierung folgende Schritte nötig:
Doublettenkontrolle („Datenvalidierung zur Überprüfung, ob der gleiche Daten-
eintrag mehr als einmal vorhanden ist“), Konsistenzkontrolle („Plausibilitätskon-
trolle zur Überprüfung, ob Einträge terminographisch einheitlich und wider-
spruchsfrei sind“), Rechtschreibkontrolle („Formalkontrolle zur Überprüfung, ob
die Schreibweise der Wörter mit den festgelegten Rechtschreibregeln überein-
stimmt“), Vollständigkeitskontrolle („Formalkontrolle zur Überprüfung, ob die
Theoretischer Rahmen
44
geforderten Daten vorhanden sind“), Formalkontrolle („Datenvalidierung zur
Überprüfung, ob die Daten den Vorgaben formal entsprechen“) und Formatkon-
trolle („Formalkontrolle zur Überprüfung, ob die Daten dem vorgegebenen For-
mat entsprechen“), Plausibilitätskontrolle („Datenvalidierung zur Überprüfung,
ob die Daten inhaltlich den vorgegebenen Kriterien entsprechen“) (vgl. DIN
2342, 2011).
Die Doublettenkontrolle ist ein sehr wichtiger Schritt in der Validierung des
terminologischen Datenbestands. Doubletten entstehen meist bei der
Zusammenführung mehrerer Datenbestände von verschiedenen Abteilungen
oder von verschiedenen Unternehmen. Werden die Doubletten nicht bereinigt,
so kostet dies die Nutzer beim Abruf der Datenbank mehr Zeit und verursacht
Kritik und Unzufriedenheit. Doubletten können entweder durch Fusion zweier
oder mehrerer Einträge oder durch Löschen der betreffenden Einträge bereinigt
werden.
Die Fusion mehrerer Einträge bietet sich an, wenn z. B. äquivalente
Benennungen in verschiedenen Sprachen in mehreren Einträgen dokumentiert
wurden oder wenn verschiedene Einträge, die den gleichen Begriff
dokumentieren einander ergänzende Informationen enthalten.
Viele TVS bieten die Funktion der automatischen Doublettenkontrolle. Die
Doubletten müssen aber trotzdem inhaltlich überprüft werden, da manche
Scheindoubletten sein könnten. So sind z. B. Einträge, die formgleiche Begriffe
aus dem Rechtsgebiet dokumentieren keine richtigen Doubletten, wenn die
Begriffsmerkmale sich nicht voll und ganz entsprechen. So bezeichnet z. B. in
der Schweiz die Benennung „Bundesrat“ die Regierung, während in
Deutschland und Österreich die Länder/Ständekammer des Bundesparlaments
gemeint ist.
Auch Homonyme sind Scheindoubletten und müssen entsprechend dem
Begriffsorientierungsprinzip in unterschiedlichen Einträgen dokumentiert werden.
Echte Doubletten können meist sehr gut erkannt werden, wenn man bei der
Bereinigung sachgebietsbezogen in den wichtigsten Sprachen filtern kann
(KÜDES, 2002: S. 67 ff.).
Theoretischer Rahmen
45
In den Terminologiearbeit Best Practices (Bauer, 2010: S. M2-18 ff.) wird zwi-
schen eintrags- und bestandsbezogenen Validierungsaspekten unterschieden.
Die Validierung kann inhaltlich, methodisch-formal, sprachlich oder technisch
erfolgen.
Die inhaltliche Validierung sollte aus zwei verschiedenen Schritten bestehen:
die Aktualisierung und die inhaltliche Ergänzung. Erst muss überprüft werden,
ob die Benennung des zu dokumentierenden Begriffs übereinstimmt. Außerdem
muss übeprüft werden, ob die Benennungen nicht veraltet sind oder ob einer
Benennung eine andere Bedeutung unterlegt wurde. Wird dies festgestellt,
müssen diese Aspekte in die Definition übernommen werden und die
Benennung von der Datenbank nicht gelöscht sondern in der entsprechenden
Datenkategorie z. B. als „veraltet“ bezeichnet werden.
Im Rahmen der inhaltichen Validierung wird überprüft, ob in den Definitionen
die wesentlichen Merkmale aufgezählt sind und ob die Angaben in der
Definition dem aktuellen Stand der Entwicklungen im Fachgebiet entsprechen.
Laut dieser Prinzipien werden auch die zusäztlichen Informationen wie z. B.
Kontexte oder Anmerkungen überprüft. Diese Validierung erfordert eine enge
Zusammenarbeit der Terminologen mit den Fachstellen im Unternehmen oder
dass die Terminologen die Fachkenntnisse in dem bearbeiteten Bereich immer
auf dem aktuellsten Stand halten.
Mit einer inhaltlichen Ergänzung der terminologischen Einträge erhöht sich die
Akzeptanz und Anwendung des Terminologiebestandes. Werden einem Eintrag
zusätzliche Informationen zugewiesen, so werden Synonyme oder
Äquivalenzen besser nachvollzogen. Werden in einer Datenbank
entsprechende Benennungen in mehreren Sprachen erfasst, so erweitert sich
der potenzielle Benutzerkreis und damit auch die Nutzbarkeit der Datenbank.
Bei der methodisch-formalen Validierung wird z. B. überprüft, ob die
methodischen Vorgaben und Konventionen bei der Erstellung der
terminologischen Einträge oder die Freigabeprozesse bei der
Terminologieprüfung eingehalten wurden.
Sehr wichtig ist auch die methodisch-formale Validierung von Quellen, da diese
für die Nachvollziehbarkeit der Informationsherkunft und die Revision der
Einträge eine große Rolle spielen.
Theoretischer Rahmen
46
Damit die terminologischen Bestände verwendet und verstanden werden, muss
die Formulierung der Informationen (Kontext, Definition, Anmerkung usw.) je
nach Zielgruppe erfolgen. So erfolgt in der Phase der sprachlichen
Validierung sowohl die linguistische und redaktionelle Überprüfung der
Benennungen, der Definitionen oder Kontexte als auch eine
Rechtschreibprüfung. Die inhaltlichen Fehler müssen auch sobald als möglich
ausgemerzt werden, da sie die Qualität und die Zuverlässigkeit der
terminologischen Bestände beeinträchtigen können. Bei der Einführung neuer
Rechtschreibregel müssen jedoch alle Varianten in der Datenbank erhalten
bleiben und mit der entsprechenden Anmerkung, dass sie nicht mehr akzeptiert
werden, versehen werden, weil sie in früheren Texten immer noch vorkommen.
Mit einem Terminologieprüfprogramm können dann anhand dieser
Anmerkungen in der Datenbank die alten Texte korrigiert werden.
Da die meisten terminologischen Datenbestände nur elektronisch erstellt
werden, muss in jeder Datenbank auch eine technische Validierug erfolgen.
So müssen z. B. Querverweise zwischen verschiedenen Einträgen überprüft
werden und sichergestellt werden, dass die Links für die elektronischen Quellen
aktiv sind. Bei besonderen Sprachen muss auch die Sprachkodierung überprüft
werden. Verfügt das TVS über einen Rollen-Rechte-System, so müssen die
einzelnen Rollen mit den entsprechenden Rechten überprüft werden.
Die Pflege der terminologischen Bestände bleibt entsprechend der
Entwicklungen im Unternehmen und in den einzelnen Fachgebieten eine
ständige Aufgabe und erfordert deswegen eine gute Organisation.
Da die Pflege in der Regel sehr zeitaufwendig ist, sollten die
Terminologieverantwortlichen Prioritäten und Kriterien für die Bereinigung der
Daten festlegen und diese genauso wie bei der Erstellung von Daten in
Projekten organisieren.
Optimierung der TermTerm- und der ELETO-Datenbank
47
3 Optimierung der TermTerm- und der ELETO-
Datenbank
Im folgenden Kapitel werden auf Grundlage der im theoretischen Teil erläuter-
ten Grundsätze der Terminologie die Struktur der Datenbank und die Datenbe-
stände analysiert und Verbesserungen vorgeschlagen. Zunächst werden die
Datenbankstrukturen der ursprünglichen Datenbanken analysiert, dann wird ein
Vorschlag für die Verbesserung der Datenbankstruktur ausgesprochen und die
zusammengeführten Datenbestände bereinigt. Berücksichtigt werden immer
systemunabhängig die Prinzipien der Datenmodellierung, auch wenn die Daten
später in Trados MultiTerm zur Verfügung gestellt werden. Zum Zweck des Da-
tenaustausches zwischen mehreren unabhängigen TVS wird im letzten Kapitel
TBX-konform eine exemplarische Export-Definition erstellt.
3.1 Datenbankanalyse
Im folgenden Kapitel werden die terminologischen Datenbestände gemäß den
Prinzipien der Datenmodellierung und Datenbankstrukturierung analysiert.
3.1.1 Auswertung der TermTerm-Datenbank
FH-Datenbank
In Abbildung 7 wird die Datenbankdefinition der im Terminologieprojekt an der
Fachhochschule Köln entstandenen Datenbank dargestellt.
Die Datenbank ist auf drei Ebenen strukturiert: Begriffs- (Entry level), Sprach-
(Index level) und Benennungsebene (Term level). Auf der Sprachebene können
die Sprachen Deutsch, Englisch und Französisch verwaltet werden. Alle enthal-
tenen Datenkategorien können mehrfach eingetragen werden.
Nach dem Prinzip der Begriffsorientierung wurden alle relevanten Datenkatego-
rien, wie z. B. Fachgebiet oder Workflow, die sich auf den gesamten Begriff be-
ziehen, auf der Begriffsebene eingetragen. Die Datenkategorie Fachgebiet ist
vom Typ Text, was jedoch für ein eventuelles Filtern nicht von Vorteil ist. Hier
empfähle sich die Anwendung einer Pickliste mit mehreren vordefinierten Fach-
gebieten.
Der Workflow erscheint zusätzlich auch auf Sprachebene, da es beispielsweise
in einem Projekt von Bedeutung sein könnte zu filtern, in welcher Sprache es
die meisten noch zu bearbeitenden Einträge gibt. Sehr wichtig für das Filtern ist,
Optimierung der TermTerm- und der ELETO-Datenbank
48
dass die Datenkategorie keinen freien Text erlaubt, sondern nur ein Wert aus
der Pickliste ausgewählt werden kann.
Die Definition und die entsprechende Quelle werden in dieser Datenbank auf
der Sprachebene platziert. Die Quelle ist an die Definition angehängt, wird aber
dem Prinzip der Datenelementarität nach in einer eigenen Datenkategorie ver-
waltet.
Alle Informationen, die sich auf die Benennungen zu einem Begriff beziehen
werden auf der Benennungsebene verwaltet. Auch hier werden die Prinzipien
der Datenelementarität und der Granularität eingehalten. Daher werden die
grammatikalischen Angaben Gender, Part of speech und Term type in separa-
ten Datenkategorien verwaltet.
Für die Möglichkeit, dass Benennungen, die in einer Sprache gleich sind, aber
von einem Land zum anderen doch leicht voneinander abweichende Merkmale
aufweisen, wurde auf der Benennungsebene auch eine Definition und die ent-
sprechende Quelle eingefügt.
Auf dieser Ebene befinden sich für die einzelnen Benennungen noch Kontexte
mit der entsprechenden Quelle. Außerdem kann hier auch abgelegt werden, für
welchen Kunden oder für welches Projekt die entsprechende Benennung er-
stellt wurde oder ob die Benennung preffered, admitted, not recommended oder
obsolete ist.
Die Datenbank wurde nach den Prinzipien der Terminologiearbeit modelliert. So
werden dem Prinzip der Begriffsorientierung nach alle Sprachen und Benen-
nungen in einem Eintrag verwaltet. Dem Prinzip der Benennungsautonomie
nach wird jede Benennung gleichwertig dokumentiert und mit den entsprechen-
den Datenkategorien versehen. Die Prinzipien der Elementarität und Granulari-
tät wurden eingehalten, indem alle Datenkategorien so fein wie möglich definiert
wurden, so werden z. B. Gender und Part of speech nicht zusammen in einer
Datenkategorie verwaltet und die Quellen werden separat von Kontext oder De-
finition in eigenen Feldern eingefügt.
Eine Besonderheit dieser Datenbank ist, dass die Quellen immer dem dement-
sprechenden Kontext oder der entsprechenden Definition angehängt werden,
da so ein einfacheres Filtern ermöglicht wird.
Wie bereits in Kapitel 1.2 erwähnt sind die terminologischen Bestände aus dem
Projekt an der FH-Köln bezüglich der inhaltlichen Ausarbeitung sehr unter-
Optimierung der TermTerm- und der ELETO-Datenbank
49
schiedlicher Qualität. Für die Dokumentation der Einträge wurden oft Quellen
aus dem Internet verwendet, da die Studierenden oftmals nicht über genügend
genormte Literatur im Bereich Terminologie verfügten. So wurden z. B. sehr
wenige Definitionen aus den Normen oder den wichtigsten terminologischen
Arbeiten erfasst. Die Definitionen entsprachen aber meistens den Ansätzen der
Definitionserstellung.
Außerdem ist anzumerken, dass bei der Auswahl der Kontexte nicht immer der
Zweck eines Kontextes in einer terminologischen Datenbank berücksichtig wur-
de. Ein Kontext soll in einer Terminologiedatenbank nicht ein beliebiger Satz
sein, der die Benennung enthält, sondern ein Satz, der mehr Informationen über
den Begriff oder die Verwendung einer Benennung in einem Fachgebiet liefert.
So waren für viele Benennungen Kontexte ohne wirklichen terminologischen
Mehrwert eingefügt und mussten bei der Bereinigung aktualisiert werden.
Abbildung 10: Datenbankdefinition FH-Köln
Optimierung der TermTerm- und der ELETO-Datenbank
50
elcat-Datenbank
Die in dem Projekt elcat erstellte Datenbank sieht der Datenbank der Fach-
hochschule bezüglich der Datenbankstruktur sehr ähnlich. Auch in dieser Da-
tenbank werden die terminologischen Einträge auf allen drei Ebenen verwaltet.
Auf Sprachebene können neben den Sprachen Deutsch, Englisch und Franzö-
sisch auch die bibliografischen Eingaben verwaltet werden.
Auf Begriffsebene wurde in dieser Datenbank noch die Datenkategorie Graphic
vom Typ Multimedia hinzugefügt. Außerdem wird hier die Datenkategorie Defi-
nition und nicht Explanation benannt. Die Datenkategorie Subject ist in dieser
Datenbank vom Typ Pickliste und kann die Werte Terminology Management,
Linguistics, Software, Controlled Language, Standards and Law beinhalten.
Durch Festlegen von Werten wird das Filtern und der Datenaustausch erleich-
tert.
Die anderen Datenkategorien sind denen der FH-Köln-Datenbank ähnlich, nur
dass sie in einigen Fällen unterschiedlich benannt wurden.
Inhaltlich wurden die Datenbestände für das Glossar, das in dem E-Learning
Programm für Terminologie elcat eingebunden ist, unterschiedlich erarbeitet.
Die meisten Einträge sind nicht so ausführlich dokumentiert, sind aber immer
mit einer Quelle belegt, was eine Aktualisierung der Inhalte vereinfacht. Die
Quellen der terminologischen Bestände sind entweder Normen (ISO 12620,
ISO 704, ISO 1087) oder aktuelle terminologische Arbeiten, wie z. B. die tekom
Studie „Erfolgreiches Terminologiemanagement im Unternehmen“ (Schmitz K.-
D. S., 2010) oder KÜDES (KÜDES, 2002). Ungefähr 50% der Einträge wurden
auch mit einer Definition dokumentiert, die aber nicht immer nach den
Prinzipien der Definitionerstellung ausgearbeitet wurde. In der Datenkategorie
definition wurden die Prinzipien der Elementarität und Granularität der
Datenkategorien nicht immer eingehalten, da meist außer der tatsächlichen
Definition auch andere Informationen aufgenommen wurden, die normalerweise
in die Datenkategorie note gehören. So wurden z. B. die festgelegten Werte für
die Datenkategorie processStatus in der Definition mit aufgeführt und mussten
bei der Bereinigung in die Datenkategorie note übertragen werden. Außerdem
befanden sich die definition und die note in den meisten Einträgen auf
Benennungsebene und wurden bei der Bereinigung auf die Sprachebene
verschoben.
Optimierung der TermTerm- und der ELETO-Datenbank
51
Abbildung 11: Datenbankdefinition elcat
TermTerm-Datenbank
Die TermTerm-Datenbank ist, wie oben erwähnt, aus der Zusammenführung
der in dem Terminologieprojekt der Fachhochschule Köln erarbeiteten und der
für das E-Learning-Programm elcat erstellten Datenbanken entstanden. In den
beiden Projekten wurden die Datenbanken unter der Anwendung von SDL Mul-
tiTerm ausgearbeitet, hatten aber unterschiedliche Datenbankdefinitionen. Vor
der Zusammenführung der Datenbanken wurden die Daten exportiert und an-
hand eines Mapping-Tools TBX-konform geändert. Die Änderungen erfolgten
Optimierung der TermTerm- und der ELETO-Datenbank
52
anhand der XSL Transformation (XSLT). XSLT ist eine Programmiersprache
zur Transformation von XML-Dokumenten. XSLT dient der Definition von Um-
wandlungsregeln. Die XSLT-Programme oder auch XSLT-Stylesheets sind
selbst nach den Regeln des XML-Standards aufgebaut. Sie werden von spezi-
ellen XSLT-Prozessoren eingelesen, die dann die XML-Dokumente mit den ge-
wünschten Angaben und Struktur ausgeben. (vgl. XSL 12)
Um die Datenbestände anhand XSLT zu ändern, wurden diese zunächst in ei-
ner XML-Datei aus MultiTerm exportiert.
Die Daten wurden analysiert und eine neue Definition für die TBX konforme Da-
tenbank erstellt. Die Datenkategorien wurden dem ISO-Datenkategorienkatalog
entnommen (ISO, 2012) Anhand dieser Datenbankdefinition (Abbildung 12)
wurden von Diana Brändle und Wolfgang Zenk die folgenden Umwandlungsre-
geln für die XSLT erstellt.
Das Feld Workflowstatus wurde auf den Sprach- und Benennungsebene ge-
löscht.
Auf Begriffsebene wurde das Feld Subject in subjectField vom Typ Pickliste
geändert. Hierfür wurden die Werte controlledLanguage, dataCategory, law,
linguistics, other, standards, terminologyManagement, terminologyResources,
terminologyScience, tools und translationScience festgelegt
Die Datenkategorie Origin wurde in originatingInstitution vom Typ Pickliste mit
den Werten TermNet, CologneUniversity und ECQA geändert.
Auf Sprachebene wurde die Datenkategorie Explanation in der FH-Datenbank
und Definition in der elcat-Datenbank in definition vereinheitlicht und die ent-
sprechende Quelle in definitionSource umgewandelt.
Auf Benennungsebene wurde die Datenkategorie Context und Con-Source in
context und contextSource vereinheitlicht. Die Datenkategorie Usage status
wurde in die Datenkategorie normativeAuthorization vom Typ Pickliste mit den
möglichen Werten admittedTerm, notRecommendedTerm, supersededTerm
und preferredTerm geändert.
Die Datenkategorie Part of speech wurde TBX-konform in partOfSpeech und
Gender in grammaticalGender geändert.
Außerdem wurden die Datenkategorien Geographical Usage, Note, Term Type
und Source in geographicalUsage, note, termType und source geändert.
Optimierung der TermTerm- und der ELETO-Datenbank
53
Abbildung 12: Datenbankdefinition TermTerm
3.1.2 Auswertung der ELETO-Datenbank
Die griechische Terminologie der Terminologie besteht aus einer Sammlung
von Benennungen im Griechischen und deren Äquivalenten im Englischen und
Französischen. Die Datenbankstruktur entspricht der eines Glossars. Die Daten
werden tabellarisch dargestellt: für jede Sprache eine Spalte, eine Spalte für
Termcode, eine für die Kodierung der Quelle, eine für die griechische Quelle,
eine für die internationale Quelle und eine für das Erstelldatum des Eintrags.
Optimierung der TermTerm- und der ELETO-Datenbank
54
Die Prinzipien der Terminologiearbeit wurden in dieser Datenbank nicht einge-
halten. So werden Synonyme im gleichen Feld mit Komma getrennt und nicht
separat in einer eigenen Zeile verwaltet.
Wie in Abbildung 13 dargestellt, werden die Datenbestände in einer Access-
Datenbank verwaltet. Diese Daten können dann beliebig in Excel, TXT, XML
oder PDF exportiert werden.
Abbildung 13: Access-Datenbank ELETO
ELETO stellt die Daten auch in einem PDF-Format zum Herunterladen zur Ver-
fügung (Abbildung 14) (ELETO, 2012).
Abbildung 14: PDF-Glossar ELETO
Die Daten stammen aus den ISO-Normen ISO 1087, ISO 704 und ISO 860,
denen auch griechische Normen entsprechen. (Abbildung 15).
Optimierung der TermTerm- und der ELETO-Datenbank
55
Abbildung 15: Quellen in ELETO
3.2 Vorschlag für die Optimierung der TermTerm- Datenbank-
struktur
In diesem Kapitel werden Vorschläge für die Verbesserung der Struktur der
TermTerm-Datenbank vorgestellt. Die Struktur der Datenbank enthält Datenka-
tegorien, die TBX konform sind und auf allen drei Ebenen verteilt sind. Für die
präskriptive Terminologiearbeit sind Datenkategorien wie normativeAuthorizati-
on besonders wichtig. In dieser Datenkategorie wurden ISO-konform neben
admittedTerm, supersededTerm und preferredTerm die Werte standardized-
Term, deprecatedTerm, legalTerm und regulatedTerm hinzugefügt. Außerdem
fehlen einige Datenkategorien, die für die Bereitstellung der Daten für ein brei-
tes Publikum und eine kooperative Bearbeitung der Daten wichtig wären.
So werden auf Sprachebene (Index level) die Datenkategorien processStatus
vom Typ Pickliste, processStatusHistory und processStatusNote hinzugefügt.
Die Datenkategorie processStatus ist in ISO 12620 wie folgt definiert: “The sta-
tus of a lexical unit or term with respect to its advancement within the standardi-
zation process” (ISO 12620). In der ISO 12620 werden für diese
Datenkategorien die Werte finalized, provisionallyProcessed und unprocessed
vorgeschalgen (ISO, 2012).
Außerdem wurden auf Sprachebene die Datenkategorien note und noteSource
hinzugefügt, die für die Eingabe von zusätzlichen Informationen für alle
Benennungen in der entsprechenden Sprache vorgesehen sind. Hier werden
meist Informationen eingefügt, die nicht in eine Definition gehören, da sonst das
Prinzip der Datenelementarität verletzt würde.
Außerdem wurde in der Pickliste der Datenkategorie originatingInstitution noch
der mögliche Wert ELETO hinzugefügt.
Optimierung der TermTerm- und der ELETO-Datenbank
56
3.3 Konzept für die Zusammenführung der TermTerm- mit der
ELETO-Datenbank
In diesem Kapitel wird ein Konzept für die Zusammenführung von Datenbe-
ständen, die in verschiedenen Systemen verwaltet wurden, präsentiert. Es wer-
den die Datenbestände, die in der Access-Datenbank verwaltet wurden, mit den
in MultiTerm verwalteten Datenbeständen zusammengeführt. Dies geschieht
mittels Export und Konvertierung mit dem Tool MultiTerm Convert. Dieser Vor-
gang wird in den nächsten Unterkapiteln dargestellt.
3.3.1 Export der Access-Datenbank
Microsoft Access ist ein proprietäres Datenbankmanagementsystem des Soft-
wareherstellers Microsoft zur Verwaltung von Daten in Datenbanken und zur
Entwicklung von Datenbankanwendungen (vgl. Mic12).
Die terminologischen Datenbestände von ELETO wurden in einer einfachen
Access-Datenbank verwaltet. Die Struktur der Datenbank wird in Abbildung 14
dargestellt. Eine Access-Datenbank enthält normalerweise mehrere Objektarten.
Diese Datenbank enthält Tabellen zur Speicherung und Abfragen zur
Aufbereitung der Daten (Filterung, Sortierung etc.).
Abbildung 16: Struktur ELETO-Access-Datenbank
Optimierung der TermTerm- und der ELETO-Datenbank
57
Access bietet unter dem Menüpunkt Externe Daten die Option Bestände zu im-
portieren oder zu exportieren.
Die Tabellen können in Excel-, Text-, HTML-, PDF- oder dBase-Dateien expor-
tiert werden.
Für die Zusammenführung der Datenbestände wird die Tabelle TERM-
TERM_Ed1 in eine Excel-Datei exportiert (Abbildung 17). Diese Daten werden
dann anhand von MultiTerm Convert in eine XML-Datei konvertiert.
Abbildung 17: Excel-Export-Datei ELETO-Datenbank
Für die Konvertierung mit MultiTerm Convert wurden die Daten in Excel überar-
beitet. Die Informationen, die für die zusammengeführte TermTerm-Datenbank
keine Bedeutung haben, wie z. B. „Stage“ oder „RECNUM“ wurden gelöscht.
Die Datenkategorien TERMEN, TERMFR und TERMGR wurden den entspre-
chenden Sprachen nach in English, French und Greek umbenannt. STERMEN
und STERMGR wurden in source EN und source GR geändert, damit diese
Quellen beim Konvertieren ohne Verwechslungsgefahr den entsprechenden
Termini zugeordnet werden können. An dieser Stelle sei angemerkt, dass die
Abkürzung GR nicht die offizielle Abkürzung für Griechisch ist (richtig: EL).
3.3.2 Konvertierung mit MultiTerm Convert
SDL MultiTerm Convert ist ein Assistent, mit dem Terminologiedaten in das
MultiTerm XML-Format (MTF.XML) konvertiert werden können. Mit MultiTerm
Convert können folgende Formate in das MTF.XML-Format konvertiert werden:
MultiTerm 5 (MTW-Dateien), OLIF XML (Open Lexicon Interchange Format),
SDL Termbase Desktop (TDB-Dateien), SDL Termbase Online (MDB-Dateien),
Tabellenkalkulations- und Datenbankaustausch-Dateien, Microsoft Excel (XLS-
Dateien, TermBase eXchange-Format (TBX-Dateien) (SDL, 2012).
Optimierung der TermTerm- und der ELETO-Datenbank
58
MultiTerm Convert wurde für die Konvertierung der aus Access exportierten
Datenbestände eingesetzt. Das Excel-Format .xlsx wird von MultiTerm Convert
ohne weitere Änderungen unterstützt.
Nach dem Starten der Anwendung wird man von einem Assistenten durch den
Konvertierungsvorgang geleitet. Als erstes wählt man die passende
Konvertierungsoption aus, in unserem Fall das Microsoft Excel Format. Im
nächsten Schritt werden die Ausgangs- und Zieldateien für die Konvertierung
bestimmt. Wie in Abbildung 18 dargestellt, werden nach der Konvertierung
folgende Dateien erstellt: eine MTF.XML Datei, die die konvertierten Daten
enthält, eine .XDT-Datei, die Termbankdefinition, die Struktur der
Terminologiedaten beschreibt und eine Log-Datei.
Abbildung 18: MultiTerm Convert Bestimmen der Ausgangs- und Zieldateien
Im nächsten Schritt werden die Datenkategorietypen für die verfügbaren Felder
der Spaltenüberschriften angegeben. In diesem Schritt werden auch die Index-
felder festgelegt. Als Indexfelder für diese Datenbank wurden English, French
und Greek ausgewählt. Die Datenkategorien source EN und source GR werden
als beschreibendes Feld vom Typ Text festgelegt (Abbildung 19).
Optimierung der TermTerm- und der ELETO-Datenbank
59
Abbildung 19: MultiTerm Convert Datenkategorietypen festlegen
Nach dem Festlegen der Datenkategorien werden die beschriebenen Felder auf
der gewünschten Ebene hinzugefügt. In unserem Fall werden die Datenkatego-
rien source EN und source GR der Benennungsebene zugeordnet.
Abbildung 20: MultiTerm Convert Eintragsstruktur erstellen
Die Daten werden in XML konvertiert und haben die untenstehende Struktur
(Abbildung 21).
Optimierung der TermTerm- und der ELETO-Datenbank
60
Abbildung 21: Konvertierung in XML
Um diese Daten in die TermTerm-Datenbank in MultiTerm importieren zu
können, sollten einige Änderungen in der XML-Datei vorgenommen werden. So
wurden die Datenkategorien source EN und source GR mit source ersetzt,
damit diese Datenkategorien mit der entsprechenden Datenkategorie in
MultiTerm übereinstimmt. Da sich die source jeweils innerhalb des gleichen
<termGrp>-Tags unter dem entsprechenden <languageGrp>-Tag befindet, wird
die source dann beim Import der richtigen Sprache zugeordnet.
3.3.3 Import in MultiTerm
Für den Import in MultiTerm wurde zuerst eine Import-Definition mit Hilfe des
Import-Assistenten erstellt. Die neu zu importierenden Einträge wurden über die
Termini des Indexes „English“ mit bereits vorhandenen Einträgen synchronisiert.
War der Terminus in der Zieltermbank nicht vorhanden, wurde der Eintrag als
Neuer hinzugefügt, war der Terminus aber vorhanden, wurden die Einträge zu-
sammengeführt (Abbildung 22).
Optimierung der TermTerm- und der ELETO-Datenbank
61
Abbildung 22: MultiTerm: Import-Assistent
Nach der Erstellung der Importdefinition wurde der Import ausgeführt und die
Ergebnisse des Imports in einer Log-Datei beschrieben. In dieser Datei kann
man einsehen, ob Einträge nicht importiert wurden oder welche Einträge neu
hinzugefügt oder mit anderen Einträgen zusammengeführt wurden.
Bei den zusammengeführten Einträgen bestand dann die Notwendigkeit viele
Datenkategorien zu bereinigen, da diese meist auch doppelt ausgeführt wurden.
3.4 Konsolidierung des Datenbestandes
In diesem Kapitel wird ein Konzept für die inhaltliche Bereinigung und Konsoli-
dierung des zusammengeführten Datenbestandes erstellt. Die meisten termino-
logischen Einträge sind viersprachig vorhanden. Beim Zusammenführen der
Datenbestände sind Doubletten entstanden oder verschiedene Datenkategorien
wie Kontext oder Definition doppelt ausgeführt worden. Die Konsolidierung des
Datenbestandes erfolgte nach den Prinzipien der Terminologiearbeit und der
Terminologievalidierung. Im ersten Schritt wurden die Doubletten überprüft und
bereinigt, um dann mit der inhaltlichen Überprüfung und Konsolidierung fortzu-
fahren. Es wurde folgender Konsolidierungsbedarf festgestellt: Die Einträge
mussten terminographisch einheitlich ausgeführt werden; hierzu wurde über-
prüft, ob sich die Datenkategorien auf den entsprechenden Ebenen befinden.
Dann musste die Vollständigkeit der Einträge überprüft werden, so dass jede
eingetragene Benennung und jede eingegebene Definition, jeder Kontext und
jede Note auch mit der entsprechenden Quelle belegt wurden. Außerdem wur-
de auch eine Formalkontrolle unternommen, um zu gewährleisten, dass z. B.
die Formalien für die Definitionserfassung eingehalten wurden oder dass die
Optimierung der TermTerm- und der ELETO-Datenbank
62
Benennungen in der Grundform ausgeführt wurden. Während der Konsolidie-
rung wurde auch auf die Rechtschreibung geachtet.
Ein sehr wichtiger Schritt in der Konsolidierung war auch die Plausibilitätskon-
trolle. Viele der Einträge aus der griechischen Terminologie der Terminologie
stammten nämlich aus Normen, hatten aber nicht immer einen wirklichen termi-
nologischen Mehrwert, da es sich meistens um Begriffe aus der Allgemeinspra-
che oder um Begriffe, die aus einem komplexeren Kontext genommen wurden,
handelte. So musste überlegt werden, ob diese Einträge komplett aus der Da-
tenbank gelöscht werden sollten oder ob sie in der verbliebenen Zeit noch do-
kumentiert werden sollten. Es wurde die Entscheidung getroffen, diese Einträge
nicht zu löschen und so weit wie möglich in diesem Schritt zu dokumentieren
und vielleicht zu einem späteren Zeitpunkt kooperativ weiter zu bearbeiten.
In den folgenden Unterkapiteln werden zuerst der Vorgang der Doublettenbe-
reinigung und dann beispielhaft behobene Probleme bei der Konsolidierung des
Datenbestands vorgestellt.
3.4.1 Doubletten bereinigen
In MultiTerm gibt es die Möglichkeit über die Funktion „Suche nach Doublet-
ten“ unter der Registerkarte Suche Doubletten zu suchen und diese danach
manuell zu bereinigen. Die Doubletten wurden in der Hitliste-Ansicht angezeigt.
Die entsprechenden Doubletten mussten zunächst inhaltlich überprüft werden,
um feststellen zu können, ob es sich nicht um Scheindoubletten handelte, wie
es z. B. bei Homonymen der Fall ist oder ob die Einträge tatsächlich die glei-
chen Informationen beinhalten. Wurden Scheindoubletten gefunden, wie z. B.
der Begriff Sprachebene, der einmal Register und einmal Indexebene bedeuten
kann, so wurden diese gemäß dem Prinzip der Begriffsorientierung in der Da-
tenbank als separate Einträge verwaltet (Abbildung 23).
Optimierung der TermTerm- und der ELETO-Datenbank
63
Abbildung 23: Scheindoubletten
Wurde festgestellt, dass in den doppelten Einträgen unterschiedliche Informati-
onen vorhanden sind, so mussten diese echten Doubletten zusammengeführt
werden.
Für eine Bereinigung der echten Doubletten wird die Funktion Zusammenführen
über die Registerkarte Bearbeiten oder mit der Taste F9 ausgeführt.
Doubletten können allerdings sehr schwer in der Hitliste-Ansicht zusammenge-
führt und dort bearbeitet werden, da manchmal unerwartete Fehlermeldungen
angezeigt werden. Werden zwei Einträge zusammengeführt, so muss immer
nach der Speicherung des vollständigen Eintrags der unvollständige ursprüngli-
che Eintrag gelöscht werden.
Optimierung der TermTerm- und der ELETO-Datenbank
64
Abbildung 24: MultiTerm: Doubletten zusammenführen
3.4.2 Inhalte konsolidieren und optimieren
In diesem Kapitel werden anhand ausgewählter Beispiele aus der TermTerm-
Datenbank Einträge vorgestellt, bei denen ein hoher Bedarf an Konsolidierung
und Optimierung bestand.
Definitionen
Wie in Abbildung 25 hervorgehoben wird, wurde in den meisten Einträgen, die
aus der elcat-Datenbank stammten, die Definition auf der Benennungsebene
platziert. Diese wurde nach den Grundsätzen der Datenmodellierung auf die
Sprachebene verschoben, da es in den meisten Fällen mehrere Benennungen
zu einem Begriff in einer Sprache gibt und in der Definition der Begriff als Gan-
zes definiert werden soll und nicht nur separate Benennungen.
Optimierung der TermTerm- und der ELETO-Datenbank
65
Abbildung 25: Definition auf Benennungsebene
Anhand dieses Beispiels ist auch festzustellen, dass die Definition nicht nach
den Prinzipien der Definitionserstellung erfasst wurde. So wurden Beispiele ei-
ner Kurzform in die Datenkategorie definition mit eingefügt. In solchen Fällen
wurden in dieser Datenbank Beispiele zu einem Begriff oder mögliche Werte in
die Datenkategorie note verschoben.
Außerdem wurde bei den Definitionen überprüft, ob diese den inhaltlichen An-
forderungen entsprechen. Es wurden Inhaltsdefinitionen vorgezogen und wenn
keine Definitionen vorhanden waren, wurden die wichtigsten Begriffe mit pas-
senden Kontexten dokumentiert.
Die Definitionen wurden auch nach den orthographischen Regeln überprüft. So
wurden Artikel am Anfang einer Definition oder Satzpunkte am Ende gelöscht.
Definitionen sollen orthographisch so gestaltet werden, dass die Benennung im
Kontext durch die Definition ersetzt werden kann. Die Definitionen wurden im-
mer mit Quellen belegt und es wurde versucht, die meisten Definitionen aus
Normen oder aus wichtigen terminologischen Arbeiten zu recherchieren und in
der Datenbank hinzuzufügen.
Kontexte
In der Terminologiearbeit wird bei der Erstellung von terminologischen Einträ-
gen auch auf die Erfassung von Kontexten viel Wert gelegt. Kontexte sind
Satzbeispiele, die die typische Verwendung einer Benennung aufzeigen. Des-
wegen müssen Kontexte sorgfältig ausgewählt werden und nicht nur einfache
Sätze, die keinen Mehrwert für den terminologischen Eintrag aufweisen, in die
Datenbank kopiert werden. Überflüssige Kontexte werden den Nutzer nur unzu-
frieden stellen und erhöhen das Risiko, dass die Datenbank dadurch an Akzep-
tanz verliert.
Optimierung der TermTerm- und der ELETO-Datenbank
66
In der TermTerm-Datenbank waren meist entweder viele Einträge ohne Kontex-
te hinterlegt und bei den Einträgen von der Fachhochschule Köln meistens
auch überflüssige Kontexte (Abbildung 26).
Abbildung 26: Überflüssige Kontexte
In diesem Fall wurde versucht, für möglichst viele Begriffe auch passende Kon-
texte aus terminologischen Arbeiten oder Normen zu finden (Abbildung 27).
Abbildung 27: geeigneter Kontext
Kontexte können neben Definitionen auch dann sehr hilfreich sein, wenn es in
einer Datenbank für eine Benennung noch kein Äquivalent in einer Sprache gibt.
So erwies sich als sehr schwierig, das passende Äquivalent zu finden, wenn
überhaupt kein Kontext vorhanden war (Abbildung 28).
Äquivalente finden
In dem folgenden Beispiel musste eine passende Benennung im Deutschen
gefunden werden, was ohne eine Definition oder einen geeigneten Kontext
Optimierung der TermTerm- und der ELETO-Datenbank
67
nicht möglich ist. Im Deutschen könnte als Äquivalent für „abstract illustrati-
on“ „abstrakte Abbildung“, „abstraktes Bild“ oder „abstrakte Illustration“ verwen-
det werden. In der Norm wird allerdings die Abbildung als figure vorgegeben.
Abbildung 28: Äquivalent finden
Auch in dem folgenden Beispiel ist es ohne Kontext schwer zu entscheiden, ob
„Richtigkeit“ das deutsche Äquivalent von „accuracy“ ist oder ob „Genauig-
keit“ passender ist, was auf Englisch jedoch mit „conciseness“ übersetzt wird.
Anhand dieses Beispiels kann man erkennen, dass es in der Terminologiearbeit
nicht um die Übersetzung von Termini geht, sondern darum, zu recherchieren
ob derselbe Begriff in diesem Fachbereich vorhanden ist und welche Benen-
nungen diesen Begriff repräsentieren. So sucht man nach Äquivalenten und
versucht nicht den Terminus einfach in die andere Sprache zu transportieren.
Optimierung der TermTerm- und der ELETO-Datenbank
68
3.5 Bereitstellung der TermTerm-Datenbank
Die inhaltliche Aufbereitung, die Konsolidierung und die Bereinigung der Daten
wurden in SDL MultiTerm 2009 durchgeführt. SDL Multiterm ist ein Terminolo-
gieverwaltungssystem, das als eigenständiges System oder als Komponente
des SDL TRADOS Studio benutzt werden kann. Die Verwaltung von terminolo-
gischen Beständen in MultiTerm kann entweder über eine Client-Anwendung
oder über den MultiTerm Server vorgenommen werden.
Die Bereinigung der TermTerm-Datenbank wurde in einer Client-Anwendung
durchgeführt.
Sehr vorteilhaft in MultiTerm ist, dass die Datenbankdefinition nicht im Vorhinein
in der Software konfiguriert und fixiert ist, sondern sich durch den Benutzer oder
Termbankadministrator leicht verändern lässt. So konnten z. B. während der
Bereinigung der TermTerm-Datenbank neue Felder hinzugefügt und bereits
bestehende geändert oder gelöscht werden. Die Änderung verschiedener Da-
tenkategorien kann allerdings nur vorgenommen werden, wenn in diesen Da-
tenkategorien keine Inhalte gespeichert wurden. Wurden diese Datenkategorien
schon ausgefüllt, muss die Datenbank in eine XML-Datei exportiert werden,
eine neue Datenbankdefinition auf Basis der alten Datenbankdefinition erstellt
werden, die Datenkategoriennamen in XML geändert und dann wieder in Multi-
Term importiert werden.
Für die Eintragung von terminologischen Daten in einer Terminologiedatenbank
gibt es in MultiTerm nützliche Termbankobjekte wie z. B. Eingabemodelle oder
Layouts, womit man diesen Prozess steuern und kontrollieren kann.
Eingabemodell
Die Eingabemodelle (engl. Input models) gelten als Vorlagen, anhand derer die
Konsistenz der Daten sichergestellt werden kann.
Die Eingabemodelle sind Termbank-spezifisch, können aber gespeichert und in
eine andere Datenbank eingefügt und angepasst werden. In MultiTerm gibt es
ein Standard-Eingabemodell, aber es können auch zusätzlich benutzerdefinier-
te Eingabemodelle für bestimmte Termbanken und bestimmte Rollen erstellt
werden.
Da die Eingabemodelle zur Gewährleistung der Konsistenz der Datenbankein-
träge beitragen, wurde auch für die Eingabe und Bereinigung der Daten in der
Optimierung der TermTerm- und der ELETO-Datenbank
69
TermTerm-Datenbank vor dem Bearbeiten des Inhalts ein benutzerdefiniertes
Eingabemodell erstellt.
Wie in Abbildung 29 veranschaulicht, erfolgt die Erstellung eines Eingabemo-
dells in MultiTerm anhand eines Assistenten.
Es können Eingabemodelle für verschiedene Nutzerrollen definiert werden. So
werden z. B. unter Anwendung eines bestimmten Eingabemodells manche Da-
tenbankfelder gesperrt, so dass diese nicht bearbeitet werden können. Es kön-
nen Standard-Werte festgelegt werden, damit die Konsistenz der Daten ge-
währleistet wird oder es kann festgelegt werden, ob Datenkategorien mehrfach
belegt werden können. Bei der Definition eines Eingabemodells kann auch ent-
schieden werden, ob, wie oft und in welcher Reihenfolge Index-, Text- und be-
schreibende Felder erscheinen.
In dem benutzerdefinierten Modell für die TermTerm-Datenbank wurde z. B. für
mehrere Felder eine Mehrfachbelegung erlaubt oder z. B. für die Datenkatego-
rie partOfSpeech der Standardwert noun festgelegt, da die Mehrheit der Einträ-
ge in der Datenbank Substantive sind. Bei der Bereinigung der griechischen
Einträge wurde als Standardwert für die Datenkategorie originatingInstitution
ELETO ausgewählt, um so die Bearbeitung der Einträge zu erleichtern und da-
mit nicht alle Felder jedes Mal ausgefüllt werden müssen.
Abbildung 29: Eingabemodelldefinition in MultiTerm
Bei der Bereinigung der Daten in MultiTerm wurde aber leider festgestellt, dass
das Arbeiten mit Eingabemodellen die Bearbeitung erleichtern könnte, wenn
Optimierung der TermTerm- und der ELETO-Datenbank
70
nicht zwischendurch Fehlermeldungen erscheinen oder bereits gelöschte Fel-
der nicht wieder überraschend auftauchen würden. Es wurde in diesem Fall
unmöglich, mit einem Eingabemodell zu arbeiten, so dass jede Datenkategorie
einzeln angeklickt werden musste.
Layout
Ein anderes nützliches Datenbankobjekt für die Darstellung der Daten in Multi-
Term sind die Layouts. Es können rollenspezifische Layouts für die Präsentati-
on von Daten erstellt werden. Ist die Datenbankstruktur sehr komplex und auf-
wändig dokumentiert, kann man für bestimmte Benutzergruppen unter
Anwendung eines benutzerdefinierten Layouts nur bestimmte Datenkategorien
anzeigen lassen. So werden die Benutzer von der Komplexität der Daten nicht
überfordert und reagieren gegebenenfalls gegenüber der Einsetzung einer
Terminologiedatenbank positiver. Anhand dieser Layouts können z. B. für die
Entwicklerrolle nur die relevanten Daten angezeigt werden, wie z. B. Abbildung,
Fachgebiet, Produktlinie, Definition etc. und Metadaten wie Genus, Numerus
oder Termtyp ausgeblendet werden.
MultiTerm verfügt auch über Standardlayouts, wie z. B. „Flags layout“ (Abbil-
dung 30) oder „Full layout“. Anhand dieser Standardlayouts werden aber Da-
tenkategorien in der Reihenfolge ihrer Erfassung angezeigt.
Abbildung 30: Standard Flags Layout in MultiTerm
Optimierung der TermTerm- und der ELETO-Datenbank
71
Für die TermTerm-Datenbank wurde ein exemplarisches Layout anhand eines
Assistenten erstellt, anhand dessen alle Datenkategorien auf jeder Ebene
angezeigt werden (Abbildung 31).
Abbildung 31: TermTerm-Layout
quickTerm
Die Terminologielehre ist eine sehr junge Wissenschaft und deswegen ist eine
Terminologie der Terminologie lebendig und in ständiger Umwandlung. In
Deutschland und auf internationalem Niveau werden ständig neue Normen her-
ausgegeben und alte Normen aktualisiert oder neue Werkzeuge mit neuen
Funktionalitäten entwickelt. In manchen Ländern sind die Terminologiewissen-
schaft und die Terminologiearbeit im Allgemeinen noch nicht so bekannt oder
gerade in der Anfangsphase. Auch in diesen Sprachen wird später eine Termi-
nologie der Terminologie entstehen. Deshalb ist es unbedingt notwendig, le-
bendige Prozesse und technische Unterstützung für die Terminologie der Ter-
minologie zu gewährleisten, um immer mehr Terminologieinteressierte in die
Erstellung einer vollständigen und aktuellen Datenbank einzubinden.
In diesem Fall könnte man von einem Life-Cycle-Management der TermTerm-
Datenbank reden, was konkret Beantragung, Aufnahme, Ablehnung, Review,
Import und Export von terminologischen Daten in einer oder mehreren Spra-
chen bedeutet (vgl. Dutz/Fleischmann, 2012).
Optimierung der TermTerm- und der ELETO-Datenbank
72
Um ein sinnvolles Life-Cycle-Management für die TermTerm-Datenbank zu si-
chern, wird die Datenbank demnächst auf der Internetpräsenz des TermTerm-
Konsortiums mittels des Terminologiewerkzeugs quickTerm zur Verfügung ge-
stellt. quickTerm setzt auf der in MultiTerm bestehenden Terminologiedaten-
bank auf und kann aus jedem Windows-Programm per Tastenkombination auf-
gerufen werden. Für die Verwaltung der TermTerm-Datenbank wird quickTerm
über einen Webbrowser zur Verfügung gestellt und kann auch ohne Einloggen
als Gast unter limitierten Zugriffsrechten genutzt werden. Ein besonderes
Merkmal von quickTerm ist die transparente Abbildung des Terminologiebean-
tragungs- und Validierungsprozesses.
Für die Beantragung von Termini kann für jede Benutzergruppe konfiguriert
werden, welche Informationen aus MultiTerm die entsprechenden Benutzer
beim Termantrag mit ausfüllen können oder müssen. Termanträge können ein-
sprachig oder mehrsprachig sein, je nach Berechtigung.
Abbildung 32: Termantrag in quickTerm
Optimierung der TermTerm- und der ELETO-Datenbank
73
Jeder Termantrag geht zunächst an den Terminologen. Dieser entscheidet dar-
über, ob ein Antrag grundsätzlich in die Termbank aufgenommen wird. Danach
kann der Terminologe den Antrag gezielt Fachleuten zuweisen und anschlie-
ßend die Informationen von diesen in die Termbank übernehmen. Die vorberei-
teten Einträge können dann in vordefinierte Freigabeschleifen geschickt werden,
in denen sich die Zuständigen abstimmen.
Der Antragsteller wird immer per E-Mail über den Ausgang seines Antrags in-
formiert.
Sehr wichtig für das Freigabeverfahren in quickTerm ist der Abstimmungspro-
zess. Die Dokumentation des Prozesses kann auch in MultiTerm übertragen
werden. Im Konzept von quickTerm erfolgt der Freigabeprozess immer auf
Sprachebene, da sich in einer bestimmten Sprache durch Einfügen von neuen
Benennungen die Gesamtkonstellation von Vorzugsbenennungen verändern
kann und so die Sprache immer neu freigegeben werden muss. Dafür ist es
wichtig, die Sprachebene mit den entsprechenden Workflowfeldern zu versehen.
Wird eine Dokumentation des gesamten Freigabeprozesses in MultiTerm er-
wünscht, so müssen entsprechende Felder für den Gesamtworkflow jeder
Sprache auf Sprachebene eingefügt werden. Eine Empfehlung dafür wäre
Workflow-Status mit den Werten Neu, In Bearbeitung, Alle abgestimmt und Ab-
geschlossen. Für jeden einzelnen Freigabeworkflow (sprich für jede Freigabe-
gruppe) wird ein entsprechendes Feld mit der Freigabehistorie benötigt und für
die Kommentare, die zwischen den Freigebern ausgetauscht werden, ein Text-
feld auf Sprachebene (kaleidoscope, 2012).
Da die TermTerm-Datenbank TBX-konform gestaltet wurde, wurden für die Do-
kumentation auf Sprachebene die Datenkategorien processHistory, processSta-
tus mit den Werten: unprocessed, finalized und provisionallyProcessed und
processNote hinzugefügt. Die Datenkategorie processStatus stammt aus dem
Datenkategorieverzeichnis isocat.org und wird wie folgt definiert: „The status of
a lexical unit or term with respect to its advancement within the standardization
process” (ISO 12620)
Ein terminologischer Eintrag in quickTerm sieh wie folgt aus:
Optimierung der TermTerm- und der ELETO-Datenbank
74
Abbildung 33: terminologischer Eintrag in quickTerm
3.6 Exemplarische TBX-konforme Exportdefinition
Wie im vorherigen Kapitel beschrieben wurde, wurde die Terminologie der Ter-
minologie in MultiTerm erstellt und verwaltet. Damit die Datenbank auch ande-
ren Nutzern zur Verfügung gestellt werden kann, wurde anhand dieser Daten-
bankstruktur eine exemplarische Exportdefinition für TBX erstellt, die in diesem
Unterkapitel vorgestellt wird.
Auf der einen Seite stellt MultiTerm schon wesentliche Eigenschaften bereit, die
notwendig sind, um eine TBX-Schnittstelle zu erstellen, wie z. B. die Orientie-
rung nach dem ISO-Metamodell, bzw. die Möglichkeit, geschlossene und offene
Datenkategorien auf Begriffs-, Sprach- und Benennungsebene zu verteilen so-
wie die Begriffsorientierung und Benennungsautonomie.
Auf der anderen Seite wird durch die Möglichkeit, die Datenkategorien nutzer-
spezifisch zu modellieren, indem man den Sprachen oder den Datenkategorien
eigene Namen gibt sowie Picklisten mit eigenen Werten zu erstellen oder Da-
tenkategorien beliebig auf verschiedenen Ebenen hinzuzufügen, die Bereitstel-
lung einer exemplarischen Schnittstelle für alle User erschwert (vgl. Schmitz K.-
D., 2012).
In MultiTerm wird ein Standard TBX-Export-Format zur Verfügung gestellt, was
jedoch vom Nutzer bearbeitet werden muss, da bei diesem Export manche Da-
tenkategorien nicht in die in der TBX-Norm vorgesehenen Tags eingeordnet
Optimierung der TermTerm- und der ELETO-Datenbank
75
werden, keine Querverweise angezeigt werden oder Picklisten nicht erkannt
werden (Abbildung 34).
In MultiTerm wird das Export-Format TBX (LISA 2002) als „TBX XML file, com-
pliant with the TBX core structure, schema version file TBXcsV02.xsd, as re-
leased by LISA 13 May 2002” beschrieben.
Wie in Abbildung 34 dargestellt, werden in der exportierten TBX-Datei alle Da-
tenkategorien in <descripGrp> eingeordnet. Dies entspricht aber nicht den Spe-
zifikationen des TBX-Standards (ISO 30042, 2008).
Abbildung 34: Export mit dem vorhandenen TBX-Export-Format
Aus diesem Grund muss in MultiTerm eine benutzerdefinierte Export-Definition
erstellt werden. Die Modellierung dieser erfolgt anhand eines Assistenten (Ab-
bildung 35). Anhand dieses Assistenten können Datenkategorien aus der Da-
tenbankstruktur ausgewählt, in einer beliebigen Reihenfolge exportiert und mit
den konformen Tags versehen werden. Im Folgenden werden mögliche Ände-
Optimierung der TermTerm- und der ELETO-Datenbank
76
rungen des Standard TBX-Exports von MultiTerm in Reihenfolge der Ebenen
des TMF-Modells vorgestellt.
Abbildung 35: Export-Assistent MultiTerm
Auf Begriffsebene (<termEntry>) werden nach dem MultiTerm-Export alle Da-
tenkategorien im Tag <descripGrp> dargestellt:
Abbildung 36: <termEntry> im MultiTerm-TBX-Export
Laut ISO 30042 wird aber z. B. die Datenkategorie originatingInsitution anhand
des Tags <admin> dargestellt. Außerdem wurden die Datenkategorien note und
noteSource inerhalb des Tags <adminGrp> als <admin> und <adminNote>
dargestellt. Abbildung 37 zeigt im Vergleich die Änderungen auf Begriffsebene.
Abbildung 37: <termEntry> TBX-konform
Auch auf Sprachebene (<langSet>) werden nach MultiTerm-TBX-Export auch
alle Datenkategorien im Tag <descripGrp> dargestellt (Abbildung 38).
Optimierung der TermTerm- und der ELETO-Datenbank
77
Abbildung 38: <langSet> im MultiTerm-TBX-Export
Auf Sprachebene wurden die Datenkategorien definition und definitionSource
zusammen in einer <descripGrp> und die Datenkategorien note und no-
teSource in einer <adminGrp> eingeordnet. Die anderen Datenkategorien auf
Sprachebene wurden in einfachen <descrip> dargestellt (Abbildung 39).
Abbildung 39: <langSet> TBX-konform
Auf Benennungsebene (<tig>) werden im MultiTerm-Export auch alle Datenka-
tegorien in <descripGrp>-Tags dargestellt (Abbildung 40).
Abbildung 40: <tig> im MultiTerm-TBX-Export
Optimierung der TermTerm- und der ELETO-Datenbank
78
Anhand der Spezifikationen im TBX-Standard wurden alle Informationen, die
sich auf die Benennung beziehen in <termNote>-Tags eingeordnet. Die Daten-
kategorien context, contextSource und note, noteSource wurden in <descrip-
Grp> bzw. <adminGrp> eingeordnet. (Abbildung 41)
Abbildung 41: <tig> TBX-konform
Sehr schwer zu modellieren sind die Querverweise in den Datenkategorien
source, noteSource, definitionSource und contextSource. Diese werden bei
dem MultiTerm- TBX-Export nicht als Querverweise exportiert. In ISO 30042
(ISO 30042, 2008) werden mehrere Möglichkeiten für die Darstellung von Quel-
len vorgeschlagen. Es kann auf in TBX eingebettete oder auf externe Elemente
verwiesen werden. Für die externen Elemente oder auch Internetquellen wird
das <xref>-Tag verwendet. (Abbildung 42)
Abbildung 42: Querverweis Source in TBX (ISO 30042)
Außer auf externe Links kann man auch auf bibliografische Einträge oder zu-
ständige Personen verweisen, deren Daten in der TBX-Datei schon vorhanden
sind.
Eine Modellierung für die Ausgabe von Querverweisen war für die TermTerm-
Datenbank jedoch nicht möglich, da die Quellen sehr unterschiedlicher Art sind.
Es wäre empfehlenswert, für die Datenkategorien source, definitionSource, no-
Optimierung der TermTerm- und der ELETO-Datenbank
79
teSource und contextSource verschiedene Möglichkeiten für die Eintragung von
Quellen (Internetadressen, bibliographische Einträge oder zuständige Personen)
anzubieten. Dafür muss man z. B in der Datenbankdefinition für die Eintragung
von Internetquellen die Datenkategorie xSource ablegen.
Die exportierte TBX-Datei kann mittels des TBX-Checkers validiert werden.
Hierzu muss jedoch die DTD um die Datenkategorien, die nicht in der ISO-
Norm vordefiniert sind, aber in der vorliegenden Datenbank vorkommen, erwei-
tert werden.
Zusammenfassung und Ausblick
80
4 Zusammenfassung und Ausblick
Die in dem Projekt TermTerm entstandene Terminologie der Terminologie dient
als Wissensdatenbank, in der die wichtigsten Begriffe im Terminologiebereich
zu finden sind. Der Mehrwert dieser Datenbank liegt in der knappen Präsentati-
on der Informationen zu einem Begriff, so dass es nicht mehr nötig ist, die In-
formationen aus mehreren Quellen, wie z. B. Normen oder terminologischen
wissenschaftlichen Arbeiten zu recherchieren.
Außerdem wird dieser terminologische Datenbestand einem großen Zielpubli-
kum zur Verfügung gestellt und damit hoffentlich die Neugier geweckt, sich zu
vernetzen oder Terminologien der Terminologie auch in anderen Sprachen zu
erstellen.
Ziel der Systematisierung und des Festhaltens in einer Datenbank der Termino-
logie der Terminologie ist es letztendlich, diesen Fachwortschatz zu verteilen
und weiter zu entwickeln. Davon können mehrere Akteursgruppen profitieren,
sei es technische Redakteure oder Übersetzer, die sich auch im Terminologie-
bereich spezialisieren möchten oder Terminologen, die z. B. ihre Fachartikel
nach der festgelegten Terminologie überprüfen möchten.
Ziel dieser Masterarbeit war es unter anderem die Terminologie der Terminolo-
gie zu bereinigen und ein Konzept für die Zusammenführung mehrerer Bestän-
de zu erarbeiten. Dies kann später als Vorlage für die gleiche Arbeit in anderen
Sprachen gelten. Außerdem können die Struktur der Datenbank und die Ansät-
ze, nach denen die Bestände erarbeitet wurden, auch als Beispiel für normative
Terminologiearbeit für verschiedene Organisationen oder Unternehmen dienen.
Bis zur Freigabe und Veröffentlichung der Datenbank sind noch einige Aufga-
ben zu bewältigen. Da der Verfasserin während der Arbeit nicht alle Normen
und wissenschaftlichen Arbeiten zur Verfügung standen, konnten manche Ein-
träge nicht genügend dokumentiert werden. Es wäre wünschenswert, wenn die-
se Normen angeschafft würden und die Einträge um die fehlenden Informatio-
nen ergänzt würden. Dazu kommt auch, dass Normen und Technologien im
Bereich der Terminologie immer wieder ergänzt oder weiterentwickelt werden.
Dadurch wird es nötig, diese Datenbank immer auf den neuesten Stand zu
bringen. Außerdem konnte bei manchen Einträgen von der Verfasserin dieser
Arbeit die Entscheidung über die normative Verwendung mancher Benennun-
Zusammenfassung und Ausblick
81
gen nicht getroffen werden. Auch hier muss in einem folgenden Schritt be-
schlossen werden, wer die Freigabe übernimmt.
Außerdem sieht die Verfasserin es als eine sehr wichtige Aufgabe für die Zu-
kunft, einen Leitfaden für das kooperative Arbeiten an der Weiterentwicklung
der Terminologie der Terminologie (Erfassungsrichtlinien für vorgeschlagene
Einträge, Arbeiten mit quickTerm, Rollensystem etc.) zu erstellen, damit die
Konsistenz innerhalb der TermTerm-Datenbank gewährleistet werden kann.
Diese Informationen sollten dann auf der Webseite des TermTerm-Projekts zur
Verfügung gestellt werden (www.termterm.org).
Obwohl die Arbeit im Rahmen eines Hochschulprojekts und nicht in einem Un-
ternehmen verfasst wurde, war trotzdem durch realistische Arbeitsprozesse wie
z. B. Bereinigung, Zusammenführung oder Export-/Importvorgänge ein „lebens-
naher“ Praxisbezug vorhanden.
Die Verfasserin erachtet das Themengebiet dieser Arbeit mit der Abgabe der
Masterarbeit als für sie noch nicht abgeschlossen und äußert den Wunsch einer
neuen Möglichkeit, sich mit dem Thema weiter zu beschäftigen.
Abkürzungsverzeichnis
82
5 Abkürzungsverzeichnis
CI Complementary Information
DIN Deutsches Institut für Normung
DTD Document Type Definition
ELETO Hellenic Society for Terminology
ISO International Organization for Standardization
LISA Localization Industry Standards Association
LS Language Section
MS Microsoft
OSCAR Open Standards for Container/content
AlllowingReuse
SALT Standards-based Access to Lexicographical
&Terminological multiligual resources
TBX TermBase eXchange
TCS Terminology Component Section
TE Terminological Entry
TerminOrgs Terminology for Large Organizations
TMF Terminology Markup Framework
TMS Translation Memory System
TS Term Section
TVS Terminologieverwaltungssystem
XML Extensible Markup Language
XSL Extensible Stylesheet Language
XSLT Extensible Stylesheet Language Transformation
Abbildungsverzeichnis
83
6 Abbildungsverzeichnis
Abbildung 1: Semitoisches Dreieck _______________________________________________________ 17
Abbildung 2: Wüsters Modell (Wüster, 1991) _______________________________________________ 18
Abbildung 3: Oesers Modell (Schmitz K.-D., 2011) ___________________________________________ 18
Abbildung 4:ISO-Norm Modell (Schmitz, 2011) _____________________________________________ 19
Abbildung 5:Schmitz-Modell (Schmitz, 2011) _______________________________________________ 19
Abbildung 6: terminologisches Metamodell ISO 16642 _______________________________________ 32
Abbildung 7: Begriffsorientierung (Schmitz, 2012) ___________________________________________ 35
Abbildung 8: TBX Grundstruktur ISO 30042 ________________________________________________ 40
Abbildung 9: TBX Beispiel ______________________________________________________________ 42
Abbildung 10: Datenbankdefinition FH-Köln ________________________________________________ 49
Abbildung 11: Datenbankdefinition elcat __________________________________________________ 51
Abbildung 12: Datenbankdefinition TermTerm _____________________________________________ 53
Abbildung 13: Access-Datenbank ELETO ___________________________________________________ 54
Abbildung 14: PDF-Glossar ELETO ________________________________________________________ 54
Abbildung 15: Quellen in ELETO _________________________________________________________ 55
Abbildung 16: Struktur ELETO-Access-Datenbank ___________________________________________ 56
Abbildung 17: Excel-Export-Datei ELETO-Datenbank _________________________________________ 57
Abbildung 18: MultiTerm Convert Bestimmen der Ausgangs- und Zieldateien _____________________ 58
Abbildung 19: MultiTerm Convert Datenkategorietypen festlegen ______________________________ 59
Abbildung 20: MultiTerm Convert Eintragsstruktur erstellen __________________________________ 59
Abbildung 21: Konvertierung in XML ______________________________________________________ 60
Abbildung 22: MultiTerm: Import-Assistent ________________________________________________ 61
Abbildung 23: Scheindoubletten _________________________________________________________ 63
Abbildung 24: MultiTerm: Doubletten zusammenführen ______________________________________ 64
Abbildung 25: Definition auf Benennungsebene _____________________________________________ 65
Abbildung 26: Überflüssige Kontexte _____________________________________________________ 66
Abbildung 27: geeigneter Kontext ________________________________________________________ 66
Abbildung 28: Äquivalent finden _________________________________________________________ 67
Abbildung 29: Eingabemodelldefinition in MultiTerm ________________________________________ 69
Abbildung 30: Standard Flags Layout in MultiTerm __________________________________________ 70
Abbildung 31: TermTerm-Layout _________________________________________________________ 71
Abbildung 32: Termantrag in quickTerm __________________________________________________ 72
Abbildung 33: terminologischer Eintrag in quickTerm ________________________________________ 74
Abbildung 34: Export mit dem vorhandenen TBX-Export-Format _______________________________ 75
Abbildung 35: Export-Assistent MultiTerm _________________________________________________ 76
Abbildung 36: <termEntry> im MultiTerm-TBX-Export ________________________________________ 76
Abbildung 37: <termEntry> TBX-konform __________________________________________________ 76
84
Abbildung 38: <langSet> im MultiTerm-TBX-Export __________________________________________ 77
Abbildung 39: <langSet> TBX-konform ____________________________________________________ 77
Abbildung 40: <tig> im MultiTerm-TBX-Export ______________________________________________ 77
Abbildung 41: <tig> TBX-konform ________________________________________________________ 78
Abbildung 42: Querverweis Source in TBX (ISO 30042) _______________________________________ 78
Literaturverzeichnis
85
7 Literaturverzeichnis
ISO 30042. (2008). Systems to manage terminology, knowledge and content--
TermBase eXchange (TBX). Geneva: ISO.
DIN 2330. (Juni 2011). Begriffe und Benennungen –Allgemeine Grundsätze.
DIN 2342. (08 2011). Begriffe der Terminologielehre. Berlin.
ISO 26162. (2012). Systems to manage terminology,knowledge and content-
Design,implementation and maintenance of terminology management
systems. Geneva: ISO.
XSL Transformation-Wikipedia. (11. 12 2012). (Wikipedia) Abgerufen am 09. 10
2012 von http://de.wikipedia.org/wiki/XSL_Transformation
Arnzt, R./Picht, H./Mayer, F. (2009). Einführung in der Terminologiearbeit.
Hildesheim: Olms.
Bauer, S. C./ Drewer, P./ Fähndrich, U./ Herwartz, R./ Massion, F./ Pulitano, D./
Schmitz, K-D (2010). Grundsätze und Methoden. In DTT e.V.,
Terminologiearbeit- Best Practices (S. M 2-1-M2-22). Köln: Deutscher
Terminologie Tag e.V.
Christer, L./ Myking, J./ Picht, H. (1998). Terminologie unter der Lupe. Vom
Grenzgebiet zum Wissenschaftszweig. Wien: TermNet (IITF-Series 9).
Dutz, P./Fleischmann, K. (2012). Terminologie Life-Cycle-Management-Ein
integrierter Einsatz. In S. K.-D. Mayer Felix, Terminologieprozesse und
Terminologiewerkzeuge: Akten des Symposions Heidelberg,19-21 April
2012 (S. 39-46). Köln/München: DTT.
DTT (2010). Terminologiearbeit- Best Practices. Köln: Deutscher Terminologie
Tag e.V.
ELETO. (06. Dezember 2012). ELETO. Von
http://www.eleto.gr/en/termbases.htm abgerufen
Felber, H/Budin, G. (1989). Terminologie in Theorie und Praxis. Tübingen: Narr.
Group, B. T. (10. 12 2012). LISA OSCAR Standards. Von TBX specification:
http://www.ttt.org/oscarStandards/tbx/ abgerufen
Herwartz, R./ Massion, F./Prusseit, I./ Pulitano, D./ Reineke, D./ Rösener, C./
Seewald-Heeg, U./ Zerfaß, A. (2010). Werkzeuge und Technologien. In
DTT, Terminologiearbeit- Best Practices (S. M4-1-M4-32). Köln: DTT e.V.
Literaturverzeichnis
86
kaleidoscope. (13. 12 2012). quickTerm Web 5.2. Von
http://quickterm.kaleidoscope.at/termterm/Pages/Help/de/index.html
abgerufen
KÜDES: Konferenz der Übersetzungsdienste europäsicher Staaten. (2002).
Empfehlungen für die Terminologiearbeit. Bern: Schweizer
Bundeskanzlei.
Mayer, F. (1998). Eintragsmodelle für terminologischen Datenbanken. Tübingen:
Narr.
Mayer, F./Schmitz K.-D. (2011). Terminologie vor neuen Ufer. Ausgewählte
Beiträge der DTT-Symposien 200-2010. München/ Köln: Deutscher
Terminologie-Tag e. V.
Mayer, F./Schmitz K.-D. (2012). Terminologieprozesse und
Terminologiewerkzeuge. Akten des Symposions Heidelberg, 19.-21. April
2012. München/ Köln: Deutscher Terminologie-Tag e. V.
Microsoft. (11. 12 2012). Microsoft Access. (wikipedia) Abgerufen am 16. 10
2012 von http://de.wikipedia.org/wiki/Microsoft_Access
Reineke, D. (2005). MARTIF und TBX- Terminologieaustauschformate für dei
Lokalisierung. In D. K.-D. Reineke, Einführung in die
Softwarelokalisierung (S. 177-188). Tübingen: Narr.
Reineke, D. (2012). TBX-Modellierung, Auszeichnung und Austausch
terminologischer Daten. In F. Mayer, & K.-D. Schmitz,
Terminologieprozesse und Terminologiewerkzeuge: Akten des
Symposions Heidelberg,19-21 April 2012 (S. 193-202). München/Köln:
Deutscher Terminologie-Tag e.V.
Reinke, U. (2012). Terminologiearbeit für und mit Sprachtechnlogie. In F. Mayer,
& K.-D. Schmitz, Terminologieprozesse und Terminologiewerkzeuge.
Akten des Symposions Heidelberg, 19-21 April 2012 (S. 101-119).
München/Köln: DTT.
Resources, I. T. (06. Dezember 2012). ISOcat-Data Category Registry.
Abgerufen am 18. 10 2012 von
https://catalog.clarin.eu/isocat/interface/index.html
Schmitz, K.-D. (2011). Skript Vorlesung Terminologiewissenschaft. Köln.
Schmitz, K.-D. (2012). elcat-Projekt beendet, Lernsystem für Terminologie
verfügbar. eDITion(1), 36-37.
Literaturverzeichnis
87
Schmitz, K.-D. (2012). TBX-ein Standard für den Austausch terminologischer
Daten: Anforderungen, Probleme, Verbesserungen. tekom-
Jahrestagung:Zusammenfassung der Referate (S. 338-340). Wiesbaden:
tcworld GmbH.
Schmitz, K.-D./Straub, D. (2010). Erfolgreiches Terminologiemanagement im
Unternehmen. Stuttgart: TC and more GmbH.
Schmitz, K.-D./Kaukonen, D. (11. 12 2012). E-Learning Terminologie. (FH-Köln)
Abgerufen am 04. 09 2012 von http://www.iim.fh-
koeln.de/dtp/eLearning/00_allgemeines.html
SDL. (11. 12 2012). Info zu SDL MultiTerm Convert. Abgerufen am 17. 10 2012
von
http://producthelp.sdl.com/SDL_MultiTerm_2011/client_de/SDL_MultiTer
m_Convert/About_MultiTerm_Convert.htm
Wright, S. E./Wright, L. (1997). Descriptive Terminology. In S. E. Wright,
Handbook of terminology management (S. 147-160). John Benjamins
B.V.
Wright, S. E. (1997). Handbook of terminology management. John Benjamins
B.V.
Wüster, E. (1991). Einführung in die allgemeine Terminologielehre und
terminologische Lexikographie. Bonn: Romanistischer Verlag.