lernmodul linguistisches propädeutikum - files.ifi.uzh.ch ·...
TRANSCRIPT
Lernmodul lowast
Linguistisches Propaumldeutikum
Institut fuumlr ComputerlinguistikUniversitaumlt Zuumlrich
httpwwwcluzhch
Simon Clematidesiclematcluzhch
Version von 28 Maumlrz 2007
lowastPDF-Version httpwwwcluzhchsiclematlehreling-propscriptscriptpdfHTML-Versionhttpwwwclunizhchsiclematlehreling-propscripthtmlscripthtmlFolien-Version httpwwwclunizhchsiclematlehreling-propslides-4uppdf
Inhaltsverzeichnis
1 Linguistisches Propaumldeutikum I 411 Wort 4
111 Definition 4112 Token 5113 Wortform 5114 synt Wort 5115 Lexem 6
12 Wortarten 6121 5 Hauptwortarten nach Glinz 6
13 Morphologische Merkmale 7131 Genus 8132 Zahl 8133 Kasus 8134 Modus 9135 Zeit 9136 Person 9137 Grad 9138 Flexion 10
14 STTS 1015 Vertiefung 11
2 Linguistisches Propaumldeutikum II 1221 Proben 12
211 Ersetzen 12212 Einsetzen 13213 Weglassen 13214 Verschieben 14215 Umformen 14
22 Satz 1523 Syntaxanalyse 15
231 Konstituenz 15232 Koumlpfe 15233 Dependenz 17234 Satzglieder 17
24 Baumbanken 18241 NEGRA 18242 TIGERSearch 19
25 Vertiefung 20
3 Literaturverzeichnis 21
2
Index 22
3
Abbildungsverzeichnis
11 5 Hauptwortarten nach Glinz 7
21 Moderne Satzgliedlehre 18
4
1 Linguistisches Propaumldeutikum I
Lernziele
bull Kenntnis der Begriffe Wort Token Lexem Lemma Lexemverband
bull Kenntnis der Wortartenlehre fuumlr Deutsch
bull Kenntnis der morphologischen Kategorien fuumlr Deutsch und Englisch
bull Kenntnis und Anwendung des Stuttgart-Tuumlbingen-Tagsets (STTS) mit Hilfe der Referenz-karte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von Morphologie und Wortarten
11 Wort
111 Definition
Wort
Definition 111 (nach [Buszligmann 1990]) Wort Intuitiv vorgegebener und umgangssprachlichverwendeter Begriff fuumlr sprachliche Grundeinheiten dessen zahlreiche sprachwissenschaftlicheDefinitionsversuche uneinheitlich und kontrovers sind
Beispiel 112 (Was ist ein Wort)
1 Sie wollte vor allem am 1 Spiel teilnehmen
2 Sie nahm zB an dem 2 Spiel teil
3 Das gibts doch nicht
4 Blick Online verlost zum Film-Start das laquoIch bin Boratraquo-Kit [ ]
Praumlzisierungsversuche des Wort-BegriffsSprachliche Ebenen zur Praumlzisierung des Wort-Begriffs
bull phonetisch-phonologisch Kleinstes durch Wortakzent und Grenzsignale wie Pause oderKnacklaut theoretisch isolierbares Lautsegment
bull orthographisch-graphemisch durch Leerstellen im Schriftbild isolierte Einheit
bull morphologisch Grundeinheit welche flektierbar ist
bull lexikalisch-semantisch kleinster Bedeutungstraumlger welcher im Lexikon kodifiziert ist
bull syntaktisch kleinste verschieb- und ersetzbare Einheit des Satzes
5
Gaumlngige Wortauffassungen [Linke 2001]
Wieviele verschiedene Woumlrter hat dieser SatzWenn hinter Fliegen eine Fliege fliegt fliegt eine Fliege Fliegen nach
Antworten 11 7 6 5 __
112 Token
Antwort 11 Wort als Vorkommen einer Wortform
Wieviele verschiedene Woumlrter hat dieser SatzWenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt7 eine8 Fliege9 Fliegen10 nach11
Definition 113 (Token) Ein Token ist ein einzelnes Vorkommen einer Wortform in einemText
BemerkungIn der CL werden Interpunktionszeichen ebenfalls als textuelle Token betrachtet Die Antwortwaumlre dann
113 Wortform
Antwort 7 Wort als Wortform
Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7
Definition 114 (Wortform) Eine Wortform ist eine rein graphematische Einheit eines Textes
BemerkungDieselbe Wortform kann Woumlrter unterschiedlicher Bedeutung repraumlsentieren
bull Die Fliege war tot
bull Er trug eine samtene Fliege
bull Fliege nicht so schnell
114 Syntaktisches Wort
Antwort 7 Wort als syntaktisches Wort
Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7
Definition 115 (Syntaktisches Wort) Ein syntaktisches Wort ergibt sich aus einer Wortformkombiniert mit ihren morphosyntaktischen MerkmalenRein orthographische Varianten einer Wortform werden fuumlr ein syntaktisches Wort normalerweisezusammengefasst
Beispiel 116 (Wortform vs syntaktisches Wort)Die Wortform ldquoFliegenrdquo kann mindestens 4 syntaktische Woumlrter repraumlsentieren ldquoFliegerdquo in No-minativ Akkusativ Dativ oder Genitiv Plural
6
115 Lexem
Antwort 6 Wort als Lexem
Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5 fliegt5 eine4 Fliege3 Fliegen3 nach6
Definition 117 (Lexem im engen Sinn) Ein Lexem ist eine Menge (Paradigma) von syn-taktischen Woumlrtern welche sich nur in bestimmten morphosyntaktischen Merkmalen (KasusNumerus Tempus usw) unterscheiden
Definition 118 (Nennform Zitierform Grundform Lemma) Ein Lemma ist eine lexikogra-phische Standard-Notation fuumlr ein Lexem
Beispiel 119 (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im Nominativ Singular repraumlsentiertVerb-Lexeme durch den Infinitiv Wie werden Verb-Lexeme im Latein notiert
Antwort 5 Wort als Lexemverband
Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3 fliegt3 eine4 Fliege3 Fliegen3 nach5
Definition 1110 (Lexemverband auch Lexem im weiten Sinn) Ein Lexemverband ist eineMenge von Lexemen welche den gleichen Wortstamm haben
BemerkungLexemverbaumlnde umfassen typischerweise Lexeme mit unterschiedlichen Wortarten
Beispiel 1111 (Satz als Menge von Lexemverbaumlnden)Wie laumlsst sich die Menge der Woumlrter des Beispielsatzes in Mengennotation als Lexemverbanddarstellen
12 Lehre von den Wortarten
Wortarten nach [Buszligmann 1990]
Definition 121 (Redeteile engl parts of speech (PoS)) Wortarten sind das Ergebnis derKlassifizierung der Woumlrter einer Sprache nach morphologischen syntaktischen undoder seman-tischen Kriterien
Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca 100 vor Chr) wirkte stark bis ins 19 Jahrhun-dert Fuumlr Deutsch wurde in den Schulen lange die traditionelle 10-Wortarten-Lehre (Numeraleals eigene Kategorie) gemaumlss Adelung (1781) vermittelt Mit der 5-Wortarten-Lehre nach HansGlinz setzte sich ab den 50er-Jahren eine flachere Einteilung durch welche explizite (operatio-nalisierbare) und durchgaumlngige Klassifikationskriterien anwendet
121 5 Hauptwortarten nach Glinz
KlassifikationskriterienWelcher Fachbegriff waumlre praumlziser anstelle von ldquoWoumlrterrdquo in der Abbildung
7
Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]
13 Morphologische Merkmale
Morphologische Kategorien und ihre Merkmale
Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden
Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems
bull Konjugation von Verben
bull Deklination von Nomen Adjektiven Artikeln und Pronomen
bull Steigerung von Adjektiven
Diskussion Sind steigerbare Adverbien ein Widerspruch im System
Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn
8
131 Genus
Das Genus (engl gender) Grammatisches Geschlecht
Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien
Tabelle 11 Uumlbersicht Genera
BemerkungDer Plural von Genus lautet Genera
Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)
132 Numerus
Der Numerus (engl number) Grammatische Zahl
Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner
Tabelle 12 Uumlbersicht Numeri
BemerkungDer Plural von Numerus lautet Numeri
Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)
133 Kasus
Der Kasus (engl case) Fall
Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum
Tabelle 13 Uumlbersicht Kasus
BemerkungDer Plural von Kasus lautet Kasus
Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)
9
134 Modus
Der Modus (engl mode mood) Aussageweise
Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe
Tabelle 14 Uumlbersicht Modi
BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt
135 Tempus
Das Tempus (engl tense) grammatische Zeit Zeitform
Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging
Tabelle 15 Uumlbersicht Tempora
BemerkungenDer Plural von Tempus lautet Tempora
136 Person
Die Person (engl person)
Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht
Tabelle 16 Uumlbersicht Personen
BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich
Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)
137 Grad
Der Grad (engl degree) Steigerung Komparation
Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)
10
Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste
Tabelle 17 Uumlbersicht Komparation
138 Adjektiv-Flexion
Die Adjektiv-Flexion (engl adjective inflection)
Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse
Tabelle 18 Uumlbersicht Adjektiv-Flexion
Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)
14 STTS
StuttgartTuumlbingen-Tagset (STTS)
bull httpwwwclunizhchclabhilfestts
bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)
bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert
bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output
bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden
bull Alternativen Muumlnsteraner Tagset [Steiner 2003]
Besonderheiten von STTS
bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion
bull Kategorie fuumlr fremdsprachliches Material (FM)
bull Feine Aufgliederung bei Partikeln
bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen
bull Eigennamen sind eine semantisch definierte Klasse
bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden
11
15 Vertiefung
bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell
bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]
bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem
PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie
12
2 Linguistisches Propaumldeutikum II
Lernziele
bull Kenntnis der klassischen syntaktischen Proben
bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase
bull Kenntnis der wichtigsten syntaktischen Funktionen
bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen
bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank
21 Linguistische Proben
Linguistische Testverfahren
Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen
211 Ersatzprobe
Ersatzprobe
Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben
Beispiel 213 (Bestimmung des Kasus)
Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat
Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen
Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)
bull Das ist das Angebot das uns uumlberzeugt hat
13
bull Dieses ist das Angebot welches uns uumlberzeugt hat
bull Welches ist das Angebot dieses uns uumlberzeugt hat
bull Das ist dieses Angebot welches uns uumlberzeugt hat
Probleme der Interpretation
bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes
bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen
212 Einsetzprobe
Einsetzprobe
Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert
Beispiel 216 (Bestimmung der Wortart)
Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive
213 Weglassprobe
Weglassprobe
Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten
Beispiel 218 (Bestimmung eines Satzglieds)
1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
FrageWarum nicht Variante 4
14
214 Verschiebeprobe
Verschiebeprobe
Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen
Beispiel 2110 (Bestimmung von Satzgliedern)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen bereite ich die Sitzung mit dem Chef vor
3 Ich bereite die Sitzung mit dem Chef morgen vor
Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb
Verschiebeprobe
Beispiel 2111 (Unzulaumlssiges Verschieben)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen ich bereite die Sitzung mit dem Chef vor
3 Die Sitzung bereite ich morgen mit dem Chef vor
GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung
215 Umformungsproben
Umformungsprobe
Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut
Beispiel 2113 (Funktion von Nebensaumltzen)
1 Es wuumlrde mich freuen wenn du mitkaumlmest
2 Dein Mitkommen wuumlrde mich freuen
Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)
1 Die Laumlrche ist ein Nadelbaum
2 ein Nadelbaum sein die Laumlrche
15
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
Inhaltsverzeichnis
1 Linguistisches Propaumldeutikum I 411 Wort 4
111 Definition 4112 Token 5113 Wortform 5114 synt Wort 5115 Lexem 6
12 Wortarten 6121 5 Hauptwortarten nach Glinz 6
13 Morphologische Merkmale 7131 Genus 8132 Zahl 8133 Kasus 8134 Modus 9135 Zeit 9136 Person 9137 Grad 9138 Flexion 10
14 STTS 1015 Vertiefung 11
2 Linguistisches Propaumldeutikum II 1221 Proben 12
211 Ersetzen 12212 Einsetzen 13213 Weglassen 13214 Verschieben 14215 Umformen 14
22 Satz 1523 Syntaxanalyse 15
231 Konstituenz 15232 Koumlpfe 15233 Dependenz 17234 Satzglieder 17
24 Baumbanken 18241 NEGRA 18242 TIGERSearch 19
25 Vertiefung 20
3 Literaturverzeichnis 21
2
Index 22
3
Abbildungsverzeichnis
11 5 Hauptwortarten nach Glinz 7
21 Moderne Satzgliedlehre 18
4
1 Linguistisches Propaumldeutikum I
Lernziele
bull Kenntnis der Begriffe Wort Token Lexem Lemma Lexemverband
bull Kenntnis der Wortartenlehre fuumlr Deutsch
bull Kenntnis der morphologischen Kategorien fuumlr Deutsch und Englisch
bull Kenntnis und Anwendung des Stuttgart-Tuumlbingen-Tagsets (STTS) mit Hilfe der Referenz-karte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von Morphologie und Wortarten
11 Wort
111 Definition
Wort
Definition 111 (nach [Buszligmann 1990]) Wort Intuitiv vorgegebener und umgangssprachlichverwendeter Begriff fuumlr sprachliche Grundeinheiten dessen zahlreiche sprachwissenschaftlicheDefinitionsversuche uneinheitlich und kontrovers sind
Beispiel 112 (Was ist ein Wort)
1 Sie wollte vor allem am 1 Spiel teilnehmen
2 Sie nahm zB an dem 2 Spiel teil
3 Das gibts doch nicht
4 Blick Online verlost zum Film-Start das laquoIch bin Boratraquo-Kit [ ]
Praumlzisierungsversuche des Wort-BegriffsSprachliche Ebenen zur Praumlzisierung des Wort-Begriffs
bull phonetisch-phonologisch Kleinstes durch Wortakzent und Grenzsignale wie Pause oderKnacklaut theoretisch isolierbares Lautsegment
bull orthographisch-graphemisch durch Leerstellen im Schriftbild isolierte Einheit
bull morphologisch Grundeinheit welche flektierbar ist
bull lexikalisch-semantisch kleinster Bedeutungstraumlger welcher im Lexikon kodifiziert ist
bull syntaktisch kleinste verschieb- und ersetzbare Einheit des Satzes
5
Gaumlngige Wortauffassungen [Linke 2001]
Wieviele verschiedene Woumlrter hat dieser SatzWenn hinter Fliegen eine Fliege fliegt fliegt eine Fliege Fliegen nach
Antworten 11 7 6 5 __
112 Token
Antwort 11 Wort als Vorkommen einer Wortform
Wieviele verschiedene Woumlrter hat dieser SatzWenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt7 eine8 Fliege9 Fliegen10 nach11
Definition 113 (Token) Ein Token ist ein einzelnes Vorkommen einer Wortform in einemText
BemerkungIn der CL werden Interpunktionszeichen ebenfalls als textuelle Token betrachtet Die Antwortwaumlre dann
113 Wortform
Antwort 7 Wort als Wortform
Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7
Definition 114 (Wortform) Eine Wortform ist eine rein graphematische Einheit eines Textes
BemerkungDieselbe Wortform kann Woumlrter unterschiedlicher Bedeutung repraumlsentieren
bull Die Fliege war tot
bull Er trug eine samtene Fliege
bull Fliege nicht so schnell
114 Syntaktisches Wort
Antwort 7 Wort als syntaktisches Wort
Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7
Definition 115 (Syntaktisches Wort) Ein syntaktisches Wort ergibt sich aus einer Wortformkombiniert mit ihren morphosyntaktischen MerkmalenRein orthographische Varianten einer Wortform werden fuumlr ein syntaktisches Wort normalerweisezusammengefasst
Beispiel 116 (Wortform vs syntaktisches Wort)Die Wortform ldquoFliegenrdquo kann mindestens 4 syntaktische Woumlrter repraumlsentieren ldquoFliegerdquo in No-minativ Akkusativ Dativ oder Genitiv Plural
6
115 Lexem
Antwort 6 Wort als Lexem
Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5 fliegt5 eine4 Fliege3 Fliegen3 nach6
Definition 117 (Lexem im engen Sinn) Ein Lexem ist eine Menge (Paradigma) von syn-taktischen Woumlrtern welche sich nur in bestimmten morphosyntaktischen Merkmalen (KasusNumerus Tempus usw) unterscheiden
Definition 118 (Nennform Zitierform Grundform Lemma) Ein Lemma ist eine lexikogra-phische Standard-Notation fuumlr ein Lexem
Beispiel 119 (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im Nominativ Singular repraumlsentiertVerb-Lexeme durch den Infinitiv Wie werden Verb-Lexeme im Latein notiert
Antwort 5 Wort als Lexemverband
Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3 fliegt3 eine4 Fliege3 Fliegen3 nach5
Definition 1110 (Lexemverband auch Lexem im weiten Sinn) Ein Lexemverband ist eineMenge von Lexemen welche den gleichen Wortstamm haben
BemerkungLexemverbaumlnde umfassen typischerweise Lexeme mit unterschiedlichen Wortarten
Beispiel 1111 (Satz als Menge von Lexemverbaumlnden)Wie laumlsst sich die Menge der Woumlrter des Beispielsatzes in Mengennotation als Lexemverbanddarstellen
12 Lehre von den Wortarten
Wortarten nach [Buszligmann 1990]
Definition 121 (Redeteile engl parts of speech (PoS)) Wortarten sind das Ergebnis derKlassifizierung der Woumlrter einer Sprache nach morphologischen syntaktischen undoder seman-tischen Kriterien
Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca 100 vor Chr) wirkte stark bis ins 19 Jahrhun-dert Fuumlr Deutsch wurde in den Schulen lange die traditionelle 10-Wortarten-Lehre (Numeraleals eigene Kategorie) gemaumlss Adelung (1781) vermittelt Mit der 5-Wortarten-Lehre nach HansGlinz setzte sich ab den 50er-Jahren eine flachere Einteilung durch welche explizite (operatio-nalisierbare) und durchgaumlngige Klassifikationskriterien anwendet
121 5 Hauptwortarten nach Glinz
KlassifikationskriterienWelcher Fachbegriff waumlre praumlziser anstelle von ldquoWoumlrterrdquo in der Abbildung
7
Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]
13 Morphologische Merkmale
Morphologische Kategorien und ihre Merkmale
Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden
Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems
bull Konjugation von Verben
bull Deklination von Nomen Adjektiven Artikeln und Pronomen
bull Steigerung von Adjektiven
Diskussion Sind steigerbare Adverbien ein Widerspruch im System
Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn
8
131 Genus
Das Genus (engl gender) Grammatisches Geschlecht
Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien
Tabelle 11 Uumlbersicht Genera
BemerkungDer Plural von Genus lautet Genera
Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)
132 Numerus
Der Numerus (engl number) Grammatische Zahl
Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner
Tabelle 12 Uumlbersicht Numeri
BemerkungDer Plural von Numerus lautet Numeri
Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)
133 Kasus
Der Kasus (engl case) Fall
Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum
Tabelle 13 Uumlbersicht Kasus
BemerkungDer Plural von Kasus lautet Kasus
Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)
9
134 Modus
Der Modus (engl mode mood) Aussageweise
Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe
Tabelle 14 Uumlbersicht Modi
BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt
135 Tempus
Das Tempus (engl tense) grammatische Zeit Zeitform
Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging
Tabelle 15 Uumlbersicht Tempora
BemerkungenDer Plural von Tempus lautet Tempora
136 Person
Die Person (engl person)
Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht
Tabelle 16 Uumlbersicht Personen
BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich
Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)
137 Grad
Der Grad (engl degree) Steigerung Komparation
Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)
10
Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste
Tabelle 17 Uumlbersicht Komparation
138 Adjektiv-Flexion
Die Adjektiv-Flexion (engl adjective inflection)
Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse
Tabelle 18 Uumlbersicht Adjektiv-Flexion
Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)
14 STTS
StuttgartTuumlbingen-Tagset (STTS)
bull httpwwwclunizhchclabhilfestts
bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)
bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert
bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output
bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden
bull Alternativen Muumlnsteraner Tagset [Steiner 2003]
Besonderheiten von STTS
bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion
bull Kategorie fuumlr fremdsprachliches Material (FM)
bull Feine Aufgliederung bei Partikeln
bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen
bull Eigennamen sind eine semantisch definierte Klasse
bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden
11
15 Vertiefung
bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell
bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]
bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem
PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie
12
2 Linguistisches Propaumldeutikum II
Lernziele
bull Kenntnis der klassischen syntaktischen Proben
bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase
bull Kenntnis der wichtigsten syntaktischen Funktionen
bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen
bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank
21 Linguistische Proben
Linguistische Testverfahren
Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen
211 Ersatzprobe
Ersatzprobe
Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben
Beispiel 213 (Bestimmung des Kasus)
Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat
Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen
Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)
bull Das ist das Angebot das uns uumlberzeugt hat
13
bull Dieses ist das Angebot welches uns uumlberzeugt hat
bull Welches ist das Angebot dieses uns uumlberzeugt hat
bull Das ist dieses Angebot welches uns uumlberzeugt hat
Probleme der Interpretation
bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes
bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen
212 Einsetzprobe
Einsetzprobe
Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert
Beispiel 216 (Bestimmung der Wortart)
Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive
213 Weglassprobe
Weglassprobe
Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten
Beispiel 218 (Bestimmung eines Satzglieds)
1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
FrageWarum nicht Variante 4
14
214 Verschiebeprobe
Verschiebeprobe
Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen
Beispiel 2110 (Bestimmung von Satzgliedern)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen bereite ich die Sitzung mit dem Chef vor
3 Ich bereite die Sitzung mit dem Chef morgen vor
Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb
Verschiebeprobe
Beispiel 2111 (Unzulaumlssiges Verschieben)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen ich bereite die Sitzung mit dem Chef vor
3 Die Sitzung bereite ich morgen mit dem Chef vor
GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung
215 Umformungsproben
Umformungsprobe
Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut
Beispiel 2113 (Funktion von Nebensaumltzen)
1 Es wuumlrde mich freuen wenn du mitkaumlmest
2 Dein Mitkommen wuumlrde mich freuen
Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)
1 Die Laumlrche ist ein Nadelbaum
2 ein Nadelbaum sein die Laumlrche
15
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
Index 22
3
Abbildungsverzeichnis
11 5 Hauptwortarten nach Glinz 7
21 Moderne Satzgliedlehre 18
4
1 Linguistisches Propaumldeutikum I
Lernziele
bull Kenntnis der Begriffe Wort Token Lexem Lemma Lexemverband
bull Kenntnis der Wortartenlehre fuumlr Deutsch
bull Kenntnis der morphologischen Kategorien fuumlr Deutsch und Englisch
bull Kenntnis und Anwendung des Stuttgart-Tuumlbingen-Tagsets (STTS) mit Hilfe der Referenz-karte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von Morphologie und Wortarten
11 Wort
111 Definition
Wort
Definition 111 (nach [Buszligmann 1990]) Wort Intuitiv vorgegebener und umgangssprachlichverwendeter Begriff fuumlr sprachliche Grundeinheiten dessen zahlreiche sprachwissenschaftlicheDefinitionsversuche uneinheitlich und kontrovers sind
Beispiel 112 (Was ist ein Wort)
1 Sie wollte vor allem am 1 Spiel teilnehmen
2 Sie nahm zB an dem 2 Spiel teil
3 Das gibts doch nicht
4 Blick Online verlost zum Film-Start das laquoIch bin Boratraquo-Kit [ ]
Praumlzisierungsversuche des Wort-BegriffsSprachliche Ebenen zur Praumlzisierung des Wort-Begriffs
bull phonetisch-phonologisch Kleinstes durch Wortakzent und Grenzsignale wie Pause oderKnacklaut theoretisch isolierbares Lautsegment
bull orthographisch-graphemisch durch Leerstellen im Schriftbild isolierte Einheit
bull morphologisch Grundeinheit welche flektierbar ist
bull lexikalisch-semantisch kleinster Bedeutungstraumlger welcher im Lexikon kodifiziert ist
bull syntaktisch kleinste verschieb- und ersetzbare Einheit des Satzes
5
Gaumlngige Wortauffassungen [Linke 2001]
Wieviele verschiedene Woumlrter hat dieser SatzWenn hinter Fliegen eine Fliege fliegt fliegt eine Fliege Fliegen nach
Antworten 11 7 6 5 __
112 Token
Antwort 11 Wort als Vorkommen einer Wortform
Wieviele verschiedene Woumlrter hat dieser SatzWenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt7 eine8 Fliege9 Fliegen10 nach11
Definition 113 (Token) Ein Token ist ein einzelnes Vorkommen einer Wortform in einemText
BemerkungIn der CL werden Interpunktionszeichen ebenfalls als textuelle Token betrachtet Die Antwortwaumlre dann
113 Wortform
Antwort 7 Wort als Wortform
Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7
Definition 114 (Wortform) Eine Wortform ist eine rein graphematische Einheit eines Textes
BemerkungDieselbe Wortform kann Woumlrter unterschiedlicher Bedeutung repraumlsentieren
bull Die Fliege war tot
bull Er trug eine samtene Fliege
bull Fliege nicht so schnell
114 Syntaktisches Wort
Antwort 7 Wort als syntaktisches Wort
Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7
Definition 115 (Syntaktisches Wort) Ein syntaktisches Wort ergibt sich aus einer Wortformkombiniert mit ihren morphosyntaktischen MerkmalenRein orthographische Varianten einer Wortform werden fuumlr ein syntaktisches Wort normalerweisezusammengefasst
Beispiel 116 (Wortform vs syntaktisches Wort)Die Wortform ldquoFliegenrdquo kann mindestens 4 syntaktische Woumlrter repraumlsentieren ldquoFliegerdquo in No-minativ Akkusativ Dativ oder Genitiv Plural
6
115 Lexem
Antwort 6 Wort als Lexem
Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5 fliegt5 eine4 Fliege3 Fliegen3 nach6
Definition 117 (Lexem im engen Sinn) Ein Lexem ist eine Menge (Paradigma) von syn-taktischen Woumlrtern welche sich nur in bestimmten morphosyntaktischen Merkmalen (KasusNumerus Tempus usw) unterscheiden
Definition 118 (Nennform Zitierform Grundform Lemma) Ein Lemma ist eine lexikogra-phische Standard-Notation fuumlr ein Lexem
Beispiel 119 (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im Nominativ Singular repraumlsentiertVerb-Lexeme durch den Infinitiv Wie werden Verb-Lexeme im Latein notiert
Antwort 5 Wort als Lexemverband
Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3 fliegt3 eine4 Fliege3 Fliegen3 nach5
Definition 1110 (Lexemverband auch Lexem im weiten Sinn) Ein Lexemverband ist eineMenge von Lexemen welche den gleichen Wortstamm haben
BemerkungLexemverbaumlnde umfassen typischerweise Lexeme mit unterschiedlichen Wortarten
Beispiel 1111 (Satz als Menge von Lexemverbaumlnden)Wie laumlsst sich die Menge der Woumlrter des Beispielsatzes in Mengennotation als Lexemverbanddarstellen
12 Lehre von den Wortarten
Wortarten nach [Buszligmann 1990]
Definition 121 (Redeteile engl parts of speech (PoS)) Wortarten sind das Ergebnis derKlassifizierung der Woumlrter einer Sprache nach morphologischen syntaktischen undoder seman-tischen Kriterien
Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca 100 vor Chr) wirkte stark bis ins 19 Jahrhun-dert Fuumlr Deutsch wurde in den Schulen lange die traditionelle 10-Wortarten-Lehre (Numeraleals eigene Kategorie) gemaumlss Adelung (1781) vermittelt Mit der 5-Wortarten-Lehre nach HansGlinz setzte sich ab den 50er-Jahren eine flachere Einteilung durch welche explizite (operatio-nalisierbare) und durchgaumlngige Klassifikationskriterien anwendet
121 5 Hauptwortarten nach Glinz
KlassifikationskriterienWelcher Fachbegriff waumlre praumlziser anstelle von ldquoWoumlrterrdquo in der Abbildung
7
Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]
13 Morphologische Merkmale
Morphologische Kategorien und ihre Merkmale
Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden
Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems
bull Konjugation von Verben
bull Deklination von Nomen Adjektiven Artikeln und Pronomen
bull Steigerung von Adjektiven
Diskussion Sind steigerbare Adverbien ein Widerspruch im System
Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn
8
131 Genus
Das Genus (engl gender) Grammatisches Geschlecht
Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien
Tabelle 11 Uumlbersicht Genera
BemerkungDer Plural von Genus lautet Genera
Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)
132 Numerus
Der Numerus (engl number) Grammatische Zahl
Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner
Tabelle 12 Uumlbersicht Numeri
BemerkungDer Plural von Numerus lautet Numeri
Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)
133 Kasus
Der Kasus (engl case) Fall
Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum
Tabelle 13 Uumlbersicht Kasus
BemerkungDer Plural von Kasus lautet Kasus
Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)
9
134 Modus
Der Modus (engl mode mood) Aussageweise
Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe
Tabelle 14 Uumlbersicht Modi
BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt
135 Tempus
Das Tempus (engl tense) grammatische Zeit Zeitform
Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging
Tabelle 15 Uumlbersicht Tempora
BemerkungenDer Plural von Tempus lautet Tempora
136 Person
Die Person (engl person)
Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht
Tabelle 16 Uumlbersicht Personen
BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich
Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)
137 Grad
Der Grad (engl degree) Steigerung Komparation
Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)
10
Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste
Tabelle 17 Uumlbersicht Komparation
138 Adjektiv-Flexion
Die Adjektiv-Flexion (engl adjective inflection)
Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse
Tabelle 18 Uumlbersicht Adjektiv-Flexion
Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)
14 STTS
StuttgartTuumlbingen-Tagset (STTS)
bull httpwwwclunizhchclabhilfestts
bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)
bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert
bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output
bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden
bull Alternativen Muumlnsteraner Tagset [Steiner 2003]
Besonderheiten von STTS
bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion
bull Kategorie fuumlr fremdsprachliches Material (FM)
bull Feine Aufgliederung bei Partikeln
bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen
bull Eigennamen sind eine semantisch definierte Klasse
bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden
11
15 Vertiefung
bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell
bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]
bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem
PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie
12
2 Linguistisches Propaumldeutikum II
Lernziele
bull Kenntnis der klassischen syntaktischen Proben
bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase
bull Kenntnis der wichtigsten syntaktischen Funktionen
bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen
bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank
21 Linguistische Proben
Linguistische Testverfahren
Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen
211 Ersatzprobe
Ersatzprobe
Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben
Beispiel 213 (Bestimmung des Kasus)
Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat
Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen
Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)
bull Das ist das Angebot das uns uumlberzeugt hat
13
bull Dieses ist das Angebot welches uns uumlberzeugt hat
bull Welches ist das Angebot dieses uns uumlberzeugt hat
bull Das ist dieses Angebot welches uns uumlberzeugt hat
Probleme der Interpretation
bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes
bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen
212 Einsetzprobe
Einsetzprobe
Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert
Beispiel 216 (Bestimmung der Wortart)
Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive
213 Weglassprobe
Weglassprobe
Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten
Beispiel 218 (Bestimmung eines Satzglieds)
1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
FrageWarum nicht Variante 4
14
214 Verschiebeprobe
Verschiebeprobe
Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen
Beispiel 2110 (Bestimmung von Satzgliedern)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen bereite ich die Sitzung mit dem Chef vor
3 Ich bereite die Sitzung mit dem Chef morgen vor
Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb
Verschiebeprobe
Beispiel 2111 (Unzulaumlssiges Verschieben)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen ich bereite die Sitzung mit dem Chef vor
3 Die Sitzung bereite ich morgen mit dem Chef vor
GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung
215 Umformungsproben
Umformungsprobe
Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut
Beispiel 2113 (Funktion von Nebensaumltzen)
1 Es wuumlrde mich freuen wenn du mitkaumlmest
2 Dein Mitkommen wuumlrde mich freuen
Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)
1 Die Laumlrche ist ein Nadelbaum
2 ein Nadelbaum sein die Laumlrche
15
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
Abbildungsverzeichnis
11 5 Hauptwortarten nach Glinz 7
21 Moderne Satzgliedlehre 18
4
1 Linguistisches Propaumldeutikum I
Lernziele
bull Kenntnis der Begriffe Wort Token Lexem Lemma Lexemverband
bull Kenntnis der Wortartenlehre fuumlr Deutsch
bull Kenntnis der morphologischen Kategorien fuumlr Deutsch und Englisch
bull Kenntnis und Anwendung des Stuttgart-Tuumlbingen-Tagsets (STTS) mit Hilfe der Referenz-karte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von Morphologie und Wortarten
11 Wort
111 Definition
Wort
Definition 111 (nach [Buszligmann 1990]) Wort Intuitiv vorgegebener und umgangssprachlichverwendeter Begriff fuumlr sprachliche Grundeinheiten dessen zahlreiche sprachwissenschaftlicheDefinitionsversuche uneinheitlich und kontrovers sind
Beispiel 112 (Was ist ein Wort)
1 Sie wollte vor allem am 1 Spiel teilnehmen
2 Sie nahm zB an dem 2 Spiel teil
3 Das gibts doch nicht
4 Blick Online verlost zum Film-Start das laquoIch bin Boratraquo-Kit [ ]
Praumlzisierungsversuche des Wort-BegriffsSprachliche Ebenen zur Praumlzisierung des Wort-Begriffs
bull phonetisch-phonologisch Kleinstes durch Wortakzent und Grenzsignale wie Pause oderKnacklaut theoretisch isolierbares Lautsegment
bull orthographisch-graphemisch durch Leerstellen im Schriftbild isolierte Einheit
bull morphologisch Grundeinheit welche flektierbar ist
bull lexikalisch-semantisch kleinster Bedeutungstraumlger welcher im Lexikon kodifiziert ist
bull syntaktisch kleinste verschieb- und ersetzbare Einheit des Satzes
5
Gaumlngige Wortauffassungen [Linke 2001]
Wieviele verschiedene Woumlrter hat dieser SatzWenn hinter Fliegen eine Fliege fliegt fliegt eine Fliege Fliegen nach
Antworten 11 7 6 5 __
112 Token
Antwort 11 Wort als Vorkommen einer Wortform
Wieviele verschiedene Woumlrter hat dieser SatzWenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt7 eine8 Fliege9 Fliegen10 nach11
Definition 113 (Token) Ein Token ist ein einzelnes Vorkommen einer Wortform in einemText
BemerkungIn der CL werden Interpunktionszeichen ebenfalls als textuelle Token betrachtet Die Antwortwaumlre dann
113 Wortform
Antwort 7 Wort als Wortform
Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7
Definition 114 (Wortform) Eine Wortform ist eine rein graphematische Einheit eines Textes
BemerkungDieselbe Wortform kann Woumlrter unterschiedlicher Bedeutung repraumlsentieren
bull Die Fliege war tot
bull Er trug eine samtene Fliege
bull Fliege nicht so schnell
114 Syntaktisches Wort
Antwort 7 Wort als syntaktisches Wort
Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7
Definition 115 (Syntaktisches Wort) Ein syntaktisches Wort ergibt sich aus einer Wortformkombiniert mit ihren morphosyntaktischen MerkmalenRein orthographische Varianten einer Wortform werden fuumlr ein syntaktisches Wort normalerweisezusammengefasst
Beispiel 116 (Wortform vs syntaktisches Wort)Die Wortform ldquoFliegenrdquo kann mindestens 4 syntaktische Woumlrter repraumlsentieren ldquoFliegerdquo in No-minativ Akkusativ Dativ oder Genitiv Plural
6
115 Lexem
Antwort 6 Wort als Lexem
Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5 fliegt5 eine4 Fliege3 Fliegen3 nach6
Definition 117 (Lexem im engen Sinn) Ein Lexem ist eine Menge (Paradigma) von syn-taktischen Woumlrtern welche sich nur in bestimmten morphosyntaktischen Merkmalen (KasusNumerus Tempus usw) unterscheiden
Definition 118 (Nennform Zitierform Grundform Lemma) Ein Lemma ist eine lexikogra-phische Standard-Notation fuumlr ein Lexem
Beispiel 119 (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im Nominativ Singular repraumlsentiertVerb-Lexeme durch den Infinitiv Wie werden Verb-Lexeme im Latein notiert
Antwort 5 Wort als Lexemverband
Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3 fliegt3 eine4 Fliege3 Fliegen3 nach5
Definition 1110 (Lexemverband auch Lexem im weiten Sinn) Ein Lexemverband ist eineMenge von Lexemen welche den gleichen Wortstamm haben
BemerkungLexemverbaumlnde umfassen typischerweise Lexeme mit unterschiedlichen Wortarten
Beispiel 1111 (Satz als Menge von Lexemverbaumlnden)Wie laumlsst sich die Menge der Woumlrter des Beispielsatzes in Mengennotation als Lexemverbanddarstellen
12 Lehre von den Wortarten
Wortarten nach [Buszligmann 1990]
Definition 121 (Redeteile engl parts of speech (PoS)) Wortarten sind das Ergebnis derKlassifizierung der Woumlrter einer Sprache nach morphologischen syntaktischen undoder seman-tischen Kriterien
Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca 100 vor Chr) wirkte stark bis ins 19 Jahrhun-dert Fuumlr Deutsch wurde in den Schulen lange die traditionelle 10-Wortarten-Lehre (Numeraleals eigene Kategorie) gemaumlss Adelung (1781) vermittelt Mit der 5-Wortarten-Lehre nach HansGlinz setzte sich ab den 50er-Jahren eine flachere Einteilung durch welche explizite (operatio-nalisierbare) und durchgaumlngige Klassifikationskriterien anwendet
121 5 Hauptwortarten nach Glinz
KlassifikationskriterienWelcher Fachbegriff waumlre praumlziser anstelle von ldquoWoumlrterrdquo in der Abbildung
7
Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]
13 Morphologische Merkmale
Morphologische Kategorien und ihre Merkmale
Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden
Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems
bull Konjugation von Verben
bull Deklination von Nomen Adjektiven Artikeln und Pronomen
bull Steigerung von Adjektiven
Diskussion Sind steigerbare Adverbien ein Widerspruch im System
Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn
8
131 Genus
Das Genus (engl gender) Grammatisches Geschlecht
Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien
Tabelle 11 Uumlbersicht Genera
BemerkungDer Plural von Genus lautet Genera
Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)
132 Numerus
Der Numerus (engl number) Grammatische Zahl
Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner
Tabelle 12 Uumlbersicht Numeri
BemerkungDer Plural von Numerus lautet Numeri
Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)
133 Kasus
Der Kasus (engl case) Fall
Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum
Tabelle 13 Uumlbersicht Kasus
BemerkungDer Plural von Kasus lautet Kasus
Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)
9
134 Modus
Der Modus (engl mode mood) Aussageweise
Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe
Tabelle 14 Uumlbersicht Modi
BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt
135 Tempus
Das Tempus (engl tense) grammatische Zeit Zeitform
Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging
Tabelle 15 Uumlbersicht Tempora
BemerkungenDer Plural von Tempus lautet Tempora
136 Person
Die Person (engl person)
Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht
Tabelle 16 Uumlbersicht Personen
BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich
Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)
137 Grad
Der Grad (engl degree) Steigerung Komparation
Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)
10
Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste
Tabelle 17 Uumlbersicht Komparation
138 Adjektiv-Flexion
Die Adjektiv-Flexion (engl adjective inflection)
Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse
Tabelle 18 Uumlbersicht Adjektiv-Flexion
Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)
14 STTS
StuttgartTuumlbingen-Tagset (STTS)
bull httpwwwclunizhchclabhilfestts
bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)
bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert
bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output
bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden
bull Alternativen Muumlnsteraner Tagset [Steiner 2003]
Besonderheiten von STTS
bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion
bull Kategorie fuumlr fremdsprachliches Material (FM)
bull Feine Aufgliederung bei Partikeln
bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen
bull Eigennamen sind eine semantisch definierte Klasse
bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden
11
15 Vertiefung
bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell
bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]
bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem
PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie
12
2 Linguistisches Propaumldeutikum II
Lernziele
bull Kenntnis der klassischen syntaktischen Proben
bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase
bull Kenntnis der wichtigsten syntaktischen Funktionen
bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen
bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank
21 Linguistische Proben
Linguistische Testverfahren
Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen
211 Ersatzprobe
Ersatzprobe
Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben
Beispiel 213 (Bestimmung des Kasus)
Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat
Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen
Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)
bull Das ist das Angebot das uns uumlberzeugt hat
13
bull Dieses ist das Angebot welches uns uumlberzeugt hat
bull Welches ist das Angebot dieses uns uumlberzeugt hat
bull Das ist dieses Angebot welches uns uumlberzeugt hat
Probleme der Interpretation
bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes
bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen
212 Einsetzprobe
Einsetzprobe
Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert
Beispiel 216 (Bestimmung der Wortart)
Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive
213 Weglassprobe
Weglassprobe
Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten
Beispiel 218 (Bestimmung eines Satzglieds)
1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
FrageWarum nicht Variante 4
14
214 Verschiebeprobe
Verschiebeprobe
Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen
Beispiel 2110 (Bestimmung von Satzgliedern)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen bereite ich die Sitzung mit dem Chef vor
3 Ich bereite die Sitzung mit dem Chef morgen vor
Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb
Verschiebeprobe
Beispiel 2111 (Unzulaumlssiges Verschieben)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen ich bereite die Sitzung mit dem Chef vor
3 Die Sitzung bereite ich morgen mit dem Chef vor
GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung
215 Umformungsproben
Umformungsprobe
Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut
Beispiel 2113 (Funktion von Nebensaumltzen)
1 Es wuumlrde mich freuen wenn du mitkaumlmest
2 Dein Mitkommen wuumlrde mich freuen
Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)
1 Die Laumlrche ist ein Nadelbaum
2 ein Nadelbaum sein die Laumlrche
15
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
1 Linguistisches Propaumldeutikum I
Lernziele
bull Kenntnis der Begriffe Wort Token Lexem Lemma Lexemverband
bull Kenntnis der Wortartenlehre fuumlr Deutsch
bull Kenntnis der morphologischen Kategorien fuumlr Deutsch und Englisch
bull Kenntnis und Anwendung des Stuttgart-Tuumlbingen-Tagsets (STTS) mit Hilfe der Referenz-karte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von Morphologie und Wortarten
11 Wort
111 Definition
Wort
Definition 111 (nach [Buszligmann 1990]) Wort Intuitiv vorgegebener und umgangssprachlichverwendeter Begriff fuumlr sprachliche Grundeinheiten dessen zahlreiche sprachwissenschaftlicheDefinitionsversuche uneinheitlich und kontrovers sind
Beispiel 112 (Was ist ein Wort)
1 Sie wollte vor allem am 1 Spiel teilnehmen
2 Sie nahm zB an dem 2 Spiel teil
3 Das gibts doch nicht
4 Blick Online verlost zum Film-Start das laquoIch bin Boratraquo-Kit [ ]
Praumlzisierungsversuche des Wort-BegriffsSprachliche Ebenen zur Praumlzisierung des Wort-Begriffs
bull phonetisch-phonologisch Kleinstes durch Wortakzent und Grenzsignale wie Pause oderKnacklaut theoretisch isolierbares Lautsegment
bull orthographisch-graphemisch durch Leerstellen im Schriftbild isolierte Einheit
bull morphologisch Grundeinheit welche flektierbar ist
bull lexikalisch-semantisch kleinster Bedeutungstraumlger welcher im Lexikon kodifiziert ist
bull syntaktisch kleinste verschieb- und ersetzbare Einheit des Satzes
5
Gaumlngige Wortauffassungen [Linke 2001]
Wieviele verschiedene Woumlrter hat dieser SatzWenn hinter Fliegen eine Fliege fliegt fliegt eine Fliege Fliegen nach
Antworten 11 7 6 5 __
112 Token
Antwort 11 Wort als Vorkommen einer Wortform
Wieviele verschiedene Woumlrter hat dieser SatzWenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt7 eine8 Fliege9 Fliegen10 nach11
Definition 113 (Token) Ein Token ist ein einzelnes Vorkommen einer Wortform in einemText
BemerkungIn der CL werden Interpunktionszeichen ebenfalls als textuelle Token betrachtet Die Antwortwaumlre dann
113 Wortform
Antwort 7 Wort als Wortform
Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7
Definition 114 (Wortform) Eine Wortform ist eine rein graphematische Einheit eines Textes
BemerkungDieselbe Wortform kann Woumlrter unterschiedlicher Bedeutung repraumlsentieren
bull Die Fliege war tot
bull Er trug eine samtene Fliege
bull Fliege nicht so schnell
114 Syntaktisches Wort
Antwort 7 Wort als syntaktisches Wort
Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7
Definition 115 (Syntaktisches Wort) Ein syntaktisches Wort ergibt sich aus einer Wortformkombiniert mit ihren morphosyntaktischen MerkmalenRein orthographische Varianten einer Wortform werden fuumlr ein syntaktisches Wort normalerweisezusammengefasst
Beispiel 116 (Wortform vs syntaktisches Wort)Die Wortform ldquoFliegenrdquo kann mindestens 4 syntaktische Woumlrter repraumlsentieren ldquoFliegerdquo in No-minativ Akkusativ Dativ oder Genitiv Plural
6
115 Lexem
Antwort 6 Wort als Lexem
Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5 fliegt5 eine4 Fliege3 Fliegen3 nach6
Definition 117 (Lexem im engen Sinn) Ein Lexem ist eine Menge (Paradigma) von syn-taktischen Woumlrtern welche sich nur in bestimmten morphosyntaktischen Merkmalen (KasusNumerus Tempus usw) unterscheiden
Definition 118 (Nennform Zitierform Grundform Lemma) Ein Lemma ist eine lexikogra-phische Standard-Notation fuumlr ein Lexem
Beispiel 119 (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im Nominativ Singular repraumlsentiertVerb-Lexeme durch den Infinitiv Wie werden Verb-Lexeme im Latein notiert
Antwort 5 Wort als Lexemverband
Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3 fliegt3 eine4 Fliege3 Fliegen3 nach5
Definition 1110 (Lexemverband auch Lexem im weiten Sinn) Ein Lexemverband ist eineMenge von Lexemen welche den gleichen Wortstamm haben
BemerkungLexemverbaumlnde umfassen typischerweise Lexeme mit unterschiedlichen Wortarten
Beispiel 1111 (Satz als Menge von Lexemverbaumlnden)Wie laumlsst sich die Menge der Woumlrter des Beispielsatzes in Mengennotation als Lexemverbanddarstellen
12 Lehre von den Wortarten
Wortarten nach [Buszligmann 1990]
Definition 121 (Redeteile engl parts of speech (PoS)) Wortarten sind das Ergebnis derKlassifizierung der Woumlrter einer Sprache nach morphologischen syntaktischen undoder seman-tischen Kriterien
Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca 100 vor Chr) wirkte stark bis ins 19 Jahrhun-dert Fuumlr Deutsch wurde in den Schulen lange die traditionelle 10-Wortarten-Lehre (Numeraleals eigene Kategorie) gemaumlss Adelung (1781) vermittelt Mit der 5-Wortarten-Lehre nach HansGlinz setzte sich ab den 50er-Jahren eine flachere Einteilung durch welche explizite (operatio-nalisierbare) und durchgaumlngige Klassifikationskriterien anwendet
121 5 Hauptwortarten nach Glinz
KlassifikationskriterienWelcher Fachbegriff waumlre praumlziser anstelle von ldquoWoumlrterrdquo in der Abbildung
7
Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]
13 Morphologische Merkmale
Morphologische Kategorien und ihre Merkmale
Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden
Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems
bull Konjugation von Verben
bull Deklination von Nomen Adjektiven Artikeln und Pronomen
bull Steigerung von Adjektiven
Diskussion Sind steigerbare Adverbien ein Widerspruch im System
Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn
8
131 Genus
Das Genus (engl gender) Grammatisches Geschlecht
Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien
Tabelle 11 Uumlbersicht Genera
BemerkungDer Plural von Genus lautet Genera
Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)
132 Numerus
Der Numerus (engl number) Grammatische Zahl
Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner
Tabelle 12 Uumlbersicht Numeri
BemerkungDer Plural von Numerus lautet Numeri
Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)
133 Kasus
Der Kasus (engl case) Fall
Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum
Tabelle 13 Uumlbersicht Kasus
BemerkungDer Plural von Kasus lautet Kasus
Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)
9
134 Modus
Der Modus (engl mode mood) Aussageweise
Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe
Tabelle 14 Uumlbersicht Modi
BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt
135 Tempus
Das Tempus (engl tense) grammatische Zeit Zeitform
Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging
Tabelle 15 Uumlbersicht Tempora
BemerkungenDer Plural von Tempus lautet Tempora
136 Person
Die Person (engl person)
Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht
Tabelle 16 Uumlbersicht Personen
BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich
Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)
137 Grad
Der Grad (engl degree) Steigerung Komparation
Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)
10
Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste
Tabelle 17 Uumlbersicht Komparation
138 Adjektiv-Flexion
Die Adjektiv-Flexion (engl adjective inflection)
Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse
Tabelle 18 Uumlbersicht Adjektiv-Flexion
Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)
14 STTS
StuttgartTuumlbingen-Tagset (STTS)
bull httpwwwclunizhchclabhilfestts
bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)
bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert
bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output
bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden
bull Alternativen Muumlnsteraner Tagset [Steiner 2003]
Besonderheiten von STTS
bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion
bull Kategorie fuumlr fremdsprachliches Material (FM)
bull Feine Aufgliederung bei Partikeln
bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen
bull Eigennamen sind eine semantisch definierte Klasse
bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden
11
15 Vertiefung
bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell
bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]
bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem
PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie
12
2 Linguistisches Propaumldeutikum II
Lernziele
bull Kenntnis der klassischen syntaktischen Proben
bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase
bull Kenntnis der wichtigsten syntaktischen Funktionen
bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen
bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank
21 Linguistische Proben
Linguistische Testverfahren
Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen
211 Ersatzprobe
Ersatzprobe
Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben
Beispiel 213 (Bestimmung des Kasus)
Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat
Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen
Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)
bull Das ist das Angebot das uns uumlberzeugt hat
13
bull Dieses ist das Angebot welches uns uumlberzeugt hat
bull Welches ist das Angebot dieses uns uumlberzeugt hat
bull Das ist dieses Angebot welches uns uumlberzeugt hat
Probleme der Interpretation
bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes
bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen
212 Einsetzprobe
Einsetzprobe
Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert
Beispiel 216 (Bestimmung der Wortart)
Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive
213 Weglassprobe
Weglassprobe
Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten
Beispiel 218 (Bestimmung eines Satzglieds)
1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
FrageWarum nicht Variante 4
14
214 Verschiebeprobe
Verschiebeprobe
Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen
Beispiel 2110 (Bestimmung von Satzgliedern)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen bereite ich die Sitzung mit dem Chef vor
3 Ich bereite die Sitzung mit dem Chef morgen vor
Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb
Verschiebeprobe
Beispiel 2111 (Unzulaumlssiges Verschieben)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen ich bereite die Sitzung mit dem Chef vor
3 Die Sitzung bereite ich morgen mit dem Chef vor
GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung
215 Umformungsproben
Umformungsprobe
Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut
Beispiel 2113 (Funktion von Nebensaumltzen)
1 Es wuumlrde mich freuen wenn du mitkaumlmest
2 Dein Mitkommen wuumlrde mich freuen
Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)
1 Die Laumlrche ist ein Nadelbaum
2 ein Nadelbaum sein die Laumlrche
15
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
Gaumlngige Wortauffassungen [Linke 2001]
Wieviele verschiedene Woumlrter hat dieser SatzWenn hinter Fliegen eine Fliege fliegt fliegt eine Fliege Fliegen nach
Antworten 11 7 6 5 __
112 Token
Antwort 11 Wort als Vorkommen einer Wortform
Wieviele verschiedene Woumlrter hat dieser SatzWenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt7 eine8 Fliege9 Fliegen10 nach11
Definition 113 (Token) Ein Token ist ein einzelnes Vorkommen einer Wortform in einemText
BemerkungIn der CL werden Interpunktionszeichen ebenfalls als textuelle Token betrachtet Die Antwortwaumlre dann
113 Wortform
Antwort 7 Wort als Wortform
Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7
Definition 114 (Wortform) Eine Wortform ist eine rein graphematische Einheit eines Textes
BemerkungDieselbe Wortform kann Woumlrter unterschiedlicher Bedeutung repraumlsentieren
bull Die Fliege war tot
bull Er trug eine samtene Fliege
bull Fliege nicht so schnell
114 Syntaktisches Wort
Antwort 7 Wort als syntaktisches Wort
Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7
Definition 115 (Syntaktisches Wort) Ein syntaktisches Wort ergibt sich aus einer Wortformkombiniert mit ihren morphosyntaktischen MerkmalenRein orthographische Varianten einer Wortform werden fuumlr ein syntaktisches Wort normalerweisezusammengefasst
Beispiel 116 (Wortform vs syntaktisches Wort)Die Wortform ldquoFliegenrdquo kann mindestens 4 syntaktische Woumlrter repraumlsentieren ldquoFliegerdquo in No-minativ Akkusativ Dativ oder Genitiv Plural
6
115 Lexem
Antwort 6 Wort als Lexem
Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5 fliegt5 eine4 Fliege3 Fliegen3 nach6
Definition 117 (Lexem im engen Sinn) Ein Lexem ist eine Menge (Paradigma) von syn-taktischen Woumlrtern welche sich nur in bestimmten morphosyntaktischen Merkmalen (KasusNumerus Tempus usw) unterscheiden
Definition 118 (Nennform Zitierform Grundform Lemma) Ein Lemma ist eine lexikogra-phische Standard-Notation fuumlr ein Lexem
Beispiel 119 (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im Nominativ Singular repraumlsentiertVerb-Lexeme durch den Infinitiv Wie werden Verb-Lexeme im Latein notiert
Antwort 5 Wort als Lexemverband
Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3 fliegt3 eine4 Fliege3 Fliegen3 nach5
Definition 1110 (Lexemverband auch Lexem im weiten Sinn) Ein Lexemverband ist eineMenge von Lexemen welche den gleichen Wortstamm haben
BemerkungLexemverbaumlnde umfassen typischerweise Lexeme mit unterschiedlichen Wortarten
Beispiel 1111 (Satz als Menge von Lexemverbaumlnden)Wie laumlsst sich die Menge der Woumlrter des Beispielsatzes in Mengennotation als Lexemverbanddarstellen
12 Lehre von den Wortarten
Wortarten nach [Buszligmann 1990]
Definition 121 (Redeteile engl parts of speech (PoS)) Wortarten sind das Ergebnis derKlassifizierung der Woumlrter einer Sprache nach morphologischen syntaktischen undoder seman-tischen Kriterien
Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca 100 vor Chr) wirkte stark bis ins 19 Jahrhun-dert Fuumlr Deutsch wurde in den Schulen lange die traditionelle 10-Wortarten-Lehre (Numeraleals eigene Kategorie) gemaumlss Adelung (1781) vermittelt Mit der 5-Wortarten-Lehre nach HansGlinz setzte sich ab den 50er-Jahren eine flachere Einteilung durch welche explizite (operatio-nalisierbare) und durchgaumlngige Klassifikationskriterien anwendet
121 5 Hauptwortarten nach Glinz
KlassifikationskriterienWelcher Fachbegriff waumlre praumlziser anstelle von ldquoWoumlrterrdquo in der Abbildung
7
Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]
13 Morphologische Merkmale
Morphologische Kategorien und ihre Merkmale
Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden
Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems
bull Konjugation von Verben
bull Deklination von Nomen Adjektiven Artikeln und Pronomen
bull Steigerung von Adjektiven
Diskussion Sind steigerbare Adverbien ein Widerspruch im System
Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn
8
131 Genus
Das Genus (engl gender) Grammatisches Geschlecht
Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien
Tabelle 11 Uumlbersicht Genera
BemerkungDer Plural von Genus lautet Genera
Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)
132 Numerus
Der Numerus (engl number) Grammatische Zahl
Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner
Tabelle 12 Uumlbersicht Numeri
BemerkungDer Plural von Numerus lautet Numeri
Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)
133 Kasus
Der Kasus (engl case) Fall
Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum
Tabelle 13 Uumlbersicht Kasus
BemerkungDer Plural von Kasus lautet Kasus
Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)
9
134 Modus
Der Modus (engl mode mood) Aussageweise
Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe
Tabelle 14 Uumlbersicht Modi
BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt
135 Tempus
Das Tempus (engl tense) grammatische Zeit Zeitform
Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging
Tabelle 15 Uumlbersicht Tempora
BemerkungenDer Plural von Tempus lautet Tempora
136 Person
Die Person (engl person)
Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht
Tabelle 16 Uumlbersicht Personen
BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich
Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)
137 Grad
Der Grad (engl degree) Steigerung Komparation
Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)
10
Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste
Tabelle 17 Uumlbersicht Komparation
138 Adjektiv-Flexion
Die Adjektiv-Flexion (engl adjective inflection)
Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse
Tabelle 18 Uumlbersicht Adjektiv-Flexion
Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)
14 STTS
StuttgartTuumlbingen-Tagset (STTS)
bull httpwwwclunizhchclabhilfestts
bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)
bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert
bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output
bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden
bull Alternativen Muumlnsteraner Tagset [Steiner 2003]
Besonderheiten von STTS
bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion
bull Kategorie fuumlr fremdsprachliches Material (FM)
bull Feine Aufgliederung bei Partikeln
bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen
bull Eigennamen sind eine semantisch definierte Klasse
bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden
11
15 Vertiefung
bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell
bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]
bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem
PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie
12
2 Linguistisches Propaumldeutikum II
Lernziele
bull Kenntnis der klassischen syntaktischen Proben
bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase
bull Kenntnis der wichtigsten syntaktischen Funktionen
bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen
bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank
21 Linguistische Proben
Linguistische Testverfahren
Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen
211 Ersatzprobe
Ersatzprobe
Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben
Beispiel 213 (Bestimmung des Kasus)
Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat
Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen
Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)
bull Das ist das Angebot das uns uumlberzeugt hat
13
bull Dieses ist das Angebot welches uns uumlberzeugt hat
bull Welches ist das Angebot dieses uns uumlberzeugt hat
bull Das ist dieses Angebot welches uns uumlberzeugt hat
Probleme der Interpretation
bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes
bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen
212 Einsetzprobe
Einsetzprobe
Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert
Beispiel 216 (Bestimmung der Wortart)
Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive
213 Weglassprobe
Weglassprobe
Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten
Beispiel 218 (Bestimmung eines Satzglieds)
1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
FrageWarum nicht Variante 4
14
214 Verschiebeprobe
Verschiebeprobe
Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen
Beispiel 2110 (Bestimmung von Satzgliedern)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen bereite ich die Sitzung mit dem Chef vor
3 Ich bereite die Sitzung mit dem Chef morgen vor
Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb
Verschiebeprobe
Beispiel 2111 (Unzulaumlssiges Verschieben)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen ich bereite die Sitzung mit dem Chef vor
3 Die Sitzung bereite ich morgen mit dem Chef vor
GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung
215 Umformungsproben
Umformungsprobe
Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut
Beispiel 2113 (Funktion von Nebensaumltzen)
1 Es wuumlrde mich freuen wenn du mitkaumlmest
2 Dein Mitkommen wuumlrde mich freuen
Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)
1 Die Laumlrche ist ein Nadelbaum
2 ein Nadelbaum sein die Laumlrche
15
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
115 Lexem
Antwort 6 Wort als Lexem
Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5 fliegt5 eine4 Fliege3 Fliegen3 nach6
Definition 117 (Lexem im engen Sinn) Ein Lexem ist eine Menge (Paradigma) von syn-taktischen Woumlrtern welche sich nur in bestimmten morphosyntaktischen Merkmalen (KasusNumerus Tempus usw) unterscheiden
Definition 118 (Nennform Zitierform Grundform Lemma) Ein Lemma ist eine lexikogra-phische Standard-Notation fuumlr ein Lexem
Beispiel 119 (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im Nominativ Singular repraumlsentiertVerb-Lexeme durch den Infinitiv Wie werden Verb-Lexeme im Latein notiert
Antwort 5 Wort als Lexemverband
Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3 fliegt3 eine4 Fliege3 Fliegen3 nach5
Definition 1110 (Lexemverband auch Lexem im weiten Sinn) Ein Lexemverband ist eineMenge von Lexemen welche den gleichen Wortstamm haben
BemerkungLexemverbaumlnde umfassen typischerweise Lexeme mit unterschiedlichen Wortarten
Beispiel 1111 (Satz als Menge von Lexemverbaumlnden)Wie laumlsst sich die Menge der Woumlrter des Beispielsatzes in Mengennotation als Lexemverbanddarstellen
12 Lehre von den Wortarten
Wortarten nach [Buszligmann 1990]
Definition 121 (Redeteile engl parts of speech (PoS)) Wortarten sind das Ergebnis derKlassifizierung der Woumlrter einer Sprache nach morphologischen syntaktischen undoder seman-tischen Kriterien
Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca 100 vor Chr) wirkte stark bis ins 19 Jahrhun-dert Fuumlr Deutsch wurde in den Schulen lange die traditionelle 10-Wortarten-Lehre (Numeraleals eigene Kategorie) gemaumlss Adelung (1781) vermittelt Mit der 5-Wortarten-Lehre nach HansGlinz setzte sich ab den 50er-Jahren eine flachere Einteilung durch welche explizite (operatio-nalisierbare) und durchgaumlngige Klassifikationskriterien anwendet
121 5 Hauptwortarten nach Glinz
KlassifikationskriterienWelcher Fachbegriff waumlre praumlziser anstelle von ldquoWoumlrterrdquo in der Abbildung
7
Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]
13 Morphologische Merkmale
Morphologische Kategorien und ihre Merkmale
Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden
Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems
bull Konjugation von Verben
bull Deklination von Nomen Adjektiven Artikeln und Pronomen
bull Steigerung von Adjektiven
Diskussion Sind steigerbare Adverbien ein Widerspruch im System
Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn
8
131 Genus
Das Genus (engl gender) Grammatisches Geschlecht
Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien
Tabelle 11 Uumlbersicht Genera
BemerkungDer Plural von Genus lautet Genera
Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)
132 Numerus
Der Numerus (engl number) Grammatische Zahl
Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner
Tabelle 12 Uumlbersicht Numeri
BemerkungDer Plural von Numerus lautet Numeri
Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)
133 Kasus
Der Kasus (engl case) Fall
Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum
Tabelle 13 Uumlbersicht Kasus
BemerkungDer Plural von Kasus lautet Kasus
Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)
9
134 Modus
Der Modus (engl mode mood) Aussageweise
Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe
Tabelle 14 Uumlbersicht Modi
BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt
135 Tempus
Das Tempus (engl tense) grammatische Zeit Zeitform
Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging
Tabelle 15 Uumlbersicht Tempora
BemerkungenDer Plural von Tempus lautet Tempora
136 Person
Die Person (engl person)
Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht
Tabelle 16 Uumlbersicht Personen
BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich
Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)
137 Grad
Der Grad (engl degree) Steigerung Komparation
Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)
10
Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste
Tabelle 17 Uumlbersicht Komparation
138 Adjektiv-Flexion
Die Adjektiv-Flexion (engl adjective inflection)
Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse
Tabelle 18 Uumlbersicht Adjektiv-Flexion
Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)
14 STTS
StuttgartTuumlbingen-Tagset (STTS)
bull httpwwwclunizhchclabhilfestts
bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)
bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert
bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output
bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden
bull Alternativen Muumlnsteraner Tagset [Steiner 2003]
Besonderheiten von STTS
bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion
bull Kategorie fuumlr fremdsprachliches Material (FM)
bull Feine Aufgliederung bei Partikeln
bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen
bull Eigennamen sind eine semantisch definierte Klasse
bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden
11
15 Vertiefung
bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell
bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]
bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem
PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie
12
2 Linguistisches Propaumldeutikum II
Lernziele
bull Kenntnis der klassischen syntaktischen Proben
bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase
bull Kenntnis der wichtigsten syntaktischen Funktionen
bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen
bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank
21 Linguistische Proben
Linguistische Testverfahren
Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen
211 Ersatzprobe
Ersatzprobe
Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben
Beispiel 213 (Bestimmung des Kasus)
Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat
Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen
Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)
bull Das ist das Angebot das uns uumlberzeugt hat
13
bull Dieses ist das Angebot welches uns uumlberzeugt hat
bull Welches ist das Angebot dieses uns uumlberzeugt hat
bull Das ist dieses Angebot welches uns uumlberzeugt hat
Probleme der Interpretation
bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes
bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen
212 Einsetzprobe
Einsetzprobe
Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert
Beispiel 216 (Bestimmung der Wortart)
Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive
213 Weglassprobe
Weglassprobe
Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten
Beispiel 218 (Bestimmung eines Satzglieds)
1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
FrageWarum nicht Variante 4
14
214 Verschiebeprobe
Verschiebeprobe
Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen
Beispiel 2110 (Bestimmung von Satzgliedern)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen bereite ich die Sitzung mit dem Chef vor
3 Ich bereite die Sitzung mit dem Chef morgen vor
Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb
Verschiebeprobe
Beispiel 2111 (Unzulaumlssiges Verschieben)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen ich bereite die Sitzung mit dem Chef vor
3 Die Sitzung bereite ich morgen mit dem Chef vor
GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung
215 Umformungsproben
Umformungsprobe
Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut
Beispiel 2113 (Funktion von Nebensaumltzen)
1 Es wuumlrde mich freuen wenn du mitkaumlmest
2 Dein Mitkommen wuumlrde mich freuen
Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)
1 Die Laumlrche ist ein Nadelbaum
2 ein Nadelbaum sein die Laumlrche
15
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]
13 Morphologische Merkmale
Morphologische Kategorien und ihre Merkmale
Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden
Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems
bull Konjugation von Verben
bull Deklination von Nomen Adjektiven Artikeln und Pronomen
bull Steigerung von Adjektiven
Diskussion Sind steigerbare Adverbien ein Widerspruch im System
Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn
8
131 Genus
Das Genus (engl gender) Grammatisches Geschlecht
Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien
Tabelle 11 Uumlbersicht Genera
BemerkungDer Plural von Genus lautet Genera
Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)
132 Numerus
Der Numerus (engl number) Grammatische Zahl
Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner
Tabelle 12 Uumlbersicht Numeri
BemerkungDer Plural von Numerus lautet Numeri
Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)
133 Kasus
Der Kasus (engl case) Fall
Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum
Tabelle 13 Uumlbersicht Kasus
BemerkungDer Plural von Kasus lautet Kasus
Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)
9
134 Modus
Der Modus (engl mode mood) Aussageweise
Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe
Tabelle 14 Uumlbersicht Modi
BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt
135 Tempus
Das Tempus (engl tense) grammatische Zeit Zeitform
Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging
Tabelle 15 Uumlbersicht Tempora
BemerkungenDer Plural von Tempus lautet Tempora
136 Person
Die Person (engl person)
Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht
Tabelle 16 Uumlbersicht Personen
BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich
Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)
137 Grad
Der Grad (engl degree) Steigerung Komparation
Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)
10
Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste
Tabelle 17 Uumlbersicht Komparation
138 Adjektiv-Flexion
Die Adjektiv-Flexion (engl adjective inflection)
Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse
Tabelle 18 Uumlbersicht Adjektiv-Flexion
Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)
14 STTS
StuttgartTuumlbingen-Tagset (STTS)
bull httpwwwclunizhchclabhilfestts
bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)
bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert
bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output
bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden
bull Alternativen Muumlnsteraner Tagset [Steiner 2003]
Besonderheiten von STTS
bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion
bull Kategorie fuumlr fremdsprachliches Material (FM)
bull Feine Aufgliederung bei Partikeln
bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen
bull Eigennamen sind eine semantisch definierte Klasse
bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden
11
15 Vertiefung
bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell
bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]
bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem
PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie
12
2 Linguistisches Propaumldeutikum II
Lernziele
bull Kenntnis der klassischen syntaktischen Proben
bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase
bull Kenntnis der wichtigsten syntaktischen Funktionen
bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen
bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank
21 Linguistische Proben
Linguistische Testverfahren
Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen
211 Ersatzprobe
Ersatzprobe
Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben
Beispiel 213 (Bestimmung des Kasus)
Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat
Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen
Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)
bull Das ist das Angebot das uns uumlberzeugt hat
13
bull Dieses ist das Angebot welches uns uumlberzeugt hat
bull Welches ist das Angebot dieses uns uumlberzeugt hat
bull Das ist dieses Angebot welches uns uumlberzeugt hat
Probleme der Interpretation
bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes
bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen
212 Einsetzprobe
Einsetzprobe
Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert
Beispiel 216 (Bestimmung der Wortart)
Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive
213 Weglassprobe
Weglassprobe
Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten
Beispiel 218 (Bestimmung eines Satzglieds)
1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
FrageWarum nicht Variante 4
14
214 Verschiebeprobe
Verschiebeprobe
Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen
Beispiel 2110 (Bestimmung von Satzgliedern)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen bereite ich die Sitzung mit dem Chef vor
3 Ich bereite die Sitzung mit dem Chef morgen vor
Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb
Verschiebeprobe
Beispiel 2111 (Unzulaumlssiges Verschieben)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen ich bereite die Sitzung mit dem Chef vor
3 Die Sitzung bereite ich morgen mit dem Chef vor
GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung
215 Umformungsproben
Umformungsprobe
Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut
Beispiel 2113 (Funktion von Nebensaumltzen)
1 Es wuumlrde mich freuen wenn du mitkaumlmest
2 Dein Mitkommen wuumlrde mich freuen
Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)
1 Die Laumlrche ist ein Nadelbaum
2 ein Nadelbaum sein die Laumlrche
15
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
131 Genus
Das Genus (engl gender) Grammatisches Geschlecht
Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien
Tabelle 11 Uumlbersicht Genera
BemerkungDer Plural von Genus lautet Genera
Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)
132 Numerus
Der Numerus (engl number) Grammatische Zahl
Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner
Tabelle 12 Uumlbersicht Numeri
BemerkungDer Plural von Numerus lautet Numeri
Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)
133 Kasus
Der Kasus (engl case) Fall
Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum
Tabelle 13 Uumlbersicht Kasus
BemerkungDer Plural von Kasus lautet Kasus
Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)
9
134 Modus
Der Modus (engl mode mood) Aussageweise
Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe
Tabelle 14 Uumlbersicht Modi
BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt
135 Tempus
Das Tempus (engl tense) grammatische Zeit Zeitform
Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging
Tabelle 15 Uumlbersicht Tempora
BemerkungenDer Plural von Tempus lautet Tempora
136 Person
Die Person (engl person)
Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht
Tabelle 16 Uumlbersicht Personen
BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich
Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)
137 Grad
Der Grad (engl degree) Steigerung Komparation
Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)
10
Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste
Tabelle 17 Uumlbersicht Komparation
138 Adjektiv-Flexion
Die Adjektiv-Flexion (engl adjective inflection)
Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse
Tabelle 18 Uumlbersicht Adjektiv-Flexion
Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)
14 STTS
StuttgartTuumlbingen-Tagset (STTS)
bull httpwwwclunizhchclabhilfestts
bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)
bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert
bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output
bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden
bull Alternativen Muumlnsteraner Tagset [Steiner 2003]
Besonderheiten von STTS
bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion
bull Kategorie fuumlr fremdsprachliches Material (FM)
bull Feine Aufgliederung bei Partikeln
bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen
bull Eigennamen sind eine semantisch definierte Klasse
bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden
11
15 Vertiefung
bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell
bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]
bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem
PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie
12
2 Linguistisches Propaumldeutikum II
Lernziele
bull Kenntnis der klassischen syntaktischen Proben
bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase
bull Kenntnis der wichtigsten syntaktischen Funktionen
bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen
bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank
21 Linguistische Proben
Linguistische Testverfahren
Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen
211 Ersatzprobe
Ersatzprobe
Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben
Beispiel 213 (Bestimmung des Kasus)
Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat
Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen
Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)
bull Das ist das Angebot das uns uumlberzeugt hat
13
bull Dieses ist das Angebot welches uns uumlberzeugt hat
bull Welches ist das Angebot dieses uns uumlberzeugt hat
bull Das ist dieses Angebot welches uns uumlberzeugt hat
Probleme der Interpretation
bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes
bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen
212 Einsetzprobe
Einsetzprobe
Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert
Beispiel 216 (Bestimmung der Wortart)
Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive
213 Weglassprobe
Weglassprobe
Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten
Beispiel 218 (Bestimmung eines Satzglieds)
1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
FrageWarum nicht Variante 4
14
214 Verschiebeprobe
Verschiebeprobe
Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen
Beispiel 2110 (Bestimmung von Satzgliedern)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen bereite ich die Sitzung mit dem Chef vor
3 Ich bereite die Sitzung mit dem Chef morgen vor
Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb
Verschiebeprobe
Beispiel 2111 (Unzulaumlssiges Verschieben)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen ich bereite die Sitzung mit dem Chef vor
3 Die Sitzung bereite ich morgen mit dem Chef vor
GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung
215 Umformungsproben
Umformungsprobe
Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut
Beispiel 2113 (Funktion von Nebensaumltzen)
1 Es wuumlrde mich freuen wenn du mitkaumlmest
2 Dein Mitkommen wuumlrde mich freuen
Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)
1 Die Laumlrche ist ein Nadelbaum
2 ein Nadelbaum sein die Laumlrche
15
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
134 Modus
Der Modus (engl mode mood) Aussageweise
Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe
Tabelle 14 Uumlbersicht Modi
BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt
135 Tempus
Das Tempus (engl tense) grammatische Zeit Zeitform
Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging
Tabelle 15 Uumlbersicht Tempora
BemerkungenDer Plural von Tempus lautet Tempora
136 Person
Die Person (engl person)
Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht
Tabelle 16 Uumlbersicht Personen
BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich
Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)
137 Grad
Der Grad (engl degree) Steigerung Komparation
Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)
10
Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste
Tabelle 17 Uumlbersicht Komparation
138 Adjektiv-Flexion
Die Adjektiv-Flexion (engl adjective inflection)
Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse
Tabelle 18 Uumlbersicht Adjektiv-Flexion
Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)
14 STTS
StuttgartTuumlbingen-Tagset (STTS)
bull httpwwwclunizhchclabhilfestts
bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)
bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert
bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output
bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden
bull Alternativen Muumlnsteraner Tagset [Steiner 2003]
Besonderheiten von STTS
bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion
bull Kategorie fuumlr fremdsprachliches Material (FM)
bull Feine Aufgliederung bei Partikeln
bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen
bull Eigennamen sind eine semantisch definierte Klasse
bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden
11
15 Vertiefung
bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell
bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]
bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem
PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie
12
2 Linguistisches Propaumldeutikum II
Lernziele
bull Kenntnis der klassischen syntaktischen Proben
bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase
bull Kenntnis der wichtigsten syntaktischen Funktionen
bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen
bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank
21 Linguistische Proben
Linguistische Testverfahren
Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen
211 Ersatzprobe
Ersatzprobe
Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben
Beispiel 213 (Bestimmung des Kasus)
Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat
Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen
Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)
bull Das ist das Angebot das uns uumlberzeugt hat
13
bull Dieses ist das Angebot welches uns uumlberzeugt hat
bull Welches ist das Angebot dieses uns uumlberzeugt hat
bull Das ist dieses Angebot welches uns uumlberzeugt hat
Probleme der Interpretation
bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes
bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen
212 Einsetzprobe
Einsetzprobe
Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert
Beispiel 216 (Bestimmung der Wortart)
Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive
213 Weglassprobe
Weglassprobe
Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten
Beispiel 218 (Bestimmung eines Satzglieds)
1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
FrageWarum nicht Variante 4
14
214 Verschiebeprobe
Verschiebeprobe
Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen
Beispiel 2110 (Bestimmung von Satzgliedern)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen bereite ich die Sitzung mit dem Chef vor
3 Ich bereite die Sitzung mit dem Chef morgen vor
Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb
Verschiebeprobe
Beispiel 2111 (Unzulaumlssiges Verschieben)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen ich bereite die Sitzung mit dem Chef vor
3 Die Sitzung bereite ich morgen mit dem Chef vor
GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung
215 Umformungsproben
Umformungsprobe
Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut
Beispiel 2113 (Funktion von Nebensaumltzen)
1 Es wuumlrde mich freuen wenn du mitkaumlmest
2 Dein Mitkommen wuumlrde mich freuen
Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)
1 Die Laumlrche ist ein Nadelbaum
2 ein Nadelbaum sein die Laumlrche
15
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste
Tabelle 17 Uumlbersicht Komparation
138 Adjektiv-Flexion
Die Adjektiv-Flexion (engl adjective inflection)
Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse
Tabelle 18 Uumlbersicht Adjektiv-Flexion
Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)
14 STTS
StuttgartTuumlbingen-Tagset (STTS)
bull httpwwwclunizhchclabhilfestts
bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)
bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert
bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output
bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden
bull Alternativen Muumlnsteraner Tagset [Steiner 2003]
Besonderheiten von STTS
bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion
bull Kategorie fuumlr fremdsprachliches Material (FM)
bull Feine Aufgliederung bei Partikeln
bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen
bull Eigennamen sind eine semantisch definierte Klasse
bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden
11
15 Vertiefung
bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell
bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]
bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem
PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie
12
2 Linguistisches Propaumldeutikum II
Lernziele
bull Kenntnis der klassischen syntaktischen Proben
bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase
bull Kenntnis der wichtigsten syntaktischen Funktionen
bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen
bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank
21 Linguistische Proben
Linguistische Testverfahren
Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen
211 Ersatzprobe
Ersatzprobe
Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben
Beispiel 213 (Bestimmung des Kasus)
Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat
Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen
Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)
bull Das ist das Angebot das uns uumlberzeugt hat
13
bull Dieses ist das Angebot welches uns uumlberzeugt hat
bull Welches ist das Angebot dieses uns uumlberzeugt hat
bull Das ist dieses Angebot welches uns uumlberzeugt hat
Probleme der Interpretation
bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes
bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen
212 Einsetzprobe
Einsetzprobe
Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert
Beispiel 216 (Bestimmung der Wortart)
Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive
213 Weglassprobe
Weglassprobe
Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten
Beispiel 218 (Bestimmung eines Satzglieds)
1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
FrageWarum nicht Variante 4
14
214 Verschiebeprobe
Verschiebeprobe
Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen
Beispiel 2110 (Bestimmung von Satzgliedern)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen bereite ich die Sitzung mit dem Chef vor
3 Ich bereite die Sitzung mit dem Chef morgen vor
Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb
Verschiebeprobe
Beispiel 2111 (Unzulaumlssiges Verschieben)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen ich bereite die Sitzung mit dem Chef vor
3 Die Sitzung bereite ich morgen mit dem Chef vor
GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung
215 Umformungsproben
Umformungsprobe
Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut
Beispiel 2113 (Funktion von Nebensaumltzen)
1 Es wuumlrde mich freuen wenn du mitkaumlmest
2 Dein Mitkommen wuumlrde mich freuen
Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)
1 Die Laumlrche ist ein Nadelbaum
2 ein Nadelbaum sein die Laumlrche
15
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
15 Vertiefung
bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell
bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]
bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem
PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie
12
2 Linguistisches Propaumldeutikum II
Lernziele
bull Kenntnis der klassischen syntaktischen Proben
bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase
bull Kenntnis der wichtigsten syntaktischen Funktionen
bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen
bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank
21 Linguistische Proben
Linguistische Testverfahren
Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen
211 Ersatzprobe
Ersatzprobe
Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben
Beispiel 213 (Bestimmung des Kasus)
Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat
Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen
Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)
bull Das ist das Angebot das uns uumlberzeugt hat
13
bull Dieses ist das Angebot welches uns uumlberzeugt hat
bull Welches ist das Angebot dieses uns uumlberzeugt hat
bull Das ist dieses Angebot welches uns uumlberzeugt hat
Probleme der Interpretation
bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes
bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen
212 Einsetzprobe
Einsetzprobe
Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert
Beispiel 216 (Bestimmung der Wortart)
Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive
213 Weglassprobe
Weglassprobe
Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten
Beispiel 218 (Bestimmung eines Satzglieds)
1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
FrageWarum nicht Variante 4
14
214 Verschiebeprobe
Verschiebeprobe
Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen
Beispiel 2110 (Bestimmung von Satzgliedern)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen bereite ich die Sitzung mit dem Chef vor
3 Ich bereite die Sitzung mit dem Chef morgen vor
Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb
Verschiebeprobe
Beispiel 2111 (Unzulaumlssiges Verschieben)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen ich bereite die Sitzung mit dem Chef vor
3 Die Sitzung bereite ich morgen mit dem Chef vor
GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung
215 Umformungsproben
Umformungsprobe
Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut
Beispiel 2113 (Funktion von Nebensaumltzen)
1 Es wuumlrde mich freuen wenn du mitkaumlmest
2 Dein Mitkommen wuumlrde mich freuen
Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)
1 Die Laumlrche ist ein Nadelbaum
2 ein Nadelbaum sein die Laumlrche
15
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
2 Linguistisches Propaumldeutikum II
Lernziele
bull Kenntnis der klassischen syntaktischen Proben
bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase
bull Kenntnis der wichtigsten syntaktischen Funktionen
bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte
bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen
bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank
21 Linguistische Proben
Linguistische Testverfahren
Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen
211 Ersatzprobe
Ersatzprobe
Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben
Beispiel 213 (Bestimmung des Kasus)
Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat
Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen
Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)
bull Das ist das Angebot das uns uumlberzeugt hat
13
bull Dieses ist das Angebot welches uns uumlberzeugt hat
bull Welches ist das Angebot dieses uns uumlberzeugt hat
bull Das ist dieses Angebot welches uns uumlberzeugt hat
Probleme der Interpretation
bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes
bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen
212 Einsetzprobe
Einsetzprobe
Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert
Beispiel 216 (Bestimmung der Wortart)
Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive
213 Weglassprobe
Weglassprobe
Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten
Beispiel 218 (Bestimmung eines Satzglieds)
1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
FrageWarum nicht Variante 4
14
214 Verschiebeprobe
Verschiebeprobe
Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen
Beispiel 2110 (Bestimmung von Satzgliedern)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen bereite ich die Sitzung mit dem Chef vor
3 Ich bereite die Sitzung mit dem Chef morgen vor
Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb
Verschiebeprobe
Beispiel 2111 (Unzulaumlssiges Verschieben)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen ich bereite die Sitzung mit dem Chef vor
3 Die Sitzung bereite ich morgen mit dem Chef vor
GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung
215 Umformungsproben
Umformungsprobe
Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut
Beispiel 2113 (Funktion von Nebensaumltzen)
1 Es wuumlrde mich freuen wenn du mitkaumlmest
2 Dein Mitkommen wuumlrde mich freuen
Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)
1 Die Laumlrche ist ein Nadelbaum
2 ein Nadelbaum sein die Laumlrche
15
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
bull Dieses ist das Angebot welches uns uumlberzeugt hat
bull Welches ist das Angebot dieses uns uumlberzeugt hat
bull Das ist dieses Angebot welches uns uumlberzeugt hat
Probleme der Interpretation
bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes
bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen
212 Einsetzprobe
Einsetzprobe
Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert
Beispiel 216 (Bestimmung der Wortart)
Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive
213 Weglassprobe
Weglassprobe
Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten
Beispiel 218 (Bestimmung eines Satzglieds)
1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam
FrageWarum nicht Variante 4
14
214 Verschiebeprobe
Verschiebeprobe
Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen
Beispiel 2110 (Bestimmung von Satzgliedern)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen bereite ich die Sitzung mit dem Chef vor
3 Ich bereite die Sitzung mit dem Chef morgen vor
Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb
Verschiebeprobe
Beispiel 2111 (Unzulaumlssiges Verschieben)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen ich bereite die Sitzung mit dem Chef vor
3 Die Sitzung bereite ich morgen mit dem Chef vor
GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung
215 Umformungsproben
Umformungsprobe
Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut
Beispiel 2113 (Funktion von Nebensaumltzen)
1 Es wuumlrde mich freuen wenn du mitkaumlmest
2 Dein Mitkommen wuumlrde mich freuen
Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)
1 Die Laumlrche ist ein Nadelbaum
2 ein Nadelbaum sein die Laumlrche
15
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
214 Verschiebeprobe
Verschiebeprobe
Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen
Beispiel 2110 (Bestimmung von Satzgliedern)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen bereite ich die Sitzung mit dem Chef vor
3 Ich bereite die Sitzung mit dem Chef morgen vor
Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb
Verschiebeprobe
Beispiel 2111 (Unzulaumlssiges Verschieben)
1 Die Sitzung mit dem Chef bereite ich morgen vor
2 Morgen ich bereite die Sitzung mit dem Chef vor
3 Die Sitzung bereite ich morgen mit dem Chef vor
GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung
215 Umformungsproben
Umformungsprobe
Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut
Beispiel 2113 (Funktion von Nebensaumltzen)
1 Es wuumlrde mich freuen wenn du mitkaumlmest
2 Dein Mitkommen wuumlrde mich freuen
Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)
1 Die Laumlrche ist ein Nadelbaum
2 ein Nadelbaum sein die Laumlrche
15
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
22 Satz
Satz
Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist
Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten
23 Syntaxanalyse
231 Konstituenz
Konstituenz
Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist
Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge
Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten
Konstituenten in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
L
Konstituente auf Wortebene
Rein syntaktische Konstituente
Praumlzedenz auf Wortebene
unmittelbare Dominanz
Praumlzedenz
Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente
232 Koumlpfe (oder Kerne) von Konstituenten
Koumlpfe (engl head) Kern (engl kernel)
16
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)
Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)
bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]
bull Sie rennt [mit dem Mobile hantierend] zum Kiosk
bull Es wird [viel zu oft] telefoniert
bull [Die Frau die zum Kiosk rannte ] war aufgeregt
bull Sie fuumlhlte sich [wie in einem schlechten Film]
bull Aber sie war auch [in einem ziemlich schlechten Film]
Konstituententypen
Typen von Konstituenten
1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne
2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern
3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern
4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern
5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern
6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet
Koordination Konstituenz und Koumlpfe
Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht
Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)
bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]
bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]
bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]
ProblemWas ist der Kopf
Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw
17
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
233 Dependenz bzw syntaktische Funktion
Dependenz und syntaktische Funktion
Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten
Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen
HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus
Syntaktische Funktionen in der Annotate-Darstellung
$$amp
($)((+-
0
1123+
($)($45(306
789
lt
$5((==($)(9
14gt0600
++
2-(==($)(
06
A+
amp5=0
++
+9(==($)(
0
$B1C
D
ED
F45G0
1123+
($)($45(306
4
$$AB
(==($)
HI)G=90
++
2-(==($)(
85J4J0
113CK
(
E(
+ + + +
+$
Llt L Llt
+$
A M
N M
L+$
A 1$ M
1$
AL
Llt
Llt
O P Q R S T U V W PO PP PQ
SOO SOP
SOQ SO
SOR SOS
SOT
LTrad syntaktische Funktion
Kopf
Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente
234 Satzglieder
Einige Satzglieder mit NEGRA-Funktion
bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein
bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)
bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)
bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)
bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator
bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb
18
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]
Einige Gliedteile mit NEGRA-Funktion
bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)
bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)
bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv
bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)
bull Platzhalter (PH) und wiederholte Elemente (RE)
24 Baumbanken
241 NEGRA
NEGRA-Baumbank
bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml
bull PP und NP werden mit flacher Hierarchie verbaut
bull Ketten von infiniten Verben (VP) sind zu verschachteln
bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter
bull Keine annotierten Koumlpfe in NP
bull Keine explizite Unterscheidung der Satztypen
19
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln
bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo
242 TIGERSearch
TIGERSearch Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Die wichtigsten Suchrezepte
bull Wie wird das Wort ldquoderrdquo verwendet
[ word=der ]
bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)
w [ word=der ]
bull Welche Adverbien kommen vor
w [ pos=ADV ]
bull Welche koordinierten Nominalphrasen kommen vor
p [ cat=CNP ]
bull Welche Dativobjekte kommen vor
[ ] gtDA da [ ]
NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz
Weiteres
bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch
bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)
bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml
20
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
25 Vertiefung
bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]
bull Quiz Die Form der Satzglieder
21
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
3 Literaturverzeichnis
[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19
[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17
[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20
[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15
[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10
[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6
[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5
[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11
[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11
[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11
[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10
[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18
22
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-
Index
Adjektiv-Flexion 10
Dependenz 17
Einsetzprobe 13Ersatzprobe 12
Genus 8Grad 9
Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15
Lemma 6Lexem 6Lexemverband 6
Merkmal morphologisch 7Modus 9
Numerus 8 10
Person 9Probe linguistisch 12
Satz 15Syntaktische Funktion 17
Tempus 9Token 5
Umformungsprobe 14
Verschiebeprobe 14
Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5
23
- Linguistisches Propaumldeutikum I
-
- Wort
-
- Definition
- Token
- Wortform
- synt Wort
- Lexem
-
- Wortarten
-
- 5 Hauptwortarten nach Glinz
-
- Morphologische Merkmale
-
- Genus
- Zahl
- Kasus
- Modus
- Zeit
- Person
- Grad
- Flexion
-
- STTS
- Vertiefung
-
- Linguistisches Propaumldeutikum II
-
- Proben
-
- Ersetzen
- Einsetzen
- Weglassen
- Verschieben
- Umformen
-
- Satz
- Syntaxanalyse
-
- Konstituenz
- Koumlpfe
- Dependenz
- Satzglieder
-
- Baumbanken
-
- NEGRA
- TIGERSearch
-
- Vertiefung
-
- Literaturverzeichnis
- Index
-