transkription in der sprachsythese und –erkennung ss 2004 regelgesteuerte automatische...
TRANSCRIPT
![Page 1: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/1.jpg)
Transkription in der Transkription in der Sprachsythese und –erkennungSprachsythese und –erkennung
SS 2004 SS 2004
Regelgesteuerte automatische Transkription auf der Basis von
Expertenwissen
Referent: Freshta Khairi
![Page 2: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/2.jpg)
GliederungGliederung
1. Einleitung
2. Allgemeines über P-Tra
3. Sprachelemente von P-Tra
4. Sonderzeichen
5. Klassen
6. Operatoren
![Page 3: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/3.jpg)
GliederungGliederung
7. Schreibweise
8. Regelapparat
9. Ausführung
10. Probleme
11. Praktische Anwendung
![Page 4: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/4.jpg)
EinleitungEinleitung- keine direkte Phonem – Graphem – Beziehung- Bestimmung des Lautes erst bei der Betrachtung der Umgebung-Entwicklung von Regelsystemen für verschiedene Sprachen-Diese sind meistens kontextsensitiv und basieren auf dem Ansatz von Chomsky und Halle (1968)
E → A / L_R Eine Symbolkette E (Graphem) geht in eine Symbolkette A (Phonem), wenn die linke Kontextbedingung L und die rechte Kontextbedingung R hinsichtlich E erfüllt sind.
![Page 5: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/5.jpg)
Allgemeines über P-TraAllgemeines über P-Tra
-Programmiersprache zur phonetischen Transkription
-Mit einer Erweiterung durch die Grundelemente der formalen Aussagenlogik
-Strikte Trennung zwischen dem Regelapparat und dem Interpreter
-Zur Formulierung von Regeln für eine computergestützte phonetisch – allophonische Transkription von Schrifttexten
-P-Tra ist kontextsensitiv und somit Berücksichtigung von umgebenden Buchstaben und Allophonen
![Page 6: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/6.jpg)
Sprachelemente von P-TraSprachelemente von P-Tra
-Wortanfang und Wortende stellen die Kontextgrenzen dar-Überprüfung von einem Graphem bzw. einer Graphemsequenz mit Hilfe von logischen Aussagen und die Erstellung einer Transkription-Abarbeitung von links nach rechts Buchstabe für Buchstabe-Eine Menge logischer Aussagen d.h eine Gruppe von Regeln-Filterungsprozess mit großem Einfluss der Hierarchie auf die Entscheidung
![Page 7: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/7.jpg)
Sprachelemente von P-TraSprachelemente von P-Tra
Linke Seite der Regel: Suchstring, bestehend aus einem oder mehreren Graphemen, fakultative Kontextbedingung
Rechte Seite der Regel: das resultierende Transkript
“-(A,O,U)” CH & #, Ä,E,I = Ç
linke Suchstring rechte result.Kontextbed. Kontextbed Transkript
![Page 8: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/8.jpg)
Sprachelemente von P-TraSprachelemente von P-Tra
Jede logische Aussage beansprucht eine eigene Zeile mit Präkontext, Suchstring, Postkontext und Ergebnisstring.
Präkontext: - linksseitige Kontextbedingung - graphematisch / allophonisch - graphematisch steht in (“…“)
Beispiel: “-(A, O, U)“ - allophonisch ([…]) oder (/…/)
Beispiel: [∫l, ∫, h, gr, tr]
Suchstring: graphematischBeispiel: CH
![Page 9: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/9.jpg)
Sprachelemente von P-TraSprachelemente von P-Tra
Postkontext: - rechtsseitige Kontextbedingung - graphematisch - benötigt keine Klammern u.ä.
Beispiel: #, Ä,E,I
Ergebnisstring: - wird von einem Gleichheitszeichen (=) eingeleitet - allophonisch
Beispiel: … = Ç
![Page 10: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/10.jpg)
Sprachelemente von P-TraSprachelemente von P-Tra
Die logischen Aussagen bzw. die Regeln können zu einer Gruppe zusammengefasst werden. Erkannt wird diese Gruppe durch einen Punkt und das dazugehörige Graphem.
Beispiel: .k
Die letzt Regel einer Gruppe ist eine direkte ZuordnungBeispiel: Z= ts oder auch HOTEL = ho’tεl
![Page 11: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/11.jpg)
SonderzeichenSonderzeichen
Doppelkreuz (#): - Im Prä- oder Postkontext bedeutet Wortanfang oder Wortende
- Am Ende des Suchstrings Markierung von Morphemen, insbesondere Präfixen Beispiel: “#“ VIER & # = fi:r
“#“ AUS & -TRAL = ‘aos#
Dollerzeichen ($): - steht als Platzhalter (wildcard) für ein beliebiges Graphem im Prä- oder Postkontext
Leerzeichen: - Zur besseren Gliederung können beliebig vieleverwendet werden
Sternsymbol (*): - folgende Zeile als Kommentar
![Page 12: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/12.jpg)
KlassenKlassen
Zusammenfassung der Einzelgrapheme bzw. –allophone zu einer Klasse
Beispiel: <V5> eine Klasse der Vokale <<K0>> eine Klasse von Konsonanten mit doppeltem
Vorkommen
Definiert wird eine Klasse durch ein (!). Beispiel: !K5 bdg ptk
!K5 b,d,g, p, t, k
![Page 13: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/13.jpg)
OperatorenOperatoren-Disjunktion (logisches ODER) symbolisiert durch ein Komma (,)
-*Beispiel: [r, b, f] Uß = u:s
-Konjunktion (logisches UND) hat kein Symbol*Beispiel: E & (N,R,L) S = ə
-Antivalenz (logisches EXKLUSIV – ODER) symbolisiert durch ein Semikolon (;)
*Beispiel: G & <K0; R;L;N> = k
![Page 14: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/14.jpg)
OperatorenOperatoren-Negation (logisches NICHT) mit den Symbolen (@) und (-)
-@ bei Graphem oder Allophon-(-) bei Graphem- oder Allophonstring bzw. nachfolgendem Klammer- oder Klassenausdruck
* Beispiel: “#“ ERZ & #, E @ U = e:rts
Verschachtelung logisch äquivalenter Aussagen und Verknüpfung dieser (sowohl im Prä- als auch Postkontext)
Beispiel: E & (<K4>, T) (E(N; R; S) #, U (M, N), (H, K) EI) = ə
![Page 15: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/15.jpg)
SchreibweiseSchreibweisePräkontext: Erlaubt ist hier sowohl Groß- als auch Kleinschreibung
Wörter, deren Bedeutung davon abhängig sind, können durch eine geeignete Regel berücksichtigt werden.
Beispiel: WEG = ve:k weg = vεk
Suchstring: Sowohl Groß- als auch Kleinschreibung, wobei Großschreibung alle Arten von Eingabetexten und Kleinschreibung nur Kleingeschriebenes berücksichtigt
Postkontext: Hier ist die Großschreibung obligatorisch
![Page 16: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/16.jpg)
AusführungAusführungInterpreterprogramm: - Übertragung der logischen Aussagen in die
Maschinensprache des PC - sofortige Ausgabe des Transkriptionsergebnisses
Trace – Modus- Darstellung untereinander- rechts neben jedem Allophonstring steht die Regel
![Page 17: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/17.jpg)
AusführungAusführungBeispiel: Demonstrationde /#/ DE (<K5> <K4> <V0>), (STR, SKR, ST, SP, CH, FR, <K0>) <V0) = de
m M = mo O = on N = n st /on, In, εn/ ST & #, IT, RU, RA, RÖ, AN, IG = st r R = r a’tsio:n ATION & #, EN, S = a’tsio:n
![Page 18: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/18.jpg)
RegelapparatRegelapparat
Ca. 1000 Einzelregeln
Keine systematische Morphemanalyse
Mit Ausnahme von Präfixen, da sichere Auffindung und wichtige Hilfsfunktion bei der Transkription nachfolgender Grapheme sowie Akzentuierung
![Page 19: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/19.jpg)
RegelapparatRegelapparat
Das Prinzip bei der Formulierung der Regeln:
– Man sollte aus der Umgebung des Suchstrings soviel wie möglich berücksichtigen, aber möglichst wenig Kontext.
– Optimierung von Allgemeingültigkeit der Regeln und verkürzte Arbeitszeit
![Page 20: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/20.jpg)
![Page 21: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/21.jpg)
ProblemeProbleme
Fremdwörter– Inwieweit dürfen diese sowie auch Eigennamen in den
Regelapparat aufgenommen werden?
Zusammengesetzte Wörter, da keine Morphemanalyse– Typische Fehlinterpretation bei Fugen- S
Akzetuierung– Bisher nur da, wo die Auflistung des vollständigen
Wortes oder eines geeigneten Wortteils dies erlaubt
![Page 22: Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta](https://reader035.vdocuments.pub/reader035/viewer/2022070310/55204d6149795902118b5e0c/html5/thumbnails/22.jpg)
Praktische AnwendungPraktische Anwendung