Download - Emotionen in Sprache
Hauptseminar: Phonetic and technological aspects of speaker characteristicsWintersemester 2007/08Dozent: Prof. Dr. HarringtonReferentin: Sarah Stolze
Emotionen in Sprache
Inhalt:
1) Grundfrequenz als Parameter für Sprechererkennung1.1) Beeinflussung der Grundfrequenz durch technische Faktoren1.2) Beeinflussung der Grundfrequenz durch physiologische Faktoren1.3) Beeinflussung der Grundfrequenz durch psychologische Faktoren
2) Stress2.1) Realer vs. Simulierter Stress
„Hindenburg Disaster“2.2) F0 real vs. Reproduziert 2.3) Level des empfundenen Stresses
3) Zusammenfassung
1) Grundfrequenz als Parameter für Sprechererkennung
- Abhängig von der Anatomie des Kehlkopfes Geringe Veränderung innerhalb eines
Sprechers
- robust bei Telefonübertragung
1.1 Beeinflussung der Grundfrequenz durch technische Faktoren
Schnelligkeit beim Abspielen von Sprachmaterial
Sampling Rate
Verhältnis modal zu falsetto (m) 2:1
Sprecher ausschließen, jedoch sehr ungenau
1.2 Beeinflussung der Grundfrequenz durch physiologische Faktoren
• AlterVeränderungen geschehen langsam, älteres Material
kann verwendet werden
• RauchenKann die Einschätzung des Alters erschweren
• Alkohol F0 steigt
1.3 Beeinflussung der Grundfrequenz durch psychologische Faktoren
Emotionen
Neutral- Langsame Veränderung von F0- Kontinuierliche Verlaufsform- Gut definierte Struktur der Vokale- Konsonanten unpräzise artikuliert- Kurze Pausen
F0 Verlauf verschiedener Emotionen
Figur (1): Fundamental frequency (F0) contours of selected control clustersas spoken by voice B in different situations in the scenario. Numbers refer to the control clusters.
1.3 Beeinflussung der Grundfrequenz durch psychologische Faktoren
Ärger- höhere F0 als bei neutraler Äußerung- 1 bis 2 Silben zeigen eine Spitze, sonst
kontinuierlicher, glatter Verlauf- Höhere F0 Reichweite als bei neutral- Hoher F1, da Mund weit geöffnet- Klarer Verschluss bei Konsonanten
1.3 Beeinflussung der Grundfrequenz durch psychologische Faktoren
Sorge- Flacher Verlauf der Kontur- F0 tiefer als bei neutral- Weniger Betonung als bei neutral- Unregelmäßigkeiten in der Stimmgebung
(flüstern)- Lange Dauer der Äußerung lange Vokale,
Konsonantenverschlüsse und Pausen
1.3 Beeinflussung der Grundfrequenz durch psychologische Faktoren
Angst- Schnelle Veränderung der Kontur- F0 niedriger als bei Ärger- Kann dem neutralen Muster ähneln, jedoch mit
hohen Spitzen- unregelmäßige Stimme- Längere Dauer als bei Ärger und neutral- Präzise Artikuliert
2) Stress
Was bedeutet Stress Emotionen (Angst, Ärger, Sorge)
2.1) Realer vs. Simulierter Stress
2.2) Level des empfundenen Stresses
2.1) Realer vs. Simulierter Stress„Hindenburg Disaster“
Real
Vorher: Glatter F0-Verlauf Kontinuierlicher Ab- und
Aufwärtsverlauf von F0
Nachher: Konturverlauf verändert sich
abrupt Durchschnittlicher F0-Wert ist
höher größere F0 Spanne „zittern“ bei 0,6s und 0,8s Kontrollverlust der
Muskulatur+ unregelmäßiges Atmen
Originalaufnahme des Radiosprechers
Aus: Williams, Stevens (1972)Fig.2: Radio announcer speaking before (top) and after (middle and bottom) the crash of the HINDENBURG. Narrow-band.
2.1) Realer vs. Simulierter Stress„Hindenburg Disaster“
Simuliert
vorher• Weniger „Bewegung“ als
in der Originalaufnahme• Der Verlauf ist ähnlich
glatt
nachher F0 steigt Ab- und
Aufwärtsbewegungen sind stärker ausgeprägt
„zittern“ und die ungleichmäßige Kontur ist ähnlich dem Original
Simulierte Aufnahme
Aus: Williams, Stevens (1972)
Fig. 3: Voice C simulating announcement of Hindenburg crash before (top) and after (middle and bottom) the disaster. Narrow-band.
F0 (Hz) F0 Range (Hz)
Original
Vorher 166 124-196
Nachher 196 152-260
Simuliert
Vorher 138 117-168
Nachher 222 117-280
2.2) F0 real vs. reproduziert
Tabelle 1: Durchschnittliche Grundfrequenz aus: Gfroerer, Wagner (1995)
Criminal`s mean F0 (in Hz)
Suspect`s mean F0
Incriminating Text Reproduction of Incr. Text
Spontaneous Speech
1 164 - 147
2 155 133 -
3 115 115 -
4 172 140 143
5 175 176 158
6 206 142 115
7 178 - 200
8 178 140 -
9 152 - 164
10 107 101 -
2.3) Level des empfundenen Stresses
F0 steigt Die Sprache wird weniger fließend Vokalintensität steigt Der Sprachfluss nimmt zu Die Zahl der Bursts nimmt ab
Stimmveränderung in Abhängigkeit von Stress
Aus: Hollien (1990)Fig. 4: Model of the most common shifts in the voice and speech of a person who is responding to psychological stress. SFF is speaking fundamental frequency, NF is nonfluencies, VI is vocal intensity, and SB refers to the number of speech bursts per unit of time.
3) „Zusammenfassung“
Keine Möglichkeit den genauen emotionalen Zustand einer Person zu ermitteln, eher Richtwerte, Tendenzen.
Referenzmaterial sollte dem zu untersuchenden Material so ähnlich wie möglich sein.
Literatur
Williams, Carl E., Stevens, Kenneth N.(1972 `Emotions and Speech: Some Acoustical Correlates`, Biometric Technology Today, 52 (4), 1238-1250)
Jessen, M. (1997) `Phonetic manifestations of cognitive and physical stress in trained and untrained police officers`, Forensic Linguistics, The International Journal of Speech Language and the Law, 4 (1), 125-147
Hollien, H. F. (1990) `The Acoustics of Crime: the new science of forensic phonetics`, Plenum Press, New York, chapter 12 and 13, p. 255-289
Braun, A. (1995) `Fundamental Frequency – How Speaker-Specific is it?`, Studies in Forensic Phonetics, 64,9-23
Gfroerer, S., Wagner, I. (1995) `Fundamental Frequency in Forensic Speech Samples`, Studies in Forensic Phonetics, 64, 41-48
Homayounpour, M. M., Goldman, J. Ph. (1995) `Machine vs. Human Speaker Verification` Studies in Forensic Phonetics, 64, 109-120
Danke für die Aufmerksamkeit