de ce nu ne place vocea sintetizata prezentare consilr nov2008 · diftong ea uman diftong ea...

26
DE CE NU PLACE VOCEA DE CE NU PLACE VOCEA DE CE NU PLACE VOCEA DE CE NU PLACE VOCEA SINTETIZATĂ? SINTETIZATĂ? CÂTEVA ELEMENTE DE CÂTEVA ELEMENTE DE CÂTEVA ELEMENTE DE CÂTEVA ELEMENTE DE COMPARAŢIE CU VOCEA UMANĂ COMPARAŢIE CU VOCEA UMANĂ Horia Horia-Nicolai Teodorescu*,** Nicolai Teodorescu*,** Horia Horia Nicolai Teodorescu , Nicolai Teodorescu , Monica Feraru *,** Monica Feraru *,** * Romanian Academy Institute for Computer Science Ia * Romanian Academy Institute for Computer Science Iaşi Romania i Romania * Romanian Academy, Institute for Computer Science, Ia * Romanian Academy, Institute for Computer Science, Iaşi, Romania i, Romania ** CERFS Center for Research, Technical University “Gh. Asachi”, Ia ** CERFS Center for Research, Technical University “Gh. Asachi”, Iaşi, Romania i, Romania

Upload: others

Post on 12-Aug-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

DE CE NU PLACE VOCEADE CE NU PLACE VOCEADE CE NU PLACE VOCEA DE CE NU PLACE VOCEA SINTETIZATĂ?SINTETIZATĂ?

–– CÂTEVA ELEMENTE DECÂTEVA ELEMENTE DE–– CÂTEVA ELEMENTE DE CÂTEVA ELEMENTE DE COMPARAŢIE CU VOCEA UMANĂCOMPARAŢIE CU VOCEA UMANĂ

HoriaHoria--Nicolai Teodorescu*,**Nicolai Teodorescu*,**HoriaHoria Nicolai Teodorescu ,Nicolai Teodorescu ,Monica Feraru *,**Monica Feraru *,**

* Romanian Academy Institute for Computer Science Ia* Romanian Academy Institute for Computer Science Iaşşi Romaniai Romania* Romanian Academy, Institute for Computer Science, Ia* Romanian Academy, Institute for Computer Science, Iaşşi, Romaniai, Romania** CERFS Center for Research, Technical University “Gh. Asachi”, Ia** CERFS Center for Research, Technical University “Gh. Asachi”, Iaşşi, Romaniai, Romania

Page 2: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

StructuraStructuraStructuraStructura

•• IntroducereIntroducere•• MetodologieMetodologie•• RezultateleRezultatele ananaalizeilizeiRezultateleRezultatele ananaalizeilizei•• DiscuDiscuţţiiii

C l iiC l ii•• ConcluziiConcluzii•• DirecţiiDirecţii viitoareviitoare

Page 3: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

IntroducereIntroducereinteligibilitateainteligibilitatea esteeste datădată doardoar dede formanţiiformanţiiinferioriinferiori (F(F11,, FF22))inferioriinferiori (F(F11,, FF22))calitateacalitatea pronunţiei,pronunţiei, nuanţelenuanţele şişi bogăţiabogăţia vociivociisuntsunt datedate înîn maremare măsurămăsură dede formanţiiformanţii superiorisuperiorisuntsunt datedate înîn maremare măsurămăsură dede formanţiiformanţii superiorisuperiorioo scurtăscurtă analizăanaliză aa diferenţelordiferenţelor carecare apar,apar, lala nivelniveldd f if i îî i i ăi i ă iidede formanţi,formanţi, întreîntre voceavocea sintetizatăsintetizată şişi voceavoceanaturalănaturalăccomparaţiaomparaţia priveştepriveşte singurulsingurul sintetizorsintetizor comercialcomercialautohtonautohton pentrupentru limbalimba românăromână

Page 4: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

MetodologieMetodologieggmmetodaetoda dede comparaţiecomparaţie priveştepriveşte douădouă aspecteaspecte lalanivelnivel strictstrict formanticformantic staticstatic::nivelnivel strictstrict formanticformantic staticstatic::

--valorilevalorile frecvenţelorfrecvenţelor formanţilorformanţilorl ill il ilil f lf l f ilf il--valorilevalorile raporturilorraporturilor frecvenţelorfrecvenţelor formanţilorformanţilor

raportateraportate lala frecvenţafrecvenţa fundamentaleifundamentalei pentrupentru aceaacealălăvocalăvocală

ss--aa folositfolosit oo singurăsingură vocevoce umană,umană, dindin corpusulcorpusuladnotatadnotat SRoLSRoL,, aleasăaleasă pepe criteriulcriteriul similarităţiisimilarităţiivaloriivalorii frecvenţeifrecvenţei fundamentalefundamentale

Page 5: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

DetaliiDetalii

vvoceaocea esteeste femininăfeminină;; 5555555555ff -- unun vorbitorvorbitor cucu educaţie,educaţie, fărăfărăpatologie,patologie, vocevoce regionalăregională dindin zonazona Moldovei,Moldovei, fărăfără accentaccentdialectaldialectal evidentevident etcetc..ssintetizorulintetizorul discutatdiscutat esteeste unulunul dede tiptip concatenativconcatenativ;; ppentruentrusintetizorsintetizor suntsunt folositefolosite setărilesetările defaultdefault,, VitezaViteza:: 6060,, IntonaţiaIntonaţia::6060,, FormatFormat:: ..WAVWAV -- nnuu suntsunt datedate dede cătrecătre autoriiautoriiss--aa folositfolosit utilitarulutilitarul Praat™Praat™;; cuvintelecuvintele auau fostfost segmentatesegmentatemanualmanual pepe fonemefoneme,, amam determinatdeterminat valorilevalorile mediimedii pepe vocalevocalealeale frecvenţelorfrecvenţelor fonemelorfonemeloraleale frecvenţelorfrecvenţelor fonemelorfonemelor..ccuvântuluvântul analizatanalizat esteeste Aseară,Aseară, iariar propoziţiilepropoziţiile comparatecomparatesuntsunt “Vine“Vine mama”mama” şişi “Cine“Cine aa făcutfăcut asta?”asta?”suntsunt VineVine mamamama şişi CineCine aa făcutfăcut asta?asta? ..

Page 6: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Rezultatele analizeiRezultatele analizei / “Vine mama”/ “Vine mama” (I)(I)

ii ii ee ee a1a1 a1a1 a2a2 a2a2

umanuman sinteticsintetic umanuman sinteticsintetic umanuman sinteticsintetic umanuman sinteticsintetic

F0F0 222222 234234 242242 226226 196196 225225 200200 218218

F1F1 348348 463463 518518 661661 873873 816816 921921 807807

F2F2 26902690 864864 22422242 10541054 12551255 13481348 14271427 12551255

F3F3 37923792 24502450 31163116 20832083 27182718 19281928 30703070 16421642

F1/F0F1/F0 1 571 57 1 981 98 2 142 14 2 922 92 4 454 45 3 623 62 4 604 60 3 703 70F1/F0F1/F0 1.571.57 1.981.98 2.142.14 2.922.92 4.454.45 3.623.62 4.604.60 3.703.70

F2/F2F2/F2 12.1112.11 3.693.69 9.269.26 4.664.66 6.406.40 5.995.99 7.137.13 5.755.75

F3/F0F3/F0 17.0817.08 10.4710.47 12.8712.87 9.219.21 13.8713.87 8.568.56 15.3515.35 7.537.53

Page 7: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Rezultatele analizeiRezultatele analizei / “Vine mama”/ “Vine mama” (I(III))

Vine mama - valori absolute F0, F1, F2 si F3

3500

2000

2500

3000

3500

e uman e sintetizat

F2

F3

0500

1000

1500 a1 umana1 sintetizat a2 uman

2 i t ti t

F0

F1m

an

tetiz

at

a1 u

man

sint

etiz

at

a2

uman

a2 s

inte

tizat

0 a2 sintetizat e

um

e s

int aa1

Page 8: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Rezultatele analizeiRezultatele analizei / “Vine mama”/ “Vine mama” (I(IIIII))

Vine mama - raporturi F1/F0, F2/F0 si F3/F0

16.00

8.0010.0012.0014.00

e uman e sintetizat

23

0.002.004.006.00 a1 uman

a1 sintetizat a2 uman

1

2

e uma

e sintet

a1 uman

a1 sintetiz

a2 uman

a2 sintetizat

a2 sintetizat

anetizat

anizat

at

Page 9: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Rezultatele analizeiRezultatele analizei / “/ “AsearăAseară”” (I)(I)

aa aa eaea eaea ăă ăă

umanuman sinteticsintetic umanuman sinteticsintetic umanuman sinteticsintetic

F0F0 254254 226226 200200 228228 207207 219219

F1F1 593593 752752 652652 769769 456456 785785

F2F2 16341634 14031403 18921892 11761176 16581658 12121212

F3F3 28062806 19781978 27362736 19631963 30603060 18271827

F1/F0F1/F0 2 332 33 3 333 33 3 263 26 3 373 37 2 202 20 3 583 58F1/F0F1/F0 2.332.33 3.333.33 3.263.26 3.373.37 2.202.20 3.583.58

F2/F2F2/F2 6.436.43 6.216.21 9.469.46 5.165.16 8.018.01 5.535.53

F3/F0F3/F0 11.0511.05 8.758.75 13.6813.68 8.618.61 14.7814.78 8.348.34

Page 10: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Rezultatele analizeiRezultatele analizei / “/ “AsearăAseară”” (I(III))Rezultatele analizeiRezultatele analizei / / AsearăAseară (I(III))

Aseara - F0 si formantii F1, F2, F3, valori absolute, , ,

l

3000

4000 vocala a uman

vocala a sintetizat

1000

2000 dif tong ea uman

dif tong ea sintetizat

0

1000vocala ă uman

vocala ă sintetizat1 2 3 4 vocala ă sintetizat

Page 11: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Rezultatele analizeiRezultatele analizei / “/ “AsearăAseară”” (I(IIIII))(( ))

Aseara - raporturi F1/F0, F2/F0 si F3/F0

vocala a uman

10

15 vocala a uman

vocala a sintetizat

5

10 dif tong ea uman

dif tong ea sintetizat

0

5

1 2 3

vocala ă uman

vocala ă sintetizat1 2 3 vocala ă sintetizat

Page 12: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Rezultatele analizeiRezultatele analizei / “/ “Cine a făcut astaCine a făcut asta””

Cine a facut asta - F0 si formantii F1, F2, F3, valori absolutee uman

3000

3500 e sintetizata uman

i i

2000

2500a sintetizată umană sintetizat

1000

1500

ă sintetizatu umanu sintetizat

0

500

1000a1 umana1 sintetizat

01 2 3 4 a2 uman

a2 sintetizat

Page 13: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Rezultatele analizeiRezultatele analizei / “/ “Cine a făcut astaCine a făcut asta””Cine a facut asta? - raporturi F1/F0, F2/F0 si F3/F0

e uman

14

16 e sintetizata uman

10

12 a sintetizată umană sintetizat

6

8ă sintetizatu umanu sintetizat

0

2

4a1 umana1 sintetizat

01 2 3 a2 uman

a2 sintetizat

Page 14: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Exemplu de adnotare manuală folosind utilitarului Exemplu de adnotare manuală folosind utilitarului Praat; vocePraat; voce umanumanăă propoziţia “Vine mama”propoziţia “Vine mama”Praat; voce Praat; voce umanumană ă –– propoziţia “Vine mama”propoziţia “Vine mama”

F3 F4 bine demarcati

Variabilitate bogata a traseelor

F3, F4 bine demarcati

a traseelor

Page 15: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Exemplu de adnotare manuală folosind utilitarului Exemplu de adnotare manuală folosind utilitarului

P t i t ti tăP t i t ti tă iţi “Vi ”iţi “Vi ”Praat; voce sintetizată Praat; voce sintetizată –– propoziţia “Vine mama”propoziţia “Vine mama”

Page 16: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Traseul frecvenţei fundamentale folosind utilitarul Traseul frecvenţei fundamentale folosind utilitarul WW ăă i i “Ci fă ”i i “Ci fă ”Wasp; voce Wasp; voce umanumană ă -- propoziţie “Cine a făcut asta”propoziţie “Cine a făcut asta”

Page 17: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Traseul frecvenţei fundamentale folosind utilitarul Wasp; Traseul frecvenţei fundamentale folosind utilitarul Wasp;

voce sintetizatăvoce sintetizată propoziţie “Cine a făcut asta”propoziţie “Cine a făcut asta”voce sintetizată voce sintetizată -- propoziţie “Cine a făcut asta”propoziţie “Cine a făcut asta”

variatii de tip ”ruptura”variatii de tip ruptura

discontinuitati df0/dt

Page 18: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Traseul frecvenţei fundamentale folosind utilitarul Traseul frecvenţei fundamentale folosind utilitarul WW ăă i i “i i “ViVi ””Wasp; voce Wasp; voce umanumană ă -- propoziţie “propoziţie “Vine mamaVine mama””

Page 19: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Traseul frecvenţei fundamentale folosind utilitarul Wasp; Traseul frecvenţei fundamentale folosind utilitarul Wasp; voce sintetizatăvoce sintetizată propoziţie “propoziţie “Vine mamaVine mama””voce sintetizată voce sintetizată -- propoziţie propoziţie Vine mamaVine mama

Benzi inguste

Trasee

inguste

constante, fara dinamica

Page 20: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Comparaţii între vocea umană şi cea Comparaţii între vocea umană şi cea sinteticăsintetică –– segment selectat vocalasegment selectat vocalasintetică sintetică segment selectat vocala segment selectat vocala

“i”“i”voce umană voce sintetică

Page 21: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Comparaţii între vocea umană şi cea Comparaţii între vocea umană şi cea sinteticăsintetică –– segment selectat vocalasegment selectat vocalasintetică sintetică segment selectat vocala segment selectat vocala

“e”“e”voce umană voce sintetică

Page 22: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Comparaţii între vocea umană şi cea Comparaţii între vocea umană şi cea sinteticăsintetică –– segment selectat vocalasegment selectat vocalasintetică sintetică segment selectat vocala segment selectat vocala

“a1”“a1”voce umană voce sintetică

Page 23: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

Comparaţii între vocea umană şi cea Comparaţii între vocea umană şi cea sinteticăsintetică –– segment selectat vocalasegment selectat vocalasintetică sintetică segment selectat vocala segment selectat vocala

“a2”“a2”voce umană voce sintetică

Page 24: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

ConcluziiConcluziiConcluziiConcluzii

amam arătarătatat oo metodămetodă dede verificareverificare cantitativăcantitativă aa“naturaleţii”“naturaleţii” vociivociinaturaleţiinaturaleţii vociivociioo serieserie dede diferenţediferenţe majoremajore întreîntre formanţiiformanţii superiorisuperiorill i i ăi i ă f ăf ă dd ăălala voceavocea sinteticăsintetică faţăfaţă dede ceacea umanăumană

Page 25: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

DirecţiiDirecţii viitoareviitoareDirecţii Direcţii viitoareviitoare

CreştereaCreşterea naturaleţeinaturaleţei necesită,necesită, foartefoarte probabil,probabil, ununnumărnumăr maimai maremare dede fragmentefragmente (elemente)(elemente) înînmemorie,memorie, astfelastfel încâtîncât selecţiaselecţia săsă sese facăfacă şişi ţinândţinând contcontdede traseeletraseele pentrupentru formanţiiformanţii superiorisuperiori..NeNe propunempropunem înîn viitorviitor săsă facemfacem unun numărnumăr maimai maremaredede comparaţiicomparaţii pentrupentru limbalimba românăromână –– folosindfolosinddiversediverse setărisetări pentrupentru FF00 pentrupentru sintetizorulsintetizorul respectivrespectivşişi folosindfolosind maimai multemulte vocivoci naturalenaturale corespunzătorcorespunzătoralesealese..

Page 26: De ce nu ne place vocea sintetizata Prezentare ConsILR nov2008 · diftong ea uman diftong ea sintetizat 0 vocala ă uman vocalaăsintetizat 123 4 ... diversediverse set setăriri

VVăă mulmulţţumescumescVVăă mulmulţţumesc umesc t tt t ţţi !i !pentru atenpentru atenţţie!ie!