cvičení 1 data pro experimentální práci
DESCRIPTION
Cvičení 1 Data pro experimentální práci. Potřeba dat. Data pro:trénování akustického modelu experimenty, testování, vyhodnocování Práce s daty v HTK. Trén. nahrávky. Přepisy. Trénovací nástroje. Modely. Testovací nástroje. Test. nahrávky. Aut. přepisy. Referenční přepisy. Skóre. - PowerPoint PPT PresentationTRANSCRIPT
Cvičení 1Cvičení 1
Data pro experimentální práciData pro experimentální práci
http://itakura.ite.tul.cz/jan/PMR/PMR.html
Potřeba datPotřeba dat
Data pro: trénování akustického modelu
experimenty, testování, vyhodnocování
Práce s daty v HTK
Trénovací nástroje
Trén. nahrávky Přepisy
Modely
Testovací nástroje
Test. nahrávky Aut. přepisyReferenční přepisy Skóre
Trénovací data pro fonémový Trénovací data pro fonémový akustický modelakustický model
Požadavky:
• záznamy řeči v prostředí podobném cílové aplikaci
• nahrávky musí obsahovat všechny fonémy (nejlépe s odpovídající frekvencí)
• nahrávky musí pocházet od co největšího počtu osob
• nahrávky musí být textově a akusticky různorodé
• nahrávky by měly být foneticky jednoznačné (např. bez přeřeků)
• každá nahrávka musí být foneticky správně a přesně přepsána
Ke každé nahrávce musí existovat 3 soubory (jména bez diakritiky!)
1. zaznam1.wav (nahrávka)
2. zaznam1.txt (textový přepis) K obědu si dám pizzu a džůs.
3. zaznam1.phn (fonetický přepis) - k objedu si dám picu a Čús -
Jak zvolit a nahrávat trénovací větyJak zvolit a nahrávat trénovací věty
1. Vytvořit seznam 100 vět.2. Věty by měly být snadno vyslovitelné, nejlépe najednou (bez pauzy).3. Ideální věty obsahují 6 – 8 slov, číslovky jsou rozepsány.4. Věty lze brát z tisku či z jiných zdrojů (vyvarovat se cizích slov).5. Ve větách by se měly objevit všechny fonémy, ty nejméně časté
alespoň 2 x. (Seznam fonémů na následující stránce.) 6. Texty převést do formátu Win1250!!! (ne UTF)7. K nahrávání použít vhodný software (Audacity), dobrý mikrofon.8. Nastavit si 16 kHz a 16 bit, mono!!! 9. Vypnout případnou funkci typu Speech denoising (enhancement)10. Větu si přečíst a pak v klidu nahrát.
Zajistit, aby před řečí bylo cca 0,5 sekundy ticha, totéž za větou. 11. Uložit pod správným jménem *.wav a *.txt.12. Vytvořit ke každé větě fonetický přepis – pozor na „y“, „ě“, „ďi“, „X“13. Pozor též na spodobu
„muž je“ -> „muš je“ ale „muž byl“ -> „muž bil“
Fonémy v češtině – česká fonetická abecedaFonémy v češtině – česká fonetická abecedaNouza, J., Psutka, J., Uhlíř, J.: Phonetic Alphabet for Speech Recognition of Czech. In: Radio Engineering, vol. 6, no. 4, December 1997, pp. 16-20.