cvičení 1 data pro experimentální práci

5
Cvičení 1 Cvičení 1 Data pro experimentální Data pro experimentální práci práci http://itakura.ite.tul.cz/jan/PMR/PMR.html

Upload: sheehan-kneafsey

Post on 01-Jan-2016

28 views

Category:

Documents


3 download

DESCRIPTION

Cvičení 1 Data pro experimentální práci. Potřeba dat. Data pro:trénování akustického modelu experimenty, testování, vyhodnocování Práce s daty v HTK. Trén. nahrávky. Přepisy. Trénovací nástroje. Modely. Testovací nástroje. Test. nahrávky. Aut. přepisy. Referenční přepisy. Skóre. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Cvičení 1 Data pro experimentální práci

Cvičení 1Cvičení 1

Data pro experimentální práciData pro experimentální práci

http://itakura.ite.tul.cz/jan/PMR/PMR.html

Page 2: Cvičení 1 Data pro experimentální práci

Potřeba datPotřeba dat

Data pro: trénování akustického modelu

experimenty, testování, vyhodnocování

Práce s daty v HTK

Trénovací nástroje

Trén. nahrávky Přepisy

Modely

Testovací nástroje

Test. nahrávky Aut. přepisyReferenční přepisy Skóre

Page 3: Cvičení 1 Data pro experimentální práci

Trénovací data pro fonémový Trénovací data pro fonémový akustický modelakustický model

Požadavky:

• záznamy řeči v prostředí podobném cílové aplikaci

• nahrávky musí obsahovat všechny fonémy (nejlépe s odpovídající frekvencí)

• nahrávky musí pocházet od co největšího počtu osob

• nahrávky musí být textově a akusticky různorodé

• nahrávky by měly být foneticky jednoznačné (např. bez přeřeků)

• každá nahrávka musí být foneticky správně a přesně přepsána

Ke každé nahrávce musí existovat 3 soubory (jména bez diakritiky!)

1. zaznam1.wav (nahrávka)

2. zaznam1.txt (textový přepis) K obědu si dám pizzu a džůs.

3. zaznam1.phn (fonetický přepis) - k objedu si dám picu a Čús -

Page 4: Cvičení 1 Data pro experimentální práci

Jak zvolit a nahrávat trénovací větyJak zvolit a nahrávat trénovací věty

1. Vytvořit seznam 100 vět.2. Věty by měly být snadno vyslovitelné, nejlépe najednou (bez pauzy).3. Ideální věty obsahují 6 – 8 slov, číslovky jsou rozepsány.4. Věty lze brát z tisku či z jiných zdrojů (vyvarovat se cizích slov).5. Ve větách by se měly objevit všechny fonémy, ty nejméně časté

alespoň 2 x. (Seznam fonémů na následující stránce.) 6. Texty převést do formátu Win1250!!! (ne UTF)7. K nahrávání použít vhodný software (Audacity), dobrý mikrofon.8. Nastavit si 16 kHz a 16 bit, mono!!! 9. Vypnout případnou funkci typu Speech denoising (enhancement)10. Větu si přečíst a pak v klidu nahrát.

Zajistit, aby před řečí bylo cca 0,5 sekundy ticha, totéž za větou. 11. Uložit pod správným jménem *.wav a *.txt.12. Vytvořit ke každé větě fonetický přepis – pozor na „y“, „ě“, „ďi“, „X“13. Pozor též na spodobu

„muž je“ -> „muš je“ ale „muž byl“ -> „muž bil“

Page 5: Cvičení 1 Data pro experimentální práci

Fonémy v češtině – česká fonetická abecedaFonémy v češtině – česká fonetická abecedaNouza, J., Psutka, J., Uhlíř, J.: Phonetic Alphabet for Speech Recognition of Czech. In: Radio Engineering, vol. 6, no. 4, December 1997, pp. 16-20.