Лингурус: автономная система распознавания руской...
Post on 27-Jul-2015
322 Views
Preview:
TRANSCRIPT
Автономное распознавание русской речи
Бузурнюк Н.С.
AINL Сколково 2014
Требования к решению
• Дикторонезависимость• Непрерывность распознавания• Автономность• Ориентированность
на русский язык .ru
Исходные данные
• Задача распознавания полностью не решена за 30 лет • В сегменте русского языка качество
продуктов низкое • Задача имеет решение
Принципиальная схема системы
СигналНормализация
Множествохарактеристик
РаспознаваниеОбратная связь
Нормализация сигнала
СигналСуперпозиция
фильтров Нормализованныйсигнал
Оценка
Обратная связь
Ш
!?
Множество характеристик
Функциясигнала Разложение по
множеству функций
Множествохарактеристик
ОценкаОбратная связь
!?
Функции характеристик разнородные, не аналитические, обладают избыточностью к фонемному алфавиту приблизительно в 70 раз.
Распознавание
Вычислениефонемного
вектораправдоподобия
Поиск пословарю
Обратная связь
А безсловаря?
Вычислениесловарного
вектораправдоподобия
Оценка поречевоймодели
Что получилось?
Размер приложения:– При использовании словаря в 35 тыс. слов –
80 Мб данные, 80 Мб оперативная память.– При использовании словаря до тысячи слов –
10 Мб данные, 10 Мб оперативная память.
Точность распознавания (Words Error Rate)– На геословаре (карта Москвы),
около 4000 наименований улиц – 95%– На словаре в 35 тыс. слов – 90%
Скорость распознавания (тестирование на Intel Core i5 – 3.4GHz)– При использовании словаря до тысячи слов – 70% запаса
производительности для непрерывного распознавания– Для словаря в 35 тыс. – 30% запаса производительности для
непрерывного распознавания
Интересно?
Задавайте вопросы!
Спасибо!
www.lingurus.ru
top related