Лингурус: автономная система распознавания руской...

Post on 27-Jul-2015

322 Views

Category:

Data & Analytics

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Автономное распознавание русской речи

Бузурнюк Н.С.

AINL Сколково 2014

Требования к решению

• Дикторонезависимость• Непрерывность распознавания• Автономность• Ориентированность

на русский язык .ru

Исходные данные

• Задача распознавания полностью не решена за 30 лет • В сегменте русского языка качество

продуктов низкое • Задача имеет решение

Принципиальная схема системы

СигналНормализация

Множествохарактеристик

РаспознаваниеОбратная связь

Нормализация сигнала

СигналСуперпозиция

фильтров Нормализованныйсигнал

Оценка

Обратная связь

Ш

!?

Множество характеристик

Функциясигнала Разложение по

множеству функций

Множествохарактеристик

ОценкаОбратная связь

!?

Функции характеристик разнородные, не аналитические, обладают избыточностью к фонемному алфавиту приблизительно в 70 раз.

Распознавание

Вычислениефонемного

вектораправдоподобия

Поиск пословарю

Обратная связь

А безсловаря?

Вычислениесловарного

вектораправдоподобия

Оценка поречевоймодели

Что получилось?

Размер приложения:– При использовании словаря в 35 тыс. слов –

80 Мб данные, 80 Мб оперативная память.– При использовании словаря до тысячи слов –

10 Мб данные, 10 Мб оперативная память.

Точность распознавания (Words Error Rate)– На геословаре (карта Москвы),

около 4000 наименований улиц – 95%– На словаре в 35 тыс. слов – 90%

Скорость распознавания (тестирование на Intel Core i5 – 3.4GHz)– При использовании словаря до тысячи слов – 70% запаса

производительности для непрерывного распознавания– Для словаря в 35 тыс. – 30% запаса производительности для

непрерывного распознавания

Интересно?

Задавайте вопросы!

Спасибо!

www.lingurus.ru

top related