Протоколы испытаний
DESCRIPTION
Lips reaTRANSCRIPT
Протокол с испытаний разработанного видео модуля
• Оригинальное видео в режиме реального времени: http://youtu.be/UOJA69aGNFw ,
продолжительность видео 5.48 мин. Язык – русский;
• Дата: 11 октября 2012 года (время США, Калифорния, Сан -Франциско) -8 GMT,
• Место: 95113, США, Калифорния, Сан Хосе, ул. 10 South Third Street, 3 этаж, US Market Access
Center
• Действующие лица:
тестировщик Осетров Виктор,
оператор Михаил Кашафутдинов
• Программы испытания:
RealSpeaker (на ПК Acer Aspire TimelineX 4830TG-2434G64Mnbb (Core i5 2430M 2400
Mhz/14"/1366x768/4096Mb/640Gb/DVD-RW/Wi-Fi/Bluetooth/Win 7 HP)
DragonDictation (на IPhone 4, 16 Gb)
GoogleVoiceInput (Asus Nexus 7, 8Gb)
___________________________________________________________________________________
ИНФОРМАЦИЯ О ВИДЕО
Время загрузки: 11 октября 2012 г., 5:59
Продолжительность: 5:48
Исходный файл: viktor_1-HD for Apple Devices (10 Mbps).m4v
URL видео: http://youtu.be/UOJA69aGNFw
11th october 2012, San Jose, California.
RealSpeaker Lab Company.
We are testing 3 devices (RealSpeaker on Laptop, GoogleSpeechInput on tablet and DragonDictation on IPhone4).
RealSpeaker - 77.1 % accuracy,
GoogleSpeechInput - 68.67 % accuracy,
DragonDictation - 74.7 % accuracy.
Link on Viktor Osetrov account: http://www.facebook.com/victor.osetrov
Link from the photostream: http://www.flickr.com/photos/realspeaker
Раскадровка испытаний от 11.10.12 в Сан-Хосе, Калифорния,
США.
0:00:01.000,0:00:02.000
Меня зовут Осетров Виктор
0:00:02.000,0:00:05.000
Я являюсь руководителем проекта "RealSpeaker"
0:00:05.000,0:00:08.000
и сейчас я нахожусь в
Калифорнии в городе Сан
0:00:08.000,0:00:09.000
Хосе
0:00:09.000,0:00:11.000
и по просьбе наших
партнеров
0:00:11.000,0:00:12.000
и предполагаемых инвесторов
0:00:12.000,0:00:14.000
хочу протестировать нашу
технологию
0:00:14.000,0:00:19.000
по сравнение с самыми
известными системам распознавания речи.
0:00:19.000,0:00:20.000
Передо мной три машинки:
0:00:20.000,0:00:23.000
первая машинка - это айфон,
0:00:23.000,0:00:26.000
на котором имеется
0:00:26.000,0:00:28.000
технология распознавания речи "DragonDictation"
0:00:28.000,0:00:30.000
компании "Nuance Communacations".
0:00:30.000,0:00:33.000
Данная технология работает по принципу
0:00:33.000,0:00:34.000
коснитесь и диктуйте,
0:00:34.000,0:00:36.000
то есть мне необходимо нажать на специальную
0:00:36.000,0:00:37.000
кнопку
0:00:37.000,0:00:40.000
и сказать слова и, естественно, он их
0:00:40.000,0:00:42.000
распознает
0:00:42.000,0:00:45.000
и затем можно этот текст
сохранить,
0:00:45.000,0:00:47.000
где-нибудь в заметках,
опубликовать в facebook
0:00:47.000,0:00:49.000
или в twitter.
0:00:49.000,0:00:50.000
А также
0:00:50.000,0:00:53.000
у меня имеется продукт
компании google -
0:00:53.000,0:00:54.000
называется
0:00:54.000,0:00:56.000
планшет google nexus.
0:00:56.000,0:00:59.000
Так вот nexus имеет технологию
0:00:59.000,0:01:02.000
распознавания непрерывной речи от google,
0:01:02.000,0:01:04.000
то есть можно произносить речь любой длинны
0:01:04.000,0:01:06.000
также этот текст можно
0:01:06.000,0:01:08.000
использовать вместо
клавиатуры
0:01:08.000,0:01:09.000
вводить его в
0:01:09.000,0:01:11.000
социальных сетях,
0:01:11.000,0:01:13.000
в журналах, на сайтах
и прочее.
0:01:13.000,0:01:14.000
Так же
0:01:14.000,0:01:16.000
представленна у нас
собственная разработка
0:01:16.000,0:01:18.000
технологии
распознавания речи "Real
0:01:18.000,0:01:19.000
Speaker",
0:01:19.000,0:01:20.000
которая увеличивает
0:01:20.000,0:01:22.000
точность программы
систем аудио
0:01:22.000,0:01:26.000
распознавания речи, в
нашем случае технологии google,
0:01:26.000,0:01:27.000
за счет
0:01:27.000,0:01:30.000
дополнительного анализа информации с
видеокамеры.
0:01:30.000,0:01:31.000
Сейчас я для
удобства
0:01:31.000,0:01:33.000
протестирую нашу
технологии на русском
0:01:33.000,0:01:38.000
языке, а в будущем планирую тестировать исключительно на
английском.
0:01:38.000,0:01:42.000
Технологию тестировать будем на тексте, у меня перед собой
0:01:42.000,0:01:44.000
есть правила обязательного
0:01:44.000,0:01:45.000
страхования,
0:01:45.000,0:01:47.000
то есть это обычный
документ такой
0:01:47.000,0:01:49.000
и мы попробуем
проверить одновременно
0:01:49.000,0:01:52.000
три устройства. Я думаю
0:01:52.000,0:01:56.000
можно начинать.
0:01:56.000,0:01:59.000
"При наступлении
страхового случая
0:01:59.000,0:02:00.000
дорожно
транспортного
0:02:00.000,0:02:02.000
происшествия,
0:02:02.000,0:02:04.000
водители участники
вот этого
0:02:04.000,0:02:05.000
происшествия
0:02:05.000,0:02:07.000
должны принять меры
0:02:07.000,0:02:09.000
и исполнить
обязанности
0:02:09.000,0:02:11.000
предусмотренные
правилам дорожного
0:02:11.000,0:02:14.000
движения российской
федерации,
0:02:14.000,0:02:15.000
утвержденные
постановлением
0:02:15.000,0:02:17.000
совета министров
0:02:17.000,0:02:21.000
правительства
российской федерации
0:02:21.000,0:02:26.000
от двадцать третьего
октября 1993 года,
0:02:26.000,0:02:28.000
номер 1090,
0:02:28.000,0:02:31.000
а также принять
необходимые
0:02:31.000,0:02:34.000
в сложившихся
обстоятельствах меры
0:02:34.000,0:02:36.000
с целью уменьшения
возможных убытков от
0:02:36.000,0:02:39.000
происшествия,
0:02:05.000,0:02:07.000
должны принять меры
0:02:07.000,0:02:09.000
и исполнить
обязанности
0:02:09.000,0:02:11.000
предусмотренные
правилам дорожного
0:02:11.000,0:02:14.000
движения российской
федерации,
0:02:14.000,0:02:15.000
утвержденные
постановлением
0:02:15.000,0:02:17.000
совета министров
0:02:17.000,0:02:21.000
правительства
российской федерации
0:02:21.000,0:02:26.000
от двадцать третьего
октября 1993 года,
0:02:26.000,0:02:28.000
номер 1090,
0:02:28.000,0:02:31.000
а также принять
необходимые
0:02:31.000,0:02:34.000
в сложившихся
обстоятельствах меры
0:02:34.000,0:02:36.000
с целью уменьшения
возможных убытков от
0:02:36.000,0:02:39.000
происшествия,
0
записать фамилии,
адреса очевидцев и
0:02:42.000,0:02:45.000
указать их в извещении
0:02:45.000,0:02:46.000
о дорожно
транспортном
0:02:46.000,0:02:48.000
происшествии,
0:02:48.000,0:02:50.000
принять меры по
оформлению документов
0:02:50.000,0:02:53.000
о происшествии
0:02:53.000,0:03:00.000
в соответствии с
настоящими правилами."
0:03:07.000,0:03:09.000
Для того чтобы
узнать насколько
0:03:09.000,0:03:11.000
точны устройства я сейчас
0:03:11.000,0:03:14.000
прямо перед Вами
0:03:14.000,0:03:16.000
осуществлю пост сообщений.
0:03:16.000,0:03:18.000
Начну с продукта "DragonDictation",
0:03:18.000,0:03:20.000
сейчас время напомню
0:03:20.000,0:03:24.000
4:56 местное время в Сан-Франциско
0:03:24.000,0:03:26.000
в Москве сейчас 3:56 утра
0:03:26.000,0:03:27.000
и я делаю
0:03:27.000,0:03:29.000
репост пост
0:03:29.000,0:03:31.000
системы
0:03:31.000,0:03:34.000
в мой facebook. Начну я с программы DragonDictation -
0:03:34.000,0:03:38.000
так facebook,
0:03:38.000,0:03:39.000
отправить на facebook,
0:03:39.000,0:03:42.000
и нажимаю на кнопку
ok,
0:03:42.000,0:03:45.000
вот и нажал кнопку
окей.
0:03:45.000,0:03:47.000
Все, соответственно,
сообщение моё
0:03:47.000,0:03:49.000
появилось и репостилось.
0:03:49.000,0:03:51.000
Первым было сообщение DragonDicatation.
0:03:51.000,0:03:52.000
Сейчас я
0:03:52.000,0:03:54.000
сделаю тоже самое
0:03:54.000,0:03:57.000
для продукта компании
google, тоже сделаю пост
0:03:57.000,0:04:00.000
на моей страничке в
facebook,
0:04:00.000,0:04:04.000
пост Виктора Осетрова.
0:04:04.000,0:04:09.000
Так публикую пост,
0:04:09.000,0:04:11.000
ага, пост опубликован
0:04:11.000,0:04:12.000
и у меня есть
0:04:12.000,0:04:15.000
документ в формате
word, который
0:04:15.000,0:04:16.000
сохранился на
программе RealSpeaker,
0:04:16.000,0:04:20.000
я его просто навсего скопирую
0:04:20.000,0:04:22.000
и вставлю,
0:04:22.000,0:04:23.000
хотя можно будет в
принципе тоже
0:04:23.000,0:04:24.000
набирать текст
0:04:24.000,0:04:25.000
на facebook
0:04:25.000,0:04:28.000
в следующий раз мы также это
сделаем.
0:04:28.000,0:04:29.000
И сейчас то, что мы набрали я
0:04:29.000,0:04:32.000
скопирую и вставляю
0:04:32.000,0:04:34.000
и
0:04:34.000,0:04:35.000
после этого
0:04:35.000,0:04:36.000
я просчитаю
0:04:36.000,0:04:38.000
насколько точным была
точность распознования
0:04:38.000,0:04:39.000
речи
0:04:39.000,0:04:43.000
и мы определим какая
система
0:04:43.000,0:04:47.000
была максимально более точной, а какая была не такой точной.
0:04:47.000,0:04:50.000
Все теперь будем считать
и посмотрим
0:04:50.000,0:04:53.000
дальше какие у нас получились результаты.
0:04:53.000,0:04:55.000
Оригинальный
документ состоит
0:04:55.000,0:04:57.000
из 83-их
0:04:57.000,0:04:59.000
83 слова
0:04:59.000,0:05:01.000
и, соответственно, стопроцентная
точность.
0:05:01.000,0:05:04.000
Технология реал
спикер распознала 64
0:05:04.000,0:05:06.000
процента, шестьдесят четыре
слова
0:05:06.000,0:05:09.000
и точности 77 и 10
процентов.
0:05:09.000,0:05:10.000
Технология google
0:05:10.000,0:05:11.000
распознала
0:05:11.000,0:05:14.000
57 слов, что меньше
примерно где-то на 10
0:05:14.000,0:05:15.000
процентов
0:05:15.000,0:05:18.000
от общего
количества и 68
0:05:18.000,0:05:20.000
процентов.
0:05:20.000,0:05:21.000
Технология Dragon,
0:05:21.000,0:05:23.000
она более точная,
0:05:23.000,0:05:24.000
а
0:05:24.000,0:05:25.000
ее точность распознавания
0:05:25.000,0:05:28.000
62 слова и точность
0:05:28.000,0:05:31.000
74 и 7 десятых процента. То есть
в целом реал
0:05:31.000,0:05:33.000
спикер увеличил точность
по сравнению с
0:05:33.000,0:05:34.000
конкурентами
0:05:34.000,0:05:37.000
увеличил точность распознавания речи где-то от
0:05:37.000,0:05:40.000
пяти-десяти процентов
в общем количестве, а
0:05:40.000,0:05:45.000
в зависимости от того
что имелось примерно, где-то примерно на 20 процентов
0:05:45.000,0:05:46.000
за счет видео
информации.
Конец.