Протоколы испытаний

Post on 27-Jan-2015

4.110 Views

Category:

Internet

3 Downloads

Preview:

Click to see full reader

DESCRIPTION

Lips rea

TRANSCRIPT

Протокол с испытаний разработанного видео модуля

• Оригинальное видео в режиме реального времени: http://youtu.be/UOJA69aGNFw ,

продолжительность видео 5.48 мин. Язык – русский;

• Дата: 11 октября 2012 года (время США, Калифорния, Сан -Франциско) -8 GMT,

• Место: 95113, США, Калифорния, Сан Хосе, ул. 10 South Third Street, 3 этаж, US Market Access

Center

• Действующие лица:

тестировщик Осетров Виктор,

оператор Михаил Кашафутдинов

• Программы испытания:

RealSpeaker (на ПК Acer Aspire TimelineX 4830TG-2434G64Mnbb (Core i5 2430M 2400

Mhz/14"/1366x768/4096Mb/640Gb/DVD-RW/Wi-Fi/Bluetooth/Win 7 HP)

DragonDictation (на IPhone 4, 16 Gb)

GoogleVoiceInput (Asus Nexus 7, 8Gb)

___________________________________________________________________________________

ИНФОРМАЦИЯ О ВИДЕО

Время загрузки: 11 октября 2012 г., 5:59

Продолжительность: 5:48

Исходный файл: viktor_1-HD for Apple Devices (10 Mbps).m4v

URL видео: http://youtu.be/UOJA69aGNFw

11th october 2012, San Jose, California.

RealSpeaker Lab Company.

We are testing 3 devices (RealSpeaker on Laptop, GoogleSpeechInput on tablet and DragonDictation on IPhone4).

RealSpeaker - 77.1 % accuracy,

GoogleSpeechInput - 68.67 % accuracy,

DragonDictation - 74.7 % accuracy.

Link on Viktor Osetrov account: http://www.facebook.com/victor.osetrov

Link from the photostream: http://www.flickr.com/photos/realspeaker

Раскадровка испытаний от 11.10.12 в Сан-Хосе, Калифорния,

США.

0:00:01.000,0:00:02.000

Меня зовут Осетров Виктор

0:00:02.000,0:00:05.000

Я являюсь руководителем проекта "RealSpeaker"

0:00:05.000,0:00:08.000

и сейчас я нахожусь в

Калифорнии в городе Сан

0:00:08.000,0:00:09.000

Хосе

0:00:09.000,0:00:11.000

и по просьбе наших

партнеров

0:00:11.000,0:00:12.000

и предполагаемых инвесторов

0:00:12.000,0:00:14.000

хочу протестировать нашу

технологию

0:00:14.000,0:00:19.000

по сравнение с самыми

известными системам распознавания речи.

0:00:19.000,0:00:20.000

Передо мной три машинки:

0:00:20.000,0:00:23.000

первая машинка - это айфон,

0:00:23.000,0:00:26.000

на котором имеется

0:00:26.000,0:00:28.000

технология распознавания речи "DragonDictation"

0:00:28.000,0:00:30.000

компании "Nuance Communacations".

0:00:30.000,0:00:33.000

Данная технология работает по принципу

0:00:33.000,0:00:34.000

коснитесь и диктуйте,

0:00:34.000,0:00:36.000

то есть мне необходимо нажать на специальную

0:00:36.000,0:00:37.000

кнопку

0:00:37.000,0:00:40.000

и сказать слова и, естественно, он их

0:00:40.000,0:00:42.000

распознает

0:00:42.000,0:00:45.000

и затем можно этот текст

сохранить,

0:00:45.000,0:00:47.000

где-нибудь в заметках,

опубликовать в facebook

0:00:47.000,0:00:49.000

или в twitter.

0:00:49.000,0:00:50.000

А также

0:00:50.000,0:00:53.000

у меня имеется продукт

компании google -

0:00:53.000,0:00:54.000

называется

0:00:54.000,0:00:56.000

планшет google nexus.

0:00:56.000,0:00:59.000

Так вот nexus имеет технологию

0:00:59.000,0:01:02.000

распознавания непрерывной речи от google,

0:01:02.000,0:01:04.000

то есть можно произносить речь любой длинны

0:01:04.000,0:01:06.000

также этот текст можно

0:01:06.000,0:01:08.000

использовать вместо

клавиатуры

0:01:08.000,0:01:09.000

вводить его в

0:01:09.000,0:01:11.000

социальных сетях,

0:01:11.000,0:01:13.000

в журналах, на сайтах

и прочее.

0:01:13.000,0:01:14.000

Так же

0:01:14.000,0:01:16.000

представленна у нас

собственная разработка

0:01:16.000,0:01:18.000

технологии

распознавания речи "Real

0:01:18.000,0:01:19.000

Speaker",

0:01:19.000,0:01:20.000

которая увеличивает

0:01:20.000,0:01:22.000

точность программы

систем аудио

0:01:22.000,0:01:26.000

распознавания речи, в

нашем случае технологии google,

0:01:26.000,0:01:27.000

за счет

0:01:27.000,0:01:30.000

дополнительного анализа информации с

видеокамеры.

0:01:30.000,0:01:31.000

Сейчас я для

удобства

0:01:31.000,0:01:33.000

протестирую нашу

технологии на русском

0:01:33.000,0:01:38.000

языке, а в будущем планирую тестировать исключительно на

английском.

0:01:38.000,0:01:42.000

Технологию тестировать будем на тексте, у меня перед собой

0:01:42.000,0:01:44.000

есть правила обязательного

0:01:44.000,0:01:45.000

страхования,

0:01:45.000,0:01:47.000

то есть это обычный

документ такой

0:01:47.000,0:01:49.000

и мы попробуем

проверить одновременно

0:01:49.000,0:01:52.000

три устройства. Я думаю

0:01:52.000,0:01:56.000

можно начинать.

0:01:56.000,0:01:59.000

"При наступлении

страхового случая

0:01:59.000,0:02:00.000

дорожно

транспортного

0:02:00.000,0:02:02.000

происшествия,

0:02:02.000,0:02:04.000

водители участники

вот этого

0:02:04.000,0:02:05.000

происшествия

0:02:05.000,0:02:07.000

должны принять меры

0:02:07.000,0:02:09.000

и исполнить

обязанности

0:02:09.000,0:02:11.000

предусмотренные

правилам дорожного

0:02:11.000,0:02:14.000

движения российской

федерации,

0:02:14.000,0:02:15.000

утвержденные

постановлением

0:02:15.000,0:02:17.000

совета министров

0:02:17.000,0:02:21.000

правительства

российской федерации

0:02:21.000,0:02:26.000

от двадцать третьего

октября 1993 года,

0:02:26.000,0:02:28.000

номер 1090,

0:02:28.000,0:02:31.000

а также принять

необходимые

0:02:31.000,0:02:34.000

в сложившихся

обстоятельствах меры

0:02:34.000,0:02:36.000

с целью уменьшения

возможных убытков от

0:02:36.000,0:02:39.000

происшествия,

0:02:05.000,0:02:07.000

должны принять меры

0:02:07.000,0:02:09.000

и исполнить

обязанности

0:02:09.000,0:02:11.000

предусмотренные

правилам дорожного

0:02:11.000,0:02:14.000

движения российской

федерации,

0:02:14.000,0:02:15.000

утвержденные

постановлением

0:02:15.000,0:02:17.000

совета министров

0:02:17.000,0:02:21.000

правительства

российской федерации

0:02:21.000,0:02:26.000

от двадцать третьего

октября 1993 года,

0:02:26.000,0:02:28.000

номер 1090,

0:02:28.000,0:02:31.000

а также принять

необходимые

0:02:31.000,0:02:34.000

в сложившихся

обстоятельствах меры

0:02:34.000,0:02:36.000

с целью уменьшения

возможных убытков от

0:02:36.000,0:02:39.000

происшествия,

0

записать фамилии,

адреса очевидцев и

0:02:42.000,0:02:45.000

указать их в извещении

0:02:45.000,0:02:46.000

о дорожно

транспортном

0:02:46.000,0:02:48.000

происшествии,

0:02:48.000,0:02:50.000

принять меры по

оформлению документов

0:02:50.000,0:02:53.000

о происшествии

0:02:53.000,0:03:00.000

в соответствии с

настоящими правилами."

0:03:07.000,0:03:09.000

Для того чтобы

узнать насколько

0:03:09.000,0:03:11.000

точны устройства я сейчас

0:03:11.000,0:03:14.000

прямо перед Вами

0:03:14.000,0:03:16.000

осуществлю пост сообщений.

0:03:16.000,0:03:18.000

Начну с продукта "DragonDictation",

0:03:18.000,0:03:20.000

сейчас время напомню

0:03:20.000,0:03:24.000

4:56 местное время в Сан-Франциско

0:03:24.000,0:03:26.000

в Москве сейчас 3:56 утра

0:03:26.000,0:03:27.000

и я делаю

0:03:27.000,0:03:29.000

репост пост

0:03:29.000,0:03:31.000

системы

0:03:31.000,0:03:34.000

в мой facebook. Начну я с программы DragonDictation -

0:03:34.000,0:03:38.000

так facebook,

0:03:38.000,0:03:39.000

отправить на facebook,

0:03:39.000,0:03:42.000

и нажимаю на кнопку

ok,

0:03:42.000,0:03:45.000

вот и нажал кнопку

окей.

0:03:45.000,0:03:47.000

Все, соответственно,

сообщение моё

0:03:47.000,0:03:49.000

появилось и репостилось.

0:03:49.000,0:03:51.000

Первым было сообщение DragonDicatation.

0:03:51.000,0:03:52.000

Сейчас я

0:03:52.000,0:03:54.000

сделаю тоже самое

0:03:54.000,0:03:57.000

для продукта компании

google, тоже сделаю пост

0:03:57.000,0:04:00.000

на моей страничке в

facebook,

0:04:00.000,0:04:04.000

пост Виктора Осетрова.

0:04:04.000,0:04:09.000

Так публикую пост,

0:04:09.000,0:04:11.000

ага, пост опубликован

0:04:11.000,0:04:12.000

и у меня есть

0:04:12.000,0:04:15.000

документ в формате

word, который

0:04:15.000,0:04:16.000

сохранился на

программе RealSpeaker,

0:04:16.000,0:04:20.000

я его просто навсего скопирую

0:04:20.000,0:04:22.000

и вставлю,

0:04:22.000,0:04:23.000

хотя можно будет в

принципе тоже

0:04:23.000,0:04:24.000

набирать текст

0:04:24.000,0:04:25.000

на facebook

0:04:25.000,0:04:28.000

в следующий раз мы также это

сделаем.

0:04:28.000,0:04:29.000

И сейчас то, что мы набрали я

0:04:29.000,0:04:32.000

скопирую и вставляю

0:04:32.000,0:04:34.000

и

0:04:34.000,0:04:35.000

после этого

0:04:35.000,0:04:36.000

я просчитаю

0:04:36.000,0:04:38.000

насколько точным была

точность распознования

0:04:38.000,0:04:39.000

речи

0:04:39.000,0:04:43.000

и мы определим какая

система

0:04:43.000,0:04:47.000

была максимально более точной, а какая была не такой точной.

0:04:47.000,0:04:50.000

Все теперь будем считать

и посмотрим

0:04:50.000,0:04:53.000

дальше какие у нас получились результаты.

0:04:53.000,0:04:55.000

Оригинальный

документ состоит

0:04:55.000,0:04:57.000

из 83-их

0:04:57.000,0:04:59.000

83 слова

0:04:59.000,0:05:01.000

и, соответственно, стопроцентная

точность.

0:05:01.000,0:05:04.000

Технология реал

спикер распознала 64

0:05:04.000,0:05:06.000

процента, шестьдесят четыре

слова

0:05:06.000,0:05:09.000

и точности 77 и 10

процентов.

0:05:09.000,0:05:10.000

Технология google

0:05:10.000,0:05:11.000

распознала

0:05:11.000,0:05:14.000

57 слов, что меньше

примерно где-то на 10

0:05:14.000,0:05:15.000

процентов

0:05:15.000,0:05:18.000

от общего

количества и 68

0:05:18.000,0:05:20.000

процентов.

0:05:20.000,0:05:21.000

Технология Dragon,

0:05:21.000,0:05:23.000

она более точная,

0:05:23.000,0:05:24.000

а

0:05:24.000,0:05:25.000

ее точность распознавания

0:05:25.000,0:05:28.000

62 слова и точность

0:05:28.000,0:05:31.000

74 и 7 десятых процента. То есть

в целом реал

0:05:31.000,0:05:33.000

спикер увеличил точность

по сравнению с

0:05:33.000,0:05:34.000

конкурентами

0:05:34.000,0:05:37.000

увеличил точность распознавания речи где-то от

0:05:37.000,0:05:40.000

пяти-десяти процентов

в общем количестве, а

0:05:40.000,0:05:45.000

в зависимости от того

что имелось примерно, где-то примерно на 20 процентов

0:05:45.000,0:05:46.000

за счет видео

информации.

Конец.

top related