Информационные...

30
42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ НАУКИ. 2013. № 1 (37) Информационные технологии УДК 621.391 СЕРТИФИКАЦИЯ АЛГОРИТМА СЖАТИЯ-ВОССТАНОВЛЕНИЯ ИЗМЕРИТЕЛЬНЫХ СИГНАЛОВ МОДИФИЦИРОВАННЫМ МЕТОДОМ ПРОНИ В.А. Баранов, А.В. Терехина, Б.В. Цыпин Пензенский государственный университет 440026, г. Пенза, ул. Красная, 40 E-mail: [email protected] Рассматриваются проблемы сертификации метрологической части программного обеспечения информационно-измерительных и управляющих систем. Представлены ал- горитмы сжатия-восстановления измерительного сигнала на основе метода Прони. Получены оценки погрешности восстановления при применении модифицированного метода Прони в зависимости от объема информации. Ключевые слова: сжатие-восстановление измерительного сигнала, метрологическое программное обеспечение, сертификация, метод Прони. Введение Развитие и усложнение информационно-измерительных и управляющих систем (ИИУС) неизбежно приводит к увеличению количества измерительной информации, необходимой для определения состояния системы и управления. Наиболее серьез- ным ограничением роста интенсивности обмена информацией между компонентами системы выступает малая пропускная способность каналов связи. Совершенствова- ние аппаратной части интерфейсов является длительной и затратной процедурой. Более эффективный путь решения проблемы – разработка алгоритмов сжатия и вос- становления информации и их программная реализация. При этом актуальной зада- чей проектирования ИИУС становится оценка качества программного обеспечения (ПО) в целом и отдельных его компонентов. Задача оценки качества ПО не является тривиальной, поскольку набор показа- телей качества программных продуктов и их конкретные значения зависят от функ- ционального назначения и различны на разных этапах жизненного цикла (составле- ние технического задания, разработка, отладка, эксплуатация), отличаются и пред- ставления о качестве ПО его разработчиков, специалистов по сопровождению и пользователей различного уровня [1]. Виктор Алексеевич Баранов, преподаватель кафедры «Метрология и системы качества». Анастасия Валерьевна Терехина, аспирант. Борис Вульфович Цыпин, профессор кафедры ИИТ.

Upload: others

Post on 24-Jul-2020

9 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

42

ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ НАУКИ. 2013. № 1 (37)

Информационные технологии УДК 621.391

СЕРТИФИКАЦИЯ АЛГОРИТМА СЖАТИЯ-ВОССТАНОВЛЕНИЯ ИЗМЕРИТЕЛЬНЫХ СИГНАЛОВ МОДИФИЦИРОВАННЫМ МЕТОДОМ ПРОНИ

В.А. Баранов, А.В. Терехина, Б.В. Цыпин Пензенский государственный университет 440026, г. Пенза, ул. Красная, 40 E-mail: [email protected]

Рассматриваются проблемы сертификации метрологической части программного обеспечения информационно-измерительных и управляющих систем. Представлены ал-горитмы сжатия-восстановления измерительного сигнала на основе метода Прони. Получены оценки погрешности восстановления при применении модифицированного метода Прони в зависимости от объема информации.

Ключевые слова: сжатие-восстановление измерительного сигнала, метрологическое программное обеспечение, сертификация, метод Прони.

Введение

Развитие и усложнение информационно-измерительных и управляющих систем (ИИУС) неизбежно приводит к увеличению количества измерительной информации, необходимой для определения состояния системы и управления. Наиболее серьез-ным ограничением роста интенсивности обмена информацией между компонентами системы выступает малая пропускная способность каналов связи. Совершенствова-ние аппаратной части интерфейсов является длительной и затратной процедурой. Более эффективный путь решения проблемы – разработка алгоритмов сжатия и вос-становления информации и их программная реализация. При этом актуальной зада-чей проектирования ИИУС становится оценка качества программного обеспечения (ПО) в целом и отдельных его компонентов.

Задача оценки качества ПО не является тривиальной, поскольку набор показа-

телей качества программных продуктов и их конкретные значения зависят от функ-ционального назначения и различны на разных этапах жизненного цикла (составле-ние технического задания, разработка, отладка, эксплуатация), отличаются и пред-ставления о качестве ПО его разработчиков, специалистов по сопровождению и пользователей различного уровня [1].

Виктор Алексеевич Баранов, преподаватель кафедры «Метрология и системы качества». Анастасия Валерьевна Терехина, аспирант. Борис Вульфович Цыпин, профессор кафедры ИИТ.

Page 2: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

43

Достоверная, корректная оценка качества ПО может быть получена только на основе соответствующих стандартов [2, 3].

ПО характеризуется рядом обобщенных показателей, в частности составом и требуемыми значениями характеристик качества в определенной области примене-ния; допустимой длительностью ожидания результата решения задачи [4]. Помимо общих требований к качеству ПО устанавливаются специальные требования в каж-дой конкретной области его применения.

Специфический характер носит оценка качества программ обработки результа-тов измерений. Для оценки качества программы в метрологическом смысле необхо-димо провести метрологический анализ алгоритма программы. Оценка метрологиче-ских характеристик алгоритма программы необходима разработчикам систем с блочно-модульным построением ПО при выборе из ряда возможных вариантов ал-горитма работы модуля цифровой обработки сигнала и конкретной аппаратной реа-лизации вычислительной подсистемы ИИУС.

Стандарт [5] устанавливает основные метрологические требования к ПО, ка-сающиеся наличия подробной документации, защиты, однозначной его идентифика-ции и пригодности для применения. Пригодность в метрологическом аспекте пони-мается прежде всего как возможность достижения требуемой точности измерений при использовании ПО.

Точность цифровой обработки измерительной информации определяется вы-бранным алгоритмом обработки входных данных и его программной реализацией [6]. В связи с этим различают общую и метрологическую аттестации алгоритма про-граммы. [7]. В результате общей аттестации получают оценки характеристик устой-чивости и сложности алгоритма при различных моделях входных данных, а в ре-зультате метрологической аттестации – оценки характеристик составляющих по-грешности (неопределенности) результатов обработки измерительного сигнала в конкретных условиях применения этого алгоритма. В большинстве практических случаев достоверность результатов аттестации ПО достигается за счет совместного использования методов аналитического исследования алгоритма ПО и испытаний его программной реализации.

Аттестация алгоритма ПО проводится на основе спецификации. Под специфи-кацией ПО понимается математическое описание исполняемой им задачи [8-10]. На-ряду с формулировкой задачи должен быть описан и метод ее решения в форме ал-горитма. Спецификация программного обеспечения не включает в себя описание конкретных методов программной реализации алгоритма. Формулы, эквивалентные с математической точки зрения, неразличимы с точки зрения спецификации ПО. Наиболее достоверные оценки метрологических характеристик ПО могут быть по-лучены при проведении анализа исходного кода программ. Это позволяет применить аналитические методы при исследовании функциональных свойств ПО, его влияния на точность конечного результата и тем самым повышает достоверность результатов исследования. Анализ исходного кода требует высокой квалификации персонала и значительных затрат времени, поэтому на практике применяется только в особо от-ветственных случаях.

В процессе сертификации характеристики алгоритма рекомендуется разделить на функциональные и метрологические. При сертификации процедуры сжатия-восстановления к функциональным характеристикам следует отнести объем входной информации и коэффициент сжатия, к метрологическим – погрешность восстанов-ления сигнала и время выполнения процедуры.

За оценку погрешности восстановления целесообразно принять среднеквадра-

Page 3: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

44

тическое отклонение отсчетов исходного ряда от аппроксимирующей кривой, отне-сенное к максимальному значению (пределу измерения) сигнала maxy :

%100

/~

max

1

2

y

NyyN

iii

восст , (1)

где iy~ – значения аппроксимирующей кривой, N – количество отсчетов. В настоящее время известен ряд методов сжатия-восстановления информации,

среди которых выделяется метод Прони, позволяющий восстанавливать сигнал не только по авторегрессионным коэффициентам, но и по параметрам разложения [11].

Еще одним современным методом в области цифровой обработки сигналов яв-ляется метод декомпозиции на эмпирические моды (Empirical Mode Decomposition) [12]. Данный метод эффективен при обработке нестационарных сигналов.

Декомпозиция на эмпирические моды – разложение исходного сигнала на функ-ции, удовлетворяющие необходимым условиям:

– общее число экстремумов сигнала равняется числу нулей с точностью до 1; – полусумма верхней огибающей, интерполирующей локальные максимумы, и

нижней огибающей, интерполирующей локальные минимумы, близка к нулю. Так как при использовании метода декомпозиции на эмпирические моды сжатие

осуществляется за счет хранения значений сигнала в точках экстремумов, число ко-торых в исследуемом сигнале заранее неизвестно, целесообразным является рас-смотрение методики обработки измерительного сигнала на основании декомпозиции на эмпирические моды c последующим применением к каждой из выделенных со-ставляющих метода Прони. Использование такой комбинации методов, модифици-рованного метода Прони (EMD + Прони), позволяет практически решить некоторые проблемы, возникающие при применении метода Прони:

– уменьшается критичность результата анализа к порядку модели; – уменьшается трудоемкость вычислений параметров составляющих (для каж-

дой моды этот процесс сводится к решению квадратных или кубических уравнений); – появляется возможность фильтрации сигнала еще до применения метода Про-

ни. Алгоритм, реализующий модифицированный метод Прони, представлен на

рис. 1. Сравнительные исследования характеристик метода Прони и EMD + Прони при

решении задачи сжатия-восстановления проводились в относительных единицах в среде MatLab при объеме информации N от 100 до 30000 результатов измерения. Результаты исследований приведены на рис. 2.

Установлено, что по исследованным характеристикам модифицированный ме-тод Прони превосходит традиционный, поэтому целесообразно рассмотреть функ-циональные и метрологические характеристики именно этого метода. При исследо-вании применялась следующая дискретная модель измерительного сигнала:

q

ftiUu i

p

mmmmi

12cos1

, Ni 1 , (2)

где mU , mf , m – амплитуда, частота и фаза m-той гармоники сигнала соответст-венно; i – номер отсчета сигнала (дискретное время); i – значения аддитивного бе-

лого шума с нулевым матожиданием и дисперсией 1.0ш в моменты отсчетов; q – отношение сигнал/шум; N – количество зарегистрированных дискретных отсчетов

Page 4: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

45

Рис. 1. Алгоритм сжатия-восстановления измерительной информации на основе модифицированного метода Прони

Page 5: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

46

Рис. 2. Характеристики процедуры сжатия-восстановления методами Прони и EMD +

Прони

Рис. 3. Зависимость погрешности восстановления сигнала от объема

информации

(результатов измерений); t – шаг дискретизации, согласно теореме Котельникова определяемый соотношением

max/ fNnt , (3) где mf – максимальная частота, n – число периодов сигнала за время измерения.

Для моделирования квантования уровня сигнала в процессе аналого-цифрового преобразования модель (2) была дополнена следующим образом [13]:

d

id

iuu

22round~ , (4)

где d – количество разрядов АЦП с двоичным шагом квантования; xround – бли-жайшее целое число x.

С помощью функции xround учитываются шумы квантования АЦП при усло-вии, что значение амплитуды 0U измеряемого сигнала )(tu не выходит за пределы рабочего диапазона АЦП. Модель (2) позволяет формировать сигнал любой сложно-сти, в частности при проведении исследования погрешности восстановления была принята модель в виде суммы трех гармоник [14].

В результате исследований были получены оценки погрешности восстановления результатов измерений в зависимости от объема информации (рис. 3) и значения ко-эффициентов сжатия для модифицированного метода Прони. В данном диапазоне коэффициент сжатия возрастает пропорционально увеличению числа отсчетов

12/NK , где знаменатель определяется произведением 3 извлеченных мод на 4 параметра моды, найденных по методу Прони.

Оценка времени выполнения алгоритма зависит от аппаратной реализации, вы-бранной пользователем, вследствие чего указание времени, затраченного на выпол-нение алгоритма при моделировании метода в среде MatLab, является некоррект-ным.

Заключение 1. При разработке метрологической части программного обеспечения информа-

ционно-измерительных и управляющих систем алгоритмы цифровой обработки из-мерительных сигналов должны подвергаться сертификации, т. е. оценке их метроло-гических характеристик

2. Алгоритм сжатия-восстановления измерительных сигналов при передаче по каналам связи на основе метода Прони с предварительным разложением на эмпири-ческие моды (модифицированный метод Прони) обладает более высокими функцио-нальными и метрологическими характеристиками (коэффициент сжатия, погреш-

Page 6: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

47

ность восстановления), чем алгоритм с применением только метода Прони. 3. Применение модифицированного метода Прони обеспечивает коэффициент

сжатия информации, прямо пропорциональный объему информации (количеству результатов измерений), в диапазоне от 100 до 30000 с коэффициентом пропорцио-нальности 1/12. При этом среднеквадратическая погрешность восстановления не превышает ±0,5%.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Слаев В.А., Чуновкина А.Г. Аттестация программного обеспечения, используемого в метрологии: Справочная книга / Под ред. В.А. Слаева. — СПб.: Профессионал, 2009. — 320 с.

2. ГОСТ Р ИСО/МЭК 9126–93. Оценка программной продукции. Характеристики качества и руково-дство по их применению.

3. ГОСТ Р ИСО/МЭК 12119–2000. Информационная технология. Пакеты программ. Требования к качеству и тестирование.

4. Липаев В.В. Качество программных средств: Методические рекомендации. – М.: Янус-К, 2002. – 400 с.

5. ГОСТ Р ИСО/МЭК 17025:1999. Общие требования к компетентности испытательных и калибро-вочных лабораторий.

6. ГОСТ Р 8.596–2002 ГСИ. Метрологическое обеспечение измерительных систем. Основные поло-жения.

7. МИ 2174–91 ГСИ. Аттестация алгоритмов и программ обработки данных. 8. Best Practice Guide No. 1. Validation of Software in Measurement Systems. Version 2.1, March 2004. 9. Software Support for Metrology. Wichmann B., Parkin G.I., Barker R.M. NPL DEM-ES 014, January

2007. 10. Cook H.R., Cox M.G., Dainton M.P., Harris P.M. A Methodology for Testing Spreadsheets and Other

Packages Used in Metrology. NPL Report CISE 25/99, September 1999. 11. Марпл-мл. С.Л. Цифровой спектральный анализ и его приложения: Пер. с англ. – М.: Мир, 1990. –

584 с. 12. Huang N.E., etc. The empirical mode decomposition and the Hilbert spectrum for non-linear and non-

stationary time series analysis. – Proc. Royal Soc. London, Vol. 454, pp. 903-995, 1998. 13. Мясникова М.Г. Измерение параметров электрических сигналов на основе метода Прони: Дис. …

канд. техн. наук: 05.11.01 / Пенза: Пенз. гос. ун-т, 2007. – 181 с. 14. Мясникова М.Г., Самсонкина Е.О., Самсонкина М.О. Оценивание погрешности метода Прони в

измерительных задачах // Современные проблемы оптимизации в инженерных приложениях: сб. тр. Первой Междунар. науч.-техн. конф. – Ярославль, 2005.

Статья поступила в редакцию 5 декабря 2012 г.

THE COMPRESSION - RESTORATION ALGORITHM CERTIFICATION OF MEASURING SIGNALS BY MODIFIED PRONI METHOD

V.A. Baranov, A.V. Terekhina, B.V. Cypin Penza State University 40, Krasnaja st., Penza, 440026

Problems of the software metrological part certification of information-measuringand manag-ing systems are considered. Compression - restoration algorithms of a measuring signal on the basis of the Proni method are shown. Error restoration estimates at application of the Proni modified method depending on information capacity were received.

Keywords: compression-restoration of measuring signal, metrological software, certification, Proni method.

Viktor A. Baranov, Teacher. Anastasiya V. Terekhina, Postgraduate Student. Boris V. Cypin, Professor.

Page 7: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

48

УДК 621.317

ОЦЕНКА ПОГРЕШНОСТИ СРЕДСТВА ИЗМЕРЕНИЯ ИНТЕГРАЛЬНЫХ ХАРАКТЕРИСТИК ГАРМОНИЧЕСКИХ СИГНАЛОВ С ФАЗОСДВИГАЮЩИМИ БЛОКАМИ Ю.М. Иванов, А.Е. Синицын, А.В. Симонов Самарский государственный технический университет 443100, г. Самара, ул. Молодогвардейская, 244

Приводятся результаты анализа погрешности средства измерения интегральных ха-рактеристик гармонических сигналов, использующего формирование дополнительных сигналов с помощью фазосдвигающего блока. Полученные аналитические выражения и графики погрешности позволяют выбирать оптимальные параметры измерительного процесса и угла сдвига фазы фазосдвигающего блока, обеспечивающие уменьшение дан-ного вида погрешности.

Ключевые слова: интегральные характеристики, гармонические сигналы, мгновенные значения, фазосдвигающий блок, погрешности, угол сдвига фазы.

В настоящее время получили распространение методы измерения интегральных характеристик гармонических сигналов (ИХГС) по их отдельным мгновенным зна-чениям, не связанным с периодом входного сигнала [1].

Одним из подходов, используемых для реализации методов, является разделение мгновенных значений в пространстве за счет формирования дополнительных сигна-лов напряжения и тока, сдвинутых по фазе относительно входных [2]. Это обеспечи-вает существенное сокращение времени определения ИХГС.

В [3] авторами предложен метод измерения ИХГС, который заключается в том, что в момент перехода входного сигнала напряжения через ноль одновременно из-меряют мгновенное значение дополнительного напряжения, сдвинутого по фазе от-носительно входного на угол Δα, и мгновенное значение тока; через интервал време-ни Δt одновременно измеряют мгновенные значения входного и дополнительного сигналов напряжения и тока. ИХГС определяют по измеренным значениям. К несо-мненным достоинствам метода следует отнести тот факт, что угол сдвига фаз между входным и дополнительным сигналами напряжения Δα и интервал времени Δt могут принимать (в общем случае) произвольные значения.

Если входные напряжение и ток и дополнительный сигнал напряжения соответ-ственно равны: tUtu m sin)(1 ; tIti msin)( и tUtu m sin2 , то в момент времени, когда сигнал напряжения переходит через ноль, выражения для мгновенных значений примут вид

sin21 mUU ; sin11 mII ,

где mU , mI – амплитудные значения сигналов напряжения и тока; ω – угловая частота входного сигнала; φ – угол сдвига фаз между напряжением и током.

Через образцовый интервал времени Δt мгновенные значения сигналов будут

Юрий Михайлович Иванов (к.т.н.), старший научный сотрудник. Антон Евгеньевич Синицын, аспирант. Андрей Валерьевич Симонов, аспирант.

Page 8: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

49

равны tUU m sin12 ; tUU m sin22 ; tII m sin12 .

Используя мгновенные значения сигналов, после преобразований можно полу-чить выражения для определения основных ИХГС в случае, если 90 :

– среднеквадратические значения (СКЗ) напряжения и тока

22

22212

221

222

221

2221123

4

2

UUUUU

UUUUСК ; (1)

22

22212

221

222

221

222

212

2211211

212

21122212221

34

2

UUUUU

UUUIIIIUUUUIСК

; (2)

– активная (АМ) и реактивная (РМ) мощности

2222

212

221

222

221

222

212

22111222112222112

4

2

UUUUU

UUUIUUIUUUP ; (3)

22

22212

221

222

221

22211211

4 UUUUU

UUUIQ

. (4)

При реализации метода для формирования дополнительного сигнала напряже-ния используется фазосдвигающий блок (ФСБ). При этом величина угловой погреш-ности ФСБ не имеет значения, поскольку угол Δα может быть произвольным. Одна-ко погрешность по напряжению (погрешность по модулю) ФСБ может привести к значительной потере точности измерения ИХГС.

Если амплитудное значение сигнала на выходе ФСБ отличается от входного сигнала на величину ΔUm, то мгновенные значения дополнительного напряжения примут вид sin21 mm UUU и tUUU mm sin22 .

Оценим влияние погрешности ФСБ на погрешность результата измерения ИХГС.

Для этого воспользуемся методикой оценки погрешности результата измерения интегральной характеристики как функции, аргументы которой заданы приближен-но с погрешностью, соответствующей отклонению модели от реального сигнала. Погрешности функции соответствует возможное ее приращение, которое она полу-чит, если аргументам дать приращения, равные их погрешностям [4].

Если абсолютные погрешности аргументов соответствуют отклонению мгно-венных значений дополнительного напряжения на величину ΔUm, то, считая, что мгновенные значения входных сигналов напряжения и тока измерены без погрешно-сти, можно определить предельное значение абсолютной погрешности измерения СКЗ напряжения

mUСКЗUСКЗСКЗ UUUU

2221 .

Выражения для абсолютных погрешностей определения СКЗ тока, АМ и РМ со-ответствуют аналогичным выражениям.

Используя (1) – (4) с учетом предельных значений абсолютных погрешностей, можно определить относительные погрешности определения СКЗ напряжения и тока

Page 9: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

50

и приведенные погрешности определения АМ и РМ:

ttthm

U

sinsin22cos2sinsinsin

; (5)

tttttthm

I sinsinsin22sinsin2coscoscossin

2 ; (6)

tt

ttttthmP

sinsinsincossinsincossincoscoscos

2 ;(7)

t

ttthmQ

sinsin2cossin2sinsincossin

, (8)

где m

mm U

Uh .

Анализ выражений (5) – (8) показывает, что погрешности измерения ИХГС про-порциональны hm.

Однако погрешности измерения ИХГС зависят не только от погрешности фазос-двигающего блока, но и от угла сдвига фазы ФСБ и интервала времени Δt. Кроме того, погрешности определения СКЗ тока, АМ и РМ зависят также и от угла сдвига фаз между напряжением и током.

На рис. 1 представлены графики зависимости относительной погрешности изме-рения СКЗ напряжения от Δα, изменяющегося в диапазоне от 20 до 80°, и ωΔt, изме-няющегося в диапазоне от 10 до 90°, в соответствии с (5) для hm=0,1 %.

На рис. 2 и 3 представлены графики зависимости относительной погрешности

измерения СКЗ тока и приведенной погрешности измерения АМ от Δα, изменяюще-гося в диапазоне 20÷80°, и ωΔt, изменяющегося в диапазоне 10÷80°, в соответствии с (6) и (7) при φ=0° для hm=0,1 %. На рис. 4 представлены графики зависимости при-веденной погрешности измерения РМ от Δα, изменяющегося в диапазоне 20÷80°, и ωΔt, изменяющегося в диапазоне 10÷90°, в соответствии с (8) при φ=90° для hm=0,1

Рис. 1. Графики зависимости δU от Δα и ωΔt

Page 10: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

51

%.

Рис. 2. Графики зависимости δI от Δα и ωΔt при φ=0°

Рис. 3. Графики зависимости γP от Δα и ωΔt при φ=0°

Рис. 4. Графики зависимости γQ от Δα и ωΔt при φ=90°

Page 11: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

52

Полученные результаты показывают, что погрешность измерения ИХГС, обу-словленную неидеальностью фазосдвигающего блока, можно существенно снизить за счет соответствующего выбора угла сдвига фазы ФСБ и интервала времени Δt.

В частности, при измерении СКЗ тока, АМ и РМ оптимальными являются углы сдвига фазы ФСБ, близкие к 80°, и интервалы времени (в угловой мере), близкие к 90°.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Мелентьев В.С., Батищев В.И. Аппроксимационные методы и системы измерения и контроля па-раметров периодических сигналов. – М.: Физматлит, 2011. – 240 с.

2. Мелентьев В.С., Иванов Ю.М., Синицын А.Е. Синтез методов измерения интегральных характери-стик по мгновенным значениям ортогональных составляющих гармонических сигналов // Вестник Самарского государственного технического университета. Серия: Технические науки, 2012. – № 3 (35). – С. 84-89.

3. Мелентьев В.С., Батищев В.И., Иванов Ю.М. Исследование метода измерения интегральных ха-рактеристик по мгновенным значениям сигналов // Датчики и системы: методы, средства и техно-логии получения и обработки измерительной информации (Датчики и системы – 2012): Тр. Меж-дунар. науч.-техн. конф. – Пенза: Изд-во ПГУ, 2012. – С. 11-16.

4. Батищев В.И., Мелентьев В.С. Аппроксимационные методы и системы промышленных измере-ний, контроля, испытаний, диагностики. – М.: Машиностроение-1, 2007. – 393 с.

Статья поступила в редакцию 25 декабря 2012 г. THE ESTIMATION OF THE MEASURING DEVICE ERROR OF INTEGRATED CHARACTERISTICS OF HARMONIOUS SIGNALS WITH PHASE-SHIFTING BLOCKS

J.M. Ivanov, A.E. Sinitsyn, A.V. Simonov Samara State Technical University 244, Molodogvardeyskaya st., Samara, 443100

Results of the analysis of the measuring device error of integrated characteristics of the har-monious signals, using formation of additional signals with the help of the phase-shifting block are given. The received analytical expressions and diagrams of the error allow to choose opti-mum parameters of measuring process and a phase corner shift of the phase-shifting block providing reduction of the given error kind .

Keywords: integrated characteristics, harmonious signals, instant values, the phase-shifting block, errors, a corner of shift of a phase.

Jury M. Ivanov (Ph.D. (Techn.)), Senior Research. Anton E. Sinitsyn, Postgraduate Student. Andrey V. Simonov, Postgraduate Student.

Page 12: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

53

УДК 621.317.33 МЕТОД РАЗДЕЛЬНОГО ОПРЕДЕЛЕНИЯ ПАРАМЕТРОВ ЕМКОСТНЫХ ДАТЧИКОВ В.С. Мелентьев, Т.С. Евстифеева, К.Д. Левина Самарский государственный технический университет 443100, г. Самара, ул. Молодогвардейская, 244 E-mail: [email protected]

Предлагается новый метод измерения параметров емкостных датчиков, который обеспечивает определение как емкости, так и сопротивления изоляции, что увеличива-ет точность измерения информативного параметра. Приводятся результаты анализа погрешности измерения емкости, обусловленной погрешностью квантования мгновен-ных значений переходных процессов.

Ключевые слова: переходный процесс, мгновенные значения, измерительная цепь, по-грешность, квантование.

В настоящее время успешно развивается направление, связанное с определением параметров емкостных датчиков (ЕД) по мгновенным значениям переходного про-цесса в измерительной цепи (ИЦ) [1]. Дальнейшее сокращение времени измерения обеспечивают методы измерения параметров по мгновенным значениям нескольких переходных процессов [2, 3].

Однако данные методы не учитывают многоэлементной схемы замещения дат-чиков, что снижает точность получения информации об информативном параметре ЕД.

Одним из элементов, оказывающим влияние на точность измерения, является эквивалентное активное сопротивление, обусловленное потерями в изолирующем диэлектрике и сквозными токами утечки.

В статье рассматривается новый метод, который обеспечивает измерение как емкости, так и сопротивления изоляции ЕД.

Метод заключается в том, что на ИЦ, состоящую из последовательно включен-ных образцового резистора R0, ЕД, имеющего емкость CX и сопротивление изоляции RХ, и второго образцового резистора с сопротивлением R0, подают напряжение по-стоянного тока U0; в произвольный момент времени t1 одновременно измеряют мгновенные значения переходных процессов на участке цепи, содержащем ЕД и второй образцовый резистор, и втором образцовом резисторе относительно общего вывода ИЦ; через образцовый интервал времени t измеряют мгновенное значение напряжения на том же участке цепи относительно общего вывода; через интервал времени t измеряют мгновенное значение напряжения на том же участке цепи от-носительно общего вывода и определяют неизвестную емкость по измеренным зна-чениям.

Временные диаграммы, поясняющие метод, представлены на рис. 1. После подключения источника напряжения U0 к измерительной цепи напряже-

ния на участке цепи, содержащем ЕД и второй образцовый резистор, и на втором

Владимир Сергеевич Мелентьев (д.т.н., проф.), заведующий кафедрой «Информацион-

но-измерительная техника». Татьяна Сергеевна Евстифеева, аспирант. Ксения Дмитриевна Левина, студент.

Page 13: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

54

образцовом резисторе относительно общего вывода ИЦ изменяются в соответствии с выражениями

tRR

RUtuX

X exp12

12 0

01 ;

tRR

RUtuX

X exp12

12 0

02 ,

где X

XХRRRRС

0

022 – постоянная времени ИЦ.

Переходные процессы, возникающие в данной ИЦ, имеют в общем случае шесть параметров: XС , XR , 0R , 0U , Δt и момент времени начала измерения t1, два из ко-торых ( 0R и Δt) известны. В этом случае составим систему четырех уравнений

.2exp12

12

;exp12

12

;exp12

12

;exp12

12

131

0

0

121

0

0

211

0

0

111

0

0

UttRR

RU

UttRR

RU

UtRR

RU

UtRR

RU

X

X

X

X

X

X

X

X

(1)

Используя мгновенные значения напряжений (1), можно определить сопротив-ление изоляции

11122111122111

12131121211112111202

22UUUUUUU

UUUUUUUUURRX

. (2)

Из отношения

t

UUUU exp

1112

1213 можно определить постоянную времени

ИЦ

Рис. 1. Временные диаграммы, поясняющие метод

Page 14: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

55

1112

1213lnUUUU

t . (3)

Из выражения (3) следует, что

1112

12130

0

ln2

2

UUUURR

tRRС

X

XX . (4)

Для определения емкости ЕД в соответствии с выражением (4) используется значение сопротивления RХ, полученное в соответствии с (2). Это обеспечивает уве-личение точности измерения XС .

Схема средства измерения (СИ), реализующего метод, приведена на рис. 2. В состав СИ входят: источник опорного напряжения постоянного тока ИН; ана-

логовый ключ КЛ; измерительная цепь ИЦ; два аналого-цифровых преобразователя АЦП1 и АЦП2 и контроллер КНТ с шинами управления ШУ и данных ШД.

Для преобразования мгновенных значений напряжений в код в цифровых СИ используется квантование по уровню, что неизбежно приводит к погрешности.

Для оценки влияния погрешности квантования на результирующую погреш-ность определения информативного параметра используем предложенную в [4] сле-дующую методику. Согласно методике искомая оценка соответствует погрешности вычисления значения функции, аргументы которой заданы приближенно, если пре-дельные абсолютные погрешности аргументов равны погрешностям квантования мгновенных значений.

Если считать, что при значении опорного напряжения 0U мгновенные значения напряжений 11U , 21U , 12U и 13U измеряются с погрешностями преобразования

АЦП и абсолютные погрешности измерений равны ΔU11=ΔU21=ΔU12=ΔU13= nU

2 (где

п – разрядность АЦП), то предельная абсолютная погрешность вычисления CX в со-ответствии с выражением (4) будет равна

Рис. 2. Схема средства измерения, реализующего метод

Page 15: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

56

UССССС UХUХUХUХХ

13122111 . (5)

Предельная относительная погрешность определения CX с учетом (4) и (5) при-мет вид

ttttR

tRR

nX

X

Сexp1expexp2

exp12

11

0

. (6)

Анализ (6) показывает, что погрешность зависит от следующих отношений: ме-жду образцовым интервалом времени Δt и постоянной времени ИЦ τ; между сопро-тивлением изоляции RХ и сопротивлением образцового резистора R0; между интер-валом времени с момента начала переходного процесса в ИЦ до момента начала из-мерения t1 и образцовым интервалом времени Δt.

На рис. 3 приведены графики зависимости погрешности δС от Δt/τ и RХ/R0 при t1/τ = 0,01 для 12-разрядного АЦП.

Рис. 3. График зависимости δС от RХ/R0 и Δt/τ при t1/τ = 0,01

Рис. 4. График зависимости δС от RХ/R0 и Δt/τ при t1/τ = 0,1

Page 16: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

57

На рис. 4 приведены графики зависимости погрешности δС от Δt/τ и RХ/R0 при t1/τ = 0,1 для 12-разрядного АЦП.

Анализ рис. 3 и 4 показывает, что погрешность измерения емкости практически не зависит от RХ при RХ/R0>10. Однако погрешность δС можно существенно снизить за счет соответствующего выбора соотношения Δt/τ. Кроме того, влияние квантова-ния на результирующую погрешность измерения может быть сокращено при уменьшении отношения t1/τ.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Батищев В.И., Мелентьев В.С. Измерение параметров емкостных датчиков положения и переме-щения. – М.: Машиностроение, 2005. – 124 с.

2. Мелентьев В.С., Латухова О.А. Метод измерения параметров емкостных датчиков с использова-нием двух образцовых элементов // Измерения, автоматизация и моделирование в промышленно-сти и научных исследованиях: Межвуз. сборник. – Вып. 1. – Бийск: Изд-во Алтайского гос. техн. ун-та им. И.И. Ползунова, 2011. – С. 126-128.

3. Мелентьев В.С., Батищев В.И., Смолина А.М. Метод измерения параметров емкостных датчиков положения и перемещения // Мехатроника, автоматизация, управление. – 2012. – № 8. – С. 26-30.

4. Мелентьев В.С., Батищев В.И. Аппроксимационные методы и средства измерения параметров двухполюсных электрических цепей. – М: ФИЗМАТЛИТ, 2012. – 198 с.

Статья поступила в редакцию 24 октября 2011 г.

THE METHOD OF PARAMETERS SEPARATE DEFINITION OF CAPACITOR GAUGES

V.S. Melentiev, T.S. Evstifeeva, K.D. Levina Samara State Technical University 244, Molodogvardeyskaya st., Samara, 443100

The new method of measurement of parameters of capacitor gauges which provides definition as capacities, and resistance of isolation is offered that increases accuracy of measurement of informative parameter. Results of the analysis of an error of measurement of the capacity caused by an error of quantization of instant values of transients are resulted.

Keywords: transient, instant values, a measuring circuit, an error, quantization.

Vladimir S. Melentiev (Dr. Sci. (Techn.)), Professor. Tatiana S. Evstifeeva, Postgraduate Student. Kseniya D. Levina, Student.

Page 17: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

58

УДК 681.3 АНАЛИЗ ЭМОЦИОНАЛЬНОЙ ТОНАЛЬНОСТИ ТЕКСТА И ЕГО ПРИМЕНЕНИЕ ДЛЯ ПОВЫШЕНИЯ КАЧЕСТВА ПЕРЕХОДОВ ПО РЕЛЕВАНТНЫМ ОБЪЯВЛЕНИЯМ

И.А. Минаков Институт проблем управления сложными системами РАН 443020, г. Самара, ул. Садовая, 61 E-mail: [email protected]

Рассматриваются различные подходы к анализу эмоциональной тональности текста, проводится оценка применимости метода при решении практической задачи оптими-зации интернет-рекламы и приводятся практические рекомендации по настройке ме-тода в зависимости от специфики предметной области, задачи и используемого языка документов.

Ключевые слова: сентимент-анализ, анализ тональности, онлайн-реклама, оптимиза-ция.

Введение Анализ тональности текста (sentiment analysis) – область компьютерной лин-

гвистики и интеллектуального анализа текста (text mining), ориентированная на из-влечение из него субъективных мнений и эмоций. Технология может использоваться для автоматической оценки новостных событий, новых продуктов и услуг, оценки действий человека, компании или страны. К типовым задачам относятся распознава-ние и интерпретация мнения, сегментация и классификация текстов по разным ти-пам и категориям эмоциональной окраски мнения; прогнозирование и даже форми-рование мнений в зависимости от контекста.

Данная технология существует уже много лет под различными именами и сино-нимами (sentiment metrics, brand monitoring, opinion mining, social media analysis, appraisal extraction, subjectivity analysis, polarity classification и др.), но особое разви-тие получила в последние годы с распространением Интернета и возрастанием по-пулярности социальных сетей, блогов, твитов.

Оперативность появления новой информации (отзывы доступны для анализа немедленно после исследуемого события) и широкая аудитория сети Интернет (в развитых странах доходящая до 90 % от числа жителей) позволяют применять эту технологию со значительно большей степенью точности и достоверности результа-тов.

Сейчас подход все более востребован в таких областях, как социология, полито-логия и маркетинг, отвечая на следующие типы вопросов: «Что клиенты думают о продукте?», «Как в динамике воспринимается репутация нашей компании?», «На-сколько вновь внедренный сервис/услуга повлиял на мнение клиентов о фирме?», «Чем клиентов привлекают продукты конкурентов?» и т. п.

Подходы к классификации тональности

Обзор существующих методов и подходов к анализу тональности текста приве-ден в [1] и [2]. Известные подходы можно разделить на следующие категории.

Игорь Александрович Минаков (д.т.н.), старший научный сотрудник.

Page 18: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

59

1. Подход, основанный на тональных словарях. Содержит список слов и сло-восочетаний со значением тональности, как положительной, так и отрицательной (пример реализации в [3]). При этом используется способ представления документа либо в виде набора слов (bag-of-words), либо в виде набора N-грамм (т. е. комбина-ций пар, троек и т. д. синтаксически связанных слов). Общая тональность текста мо-жет определяться либо формульным путем (например среднеарифметическое за вы-четом стоп-слов), либо более сложными методами (например обучение классифика-тора с использованием нейронной сети или генетических алгоритмов, чтобы точнее подстроить веса).

2. Подход с использованием эвристических правил и шаблонов. Набор вруч-ную сформированных шаблонов правил ЕСЛИ – ТО, где в части ЕСЛИ описывается условие (как простое унитарное условие, например «содержит слово из положитель-ного набора», так и набор условий, например «не содержит негативных слов» + «нет отрицаний» + «нет нераспознанных слов»), а в части ТО – вес принадлежности к ка-кой-либо группе (см., например, [4]).

3. Машинное обучение. Обучение классификатора на тестовой выборке разме-ченных текстов, а затем использование сформированной модели для последующего анализа. Включает целый спектр технологий, в том числе латентно-семантический анализ, метод опорных векторов, байесовские классификаторы, метод Rocchio, ней-ронные сети и другие (см., например, [2]).

Достоинства и недостатки подходов, выявленные на основе нашего опыта их использования, приведены в табл. 1.

Таблица 1

Сравнение методов анализа эмоциональной тональности текста

Достоинства Недостатки

1. Словари Простота реализации Легкость масштабирования на новые области и языки Объяснимость результатов Легкое подключение разных языков

Низкая точность

2. Правила Высокая точность при корректной подстройке Прозрачность принятия решения Объяснимость результатов Хорошая поддержка стемминга и лем-матизации

Сложность настройки на новую предметную область Новые правила для каждого язы-ка Сложность и противоречивость для сложной системы

3. Машинное обучение

Легкость настройки Хорошие результаты в случае, если велико количество классов, на которые делится тональность

Необходимость обучающей вы-борки Усложнение подстройки под за-дачу/предметную область

На наш взгляд, наибольшей перспективой обладают гибридные методы, в идеале

совмещающие подходы машинного обучения и эвристических правил и шаблонов. Хороший обзор платных и бесплатных систем анализа тональности текста при-

веден в [5].

Page 19: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

60

Использование анализа эмоциональной окраски текста в задаче оптимизациия интернет-рекламы В качестве практической проблемы исследовалась задача оптимизации интернет-

рекламы в ее частном случае – повышение вероятности перехода пользователя по рекламной ссылке (постановка проблемы и общие методы оптимизации в области интернет-рекламы рассматривались в работах [6, 7]).

В качестве тестовой выборки анализировались рекламные кампании, которые идут на сайтах, принадлежащих разным клиентам и даже находящихся в разных странах. Всего в выборке участвовала 1031 кампания, каждая в среднем идущая на 40 страницах.

Для каждой кампании измерялся CTR (Click-through rate, число нажатий на рек-ламную кампанию за тысячу показов).

В силу того, что рекламные кампании некорректно сравнивать друг с другом, все сравнения проводились на каждой кампании независимо, а затем результаты норми-ровались. При этом при нормировании учитывались внешние факторы (то, что кам-пании с разными типами рекламных баннеров могут иметь CTR, различающийся в несколько раз; что CTR зависит от региона, времени и т. п.). Т. е. нормировка осуще-ствлялась среди кампаний со схожими параметрами, чтобы максимально исключить внешние факторы, воздействующие на CTR.

Оценка эмоциональной тональности осуществлялась с помощью бесплатной системы оценки тональности текста AlchemyAPI, а также ряда собственных систем классификации, построенных по правилам, приведенным в п. 3 данной статьи.

Результаты анализа приведены в табл. 2. Таблица 2

Средний CTR рекламных кампаний в зависимости от тональности текста

Тон А Анализ

тональности

Б Тональность +

ориентация на контент

В Тональность +

поведенческий таргетинг

Нейтральный 0.3 (базис) 0.54 0.67

Позитивный 0.28 0.66 0.79

Негативный 0.38 0.41 0.55 Анализ выявил несколько очень интересных закономерностей. А – можно видеть, что если реклама показывается «случайным» образом, без

привязки к смыслу страницы, то число переходов на рекламу больше в случае, когда общая эмоциональная окраска негативна. Вероятно, это объясняется тем, что боль-шинство людей предпочитают избегать большого количества негативных новостей путем переключения на другую тематику.

Б – когда реклама связана с содержанием страницы, то ситуация меняется и пользователи чаще переходят по рекламному объявлению в том случае, если тональ-ность текста страницы позитивна. Данный результат легко объясним – если, к при-меру, рекламируются туристические путешествия, то с куда большей вероятностью они привлекут внимание в статье «Как правильно отдохнуть», нежели в статье «Ав-тобус с туристами упал в пропасть».

В – использование поведенческого таргетинга. Повышается отклик пользовате-ля, поскольку релевантность еще более возрастает. Но тональность в данном случае

Page 20: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

61

влияет так же, как и в предыдущем варианте. Прагматические выводы просты – следует стремиться показывать позитивную

рекламу (без привязки к контексту) в случае, если смысл страницы не распознан. А когда смысл ясен и существует рекламное объявление, релевантное контенту стра-ницы, следует стремиться показывать его только тогда, когда эмоциональная окра-ска текста положительна.

Общие практические рекомендации по применению подхода к анализу тональности текста

По итогам практической работы с технологией в задачах разной тематики сфор-мировался некоторый набор рекомендаций по использованию подхода в зависимо-сти от задачи. Данные выводы сугубо эмпирические. Кроме того, они применимы только к европейским языкам. Восточные языки (арабский, китайский, японский и др.) требуют дополнительного исследования.

Классификатор – Не существует наилучшего классификатора, подходящего под любые задачи. – Выбор напрямую определяется типом данных. В частности, для блогов лучше

подходит метод опорных векторов, а для «Твиттера» хорошие результаты показы-вают байесмовские методы (предположительно потому, что выполняется основное допущение – слова в твите практически независимы, а смысл понимается из общего набора).

– Рекомендуется использовать фильтр FCBF [8] – он хорошо отбирает атрибуты с минимальной взаимной информацией. Также подходит Mutual Information [9].

– При слишком долгой тренировке классификатора есть риск «перетрениров-ки» – признаки становятся слишком специфичными для обучаемой коллекции дан-ных. При этом перетренировка в основном зависит от классификатора, а не от при-знаков. Такие методы, как опорные векторы или деревья решений, менее подверже-ны проблеме перетренировки.

Классификации по группам – Наиболее корректно алгоритмы отрабатывают в случае, когда деление осуще-

ствляется на три группы (позитив, негатив, нейтральное). – Использование двух групп приводит к большому шуму (из-за необходимости

принять бинарное решение для пограничных случаев). – Использование большого дерева решений (с учетом степени уверенности, эмо-

циональности, объективности-субъективности) в основном не приносит особой вы-годы из-за общей высокой погрешности методов, обусловленной неопределенно-стью, нерелевантностью, спамом и т. д.

Выделение признаков – Наилучшее практическое использование дают биграммы и триграммы, при

этом для французского и русского языка лучше работают триграммы, а для англий-ского – биграммы. Для немецкого в силу специфики словоформирования возможны и униграммы.

– Использование униграмм дает плохое качество результатов, использование комбинаций более чем трех слов существенно повышает нагрузку на производи-тельность без ощутимого прироста результата.

– Отдельно следует обрабатывать сокращения, аббревиатуры и слова из 2-3 букв. – При определении веса признака рекомендуется использовать delta tf-idf [10].

Обычный TD-IDF не очень применим, поскольку частотность не так важна, как при поиске.

Page 21: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

62

– Отрицательные конструкции желательно прикреплять к соседним словам. При этом для русского языка достаточно прикреплять «не» к глаголу и «нет» к существи-тельному. Для английского учитывать модальные глаголы. Для французского и не-мецкого необходим более сложный синтаксический разбор, т. к. отрицание может отстоять от объекта.

Использование на практике – Поскольку каждый из методов обладает рядом недостатков, повышающих не-

достоверность результата, для реальных задач рекомендуется использовать наборы классификаторов, где каждый участвует в итоговом решении с некоторым весом.

– В случае если анализируется тренд (т. е. изменение отношения во времени), рекомендуется принцип «не уверен – исключи из рассмотрения». Понятно, что он применим только при большой выборке.

– В практических задачах рекомендуются методы, позволяющие расширения за счет эвристик. Например, во французском и немецком крайне желателен синтакси-ческий разбор до формирования N-грам, в английском полезен анализ времени гла-голов и условных времен, а в русском – использование морфологии (первое или третье лицо, местоимения и пр.).

Ограничения метода Необходимо помнить, что все используемые методы все равно обладают опреде-

ленной степенью погрешности. Наше практическое исследование показало, что даже лучшие подходы позволяют добиться точности не более 70-75 % для случая трех классов разделения. Основные проблемы, препятствующие корректному анализу, следующие:

– использование сарказма (негатив трактуется как позитив); – смешанность формулировок (в одной фразе содержится как позитив, так и не-

гатив, – например, когда часть функций нравится, а часть нет); – смешанность адресата или сравнение (когда упоминаются два объекта, но не

распознано, по отношению к кому/чему проявлен негатив); – целенаправленный спам (все чаще используется в политтехнологиях, где при-

меняются однотипные записи в поддержку того или иного кандидата); – некорректность контекста (когда позитив и негатив имеются, но не относятся к

объекту исследования); – невыполненное условие (отзыв был бы позитивным / негативным, если бы вы-

полнилось определенное условие; иногда условие уже невыполнимо, иногда оно за-висит от будущих факторов);

– использование смайликов, меняющее контекст фразы. Также хороший обзор проблем анализа тональности приведен в [11].

Заключение В связи с экспоненциальным ростом информационных материалов, популяриза-

цией социальных сетей и переходом бизнес-активности в Интернет интерес к облас-ти анализа эмоциональной тональности текстов возрос многократно.

Наш опыт работы с данной технологией подтверждает ее пользу и примени-мость при решении практических задач.

В то же время технология находится еще на ранних стадиях развития и ни один из методов неприменим «из коробки» и нуждается в существенной доработке под предметную область и специфику задачи – будь то трудновыполнимое требование к разметке значительного корпуса текстов или дорогостоящая подстройка правил под

Page 22: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

63

предметную область. Существующие известные системы для анализа эмоциональной окраски, как

платные, так и бесплатные, тоже не гарантируют приемлемого результата. Отдельным вопросом является поддержка разных языков одновременно, зачас-

тую востребованная при анализе. На наш взгляд, перспективы заключаются в открытом и дополняемом инстру-

ментарии, позволяющем конструировать инструмент анализа тональности и выбора из множества известных методов компьютерной лингвистики, включая морфологи-ческий и синтаксический анализ, работу со словарями, методы машинного обучения, деревья принятия решений и ряд других.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. http://habrahabr.ru/post/149605/ 2. Котельников Е.В., Клековкина М.В. Автоматический анализ тональности текстов на основе мето-

дов машинного обучения // Компьютерная лингвистика и интеллектуальные технологии: по мате-риалам ежегодной Международной конференции «Диалог» (Бекасово, 30 мая – 3 июня 2012 г.). – Вып. 11 (18). – М.: Изд-во РГГУ, 2012.

3. Strapparava, C. and Vlitutti, A. (2004). Wordnet-affect: and affective extension of wordnet. In Proceed-ings of the 4th International Conference on Language Resources and Evaluation.

4. Yang, Shih А rule-based approach for effective sentiment analysis – http://pacis2012.org/files/papers/pacis2012_T25_Yang_288.pdf

5. Прохоров А., Керимов А. Сентимент-анализ и продвижение в социальных медиа / // Компьютер-Пресс. – 2012. – № 7. – С. 98-105.

6. Якушин А.В., Вольман С.И. , Минаков И.А. Разработка системы поддержки принятия решений при оптимизации хода рекламных кампаний в сети Интернет // Проблемы управления и моделирования в сложных системах: Тр. XI Междунар. конф. – С. 68-72.

7. Минаков И.А., Якушин А.В., Кочуров А.В., Хайрутдинов А.Р., Вольман С.И. Разработка системы моделирования динамики поведения пользователей для оптимизации рекламных кампаний в сети Интернет // Проблемы управления и моделирования в сложных системах: Тр. ХI Междунар. конф., Самара, 22 июня – 24 июня 2009. – Самара: СНЦ РАН, 2009. – С. 644-651.

8. http://web.itu.edu.tr/~cataltepe/pdf/2008_ISCIS_BarisFeatSelect.pdf 9. http://nlp.stanford.edu/IR-book/html/htmledition/mutual-information-1.html 10. Justin Martineau, and Tim Finin. Delta TFIDF: An Improved Feature Space for Sentiment Analy-

sishttp://ebiquity.umbc.edu/_file_directory_/papers/446.pdf 11. http://www.semanticforce.net/ru/blog/article/10-problem-analiza-tonalnosti/

Статья поступила в редакцию 12 января 2013 г.

SENTIMENT ANALYSIS: PRACTICAL RECOMMENDATIONS AND ITS USAGE FOR IMPROVING USER-REACTION ON RELEVANT ONLINE ADVERTISEMENTS

I.A. Minakov Institution of the Russian Academy of Sciences Institute for the Control of Complex Systems of RAS 61, Sadovaya st., Samara, 443020

The paper discusses and classifies different approaches for sentiment analysis, shows its im-plementation for solving a problem of optimizing online advertisements and gives practical recommendations for SA setup depending on problem domain specifics, task requirements and languages of documents.

Keywords: sentiment analysis, online advertisements, optimization.

Igor A. Minakov (Dr. Sci. (Techn.)), Senior Research.

Page 23: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

64

УДК 681.518

ИНТЕГРАЛЬНЫЙ МЕТОД ОПРЕДЕЛЕНИЯ ПАРАМЕТРОВ МНОГОЭЛЕМЕНТНЫХ ДВУХПОЛЮСНЫХ ЦЕПЕЙ ПРИ СИНУСОИДАЛЬНОМ ВОЗДЕЙСТВИИ

Н.Н. Хрисанов Самарский государственный технический университет 443100, г. Самара, ул. Молодогвардейская, 244

E-mail: [email protected]

Рассматривается метод определения параметров многоэлементных двухполюсных це-пей, основанный на интегрировании переходного процесса при синусоидальном воздей-ствии.

Ключевые слова: многоэлементный двухполюсник, метод Прони, интегральный метод, синусоидальное воздействие.

В измерительной технике широко распространены интегральные методы опре-деления параметров многоэлементных двухполюсных цепей благодаря фильтрую-щим свойствам операции интегрирования. В [1, 2, 3] предложены методы, основан-ные на применении ступенчатого или экспоненциального воздействия, однако они применимы не для всех типов двухполюсников. Значительно расширить область применения интегрального метода возможно при использовании синусоидального воздействия.

Теоретическое обоснование метода Свободная составляющая для линейной двухполюсной электрической цепи в

общем случае представляет собой сумму экспонент:

n

iii tpAth

1)exp()( ,

где iA – постоянные интегрирования (амплитуды экспонент), которые определяются из начальных условий; ip – корни (показатели экспонент) характеристического урав-нения. Причем амплитуды iA и показатели ip являются функциями элементов ис-следуемой двухполюсной электрической цепи. Как правило, определив амплитуды

iA и показатели ip , можно определить и значения всех элементов электрической цепи.

Рассмотрим переходные процессы в простейшем двухполюснике – последова-тельной RC-цепи – при подаче на нее синусоидального воздействия. Пусть струк-турная схема измерительного канала имеет вид, представленный на рис. 1, где ИСВ – источник синусоидального воздействия; ДЭЦ – исследуемая двухполюсная электрическая цепь (в данном случае последовательная RC-цепь); ОУ – операцион-ный усилитель; УПО – устройство предварительной обработки, включающее в себя аналоговый интегратор; ВУ – вычислительное устройство; 0R – опорный элемент.

По сигналу «Пуск» источником синусоидального воздействия на входе иссле-дуемого двухполюсника формируется напряжение вида

Николай Николаевич Хрисанов (к.т.н., доц.), доцент кафедры «Вычислительная техника».

Page 24: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

65

ИСВ

R0

ОУ

R С УПО ВУ

Пуск ДЭЦ

tUtU sin)( 0ВХ . (1)

Рис. 1. Схема для определения параметров последовательной RC-цепи

Запишем (1) в операторной форме:

221)(

p

UpU 0ВХ . (2)

Для напряжения на выходе операционного усилителя можно записать:

RCpR

pRpU

pCR

RpUpU1

)(1)()( 0ВХ

0ВХВЫХ . (3)

Подставляя (2) в (3), получим:

122ВЫХ )(

ppppApU

,

где

RRUA 0

0 , RC

p 11 .

Переходя к оригиналу, получим для выходного напряжения:

tpeptptAtU 111ВЫХ cos sin)( . (4)

Запишем выражение для неопределенного интеграла от (4):

tpetptAdttU 1 sin cos)( 1

ВЫХ

.

При 0t имеем 0)(

0ВЫХ t

dttU . Тогда определенный интеграл от выходного напряжения в пределах от 0t до

некоторого Рtt будет равен

Р1

Р

Р1

Р0

ВЫХ sincos)( tpt

etptAdttU

. (5)

Учитывая, что )sh( 21sin ixieei

x ixix , получим:

Р1РРРР

Р

221)( 1

0ВЫХ

tptitititit

eeeipeeAdttU

Page 25: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

66

Таким образом, интеграл от входного напряжения в интервале от 0t до неко-торого Рtt также есть сумма экспонент и, следовательно, для определения показа-телей и амплитуд в (5) также можно применить метод Прони [4]. При этом в качест-ве исходных данных можно брать не равноотстоящие ординаты переходного про-цесса (как в методе Прони), а значения интегралов от 0t до равноотстоящих орди-нат Рt , 2 Рt , 3 Рt … переходного процесса.

Из предыдущих рассуждений следует, что применение интегралов в методе Прони возможно, если выходное напряжение имеет вид

n

i i

ii

ZtppAU

0ВЫХ

)exp( , где

n

ikk

kii ppZ0

.

Выражение для неопределенного интеграла для выходного напряжения будет иметь вид

n

i i

i

ZtpAdtU

0ВЫХ

)exp( .

Можно показать, что при 0t и любом n значение этого выражения равно ну-лю. Отметим, что в этом случае также 0)(ВЫХ

tdttU и, следовательно,

0)(0

ВЫХ

dttU .

При использовании синусоидального воздействия необходимо определить пока-затели двух экспонент, т. е. 2n . Следовательно, необходимо произвести интегри-рование на n2 участках. Значения этих интегралов обозначим как 4,1,~

jH j . По-казатель одной экспоненты (соответствующей синусоидальному воздействию) из-вестен, он может быть исключен из экспериментальных данных выполнением опе-рации свертки:

jjjj HbHbHbH ~~~21120 , )0~(,2,1 0 Hnj ,

где 1=0b , ptb cos2=1 , 1=2b . В итоге задача сводится к нахождению двух параметров – амплитуды A и пока-

зателя 1p одной экспоненты. Общая схема определения параметров экспонент и затем параметров двухпо-

люсной сети выглядит следующим образом. 1. Производят интегрирование свободной составляющей переходного процесса

на n2 участках: Р

0ВЫХ

~ jt

j dtUH , nj 2,1 , где Рt – некоторый фиксированный интер-

вал времени; n – порядок дифференциального уравнения, описывающего двухпо-люсную цепь.

2. Выполняют фильтрацию известных параметров, соответствующих входному воздействию из экспериментальных данных, выполнением операции свертки, в ре-зультате чего получают n2 значений интегралов:

jjjj HbHbHbH ~~~21120 , )0~(,2,1 0 Hnj , (6)

где 1=0b , ptb cos2=1 , 1=2b [4]. Далее следуют стандартные шаги метода Прони (пункты 3-4).

Page 26: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

67

3. Определяют n коэффициентов характеристического уравнения nici ,0 , ( 1nc ) решением следующей системы уравнений:

0...0...0...0...

2121110

2113120

112110

nnnnn

nnn

nnn

HHcHcHc

HHcHcHcHHcHcHc

. (7)

4. Находят n корней характеристического уравнения

01

10

n

i

iicc (8)

и определяют показатели экспонент. Для действительных корней находят соответст-вующее значение показателя jp

Р

ln

tp j

j

, (9)

для комплексно-сопряженных ( jyxjj 1, ) – коэффициент затухания j и часто-ту синусоиды j :

Р

lnt

zj

Р

)(t

zyarctgj , где 22 yxz .

5. Используя соотношения для исследуемой электрической цепи, определяют амплитуды экспонент и затем параметры двухполюсника решением системы урав-нений

xAii FA , xp

ii Fp , ni ,1 ,

где ),...,,( 21 mxxxx – вектор параметров двухполюсника. Важным моментом в использовании вышеописанной методики является выбор

частоты входного синусоидального воздействия, а также оптимального значения интервала разбиения Рt , в соответствии с которым производится интегрирование свободной составляющей переходного процесса. Очевидно, выбор частоты и ин-тервала Рt необходимо производить таким образом, чтобы обеспечить минимальное значение погрешности определения составляющих вектора x (искомых параметров двухполюсной цепи).

Рассмотрим основные составляющие погрешности определения этих параметров при применении вышеописанной методики.

Пусть измерение ординат свободной составляющей переходного процесса про-изводится с интервалом времени t с систематической погрешностью , а средне-квадратичное отклонение случайной погрешности равно .

Предельная погрешность ix определения параметра ix может быть вычислена

по формуле

iiixдxx t ,

где ix – систематическая погрешность определения параметра ix ; ix – средне-квадратичное отклонение случайной погрешности определения ix ; дt – доверитель-

Page 27: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

68

ный интервал. Поскольку искомые параметры являются функциями jH , nj 2,1 , воспользу-

емся формулами для погрешности косвенных измерений:

n

jj

j

ix

Hx

i

2

1,

jkkj

j

i

k

in

jj

j

ix K

Hx

Hx

Hx

i 22

1

22

2 , (10)

где j – систематическая погрешность определения интеграла jH ; j – среднеквад-ратичное отклонение случайной погрешности определения интеграла jH ; kjK – кор-реляционный момент величин kH и jH .

Для j можно записать: Р)1( tjTj ,

где T – интервал интегрирования при определении 1H . Среднеквадратичное отклонение j случайной погрешности определения jH

при использовании методов дискретного интегрирования (например метода трапе-ций) и при условии, что корреляционная функция погрешности спадает до нуля за время порядка интервала между замерами, равно

tn jj ,

где jn – количество отсчетов, взятых на интервале jT (интервале интегрирования переходной характеристики при определении jH ).

Учитывая, что t

tjTn j Р)1( , получим

ttjTj Р)1( .

Можно показать, что корреляционный момент kjK величин kH и jH равен

jkj HK 2 .

С учетом этого среднеквадратичное отклонение случайной погрешности опре-деления ix запишется в виде

jkj

j

i

k

in

jj

j

ix

Hx

Hx

Hx

i2

2

1

22

22 .

Поскольку значения интегралов jH и погрешности их определения зависят от значений частоты и интервала Рt , выбор и Рt целесообразно производить та-ким образом, чтобы обеспечить минимальное значение соответствующей погрешно-сти:

iiixдx

tx t

Р,

* min .

Определение параметров двухэлементных двухполюсников

Для определения параметров двухэлементного двухполюсника при синусои-дальном воздействии достаточно произвести интегрирование свободной составляю-

Page 28: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

69

щей переходного процесса на трех участках. В результате получим три значения 3,1,~ jH j (значение 0

~H принимаем равным нулю). Исключаем из исходных дан-ных значение известной экспоненты применением операции фильтрации (6). Полу-чим два значения интегралов:

22111~~ HbHbH , 3221102

~~~ HbHbHbH .

Для последовательной RC -цепи (см. рис. 1) система уравнений (7) примет вид 0210 HHc , откуда находим

1

20 H

Hc .

Характеристическое уравнение (8) в данном случае имеет единственный дейст-вительный корень 0c .

По формуле (9) находим

Р

121

lnt

HHp , 2,1=k .

Учитывая (5), запишем выражение для kH , 2,1k :

Р1-sincos Р

tkpk etkptkAH

.

Используя одно из значений интеграла 1H или 2H , находим значение амплиту-ды A :

Р1Р

1Р sin cos tkp

k

etkptk

HA-

.

Система уравнений (15) в данном случае примет вид

RCp

RRUA

11

00

.

Решая эту систему уравнений относительно R и C , получим:

ARUR 0

0 , Rp

C1

1 .

Оценим погрешность определения параметров элементов двухэлементного двухполюсника. С целью упрощения выражений для частных производных в форму-лах (10) запишем их в следующем виде.

33

12

2

11

1

1 ~~~1

Hp

Hp

Hp

p , 1

11

1pA

pA

HA

, ARAR

,

RpCRC

pC

1

1,

где

Page 29: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

70

221123121

3232

1222

1

1~

bHbHbHbHHtbbHbHbH

Hp

∂,

221123121

22321

211

2

1~

bHbHbHbHHtbHbHbH

Hp

P

--∂

∂, 23121

2

3

1~

bHbHHtb

Hp

P

∂,

-∂

∂A

) 3sin() 3cos(

1~ 133 1 Ppt

PtpettH P

,

-∂

∂A2

) 3sin() 3cos(

3) 3sin(~

13

31

1 1

1

PptP

ptP

P

tpett

ettH

pP

P

,

∂2ARU

AR 00

, ∂

∂2

1

1

RpRC

AppC

211

1

.

На погрешность определения параметров двухполюсника большое влияние ока-зывают выбор частоты входного синусоидального воздействия и интервал разбиения

Рt . На рис. 2 а, б приведены зависимости систематической (а) и случайной погреш-ности (б) определения параметров от отношения периода синусоидального входного воздействия fT 1 к постоянной времени исследуемого двухполюсника. Из рис. 2

следует, что частоту входного воздействия следует выбирать исходя из соотношения 5,111 f .

Рис. 2. Зависимость систематической (а) и случайной погрешности (б) определения парамет-ров от отношения периода входного воздействия к постоянной времени исследуемого двух-

полюсника (сплошная линия – погрешность определения R, пунктирная – С) На рис. 3 а, б приведены зависимости систематической (а) и случайной погреш-

ности (б) определения параметров от отношения периода синусоидального входного воздействия fT 1 к интервалу разбиения Рt .

Из рис. 3 следует, что интервал разбиения при интегрировании выходного сиг-нала должен быть равен Tt 5,0Р .

Page 30: Информационные технологииvestnik-teh.samgtu.ru/sites/vestnik-teh.samgtu.ru/... · 42 ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ

71

Рис. 3. Зависимость систематической (а) и случайной погрешности (б) определения па-

раметров от отношения периода входного воздействия к интервалу разбиения (сплошная линия – погрешность определения R, пунктирная – С)

Рассмотренный способ определения параметров двухполюсника может быть

реализован с помощью устройства, описанного в [5].

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Хрисанов Н.Н., Фролагин Д.Б. Определение параметров двухполюсных цепей по интегральным характеристикам переходного процесса // Тезисы Всероссийской научн.-техн. конф. «Методы и средства измерения в системах контроля и управления». – Пенза, 11-12 апреля 2001 г. – С. 125-127.

2. Пат. 2310872 России МКИ3 G01R 27/02. Способ определения параметров многоэлементных двух-полюсных цепей / Н.Н. Хрисанов (Россия); № 2005128367/28; заявлено 12.09.2005;. Опубл. 10.05.2009. Бюл. № 13.

3. Пат. 2210081 России МКИ3 G01R 27/02. Способ определения параметров многоэлементных двух-полюсных цепей / Н.Н. Хрисанов, Д.Б. Фролагин (Россия); № 2001133361/09; заявлено 07.12.2001; Опубл. 27.03.2005. Бюл. № 09.

4. Марпл-мл. С.Л. Цифровой спектральный анализ и его приложения: Пер. с англ. – М.: Мир, 1990. – 584 с.

5. Пат. 2212677 России МКИ3 G01R 27/02. Устройство для определения параметров многоэлемент-ных двухполюсных цепей / Н.Н. Хрисанов, Д.Б. Фролагин (Россия); № /09; заявлено 26.03.2001; Опубл. 10.12.2004. Бюл. № 34.

Статья поступила в редакцию 23 ноября 2012 г. THE INTEGRAL METHOD OF DETERMINING THE PARAMETERS OF MULTIELEMENT TWO POLE CIRCUIT SINUSOIDAL EFFECTS

N.N. Hrisanov Samara State Technical University 244, Molodogvardeyskaya st., Samara, 443100

The method of determining the multielement bipolar circuits parameters is considered based on the integration of the transient sinusoidal exposure.

Keywords:multi-element two-terminal, Prony's method, the integral method, the sinusoidal effect .

Nikolay N. Hrisanov (Ph. D. (Techn.)), Associate Professor