ДИНАМИЧЕСКАЯ РЕКОНСТРУКЦИЯ В...

1469

УДК 517.9

ДИНАМИЧЕСКАЯ РЕКОНСТРУКЦИЯГРАНИЧНЫХ УПРАВЛЕНИЙ

В ПАРАБОЛИЧЕСКИХ СИСТЕМАХ

А.И. КороткийИнститут математики и механики им. Н.Н. Красовского УрО РАН

Россия, 620990, Екатеринбург, ул. Софьи Ковалевской, 16E-mail: [email protected]

Д.О. МихайловаИнститут математики и механики им. Н.Н. Красовского УрО РАН

Россия, 620990, Екатеринбург, ул. Софьи Ковалевской, 16E-mail: [email protected]

Ключевые слова: динамическая система, управление, реконструкция, метод ди-намической регуляризации, стабилизатор, кусочно-равномерная сходимость.

Аннотация: Рассматривается задача о восстановлении априори неизвестных гра-ничных управлений в динамических системах, описываемых краевыми задачамидля параболических уравнений. Восстановление осуществляется по результатамприближенных измерений текущих фазовых состояний наблюдаемого движениясистемы. Задача решается в динамическом варианте, реконструкция управленийдолжна осуществляться в динамике, по ходу движения системы. Рассматриваемаязадача некорректна. Для решения задачи предлагается воспользоваться методом ди-намической регуляризации Ю.С. Осипова и А.В. Кряжимского. Построены новыемодификации динамических алгоритмов, которые позволяют получать усиленныерезультаты, в частности, получать поточечную и кусочно-равномерную сходимостирегуляризованных приближений метода.

1. Введение

В работе исследуется обратная задача динамики, состоящая в нахождении апри-ори неизвестных управляющих воздействий, функционирующих в управляемой ди-намической системе. Динамическая система описывается краевой задачей для ли-нейного параболического уравнения. Управляющие воздействия сосредоточены награнице области изменения независимых переменных в условиях Дирихле. Исходнойдополнительной информацией для решения обратной задачи служат результаты на-блюдений за системой в виде приближенных измерений текущих фазовых состоянийсистемы. Хорошо известно [1–11], что рассматриваемая задача некорректна и для еерешения необходимо привлекать методы регуляризации [12–17]. Задачу предлагаетсярешать в динамическом варианте, восстановление (реконструкция, идентификация)искомого управления должно осуществляться в динамике, синхронно с развитием

XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯВСПУ-2014

Москва 16-19 июня 2014 г

mailto:[email protected]

mailto:[email protected]

1470

процесса, по ходу движения системы. При этом результаты измерений текущих фа-зовых положений системы поступают наблюдателю в динамике в течение заданногопромежутка времени. Для определения текущего приближения к искомому управ-лению разрешено использовать только поступившее в данный момент приближенноеизмерение состояния системы. Для решения задачи предлагается воспользоватьсяметодом, разработанным Ю.С. Осиповым и его школой, — методом динамическойрегуляризации [5–9]. В работе построены и обоснованы новые модификации динами-ческих регуляризующих алгоритмов решения обратной задачи, которые, в отличиеот традиционных алгоритмов, позволяют получить сходимость регуляризованныхприближений не только в пространствах Лебега, но и усиленные сходимости, в част-ности, поточечную, кусочно-равномерную, сходимость вариаций. Основные результа-ты достигнуты с помощью использования специальных стабилизаторов, содержащихвариации возможных решений [18–22]. Такие стабилизаторы позволяют восстанав-ливать как гладкие, так и негладкие (в том числе разрывные) управления. Выпол-нена конечномерная аппроксимация задачи восстановления, основанная на методеразделения переменных. Приводятся результаты численного моделирования, пока-зывающие способность построенных алгоритмов восстанавливать тонкую структуруискомых управлений, которые могут содержать, например, изломы, разрывы илиимпульсы. Работа продолжает исследования [21–25].

2. Постановка задачи

Опишем содержательную сторону задачи. Рассматривается управляемая дина-мическая система, состояние которой в момент времени t из заданного ограниченногоотрезка времени T = [t0, ϑ] характеризуется функцией y[t] = y(t, ·), определенной внекоторой области Ω евклидова пространства Rn, n > 1. Эволюция состояний вовремени (движение системы) описывается краевой задачей [26,27]

(1) yt = Ay + f , (t, x) ∈ Q = T × Ω ,

(2) y(t0, x) = y0(x) , x ∈ Ω ,

(3) y(t, x) = g(x) · u(t) , t ∈ T , x ∈ Γ = ∂Ω ,

где y0 — начальное состояние системы; f — заданная функция наQ; g = (g1, . . . , gm) —заданная вектор-функция на Γ, m > 1; u = (u1, . . . , um) — вектор-функция управля-ющего воздействия на систему, определенная на T ; A — заданный линейный самосо-пряженный коэрцитивный эллиптический оператор второго порядка

Ay =n∑

i,j=1

∂

∂ xi

(aij(x)

∂ y

∂ xj

)− a(x) y .

Допустимые управляющие функции подчинены геометрическому ограничению

u(t) ∈ P ⊂ Rm, t ∈ T .



1471

Пусть за движением y = y[t], t ∈ T , управляемой динамической системы осу-ществляется наблюдение в течение промежутка времени T и в соответствующие те-кущие моменты времени t ∈ T приближенно измеряются состояния системы y[t],результатами этих измерений являются функции yδ[t], удовлетворяющие условию

‖ yδ[t]− y[t] ‖ 6 δ , t ∈ T ,

где δ — числовой параметр, характеризующий точность измерений, 0 6 δ 6 δ 0.Задача восстановления состоит в том, чтобы построить такой динамический ал-

горитм реконструкции управления, который по результатам yδ = yδ[t], t ∈ T , при-ближенных измерений наблюдаемого движения системы y = y[t], t ∈ T , приближен-но определял бы (восстановливал) ту реализацию u = u(t), t ∈ T , управляющеговоздействия на динамическую систему, которая порождает наблюдаемое движениесистемы. При этом результат uδ = uδ(t), t ∈ T , восстановления искомого управля-ющего воздействия u = u(t), t ∈ T , должен быть тем точнее, чем меньше ошибкиизмерений.

Смысл понятия приближенного восстановления далее будет варьироваться иуточняться. Предположим также, что при решении задачи восстановления известныаприорные геометрические ограничения P на множество допустимых управлений иуравнения динамики процесса вместе с начальным состоянием y0.

Задачу реконструкции можно трактовать как задачу нахождения семейства под-ходящих отображений Dδ, 0 6 δ 6 δ 0, которые переводят результаты приближенныхизмерений состояний системы в приближения к искомому управлению и обладаютсвойством устойчивости

Dδ( yδ) = uδ → u , δ → 0 .

Уточним постановку задачи. Пусть P — выпуклое компактное множество из Rm;W — банахово пространство [15, 17, 28–30] вектор-функций u : T 3 t → u(t) ∈ Rm сограниченным изменением, в котором норма равна

‖u ‖W = ‖u ‖L2(T ;Rm) + V [u ] ,

где V [u ] — полная вариация функции u [15, 17,28–30],

V [u ] = sup l∑

i=1

‖u(ti)− u(ti−1) ‖Rm : σ ∈ Σ,

супремум берется по множеству Σ всех конечных разбиений σ отрезка T

σ =

[t0, t1), . . . , [tl−1, ϑ], t0 < t1 < · · · < tl−1 < tl = ϑ , l ∈ N .

Пусть U — множество всех допустимых управлений в задаче, это множество всехфункций из W , которые при t ∈ T принимают значения из P ,

U =u ∈ W : u(t) ∈ P , t ∈ T

.

Будем считать, что Ω является ограниченной строго липшицевой областью вRn с кусочно-гладкой границей Γ (для дальнейшего достаточно, чтобы область Ωобладала, например, свойствами [27, c. 212, 222]). Пусть f ∈ L2(Q), g ∈ L2(Γ; Rm),



1472

y0 ∈ L2(Ω), коэффициенты оператора A удовлетворяют в Ω условиям: a ∈ L∞(Ω),a > a0 = const > 0, aij = aj i , aij ∈ W 1

p (Ω), p > n, причем существуют такиечисла ν = const > 0 и µ = const > ν , что для любого ξ ∈ Rn и почти всех x ∈ Ωвыполняются неравенства

νn∑i=1

ξ2i 6

n∑i,j=1

aij(x) ξi ξj 6 µ

n∑i=1

ξ2i .

Известно [31–33], что при указанных условиях на параметры краевой задачи(1)–(3) для любого управления u ∈ U существует единственное слабое решениеy = y(t, x) = y(t, x;u), (t, x) ∈ Q, этой краевой задачи из пространства C(T ; L2(Ω)).Это решение иногда будем называть движением динамической системы (1)–(3), по-рожденным управлением u ∈ U , и будем обозначать его символом y = y[·;u] или сим-волом y = y[t;u], t ∈ T . Пространство H = L2(Ω) является фазовым пространствомдинамической системы (1)–(3). Норму в этом пространстве обозначим символом ‖ · ‖,скалярное произведение — символом 〈 · , · 〉.

Введем множество всех возможных движений системы (1)–(3), отвечающих всемвозможным управлениям u ∈ U :

Y =y = y[·;u] : u ∈ U

.

Для каждого движения y ∈ Y введем множество всех допустимых управлений,порождающих данное движение:

U(y) =u ∈ U : y[·;u] = y

,

и множество всех возможных измерений этого движения:

Yδ(y) =yδ ∈ L2(T ; H) : ‖ y[t]− yδ[t] ‖ 6 δ , t ∈ T

.

Опишем класс отображений (алгоритмов), в котором будем искать решение за-дачи восстановления. Следуя [5–9], решение задачи будем искать в классе семействконечношаговых динамических алгоритмов (КДА) D =

Dσδ : σ ∈ Σ, δ ∈ [0, δ0] .

Каждый КДА формализуем в виде тройки [8]:

Dσδ =

((ti)

li=0; (Ei)

l−1i=0; (Fi)

l−1i=0

),

где (ti)li=0 — точки разбиения σ отрезка времени T , t0 = t0 < t1 < · · · < tl−1 < tl = ϑ;

Ei — отображение, которое позиционным способом формирует на отрезке [ti, ti+1]приближение к искомому управлению; Fi — отображение, формирующее позицион-ным способом движение некоторой вспомогательной системы-модели (поводыря [2,8])на отрезке [ti, ti+1] в фазовом пространстве H.

Детализируем представленные алгоритмы. Пусть задано какое-либо разбиение σотрезка времени T точками (ti)

li=0 , t0 < t1 < · · · < tl−1 < tl = ϑ. Пусть Ui — сужение

функций из U на отрезок [ti, ti+1]; Ei — отображение H×H×P ×R+×R+ в Ui; Fi —отображение H×Ui в H. Последними двумя аргументами отображения Ei являютсячисловые параметры α и ε из R+, которые будут выбираться в зависимости от ве-личины погрешности измерений δ, т.е. будут являться параметрами регуляризации.Разбиение σ отрезка T также будет выбираться в зависимости от величины погреш-ности измерений δ, причем так, чтобы диаметр d = d(σ(δ)) разбиения стремился кнулю при δ → 0. Можно считать, что d(σ(δ)) 6 ϕ(δ), где ϕ(δ)→ 0 при δ → 0.



1473

Введем теперь понятие реализации алгоритма. Для алгоритма Dσδ , каких-либо

чисел α ∈ R+, ε ∈ R+ и функций y ∈ Y , ξ ∈ Yδ(y) назовем (Dσδ , ξ)-реализацией

алгоритма управление uδ ∈ U , сформированное по правилу:

u δ(τ) = uiδ(τ) = Ei(ξ[ti], z[ti], u

i−1δ (ti), α, ε

), τ ∈ [ti, ti+1) ,

z[t0] = y0 , z[ti+1] = Fi(z[ti], u

iδ

), i = 0, . . . , l − 1.

Для корректного формирования реализации алгоритма необходимо определитьзначение ui−1

δ (ti) при i = 0. В связи с этим предположим, что все допустимые управ-ления в начальный момент времени t = t0 принимают значение u(0) ∈ P и длякаждого движения y ∈ Y известно некоторое приближение u(h)

y ∈ P значения u(0) вначальный момент времени, причем∥∥u(h)

y − u(0)∥∥Rm 6 h, h ∈ [0, h0] .

Определим теперь значение u−1δ (t0) равенством u−1

δ (t0) = u(h)y . Точность приближения

будем считать зависящей от точности измерений δ, h = h(δ).В соответствии с правилом формирования реализации алгоритма, управления

uiδ и состояния поводыря z[ti] будут последовательно вычисляться по ходу движениясистемы (в режиме реального времени). К конечному моменту времени t = ϑ в ди-намике будет сформирована вся реализация алгоритма uδ, определенная на отрезкеT (в момент времени t = ϑ значение uδ(ϑ) определяется значением ul−1

δ (ϑ)).Описание работы алгоритма во времени (формирование (Dσ

δ , ξ)-реализации)имеется в [5–9]. Далее (Dσ

δ , ξ)-реализацию иногда будем обозначать символом Dσδ (ξ).

Реализация алгоритма — это и есть выход КДА.Скажем, что семейство алгоритмов D =

Dσδ : σ ∈ Σ, δ ∈ [0, δ0]

решает зада-

чу реконструкции на множестве Y0 ⊆ Y , если при некотором выборе зависимостейσ = σ(δ), α = α(δ), ε = ε(δ), h = h(δ) для любого y ∈ Y0 при любых ξ ∈ Yδ(y) имеетместо сходимость

Dσδ (ξ)→ u(y) в L2(T ; Rm) при δ → 0 ,

где u(y) — Λ-нормальный элемент множества U(y), т.е. элемент, минимизирующийна множестве U(y) функционал Λ = Λ[u] = ‖u ‖2

L2(T ;Rm) + V [u] (такой элемент суще-ствует и является единственным [23–25]).

Задача. Построить семейство алгоритмов D =Dσδ : σ ∈ Σ, δ ∈ [0, δ0]

,

решающее задачу реконструкции на множестве Y .Все рассматриваемые в работе числовые величины и пространства считаются

вещественными, измеримость и интегрируемость понимаются по Лебегу, определенияиспользуемых пространств имеются в [26,27,29–31].

3. Решение задачи

Помимо исходной динамической системы потребуется вспомогательная система-модель (поводырь) [2,8]. В качестве поводыря рассмотрим копию исходной системы.

Решение краевой задачи (1)–(3) можно представить в виде ряда Фурье

y = y(t, x) =∞∑j=1

yj(t)ωj(x) , t ∈ T , x ∈ Ω ,



1474

с коэффициентами, удовлетворяющими дифференциальным уравнениям,

yj(t) = −λj yj(t) + fj(t) +⟨g · u(t) ,

∂ωj∂N

⟩L2(Γ)

, t ∈ T, yj(t0) = y0j ,

где y0j = 〈 y0, ωj 〉, fj(t) = 〈 f(t, ·), ωj 〉, λj, ωj : j ∈ N — решение вW 1

2(Ω) спек-тральной задачи

Aω = −λω в Ω , ω = 0 на Γ , 〈ω, ω 〉 = 1 .

Известно [26,27], что спектральная задача разрешима для счетного набора веще-ственных положительных чисел λ = λj, j ∈ N, каждое из которых имеет конечнуюкратность, и их можно упорядочить (с учетом их кратности) в порядке возрастания0 < λ1 6 λ2 6 · · · 6 λj 6 . . . , λj → ∞ при j → ∞, соответствующие собственнымчислам λj собственные функции ωj образуют ортонормированный базис в L2(Ω) и ба-

зис вW 1

2(Ω) иW 22, 0(Ω) = W 2

2 (Ω) ∩W 1

2(Ω). Заметим, что по теоремам о следах [26,27]∂ωj/∂N ∈ L2(Γ). Отметим также, что коэффициенты Фурье yj имеют представление

yj(t) = y0j exp(−λj(t− t0)) +

∫ t

t0

fj(τ) exp(−λj(t− τ)) dτ+

+

∫ t

t0

⟨g · u(τ) ,

∂ωj∂N

⟩L2(Γ)

exp(−λj(t− τ)) dτ .

Введем в рассмотрение гильбертово пространство числовых последовательностейq = (q1, q2, . . . ) со скалярным произведением и соответствующей ему нормой

⟨q(1), q(2)

⟩β

=∞∑j=1

βj q(1)j q

(2)j ,

∥∥ q ∥∥β

=⟨q, q⟩1/2

β,

0 < βj λkj 6 1 , βj ∈ (0, 1) , β1 < β2 < . . . , k ∈ 1, 2 , j ∈ N .

Введем также обозначения:

BΓ(g u) =(⟨

g · u , ∂ω1

∂N

⟩L2(Γ) ,

⟨g · u , ∂ω2

∂N

⟩L2(Γ), . . .

);

BΩ(y) = ( y1, y2, . . . ), yj = 〈 y , ωj 〉 , j ∈ N ;

Φi( v ) = Φi( v; η, ζ ) = 2⟨BΩ( η−ζ ) , BΓ

(∫ ti+1

ti

g·v(τ) dτ)⟩

β+αΛ

ti+1

ti [ v ] ;

Λτt [ v ] =

∥∥ v ∥∥2

L2( [t,τ ];Rm)+ V τ

t [ v ] , Λ[v] = Λϑt0

[ v ] , α = const > 0 ,

где V τt [ v ] — полная вариация функции v на отрезке [t, τ ],

(4) Φ ∗i = Φ ∗i (w ) = min

Φi( v ) : v ∈ U [ ti, ti+1; w ],

U [ ti, ti+1; w ] = u ∈ Ui : u(ti) = w .Приступим к построению искомых алгоритмов. Фиксируем δ ∈ [0, δ0], разбиение

σ ∈ Σ отрезка T точками (ti)li=0 , i ∈ 0, . . . , l − 1, η ∈ H, ζ ∈ H, w ∈ P , α ∈ R+,

ε ∈ R+. Определим значение отображения Ei в точке (η, ζ, w, α, ε) по правилу

(5) Ei(η, ζ, w, α, ε

)= viδ ,



1475

где viδ есть элемент множества U [ ti , ti+1; w ], удовлетворяющий условию

Φ ∗i 6 Φi( viδ ) 6 Φ ∗i + ε ( ti+1 − ti ) ,

параметр ε = ε(δ) характеризует точность по функционалу решения экстремальнойзадачи (4).

Значение z внутренней переменной, определяющей состояние системы-модели вначальный момент времени t0, положим равным yδ[t0], т.е. z0 = yδ[t0]. В последующиемоменты времени ti+1, i ∈ 0, . . . , l − 1, элемент zi+1 находится из краевой задачи

zt = Az + f , (t, x) ∈ [ti, ti+1]× Ω ,

z(ti, x) = zi(x) , x ∈ Ω ,

z(t, x) = g(x) · viδ(t), t ∈ [ti, ti+1] , x ∈ Γ ,

и определяется равенством

(6) Fi(z i, v

iδ

)= z(ti+1, ·) = z i+1 .

Работа КДА (формированиеDσδ (ξ)-реализации) протекает во времени по следую-

щей схеме. Пусть наблюдение осуществляется за каким-либо движением y ∈ Y , ре-зультатом приближенных измерений состояний динамической системы служит функ-ция ξ ∈ Yδ(y). До начала процесса восстановления фиксируются зависимости α =α(δ), ε = ε(δ), h = h(δ), разбиение σ = σ(δ) ∈ Σ с диаметром d = d(σ(δ)) 6 ϕ(δ) истановится известным уровень погрешности измерений δ.

Шаг i = 0. В начальный момент времени t0 поступает приближенное измерениеξ[t0] состояния системы y[t0]. По предположению, наблюдателю становится извест-ным также приближенное значение u(h)

y восстанавливаемого управления u в началь-ный момент времени t0. Положив η = ξ[t0], ζ = z[t0], w = u

(h)y , α = α(δ), ε = ε(δ),

наблюдатель в момент времени t0 находит значение E0

(η, ζ, w, α, ε

)= v0

δ по правилу(5). Найденное значение v0

δ принимается за приближение к искомому управлениюu на отрезке времени [t0, t1]. Значение v0

δ (t1) запоминается для выполнения следую-щего шага. Далее по правилу (6) система-модель переводится из состояния z[t0] всостояние z[t1] = F0

(z[t0], v0

δ

), которое запоминается для выполнения следующего

шага.Шаг i = 1. В момент времени t1 наблюдателю поступает информация о состоя-

нии системы y[t1] в виде приближенного измерения ξ[t1]. Положив η = ξ[t1], ζ = z[t1],w = v0

δ (t1), α = α(δ), ε = ε(δ), наблюдатель в момент времени t1 находит значениеE1

(η, ζ, w, α, ε

)= v1

δ по правилу (5). Найденное значение v1δ принимается за прибли-

жение к искомому управлению u на отрезке времени [t1, t2]. Далее по правилу (6)поводырь переводится из состояния z[t1] в состояние z[t2] = F1

(z[t1], v1

δ

). Значения

z[t2] и v1δ (t2) запоминаются для выполнения следующего шага.

По мере поступления новых измерений ξ[t2], ξ[t3], . . . , ξ[tl−1], аналогично шагуi = 1 последовательно определяются функции v2

δ , v3δ , . . . , v

l−1δ на отрезках [t2, t3],

[t3, t4], . . . , [tl−1, tl] соответственно. Таким образом, в динамике к конечному моментувремени tl = ϑ будет получена полная Dσ

δ (ξ)-реализация алгоритма uδ. Из описанияработы КДА во времени видны возможность его осуществления в режиме реальноговремени и вольтерровость алгоритма.



1476

Обозначим через µ : R+ → R+ модуль непрерывности множества движений Y ,рассматриваемых как отображения T 3 t→ y[t] ∈ H (он существует в силу компакт-ности множества Y в пространстве C(T ; H)),∥∥ y[t1]− y[t2]

∥∥H6 µ

(| t1 − t2 |

), t1 , t2 ∈ T .

Сформулируем основное утверждение.Теорема 1. Пусть параметры регуляризации α = α(δ), ε = ε(δ), ϕ = ϕ(δ),

h = h(δ) и модуль непрерыности µ = µ(δ) удовлетворяют условиям согласования(ε(δ) + δ+µ(δ)

)α(δ)−1 → 0 , ϕ(δ)→ 0 , h(δ)→ 0 , α(δ)→ 0 , δ → 0 .

Тогда алгоритм D =Dσδ : σ ∈ Σ, δ ∈ [0, δ0]

, состоящий из методов (5)–(6), реша-

ет задачу восстановления на множестве Y , т.е. для любого y ∈ Y , каковы бы нибыли измерения ξ ∈ Yδ(y), имеет место сходимость Dσ

δ (ξ)→ u(y) в L2(T ; Rm) приδ → 0, более того, для Dσ

δ (ξ)-реализаций алгоритма uδ при δ → 0 имеют место сле-дующие сходимости: u δ(t)→ u(t) в Rm поточечно на T ; V [u δ]→ V [u]; u δ(t)→ u(t)в Rm равномерно по t на любом отрезке, не содержащем точек разрыва функции u.Имеет место также сходимость движения поводыря к наблюдаемому движениюсистемы z[ ·;u δ ]→ y в C(T ;H) при δ → 0.

Доказательство. Обоснование проводится аналогично [5–9] и основано на уста-новлении равномерной оценки

Ξ(t) 6 δ2 + C(µ(δ) + ε(δ) + δ

), t ∈ T ,

для оценочного функционала

(7) Ξ(t) =∥∥BΩ( y[ t; u ]− z[ t;u δ ] )

∥∥2

β+ αΛt

t0[u δ ]− αΛt

t0[ u ] .

Далее обычным способом доказываются сходимости u δ → u в L2(T ; Rm),

u δ(t)→ u(t) в Rm поточечно на T , V [u δ ]→ V [ u ] ,

из которых с применением результатов [17, гл. 4] выводится кусочно-равномернаясходимость регуляризованных приближений. Теорема доказана.

4. Конечномерная аппроксимация задачи

Восстановление управлений в системе (1)–(3) на основе результатов предыдущегопараграфа связано с минимизацией функционалов и пересчетом состояний поводыряв бесконечномерных пространствах. Для численной реализации алгоритма требуетсяконечномерная аппроксимация задачи. Опишем способ аппроксимации задачи рекон-струкции, основанный на методе разделения переменных.

Фиксируем какое-нибудь натуральное число k ∈ N. В основу построений дина-мического регуляризующего алгоритма положим системы обыкновенных дифферен-циальных уравнений для коэффициентов Фурье yj при j = 1, . . . , k. Копии такихсистем будут описывать движение поводыря.

Решение задачи восстановления будем искать в виде алгоритма

D =Dk, σδ : k ∈ N, σ ∈ Σ, δ ∈ [0, δ0]

,



1477

состоящего из троек

Dk, σδ =

((ti)

li=0; (Ek

i )l−1i=0; (F k

i )l−1i=0

),

где (ti)li=0 — точки разбиения σ ∈ Σ; Ek

i — отображение H ×Rk ×P ×R+×R+ в Ui;F ki — отображение Rk × Ui в Rk (подробные пояснения к отображениям имеются в

предыдущем разделе).Введем в рассмотрение пространство k-мерных векторов q = (q1, . . . , qk) со ска-

лярным произведением и соответствующей ему нормой

⟨q(1), q(2)

⟩β, k

=k∑j=1

βj q(1)j q

(2)j ,

∥∥ q ∥∥β, k

=⟨q, q

⟩1/2

β, k,

числа βj, j ∈ N, удовлетворяют условиям, указанным в предыдущем разделе.Введем также обозначения

BkΓ(g u) =

(⟨g · u , ∂ω1

∂N

⟩L2(Γ) , . . . ,

⟨g · u , ∂ωk

∂N

⟩L2(Γ)

);

BkΩ(y) = ( y1, . . . , yk ), yj = 〈 y, ωj 〉 , j = 1, . . . , k ;

Φki (v) = Φk

i (v; η, ζ(k)) = 2⟨ζ(k) −Bk

Ω( η ) , BkΓ

(∫ ti+1

ti

g · v(τ) dτ)⟩

β, k+

+ αΛti+1

ti [ v ] , α = const > 0 ;

(8) Φk,∗i = Φk,∗

i (w) = min

Φki (v) : v ∈ U [ ti, ti+1; w ]

.

Приступим к построению искомых алгоритмов. Для δ ∈ [0, δ0], k ∈ N, σ ∈ Σ,i ∈ 0, 1, . . . , l − 1, η ∈ H, ζ(k) ∈ Rk, w ∈ P , α ∈ R+, ε ∈ R+, положим

(9) Eki

(η, ζ(k), w, α, ε

)= vk,iδ ,

где vk,iδ есть элемент множества U [ ti, ti+1;w ], удовлетворяющий условию

Φk,∗i 6 Φk

i ( vk,iδ ) 6 Φk,∗

i + ε ( ti+1 − ti ) ,

ε — параметр, характеризующий точность по функционалу решения экстремальнойзадачи (8). Правило формирования элемента w описано в предыдущем разделе.

Значение z(k) ∈ Rk внутренней переменной, имеющей смысл состояния пово-дыря (вспомогательной конечномерной системы-модели), формируется следующимобразом. В начальный момент времени t0 положим z(k)[t0] = y(k)(t0), где y(k)(t0) =( 〈 y0, ω1 〉, . . . , 〈 y0, ωk 〉 ). В последующие моменты времени ti+1, i ∈ 0, . . . , l− 1, эле-менты z(k)[ti+1] находятся из решения задач Коши

yj(t) = −λjyj(t) + fj(t) +⟨g vk,iδ (t) ,

∂ωj∂N

⟩L2(Γ) , t ∈ [ti, ti+1] ,

y(k)(ti) =(y1(ti), . . . , yk(ti)

)= z(k)[ti] , j = 1, . . . , k ,



1478

и определяются равенствами

(10) z(k)[ti+1] = y(k)(ti+1) = F ki

(z(k)[ ti ] , v

k, iδ

).

Работа алгоритма Dk, σδ во времени аналогична работе алгоритма D σ

δ и подробноописана в предыдущем разделе.

Обозначим

maxu∈U

maxt∈T

∥∥∥ y(t, ·;u)−k∑j=1

yj(t, ·;u)ωj

∥∥∥ = Rk .

В работах [32,33] установлено, что Rk → 0 при k →∞.Учитывая свойства построенного алгоритма, можно установить равномерную ма-

лость функционала (7), из которой, с учетом исследований [8, 15, 17, 21], вытекаетсправедливость следующего утверждения.

Теорема 2. Пусть параметры регуляризации k = k(δ), α = α(δ), ε = ε(δ),ϕ = ϕ(δ), h = h(δ) и модуль непрерыности µ = µ(δ) удовлетворяют условиямсогласования(

Rk(δ) + ε(δ) + δ + µ(δ))α(δ)−1 → 0 ,

k(δ)→∞ , α(δ)→ 0 , ε(δ)→ 0 , ϕ(δ)→ 0 , h(δ)→ 0 , δ → 0 .

Тогда алгоритм D=Dk,σδ : k∈N, σ∈Σ, δ∈ [0, δ0]

, состоящий из методов (9)–(10),

решает задачу восстановления на множестве Y , т.е. для любого y ∈ Y , каковы быни были измерения ξ ∈ Yδ(y), имеет место сходимость Dσ

δ (ξ) → u(y) в L2(T ; Rm)при δ → 0, более того, для Dσ

δ (ξ)-реализаций алгоритма uδ при δ → 0 имеют ме-сто следующие сходимости: u δ(t) → u(t) в Rm поточечно на T ; V [u δ] → V [u];u δ(t)→ u(t) в Rm равномерно по t на любом отрезке, не содержащем точек разрывафункции u. Имеет место также сходимость движения поводыря к наблюдаемомудвижению системы

z(k(δ))[·;uδ] =k∑j=1

z(k(δ))j [·;uδ]ωj → y в C(T ;H) при δ → 0 .

5. Численное моделирование

Приведем результаты численных расчетов для системы yt = a2yxx, (t, x) ∈ Q;y(0, x) = y0(x), x ∈ Ω = (0, b); y(t, 0) = u(t), y(t, b) = 0, t ∈ T = [0, 1].

Пусть P = [ν1, ν2], приближенное измерение состояний динамической системымоделируется соотношением yδ(t, x) = y(t, x) + δ ξ(t, x), ‖ ξ(t, ·) ‖ 6 1. Искомое управ-ление есть разрывная функция u(t) = 2 t2 при t ∈ [0, 0.5], u(t) = 3 t−1 при t ∈ (0.5, 1].

Способы дискретизации задачи подробно описаны в [23–25]. В этих же работахподробно описан метод проекции субградиента минимизации целевого функционала.

Результаты расчетов приведены в таблице и на рисунке (сплошная линия —искомое управление, пунктирная — результат восстановления при δ = δ1, точко-пунктирная — при δ = δ2, линия из точек — при δ = δ3). При расчетах основныепараметры принимали следующие значения: h = 0.0005 (шаг сетки при дискретиза-ции интегралов и поводырей), M = 1000 (количество итераций в методе проекциисубградиента), α = 0.25 δ, k = 100, τ = 0.25h (величина шага в методе проекциисубградиента на частичном отрезке).



1479

Погрешность δ Невязка Относительная погрешностьδ1 = 0.03 0.0071 22.3066δ2 = 0.01 0.0029 9.0933δ3 = 0.0002 0.0016 4.9344

6. Заключение

В работе построены новые регуляризирующие динамические алгоритмы рекон-струкции граничных управлений в условиях Дирихле параболических динамическихсистем по результатам приближенных измерений текущих состояний систем. Благо-даря использованию специальных стабилизаторов, содержащих вариации возмож-ных решений, получены новые усиленные результаты о сходимости регуляризован-ных приближений не только в пространствах Лебега, но и кусочно-равномерная схо-димость. Описан один из способов конечномерной аппроксимации задачи.

Работа выполнена по программе Президиума РАН «Фундаментальные пробле-мы нелинейной динамики в математических и физических науках» при поддержкеУрО РАН (проект 12-П-1-1009), поддержана программой межрегиональных и меж-ведомственных фундаментальных исследований УрО РАН (проект 12-С-1-1001) иподдержана РФФИ (14-01-00155).

Список литературы1. Красовский Н.Н. Теория управления движением. М.: Наука, 1968. 476 с.2. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.

456 с.3. Крутько П.Д. Обратные задачи динамики управляемых систем. Нелинейные модели. М.:

Наука, 1988. 332 с.4. Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.

392 с.5. Максимов В.И. Задачи динамического восстановления входов бесконечномерных систем.

Екатеринбург: Изд-во УрО РАН, 2000. 304 с.6. Осипов Ю.С., Васильев Ф.П., Потапов М.М. Основы метода динамической регуляризации.

М.: Изд-во МГУ, 1999. 237 с.7. Осипов Ю.С., Кряжимский А.В., Максимов В.И. Задачи динамического восстановления

входов управляемых систем. Екатеринбург: Изд-во УрО РАН, 2011. 292 с.8. Кряжимский А.В., Осипов Ю.С. О моделировании управления в динамической системе //

Известия АН СССР. Техническая кибернетика. 1983. 2. С. 51-60.



1480

9. Короткий А.И. Обратные задачи динамики управляемых систем с распределенными пара-метрами // Известия вузов. Математика. 1995. 11. C. 101-124.

10. Черноусько Ф.Л., Меликян А.А. Игровые задачи управления и поиска. М.: Наука, 1978.270 с.

11. Osipov Yu.S., Kryazhimskii A.V. Inverse problems of ordinary differential equations: Dynamicalsolutions. L.: Gordon and Breach, 1995. 625 p.

12. Иванов В.К., Васин В.В., Танана В.П. Теория линейных некорректных задач и ее приложе-ния. М.: Наука, 1978. 206 с.

13. Кабанихин С.И. Обратные и некорректные задачи. Новосибирск: Сибирское научное изда-тельство, 2009. 457 с.

14. Лаврентьев М.М., Романов В.Г., Шишатский С.П. Некорректные задачи математическойфизики и анализа. М.: Наука, 1980. 288 с.

15. Леонов А.С. Решение некорректно поставленных обратных задач: Очерк теории, практиче-ские алгоритмы и демонстрация в МАТЛАБ. М.: ЛИБРОКОМ, 2010. 336 с.

16. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. М.: Наука, 1979. 288 с.17. Тихонов А.Н., Леонов А.С., Ягола А.Г. Нелинейные некорректные задачи. М.: Наука, 1995.

212 c.18. Васин В.В. Регуляризация и дискретная аппроксимация некорректных задач в пространстве

функций ограниченной вариации // Доклады РАН. 2001. Т. 376, 1. С. 11-14.19. Васин В.В. Устойчивая аппроксимация негладких решений некорректно поставленных за-

дач // Доклады РАН. 2005. Т. 402, 5. С. 586-589.20. Васин В.В. Аппроксимация негладких решений линейных некорректных задач // Труды

Института математики и механики УрО РАН. 2006. Т. 12, 1. С. 64-77.21. Короткий М.А. Восстановление управлений статическим и динамическим методами регуля-

ризации с негладкими стабилизаторами // Прикладная математика и механика. 2009. Т. 73,Вып. 1. С. 39-53.

22. Vasin V.V., Korotkii M.A. Tikhonov regularization with nondifferentiable stabilizing functional// Journal of Inverse and Ill-Posed Problems. 2007. Vol. 15, No. 8. P. 853-865.

23. Короткий А.И., Михайлова Д.О. Восстановление управлений в параболических системахметодом Тихонова с негладкими стабилизаторами // Труды Института математики и меха-ники УрО РАН. 2010. Т. 16, 4. С. 211-227.

24. Короткий А.И., Михайлова Д.О. Восстановление граничных управлений в параболическихсистемах // Труды Института математики и механики УрО РАН. 2012. Т. 18, 1. С. 178-197.

25. Короткий А.И., Михайлова Д.О. Восстановление распределенных управлений в параболи-ческих системах динамическим методом // Труды Института математики и механики УрОРАН. 2013. Т. 19, 1. С. 160-169.

26. Ладыженская О.А. Краевые задачи математической физики. М.: Наука, 1973. 408 с.27. Ладыженская О.А., Уральцева Н.Н. Линейные и квазилинейные уравнения эллиптического

типа. М.: Наука, 1973. 576 с.28. Агеев А.Л. Регуляризация нелинейных операторных уравнений на классе разрывных функ-

ций // Журнал вычисл. матем. и матем. физики. 1980. Т. 20, 4. С. 819-836.29. Васильев Ф.П. Методы оптимизации. М.: Факториал, 2002. 824 с.30. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М.:

Наука, 1972. 496 с.31. Лионс Ж.-Л. Оптимальное управление системами, описываемыми уравнениями с частными

производными. М.: Мир, 1972. 418 с.32. Осипов Ю.С., Охезин С.П. К теории дифференциальных игр в параболических системах //

ДАН СССР. 1976. Т. 226, 6. С. 1267-1270.33. Короткий А.И., Осипов Ю.С. Аппроксимация в задачах позиционного управления парабо-

лическими системами // Прикладная математика и механика. 1978. Т. 42, 4. С. 599-605.



ДИНАМИЧЕСКАЯ РЕКОНСТРУКЦИЯ В...

Documents