ДИНАМИЧЕСКАЯ РЕКОНСТРУКЦИЯ В...
TRANSCRIPT
1469
УДК 517.9
ДИНАМИЧЕСКАЯ РЕКОНСТРУКЦИЯГРАНИЧНЫХ УПРАВЛЕНИЙ
В ПАРАБОЛИЧЕСКИХ СИСТЕМАХ
А.И. КороткийИнститут математики и механики им. Н.Н. Красовского УрО РАН
Россия, 620990, Екатеринбург, ул. Софьи Ковалевской, 16E-mail: [email protected]
Д.О. МихайловаИнститут математики и механики им. Н.Н. Красовского УрО РАН
Россия, 620990, Екатеринбург, ул. Софьи Ковалевской, 16E-mail: [email protected]
Ключевые слова: динамическая система, управление, реконструкция, метод ди-намической регуляризации, стабилизатор, кусочно-равномерная сходимость.
Аннотация: Рассматривается задача о восстановлении априори неизвестных гра-ничных управлений в динамических системах, описываемых краевыми задачамидля параболических уравнений. Восстановление осуществляется по результатамприближенных измерений текущих фазовых состояний наблюдаемого движениясистемы. Задача решается в динамическом варианте, реконструкция управленийдолжна осуществляться в динамике, по ходу движения системы. Рассматриваемаязадача некорректна. Для решения задачи предлагается воспользоваться методом ди-намической регуляризации Ю.С. Осипова и А.В. Кряжимского. Построены новыемодификации динамических алгоритмов, которые позволяют получать усиленныерезультаты, в частности, получать поточечную и кусочно-равномерную сходимостирегуляризованных приближений метода.
1. Введение
В работе исследуется обратная задача динамики, состоящая в нахождении апри-ори неизвестных управляющих воздействий, функционирующих в управляемой ди-намической системе. Динамическая система описывается краевой задачей для ли-нейного параболического уравнения. Управляющие воздействия сосредоточены награнице области изменения независимых переменных в условиях Дирихле. Исходнойдополнительной информацией для решения обратной задачи служат результаты на-блюдений за системой в виде приближенных измерений текущих фазовых состоянийсистемы. Хорошо известно [1–11], что рассматриваемая задача некорректна и для еерешения необходимо привлекать методы регуляризации [12–17]. Задачу предлагаетсярешать в динамическом варианте, восстановление (реконструкция, идентификация)искомого управления должно осуществляться в динамике, синхронно с развитием
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯВСПУ-2014
Москва 16-19 июня 2014 г
1470
процесса, по ходу движения системы. При этом результаты измерений текущих фа-зовых положений системы поступают наблюдателю в динамике в течение заданногопромежутка времени. Для определения текущего приближения к искомому управ-лению разрешено использовать только поступившее в данный момент приближенноеизмерение состояния системы. Для решения задачи предлагается воспользоватьсяметодом, разработанным Ю.С. Осиповым и его школой, — методом динамическойрегуляризации [5–9]. В работе построены и обоснованы новые модификации динами-ческих регуляризующих алгоритмов решения обратной задачи, которые, в отличиеот традиционных алгоритмов, позволяют получить сходимость регуляризованныхприближений не только в пространствах Лебега, но и усиленные сходимости, в част-ности, поточечную, кусочно-равномерную, сходимость вариаций. Основные результа-ты достигнуты с помощью использования специальных стабилизаторов, содержащихвариации возможных решений [18–22]. Такие стабилизаторы позволяют восстанав-ливать как гладкие, так и негладкие (в том числе разрывные) управления. Выпол-нена конечномерная аппроксимация задачи восстановления, основанная на методеразделения переменных. Приводятся результаты численного моделирования, пока-зывающие способность построенных алгоритмов восстанавливать тонкую структуруискомых управлений, которые могут содержать, например, изломы, разрывы илиимпульсы. Работа продолжает исследования [21–25].
2. Постановка задачи
Опишем содержательную сторону задачи. Рассматривается управляемая дина-мическая система, состояние которой в момент времени t из заданного ограниченногоотрезка времени T = [t0, ϑ] характеризуется функцией y[t] = y(t, ·), определенной внекоторой области Ω евклидова пространства Rn, n > 1. Эволюция состояний вовремени (движение системы) описывается краевой задачей [26,27]
(1) yt = Ay + f , (t, x) ∈ Q = T × Ω ,
(2) y(t0, x) = y0(x) , x ∈ Ω ,
(3) y(t, x) = g(x) · u(t) , t ∈ T , x ∈ Γ = ∂Ω ,
где y0 — начальное состояние системы; f — заданная функция наQ; g = (g1, . . . , gm) —заданная вектор-функция на Γ, m > 1; u = (u1, . . . , um) — вектор-функция управля-ющего воздействия на систему, определенная на T ; A — заданный линейный самосо-пряженный коэрцитивный эллиптический оператор второго порядка
Ay =n∑
i,j=1
∂
∂ xi
(aij(x)
∂ y
∂ xj
)− a(x) y .
Допустимые управляющие функции подчинены геометрическому ограничению
u(t) ∈ P ⊂ Rm, t ∈ T .
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯВСПУ-2014
Москва 16-19 июня 2014 г
1471
Пусть за движением y = y[t], t ∈ T , управляемой динамической системы осу-ществляется наблюдение в течение промежутка времени T и в соответствующие те-кущие моменты времени t ∈ T приближенно измеряются состояния системы y[t],результатами этих измерений являются функции yδ[t], удовлетворяющие условию
‖ yδ[t]− y[t] ‖ 6 δ , t ∈ T ,
где δ — числовой параметр, характеризующий точность измерений, 0 6 δ 6 δ 0.Задача восстановления состоит в том, чтобы построить такой динамический ал-
горитм реконструкции управления, который по результатам yδ = yδ[t], t ∈ T , при-ближенных измерений наблюдаемого движения системы y = y[t], t ∈ T , приближен-но определял бы (восстановливал) ту реализацию u = u(t), t ∈ T , управляющеговоздействия на динамическую систему, которая порождает наблюдаемое движениесистемы. При этом результат uδ = uδ(t), t ∈ T , восстановления искомого управля-ющего воздействия u = u(t), t ∈ T , должен быть тем точнее, чем меньше ошибкиизмерений.
Смысл понятия приближенного восстановления далее будет варьироваться иуточняться. Предположим также, что при решении задачи восстановления известныаприорные геометрические ограничения P на множество допустимых управлений иуравнения динамики процесса вместе с начальным состоянием y0.
Задачу реконструкции можно трактовать как задачу нахождения семейства под-ходящих отображений Dδ, 0 6 δ 6 δ 0, которые переводят результаты приближенныхизмерений состояний системы в приближения к искомому управлению и обладаютсвойством устойчивости
Dδ( yδ) = uδ → u , δ → 0 .
Уточним постановку задачи. Пусть P — выпуклое компактное множество из Rm;W — банахово пространство [15, 17, 28–30] вектор-функций u : T 3 t → u(t) ∈ Rm сограниченным изменением, в котором норма равна
‖u ‖W = ‖u ‖L2(T ;Rm) + V [u ] ,
где V [u ] — полная вариация функции u [15, 17,28–30],
V [u ] = sup l∑
i=1
‖u(ti)− u(ti−1) ‖Rm : σ ∈ Σ,
супремум берется по множеству Σ всех конечных разбиений σ отрезка T
σ =
[t0, t1), . . . , [tl−1, ϑ], t0 < t1 < · · · < tl−1 < tl = ϑ , l ∈ N .
Пусть U — множество всех допустимых управлений в задаче, это множество всехфункций из W , которые при t ∈ T принимают значения из P ,
U =u ∈ W : u(t) ∈ P , t ∈ T
.
Будем считать, что Ω является ограниченной строго липшицевой областью вRn с кусочно-гладкой границей Γ (для дальнейшего достаточно, чтобы область Ωобладала, например, свойствами [27, c. 212, 222]). Пусть f ∈ L2(Q), g ∈ L2(Γ; Rm),
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯВСПУ-2014
Москва 16-19 июня 2014 г
1472
y0 ∈ L2(Ω), коэффициенты оператора A удовлетворяют в Ω условиям: a ∈ L∞(Ω),a > a0 = const > 0, aij = aj i , aij ∈ W 1
p (Ω), p > n, причем существуют такиечисла ν = const > 0 и µ = const > ν , что для любого ξ ∈ Rn и почти всех x ∈ Ωвыполняются неравенства
νn∑i=1
ξ2i 6
n∑i,j=1
aij(x) ξi ξj 6 µ
n∑i=1
ξ2i .
Известно [31–33], что при указанных условиях на параметры краевой задачи(1)–(3) для любого управления u ∈ U существует единственное слабое решениеy = y(t, x) = y(t, x;u), (t, x) ∈ Q, этой краевой задачи из пространства C(T ; L2(Ω)).Это решение иногда будем называть движением динамической системы (1)–(3), по-рожденным управлением u ∈ U , и будем обозначать его символом y = y[·;u] или сим-волом y = y[t;u], t ∈ T . Пространство H = L2(Ω) является фазовым пространствомдинамической системы (1)–(3). Норму в этом пространстве обозначим символом ‖ · ‖,скалярное произведение — символом 〈 · , · 〉.
Введем множество всех возможных движений системы (1)–(3), отвечающих всемвозможным управлениям u ∈ U :
Y =y = y[·;u] : u ∈ U
.
Для каждого движения y ∈ Y введем множество всех допустимых управлений,порождающих данное движение:
U(y) =u ∈ U : y[·;u] = y
,
и множество всех возможных измерений этого движения:
Yδ(y) =yδ ∈ L2(T ; H) : ‖ y[t]− yδ[t] ‖ 6 δ , t ∈ T
.
Опишем класс отображений (алгоритмов), в котором будем искать решение за-дачи восстановления. Следуя [5–9], решение задачи будем искать в классе семействконечношаговых динамических алгоритмов (КДА) D =
Dσδ : σ ∈ Σ, δ ∈ [0, δ0] .
Каждый КДА формализуем в виде тройки [8]:
Dσδ =
((ti)
li=0; (Ei)
l−1i=0; (Fi)
l−1i=0
),
где (ti)li=0 — точки разбиения σ отрезка времени T , t0 = t0 < t1 < · · · < tl−1 < tl = ϑ;
Ei — отображение, которое позиционным способом формирует на отрезке [ti, ti+1]приближение к искомому управлению; Fi — отображение, формирующее позицион-ным способом движение некоторой вспомогательной системы-модели (поводыря [2,8])на отрезке [ti, ti+1] в фазовом пространстве H.
Детализируем представленные алгоритмы. Пусть задано какое-либо разбиение σотрезка времени T точками (ti)
li=0 , t0 < t1 < · · · < tl−1 < tl = ϑ. Пусть Ui — сужение
функций из U на отрезок [ti, ti+1]; Ei — отображение H×H×P ×R+×R+ в Ui; Fi —отображение H×Ui в H. Последними двумя аргументами отображения Ei являютсячисловые параметры α и ε из R+, которые будут выбираться в зависимости от ве-личины погрешности измерений δ, т.е. будут являться параметрами регуляризации.Разбиение σ отрезка T также будет выбираться в зависимости от величины погреш-ности измерений δ, причем так, чтобы диаметр d = d(σ(δ)) разбиения стремился кнулю при δ → 0. Можно считать, что d(σ(δ)) 6 ϕ(δ), где ϕ(δ)→ 0 при δ → 0.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯВСПУ-2014
Москва 16-19 июня 2014 г
1473
Введем теперь понятие реализации алгоритма. Для алгоритма Dσδ , каких-либо
чисел α ∈ R+, ε ∈ R+ и функций y ∈ Y , ξ ∈ Yδ(y) назовем (Dσδ , ξ)-реализацией
алгоритма управление uδ ∈ U , сформированное по правилу:
u δ(τ) = uiδ(τ) = Ei(ξ[ti], z[ti], u
i−1δ (ti), α, ε
), τ ∈ [ti, ti+1) ,
z[t0] = y0 , z[ti+1] = Fi(z[ti], u
iδ
), i = 0, . . . , l − 1.
Для корректного формирования реализации алгоритма необходимо определитьзначение ui−1
δ (ti) при i = 0. В связи с этим предположим, что все допустимые управ-ления в начальный момент времени t = t0 принимают значение u(0) ∈ P и длякаждого движения y ∈ Y известно некоторое приближение u(h)
y ∈ P значения u(0) вначальный момент времени, причем∥∥u(h)
y − u(0)∥∥Rm 6 h, h ∈ [0, h0] .
Определим теперь значение u−1δ (t0) равенством u−1
δ (t0) = u(h)y . Точность приближения
будем считать зависящей от точности измерений δ, h = h(δ).В соответствии с правилом формирования реализации алгоритма, управления
uiδ и состояния поводыря z[ti] будут последовательно вычисляться по ходу движениясистемы (в режиме реального времени). К конечному моменту времени t = ϑ в ди-намике будет сформирована вся реализация алгоритма uδ, определенная на отрезкеT (в момент времени t = ϑ значение uδ(ϑ) определяется значением ul−1
δ (ϑ)).Описание работы алгоритма во времени (формирование (Dσ
δ , ξ)-реализации)имеется в [5–9]. Далее (Dσ
δ , ξ)-реализацию иногда будем обозначать символом Dσδ (ξ).
Реализация алгоритма — это и есть выход КДА.Скажем, что семейство алгоритмов D =
Dσδ : σ ∈ Σ, δ ∈ [0, δ0]
решает зада-
чу реконструкции на множестве Y0 ⊆ Y , если при некотором выборе зависимостейσ = σ(δ), α = α(δ), ε = ε(δ), h = h(δ) для любого y ∈ Y0 при любых ξ ∈ Yδ(y) имеетместо сходимость
Dσδ (ξ)→ u(y) в L2(T ; Rm) при δ → 0 ,
где u(y) — Λ-нормальный элемент множества U(y), т.е. элемент, минимизирующийна множестве U(y) функционал Λ = Λ[u] = ‖u ‖2
L2(T ;Rm) + V [u] (такой элемент суще-ствует и является единственным [23–25]).
Задача. Построить семейство алгоритмов D =Dσδ : σ ∈ Σ, δ ∈ [0, δ0]
,
решающее задачу реконструкции на множестве Y .Все рассматриваемые в работе числовые величины и пространства считаются
вещественными, измеримость и интегрируемость понимаются по Лебегу, определенияиспользуемых пространств имеются в [26,27,29–31].
3. Решение задачи
Помимо исходной динамической системы потребуется вспомогательная система-модель (поводырь) [2,8]. В качестве поводыря рассмотрим копию исходной системы.
Решение краевой задачи (1)–(3) можно представить в виде ряда Фурье
y = y(t, x) =∞∑j=1
yj(t)ωj(x) , t ∈ T , x ∈ Ω ,
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯВСПУ-2014
Москва 16-19 июня 2014 г
1474
с коэффициентами, удовлетворяющими дифференциальным уравнениям,
yj(t) = −λj yj(t) + fj(t) +⟨g · u(t) ,
∂ωj∂N
⟩L2(Γ)
, t ∈ T, yj(t0) = y0j ,
где y0j = 〈 y0, ωj 〉, fj(t) = 〈 f(t, ·), ωj 〉, λj, ωj : j ∈ N — решение вW 1
2(Ω) спек-тральной задачи
Aω = −λω в Ω , ω = 0 на Γ , 〈ω, ω 〉 = 1 .
Известно [26,27], что спектральная задача разрешима для счетного набора веще-ственных положительных чисел λ = λj, j ∈ N, каждое из которых имеет конечнуюкратность, и их можно упорядочить (с учетом их кратности) в порядке возрастания0 < λ1 6 λ2 6 · · · 6 λj 6 . . . , λj → ∞ при j → ∞, соответствующие собственнымчислам λj собственные функции ωj образуют ортонормированный базис в L2(Ω) и ба-
зис вW 1
2(Ω) иW 22, 0(Ω) = W 2
2 (Ω) ∩W 1
2(Ω). Заметим, что по теоремам о следах [26,27]∂ωj/∂N ∈ L2(Γ). Отметим также, что коэффициенты Фурье yj имеют представление
yj(t) = y0j exp(−λj(t− t0)) +
∫ t
t0
fj(τ) exp(−λj(t− τ)) dτ+
+
∫ t
t0
⟨g · u(τ) ,
∂ωj∂N
⟩L2(Γ)
exp(−λj(t− τ)) dτ .
Введем в рассмотрение гильбертово пространство числовых последовательностейq = (q1, q2, . . . ) со скалярным произведением и соответствующей ему нормой
⟨q(1), q(2)
⟩β
=∞∑j=1
βj q(1)j q
(2)j ,
∥∥ q ∥∥β
=⟨q, q⟩1/2
β,
0 < βj λkj 6 1 , βj ∈ (0, 1) , β1 < β2 < . . . , k ∈ 1, 2 , j ∈ N .
Введем также обозначения:
BΓ(g u) =(⟨
g · u , ∂ω1
∂N
⟩L2(Γ) ,
⟨g · u , ∂ω2
∂N
⟩L2(Γ), . . .
);
BΩ(y) = ( y1, y2, . . . ), yj = 〈 y , ωj 〉 , j ∈ N ;
Φi( v ) = Φi( v; η, ζ ) = 2⟨BΩ( η−ζ ) , BΓ
(∫ ti+1
ti
g·v(τ) dτ)⟩
β+αΛ
ti+1
ti [ v ] ;
Λτt [ v ] =
∥∥ v ∥∥2
L2( [t,τ ];Rm)+ V τ
t [ v ] , Λ[v] = Λϑt0
[ v ] , α = const > 0 ,
где V τt [ v ] — полная вариация функции v на отрезке [t, τ ],
(4) Φ ∗i = Φ ∗i (w ) = min
Φi( v ) : v ∈ U [ ti, ti+1; w ],
U [ ti, ti+1; w ] = u ∈ Ui : u(ti) = w .Приступим к построению искомых алгоритмов. Фиксируем δ ∈ [0, δ0], разбиение
σ ∈ Σ отрезка T точками (ti)li=0 , i ∈ 0, . . . , l − 1, η ∈ H, ζ ∈ H, w ∈ P , α ∈ R+,
ε ∈ R+. Определим значение отображения Ei в точке (η, ζ, w, α, ε) по правилу
(5) Ei(η, ζ, w, α, ε
)= viδ ,
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯВСПУ-2014
Москва 16-19 июня 2014 г
1475
где viδ есть элемент множества U [ ti , ti+1; w ], удовлетворяющий условию
Φ ∗i 6 Φi( viδ ) 6 Φ ∗i + ε ( ti+1 − ti ) ,
параметр ε = ε(δ) характеризует точность по функционалу решения экстремальнойзадачи (4).
Значение z внутренней переменной, определяющей состояние системы-модели вначальный момент времени t0, положим равным yδ[t0], т.е. z0 = yδ[t0]. В последующиемоменты времени ti+1, i ∈ 0, . . . , l − 1, элемент zi+1 находится из краевой задачи
zt = Az + f , (t, x) ∈ [ti, ti+1]× Ω ,
z(ti, x) = zi(x) , x ∈ Ω ,
z(t, x) = g(x) · viδ(t), t ∈ [ti, ti+1] , x ∈ Γ ,
и определяется равенством
(6) Fi(z i, v
iδ
)= z(ti+1, ·) = z i+1 .
Работа КДА (формированиеDσδ (ξ)-реализации) протекает во времени по следую-
щей схеме. Пусть наблюдение осуществляется за каким-либо движением y ∈ Y , ре-зультатом приближенных измерений состояний динамической системы служит функ-ция ξ ∈ Yδ(y). До начала процесса восстановления фиксируются зависимости α =α(δ), ε = ε(δ), h = h(δ), разбиение σ = σ(δ) ∈ Σ с диаметром d = d(σ(δ)) 6 ϕ(δ) истановится известным уровень погрешности измерений δ.
Шаг i = 0. В начальный момент времени t0 поступает приближенное измерениеξ[t0] состояния системы y[t0]. По предположению, наблюдателю становится извест-ным также приближенное значение u(h)
y восстанавливаемого управления u в началь-ный момент времени t0. Положив η = ξ[t0], ζ = z[t0], w = u
(h)y , α = α(δ), ε = ε(δ),
наблюдатель в момент времени t0 находит значение E0
(η, ζ, w, α, ε
)= v0
δ по правилу(5). Найденное значение v0
δ принимается за приближение к искомому управлениюu на отрезке времени [t0, t1]. Значение v0
δ (t1) запоминается для выполнения следую-щего шага. Далее по правилу (6) система-модель переводится из состояния z[t0] всостояние z[t1] = F0
(z[t0], v0
δ
), которое запоминается для выполнения следующего
шага.Шаг i = 1. В момент времени t1 наблюдателю поступает информация о состоя-
нии системы y[t1] в виде приближенного измерения ξ[t1]. Положив η = ξ[t1], ζ = z[t1],w = v0
δ (t1), α = α(δ), ε = ε(δ), наблюдатель в момент времени t1 находит значениеE1
(η, ζ, w, α, ε
)= v1
δ по правилу (5). Найденное значение v1δ принимается за прибли-
жение к искомому управлению u на отрезке времени [t1, t2]. Далее по правилу (6)поводырь переводится из состояния z[t1] в состояние z[t2] = F1
(z[t1], v1
δ
). Значения
z[t2] и v1δ (t2) запоминаются для выполнения следующего шага.
По мере поступления новых измерений ξ[t2], ξ[t3], . . . , ξ[tl−1], аналогично шагуi = 1 последовательно определяются функции v2
δ , v3δ , . . . , v
l−1δ на отрезках [t2, t3],
[t3, t4], . . . , [tl−1, tl] соответственно. Таким образом, в динамике к конечному моментувремени tl = ϑ будет получена полная Dσ
δ (ξ)-реализация алгоритма uδ. Из описанияработы КДА во времени видны возможность его осуществления в режиме реальноговремени и вольтерровость алгоритма.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯВСПУ-2014
Москва 16-19 июня 2014 г
1476
Обозначим через µ : R+ → R+ модуль непрерывности множества движений Y ,рассматриваемых как отображения T 3 t→ y[t] ∈ H (он существует в силу компакт-ности множества Y в пространстве C(T ; H)),∥∥ y[t1]− y[t2]
∥∥H6 µ
(| t1 − t2 |
), t1 , t2 ∈ T .
Сформулируем основное утверждение.Теорема 1. Пусть параметры регуляризации α = α(δ), ε = ε(δ), ϕ = ϕ(δ),
h = h(δ) и модуль непрерыности µ = µ(δ) удовлетворяют условиям согласования(ε(δ) + δ+µ(δ)
)α(δ)−1 → 0 , ϕ(δ)→ 0 , h(δ)→ 0 , α(δ)→ 0 , δ → 0 .
Тогда алгоритм D =Dσδ : σ ∈ Σ, δ ∈ [0, δ0]
, состоящий из методов (5)–(6), реша-
ет задачу восстановления на множестве Y , т.е. для любого y ∈ Y , каковы бы нибыли измерения ξ ∈ Yδ(y), имеет место сходимость Dσ
δ (ξ)→ u(y) в L2(T ; Rm) приδ → 0, более того, для Dσ
δ (ξ)-реализаций алгоритма uδ при δ → 0 имеют место сле-дующие сходимости: u δ(t)→ u(t) в Rm поточечно на T ; V [u δ]→ V [u]; u δ(t)→ u(t)в Rm равномерно по t на любом отрезке, не содержащем точек разрыва функции u.Имеет место также сходимость движения поводыря к наблюдаемому движениюсистемы z[ ·;u δ ]→ y в C(T ;H) при δ → 0.
Доказательство. Обоснование проводится аналогично [5–9] и основано на уста-новлении равномерной оценки
Ξ(t) 6 δ2 + C(µ(δ) + ε(δ) + δ
), t ∈ T ,
для оценочного функционала
(7) Ξ(t) =∥∥BΩ( y[ t; u ]− z[ t;u δ ] )
∥∥2
β+ αΛt
t0[u δ ]− αΛt
t0[ u ] .
Далее обычным способом доказываются сходимости u δ → u в L2(T ; Rm),
u δ(t)→ u(t) в Rm поточечно на T , V [u δ ]→ V [ u ] ,
из которых с применением результатов [17, гл. 4] выводится кусочно-равномернаясходимость регуляризованных приближений. Теорема доказана.
4. Конечномерная аппроксимация задачи
Восстановление управлений в системе (1)–(3) на основе результатов предыдущегопараграфа связано с минимизацией функционалов и пересчетом состояний поводыряв бесконечномерных пространствах. Для численной реализации алгоритма требуетсяконечномерная аппроксимация задачи. Опишем способ аппроксимации задачи рекон-струкции, основанный на методе разделения переменных.
Фиксируем какое-нибудь натуральное число k ∈ N. В основу построений дина-мического регуляризующего алгоритма положим системы обыкновенных дифферен-циальных уравнений для коэффициентов Фурье yj при j = 1, . . . , k. Копии такихсистем будут описывать движение поводыря.
Решение задачи восстановления будем искать в виде алгоритма
D =Dk, σδ : k ∈ N, σ ∈ Σ, δ ∈ [0, δ0]
,
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯВСПУ-2014
Москва 16-19 июня 2014 г
1477
состоящего из троек
Dk, σδ =
((ti)
li=0; (Ek
i )l−1i=0; (F k
i )l−1i=0
),
где (ti)li=0 — точки разбиения σ ∈ Σ; Ek
i — отображение H ×Rk ×P ×R+×R+ в Ui;F ki — отображение Rk × Ui в Rk (подробные пояснения к отображениям имеются в
предыдущем разделе).Введем в рассмотрение пространство k-мерных векторов q = (q1, . . . , qk) со ска-
лярным произведением и соответствующей ему нормой
⟨q(1), q(2)
⟩β, k
=k∑j=1
βj q(1)j q
(2)j ,
∥∥ q ∥∥β, k
=⟨q, q
⟩1/2
β, k,
числа βj, j ∈ N, удовлетворяют условиям, указанным в предыдущем разделе.Введем также обозначения
BkΓ(g u) =
(⟨g · u , ∂ω1
∂N
⟩L2(Γ) , . . . ,
⟨g · u , ∂ωk
∂N
⟩L2(Γ)
);
BkΩ(y) = ( y1, . . . , yk ), yj = 〈 y, ωj 〉 , j = 1, . . . , k ;
Φki (v) = Φk
i (v; η, ζ(k)) = 2⟨ζ(k) −Bk
Ω( η ) , BkΓ
(∫ ti+1
ti
g · v(τ) dτ)⟩
β, k+
+ αΛti+1
ti [ v ] , α = const > 0 ;
(8) Φk,∗i = Φk,∗
i (w) = min
Φki (v) : v ∈ U [ ti, ti+1; w ]
.
Приступим к построению искомых алгоритмов. Для δ ∈ [0, δ0], k ∈ N, σ ∈ Σ,i ∈ 0, 1, . . . , l − 1, η ∈ H, ζ(k) ∈ Rk, w ∈ P , α ∈ R+, ε ∈ R+, положим
(9) Eki
(η, ζ(k), w, α, ε
)= vk,iδ ,
где vk,iδ есть элемент множества U [ ti, ti+1;w ], удовлетворяющий условию
Φk,∗i 6 Φk
i ( vk,iδ ) 6 Φk,∗
i + ε ( ti+1 − ti ) ,
ε — параметр, характеризующий точность по функционалу решения экстремальнойзадачи (8). Правило формирования элемента w описано в предыдущем разделе.
Значение z(k) ∈ Rk внутренней переменной, имеющей смысл состояния пово-дыря (вспомогательной конечномерной системы-модели), формируется следующимобразом. В начальный момент времени t0 положим z(k)[t0] = y(k)(t0), где y(k)(t0) =( 〈 y0, ω1 〉, . . . , 〈 y0, ωk 〉 ). В последующие моменты времени ti+1, i ∈ 0, . . . , l− 1, эле-менты z(k)[ti+1] находятся из решения задач Коши
yj(t) = −λjyj(t) + fj(t) +⟨g vk,iδ (t) ,
∂ωj∂N
⟩L2(Γ) , t ∈ [ti, ti+1] ,
y(k)(ti) =(y1(ti), . . . , yk(ti)
)= z(k)[ti] , j = 1, . . . , k ,
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯВСПУ-2014
Москва 16-19 июня 2014 г
1478
и определяются равенствами
(10) z(k)[ti+1] = y(k)(ti+1) = F ki
(z(k)[ ti ] , v
k, iδ
).
Работа алгоритма Dk, σδ во времени аналогична работе алгоритма D σ
δ и подробноописана в предыдущем разделе.
Обозначим
maxu∈U
maxt∈T
∥∥∥ y(t, ·;u)−k∑j=1
yj(t, ·;u)ωj
∥∥∥ = Rk .
В работах [32,33] установлено, что Rk → 0 при k →∞.Учитывая свойства построенного алгоритма, можно установить равномерную ма-
лость функционала (7), из которой, с учетом исследований [8, 15, 17, 21], вытекаетсправедливость следующего утверждения.
Теорема 2. Пусть параметры регуляризации k = k(δ), α = α(δ), ε = ε(δ),ϕ = ϕ(δ), h = h(δ) и модуль непрерыности µ = µ(δ) удовлетворяют условиямсогласования(
Rk(δ) + ε(δ) + δ + µ(δ))α(δ)−1 → 0 ,
k(δ)→∞ , α(δ)→ 0 , ε(δ)→ 0 , ϕ(δ)→ 0 , h(δ)→ 0 , δ → 0 .
Тогда алгоритм D=Dk,σδ : k∈N, σ∈Σ, δ∈ [0, δ0]
, состоящий из методов (9)–(10),
решает задачу восстановления на множестве Y , т.е. для любого y ∈ Y , каковы быни были измерения ξ ∈ Yδ(y), имеет место сходимость Dσ
δ (ξ) → u(y) в L2(T ; Rm)при δ → 0, более того, для Dσ
δ (ξ)-реализаций алгоритма uδ при δ → 0 имеют ме-сто следующие сходимости: u δ(t) → u(t) в Rm поточечно на T ; V [u δ] → V [u];u δ(t)→ u(t) в Rm равномерно по t на любом отрезке, не содержащем точек разрывафункции u. Имеет место также сходимость движения поводыря к наблюдаемомудвижению системы
z(k(δ))[·;uδ] =k∑j=1
z(k(δ))j [·;uδ]ωj → y в C(T ;H) при δ → 0 .
5. Численное моделирование
Приведем результаты численных расчетов для системы yt = a2yxx, (t, x) ∈ Q;y(0, x) = y0(x), x ∈ Ω = (0, b); y(t, 0) = u(t), y(t, b) = 0, t ∈ T = [0, 1].
Пусть P = [ν1, ν2], приближенное измерение состояний динамической системымоделируется соотношением yδ(t, x) = y(t, x) + δ ξ(t, x), ‖ ξ(t, ·) ‖ 6 1. Искомое управ-ление есть разрывная функция u(t) = 2 t2 при t ∈ [0, 0.5], u(t) = 3 t−1 при t ∈ (0.5, 1].
Способы дискретизации задачи подробно описаны в [23–25]. В этих же работахподробно описан метод проекции субградиента минимизации целевого функционала.
Результаты расчетов приведены в таблице и на рисунке (сплошная линия —искомое управление, пунктирная — результат восстановления при δ = δ1, точко-пунктирная — при δ = δ2, линия из точек — при δ = δ3). При расчетах основныепараметры принимали следующие значения: h = 0.0005 (шаг сетки при дискретиза-ции интегралов и поводырей), M = 1000 (количество итераций в методе проекциисубградиента), α = 0.25 δ, k = 100, τ = 0.25h (величина шага в методе проекциисубградиента на частичном отрезке).
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯВСПУ-2014
Москва 16-19 июня 2014 г
1479
Погрешность δ Невязка Относительная погрешностьδ1 = 0.03 0.0071 22.3066δ2 = 0.01 0.0029 9.0933δ3 = 0.0002 0.0016 4.9344
6. Заключение
В работе построены новые регуляризирующие динамические алгоритмы рекон-струкции граничных управлений в условиях Дирихле параболических динамическихсистем по результатам приближенных измерений текущих состояний систем. Благо-даря использованию специальных стабилизаторов, содержащих вариации возмож-ных решений, получены новые усиленные результаты о сходимости регуляризован-ных приближений не только в пространствах Лебега, но и кусочно-равномерная схо-димость. Описан один из способов конечномерной аппроксимации задачи.
Работа выполнена по программе Президиума РАН «Фундаментальные пробле-мы нелинейной динамики в математических и физических науках» при поддержкеУрО РАН (проект 12-П-1-1009), поддержана программой межрегиональных и меж-ведомственных фундаментальных исследований УрО РАН (проект 12-С-1-1001) иподдержана РФФИ (14-01-00155).
Список литературы1. Красовский Н.Н. Теория управления движением. М.: Наука, 1968. 476 с.2. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
456 с.3. Крутько П.Д. Обратные задачи динамики управляемых систем. Нелинейные модели. М.:
Наука, 1988. 332 с.4. Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.
392 с.5. Максимов В.И. Задачи динамического восстановления входов бесконечномерных систем.
Екатеринбург: Изд-во УрО РАН, 2000. 304 с.6. Осипов Ю.С., Васильев Ф.П., Потапов М.М. Основы метода динамической регуляризации.
М.: Изд-во МГУ, 1999. 237 с.7. Осипов Ю.С., Кряжимский А.В., Максимов В.И. Задачи динамического восстановления
входов управляемых систем. Екатеринбург: Изд-во УрО РАН, 2011. 292 с.8. Кряжимский А.В., Осипов Ю.С. О моделировании управления в динамической системе //
Известия АН СССР. Техническая кибернетика. 1983. 2. С. 51-60.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯВСПУ-2014
Москва 16-19 июня 2014 г
1480
9. Короткий А.И. Обратные задачи динамики управляемых систем с распределенными пара-метрами // Известия вузов. Математика. 1995. 11. C. 101-124.
10. Черноусько Ф.Л., Меликян А.А. Игровые задачи управления и поиска. М.: Наука, 1978.270 с.
11. Osipov Yu.S., Kryazhimskii A.V. Inverse problems of ordinary differential equations: Dynamicalsolutions. L.: Gordon and Breach, 1995. 625 p.
12. Иванов В.К., Васин В.В., Танана В.П. Теория линейных некорректных задач и ее приложе-ния. М.: Наука, 1978. 206 с.
13. Кабанихин С.И. Обратные и некорректные задачи. Новосибирск: Сибирское научное изда-тельство, 2009. 457 с.
14. Лаврентьев М.М., Романов В.Г., Шишатский С.П. Некорректные задачи математическойфизики и анализа. М.: Наука, 1980. 288 с.
15. Леонов А.С. Решение некорректно поставленных обратных задач: Очерк теории, практиче-ские алгоритмы и демонстрация в МАТЛАБ. М.: ЛИБРОКОМ, 2010. 336 с.
16. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. М.: Наука, 1979. 288 с.17. Тихонов А.Н., Леонов А.С., Ягола А.Г. Нелинейные некорректные задачи. М.: Наука, 1995.
212 c.18. Васин В.В. Регуляризация и дискретная аппроксимация некорректных задач в пространстве
функций ограниченной вариации // Доклады РАН. 2001. Т. 376, 1. С. 11-14.19. Васин В.В. Устойчивая аппроксимация негладких решений некорректно поставленных за-
дач // Доклады РАН. 2005. Т. 402, 5. С. 586-589.20. Васин В.В. Аппроксимация негладких решений линейных некорректных задач // Труды
Института математики и механики УрО РАН. 2006. Т. 12, 1. С. 64-77.21. Короткий М.А. Восстановление управлений статическим и динамическим методами регуля-
ризации с негладкими стабилизаторами // Прикладная математика и механика. 2009. Т. 73,Вып. 1. С. 39-53.
22. Vasin V.V., Korotkii M.A. Tikhonov regularization with nondifferentiable stabilizing functional// Journal of Inverse and Ill-Posed Problems. 2007. Vol. 15, No. 8. P. 853-865.
23. Короткий А.И., Михайлова Д.О. Восстановление управлений в параболических системахметодом Тихонова с негладкими стабилизаторами // Труды Института математики и меха-ники УрО РАН. 2010. Т. 16, 4. С. 211-227.
24. Короткий А.И., Михайлова Д.О. Восстановление граничных управлений в параболическихсистемах // Труды Института математики и механики УрО РАН. 2012. Т. 18, 1. С. 178-197.
25. Короткий А.И., Михайлова Д.О. Восстановление распределенных управлений в параболи-ческих системах динамическим методом // Труды Института математики и механики УрОРАН. 2013. Т. 19, 1. С. 160-169.
26. Ладыженская О.А. Краевые задачи математической физики. М.: Наука, 1973. 408 с.27. Ладыженская О.А., Уральцева Н.Н. Линейные и квазилинейные уравнения эллиптического
типа. М.: Наука, 1973. 576 с.28. Агеев А.Л. Регуляризация нелинейных операторных уравнений на классе разрывных функ-
ций // Журнал вычисл. матем. и матем. физики. 1980. Т. 20, 4. С. 819-836.29. Васильев Ф.П. Методы оптимизации. М.: Факториал, 2002. 824 с.30. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М.:
Наука, 1972. 496 с.31. Лионс Ж.-Л. Оптимальное управление системами, описываемыми уравнениями с частными
производными. М.: Мир, 1972. 418 с.32. Осипов Ю.С., Охезин С.П. К теории дифференциальных игр в параболических системах //
ДАН СССР. 1976. Т. 226, 6. С. 1267-1270.33. Короткий А.И., Осипов Ю.С. Аппроксимация в задачах позиционного управления парабо-
лическими системами // Прикладная математика и механика. 1978. Т. 42, 4. С. 599-605.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯВСПУ-2014
Москва 16-19 июня 2014 г