第三章 极小值原理及应用
DESCRIPTION
第三章 极小值原理及应用. 经典变分法缺陷:. 1 、应用前提: a 、控制量 u(t) 的取值不受任何限制,没有任何 不等式约束。. b 、 f 、 L 、. 等函数对其自变量有充分可微性。. 2 、实际控制要求:. , i=1,2,3……. a 、控制量 u 受不等式约束,如:. b 、性能指标有时并不完全可微. 如:燃料最优控制:. 若采用经典变分:. 若采用经典变分法:. 不再适用,求不出解来. 极小值原理. 实际应为. - PowerPoint PPT PresentationTRANSCRIPT
第三章 极小值原理及应用第三章 极小值原理及应用经典变分法缺陷:
1 、应用前提: a 、控制量 u(t) 的取值不受任何限制,没有任何 不等式约束。
b 、 f、 L 、 等函数对其自变量有充分可微性。
2 、实际控制要求:
a 、控制量 u 受不等式约束,如: 0)( uM i , i=1,2,3……
b 、性能指标有时并不完全可微
如:燃料最优控制: ft
tdttuJ
0
)(
20 uuu
若采用经典变分: 。极小值原理。实际应为 0*
1* ;,0 UUUU
U
H
10 uuu
0U 1U
H
UJ ][
u
0U 1U 2U
H
UJ ][
u0U 1U
若采用经典变分法: 0U
H 不再适用,求不出解来
实际应为 0* UU 极小值原理
10 uuu
若在容许控制范围内, J或 H 有极值且唯一,用极小值原理与经典变分法,所得
结论一致。
0U 1U
H
UJ ][
u*U
一、 < 定理 > 极小值原理: [ 时变系统 ]
时变受控系统 ),,( tUXfX
,其中控制向量 rRtu )( , 为容许控制
域, U(t) 是在 内取值的任何分段连续函数,为使状态向量由初始
00 )( XtX 转移到末端 )( ftX , )( ftX 满足约束: 0]),([ ff ttXg
ft,
未定, 并使性能指标达 ft
tff dtttUtXLttXJ0
]),(),([]),([
到极小值。设 )(* tU 和 *ft 是如上 J 为最小的最优解, )(* tX 为最优状态轨
为 0的 n 维向量 )(t ,满足 :
1 、规范方程:
X
H
tUXfX
),,(
2 、边界条件:
0)(
])(
)],([[
)(
]),([)(
)( 00
f
T
ft
f
ffT
f
fff
t
g
tH
tX
ttXg
tX
ttXt
XtX
f
线,则必存在不
3 、与 )(* tU 对应的哈密顿函数 H 取极小值。]),(),(),([min]),(),(),([ **
)(
*** tttUtXHtttUtXHtu
即 : 设 )(),( ** ttX 为满足 状态方程和协状态方程的最优解。
在 中。把 H 仅看作 U 的函数,若 J 为最小,必要条)(* tU 使得
]),(),(),([ *** tttUtXH
仅看作 U 的函数时也取最小值。极小值原理的证明:应用数学基础较多,有些书中用很大篇幅进行
二、极小值原理的意义:1 、容许控制条件放宽
变分法:在整个控制域,对 U 没有约束 0u
H
有时 计算不易。极小值原理: H在 U 的约束闭集中取极小值。
变分法仅为极小值原理的一个特例。
]),(),(),([ *** tttUtXH
0u
H
件为
证明,省略。
且即使 U 不受限制,
2 、最优控制 *U 使哈密顿函数 H 取极小值,极小值原理由此得名。
这一原理是苏联学者 “庞特里亚金”等人首先提出,而后加以证明得。
在证明过程中: 与 H 得符号与这里所定义的相反。 HH _
)](),(),([max)](),(),([ *_
)(
**_
tuttXHtUttXHtu
∴所以有的文献中也称为“极大值原理”。
3、 H对 u 没有可微要求,因此应用拓宽。4 、 极小值原来是求取最优控制的必要条件,非充分条件。即:满足极小值原理不一定 J 取极小值 , 需进一步判断。
一般 : 对于实际系统 有最优解 有唯一解 最优解--------根据物理意义
--------极小值原理 --
三、几种边界条件得讨论:上面所讨论的是 0t 和 )( 0tX 已知。 )( ftX 受约束, ft 自由的最一般
情况。若 ft 和末端状态不同,只需改变极小值原理的边界条件即可。1 ) ftt ,0 已知, ff XtXXtX )(,)( 00 边界条件为: 2) 000 )(, XtXt 给定, )( ftX 自由, ft 未给定,
边界条件: ftf X
tXtX |)(,)( 00
确定 :ft 0
f
f ttH
3) ftt ,0 已知, 00 )( XtX 给定 , 末端受约束 0]),([ ff ttXg
边界条件为 :
0]),([
)(
)( 00
ff
f
T
ff
ttXg
tX
gt
Xt
XtX
若 ft 自由 : 外加 : 0|
f
T
ft t
g
tH
f
ff XtXXtX )(,)( 00
四、例题分析 : 设一阶系统状态方程:)()()( tutxtx
x(0)=5
控制约束 : 15.0 u试求使性能指标 :
1
0)]()([ dttutxJ
为极小值的最优控制 及最优性能指标 *J
解 : 定常系统 , ft 固定 , 末端自由问题)1()1()( uxuxuxH
根据极小值原理 ,使 H 绝对极小相当于使 J 为极小
所以 )(* tU5.0
1
由协状态方程 : 1)()];(1[)(
tcettX
Ht
)(* tU
1
1
由横截条件 : 1)(;;01)1( 11 tetecce
显然 : 当 1)( st 时, )(* tU 产生切换
307.0,11)( 1 s
ts tet s
所以 )(* tU5.0
1
)(tx5.0)(
1)(
tx
tx
)(tx5.0
1
2
1
t
t
ec
ec
307.00 t
1307.0 t
307.00 t
1307.0 t
307.00 t
1307.0 t
由 x(0)=5 代入 , 得 41 c
所以 14)(* tetx
令 t=0.307 可得 0.307≤t≤1时 x(t) 的初始条件 :
44.614)307.0( 307.0 ex 解得 34.42 c
所以 )(* tX5.034.4
14
t
t
e
e
将 ** ,UX 代入 J 可得 :
64.8)]()([1
0
*** dttUtXJ
307.00 t
307.00 t
1307.0 t
例 2:
10)0(
)(2
1)(min
1
0
22
x
uxx
dtuxuJ
求 *u
a)对 U 没有约束 b) |u| 3.0
解 :a)
*
22
0
)(2
1
2
1
0)1(
U
u
H
uxuxH
xuxx
xx
H
0
10)0( x
0)1(
解得 : tt
tt
eet
eetx22
22*
)12(9.9)12(1.0)(
9.91.0)(
b) |u| 3.0
由极小值原理 : }sgn{* U
当 t=1 时 0
在 [0,1] 区间 0)( t
所以 3.0)(* tU
五、极小值原理中哈密顿函数 H 的性质讨论用途:对于所求解的最优控制的验证,或帮助求解最优控制及
1 、线性定常系统: ),( UXfX
ft、)1 固定, dtUXLtXJft
tf 0
),()]([ 包括
ft
t
f
dtUXLJ
tXJ
0),(
)]([
( 与末端状态无关 )则 : )()( **
ftHtH 常数 。 { t
H
dt
dH
H 中不显函 t}
ft、)2 自由,
f
f
t
t
t
tf
f
dtUXL
dtUXLtX
tX
J
0
0
),(
),()]([
)]([
沿最优控制轨线: 0)()( *** ftHtH (与末端状态无关)
因为 )(* tH 中不显函 t 所以 )()( ***ftHtH 常数
又因为 ft 自由 , 0)(;0;0)( ****
fff
f tHtt
tH
*ft
2 、对于时变系统: ),,( tUXfX
ft、)1 固定 :
f
f
t
tff
t
t
ff
dttUXLttX
dttUXL
ttX
J
0
0
),,(]),([
),,(
]),([
ft
tf dH
tHtH0
)()( **
ft、)2 自由 : ft
tff dttUXLttXJ0
),,(]),([ ,末端 0)],([ ff ttXg
0)( **
f
T
ff t
g
ttH
若末端自由 : f
f ttH
)( **
证明:见胡寿松 P91页
第四节最小值原理在实际中的应用
几个典型例子: 1. 时间最优控制问题 2. 最小燃料消耗问题 3. 最小能量控制问题 4. 线性调节问题介绍重点:时间最优控制问题(其他求解思想与此类似)
一、时间最优控制问题
所谓时间最优控制,就是把系统从初始状态转移到目标状态的时间作为性能指标,即使转移时间为最短。
这也是发展得最早的最优控制问题之一。
1 、问题提出(时变系统) 已知受控系统并设 f 和 B对 X(t)和 t 连续可微。
0)0(),()),(()),(( XXtuttXBttXfX
1)( tju rj ......2,1
0)( ftxg
00
ttdtJft
t f ft
X: n×1 状态向量 u : r×1 控制向量 f : n×1 函数向量 B: n×r 函数值矩阵
控制向量约束条件 :
末端状态: g : p ×1 维函数向量目标函数: : 自由
问题:寻求最优控制 u*(t) ,使系统由初态到终态, 目标函数 J 为最小
应用最小值原理进行问题的求解步骤:⑴列写哈密顿函数
)(),()(),()(1
)(),(),()(1
),(),(),(
tuttxBtttxft
tuttxBttxft
tttutxH
TT
T
⑵由控制方程求 u*(t)
u 有约束, ∴ H在 u* 上取得极小值,即:
令 q:r ×1 维向量函数
[注: ]
)(),(*)(*min),(),(*),(*1
tuttxBttttutxH T
u
T
j
1)(*),(*)(* nnrT tttxBtq
TTT ABBA
r
jjj
u
T
u
T tutqtutqtutqjj 111
)()(min)()(*min)(*)(*
)()(min1 1
tutq jj
r
j u j
则有: j =1, 2…r
最优控制 u*(t) 是使 为极小,则:
)()()(min1 1
tqtutq jjj
r
j u j
)()( tutq jj
)(* tu j0)(*,
0)(*,
0)(*,
tq
tq
tq
j
j
j
不定
可见:当 时, 有确定值,正常情况 当 时, 不定, 奇异情况
0)( tq j )(* tu j0)( tq j )(* tu j
+1
-1t
+1
-1
u*(t)
奇异
我们仅研究正常情况u*(t)写成符号函数 sgn{ }形式则 j =1, 2…r向量形式: u*(t)=-sgn{q*(t)} =-sgn{ }
)(*sgn)(* tqtu jj
)(*),( tttxBT
⑶ 根据规范方程:
)()(
)(),(),(
tX
Ht
tuttxBttxfX
及初始条件和横截条件:
0
00
ff tt
T
Ht
g
XtX
f
ffT
f tX
ttxgt
,
可求得 x*(t) 及 )(* t
⑷求最优控制 u*(t) )(*),(*sgn)(* tttxBtu T →砰一砰控制
2 、砰一砰控制定理: 要求控制量始终为最大或最小 设 u*(t) 是上述问题提出的解, x*(t), 是相应的状态轨线和协状态轨线。若问题正常 ( 非奇异 ) ,则 这是一个继电器控制方式,称为砰一砰控制
)(* t
)(*),(sgn)(* tttxBtu T
3 、线性定常系统的最小时间控制问题的解法:
⑴如何确定最优控制 u*(t) 设线性定常系统的状态方程为:
0)0(),()()( XXtButAXtX
其中, X: n ×1 维状态向量 u :控制变量 A, B 分别为 n ×n, n ×1矩阵约束条件: 末端条件:
1)( tu
0ftX
求 ,使系统状态从 转移到 所用时间最短,即使 为最小
)(* tu 00 )( XtX 0)( ff XtX
ft
ftdtJ0
⑵问题的求解①首先列写哈密顿函数:
)()()()(1 tButtAXtH TT
②根据极小值原理分析可得: )(*sgn)(* tBtu T
③有规范方程: BtBtAXtBXtAXX T )(sgn)()()( *
BtT )(sgn * 注: 为标量函数,题意要求)(tu
000 )()(
0)()(
tA
TT
T
ett
tAtAX
H
代入 得:)(* tu
Betu
TtATo
T
sgn)(*
Be AtTo
sgn
可见, 的值完全由 的符号决定 但是, 的确定是不容易的。因为它还和系统的状态变量有关系。通常采用的方法是:
)(* tu oo
先设一个 ,求出 ,求出 ,判定若为0,则 即为所求;否则修正 重复上述过程
o )(t )(tX ?0)( ftX
)(t 0
⑶开关次数定理: 设线性系统 是正常的(不存在非奇异问题),若矩阵 A 的特征值均为实数,假定时间最优控制存在,并令其为 则 u*(t) 的切换次数最多不超过( n-1 )次,n 为系统的维数。
)()( tButAXX
,.....2,1),(* rjtu j ,1ju
以下将根据极小值定理,开关次数定理及相平于状态空间分析,求 u*
例题分析 1 : 时间最优控制问题ftJ min
ux
xx
2
21
0
1
)(1
)0(1
ftx
x0
1
)(2
)0(2
ftx
x
求 u*(t)1u
解:对象为二阶线性系统 [双积分模型的时间最优控制 ](应用最普通最广泛的一种)
2
221
sgn*
1
u
uxH
由规范方程:
01
1
X
HX
H
11 C
12
2
X
H212 CtC
则
由ux
xx
2
21
21sgn* CtCu
C1, C2 的取值要求:保证0
1
)(1
)0(1
ftx
x
0
1
)(2
)0(2
ftx
x
*ff tt 由开关次数定理知:切换一次,设切换时间为 ts ,则令
为了求出 ts ,必须首先找出状态在 平面上的转移轨线。
1
2)(2 ,0
C
Ctst
21xx
t2
t
t
0
0
1
1
ts tf
由ux
xx
2
21
设 u=1 ,则
12
21
x
xx
则: 22 atx
122
1 2
1atatx
)2
()(2
1 22
12
2a
aat
22
22
1Kx
如图 (a) 所示,为一组抛物线,当 K=0 时经过原点 [pos]
2
22
12a
aK 其中
t
s
p
0
X2
若 u=-1 ,则
12
21
x
xx
22 btx
122
1 2
1btbtx
12
22
1Kx
2111 2
1bbK
为一组抛物线,如图 (b) ,当 K1=0 时过原点[NOT]
X1
X2
u=-1
N
T
o
显然:若 初始状态在 NO 或在 PO 上,可进一步转移到目标原点,称 NOP 为开关曲线
)0(2)0(1 , xx
由题意假设
它落在 u=-1 相应抛物线组中的一条上,即AQB ,这时在 u=-1 的作用下,
状态由 沿 AQB
转移到 B ,进行切换, B位于 PO 上,一步可到达原点。
1
1)0(X
1
1)0(X
N
X2
o
p
X1B u=+1
u=-1
A[1,1]
因此,问题的解为 :①先以 u=-1 控制到达 Po曲线上的 B点②以 u=+1沿开关曲线 Po 到达原点 从初始状态到达末端状态的轨迹为 AQBO , 即 u*= 进而,可求出转移时间 ts 及最优时间 把状态轨线控制序列分成若干段,逐步算出所需时间,最后相加。求 及 ts在 AQB段 ,u=-1,
切换次数为 1
-1,+1t f
*
t f
bbtxbxt
t
12
2
1
22
2
1
1
10x
121 bb
到达 B点:t=ts,
1
2
1
1
2
1
2
tttx
ttx
sss
ss
BO 段:u=+1 , 12
21
22
2
1atatx
atx
当 时, ,则ftt 0)(2)(1 ff tt xx
21
2
2
1f
f
ta
ta
221 2
1
2
1ff ttttx
fttx 2
22)(1
)(2
2
1
2
1fsfst
fst
ttttx
ttx
s
s
在 B点应有:22
)(12
2
1
2
11
2
1
1
fsfsts
sfs
ttttxt
ttt
s
联立求解: 即:
2
321
2
31
f
s
t
t2
321* ft
1
1*u
2
321
2
31
2
310
t
t
例题分析 2 :二阶积分系统的最小时间控制系统
ux
x x
21u
最小时间控制问题:求 u*(t), 使系统由初态
xxxx
20
100
0
转移到末端状态 的时间为最小,且满足
0
0)(t fx 1u
解:⑴列写哈密顿函数: uH x 2211 2
*sgnu
⑵求解协状态方程
12
2
11
0
x
xH
H
设
022
011
)0(
)0(
,则:
constt 011)( tt 01022
)(
⑶确定控制序列:显然,由⑵知, 为一条直线,其形式有可能为 4种
)(sgn* 2 tu )(2 t
因此, u 相应的控制序列为: {-1}, {+1, -1}, {-1,+1}{+1}
2 22
2
2 2
2 2
-1 -1u u
u
u
+1
0,0 0201 0,0 0201
0,0 0201 0,0 0201
⑷状态轨线: 由⑶知, u有 4 种可能的取值,其值为 ±1 ,代入状态方程: dBuexetx
t tAAt )()(0
)()0(
10
1 teAt
注: 11 AsIeAt
10
11
0
11
0
1 211
1 t
s
sss
s
)(2
1
)(1
0
10
1
10
1
10
1)(
2
02
0201
)(2
)(1
002
01
tut
tx
txx
x
x
dut
x
xttx
t
t
t
利用上式,消去中间变量 t ,可导出 x1和 x2 的关系为:
)(2
1)(
2
1)( )(
22
202011 tuxtuxxtx t 1)( tu
其在 X1, X2平面上为一组抛物线如图: u=+1 为实 u=-1 为虚
X1
X2
B
A
u=+1u=-1
⑸确定开关曲线:使系统状态直接回到末端状态的曲线AO和 BO总的开关曲线: AOB显然:
xxxxx
xxxxx
xxxxx
AOB
AO
BO
22121
2
2
2121
2
2
2121
2
1,
0,2
1,
0,2
1,
AOB 将状态平面分为两部分 和R
R
显然:
xxxxxR
xxxxxR
2212,1
2212,1
2
1
2
1
X1
X2
B
A
Ou=-1R
R
⑹确定最优控制作用 u* u* 与初始状态 有关
02
01
x
x
分析: ①若 位于 BO 上,则 u*= +1; ②若 位于 AO 上,则 u*= -1; ③若 位于 内,则 u*=[ -1, +1]; ④若 位于 内,则 u*=[ +1, -1];
02,01 xx
02,01 xx
02,01 xx R 02,01 xx R
③④在开关曲线上为转折点
例 3 :升降机的快速降落问题: 设有一升降机W ,它的质量为 1 ,升降机一方面 受重力 g 的作用,另一方面受控制器的作用力u(t) 的作用,且(M> g 是常数)设 x(t) 为升降机离开地面的距离,当 t= 时, [离地面距离 ] [垂直运动速度 ]
,)( Mtu
t0
xtxt
x
x0
20
0
10
)(
)(
问题:求 u*( t) , 使升降机最快的到达地面,并且到达地面时的速度为零。即: t dtJ f t f0
最小, 自由t f
0t fx 0t fx
W
u
gX(t)
解:建立升降机系统的数学模型, F=ma 即: X
dt
xdgu t
2
2
)(
令:
)(2
)(1
t
t
xx
xx
即:gux
xx
2
21
02)0(2
01)0(1
xx
xx
0
0
)(2
)(1
f
f
t
t
x
x
哈密顿函数: guxH 2211 显然,为了使 H 为最小,则 2sgn* Mu
即:
*
*
*
u
Mu
Mu
不确定 0
0
0
)(2
)(2
)(2
t
t
t
协状态方程: 即: 常数
12
2
21
x
H
x
H
212
11
CtC
C
相应于 的 4 种可能, u* 的取值有 4 种可能{+M}, {-M}, {+M,-M}, {-M, +M}因此,下面只研究 u=±M 时升降机的状态轨线
2
设 u=M ,则状态方程为: …① …②① /② :
是一组抛物线,图中实线箭头表示状态运动的方向
gMx
xx
2
21
CgM
xx
gM
x
dx
dx
22
1
2
2
1
2
1
在此族曲线中,只有 到达原点,r
)(2:
22
1 gM
xxr
r
r
设 u=-M ,同理可得:
如图虚线所示CgM
xx
22
1 2
1
只有 到达原点, r r)(2
:2
21 gM
xx
rrr 开关曲线r 将相平面分为两部分,在 r下半部的记为 ,包括 在 r 上半部的记位 ,包括
R
R
r
r
u* 只取 +M或 -M ,切换最多一次,因此可得到结论:ⅰ〈〉初始状态 在 上, 状态沿 回原点
xxx 02010, r
Mu * r
ⅱ〈 〉当 在曲线 上时 , 状态沿 回原点
ⅲ〈 〉当 时, 沿相应的虚线抛物线运动到 时, 沿 回到原点。
Rxx
0201,
xx 0201, r
r
Mu *
Mu * r
马上切换r
Mu *
ⅳ〈 〉当 时, ,沿相应的实抛物线运动到 时,
Rxx
0201,
Mu * r
马上切换
总之:
xxxxxrr
xxxxxR
xxxxxR
22121
22121
22121
2
1,
2
1,
2
1,
Mu * ,沿 回到原点。r
R
R
Mu *
Mu *
Mu *
Mu *
r
r
对于实际问题升降机的分析:它在地面之上,∴ ,处于相平面的右半部分,且设
01x
020x
a〉若 ,而 时状态沿实抛物线运动与 轴交于N ,这意味着升降机到达地面时,速度不为 0 ,不合要求。
Rx
0 rx
0
)0( N
<b> 当 即开始以最大推力向下最用, 使升降机尽快下降。当其状态检测到达 时,马上改变控制,使它以 的最大推力向上作用,这样升降机将以速度 0 到达地面。
,*,0 MuRX
rMu * Mu *
Mu *
Nr
从上例可以看出:快速最优控制有如下特点:< > u*ⅰ 要么最大,要么最小。< > u*ⅱ 的取值经过有限的( n-1 )次(可为最多次)数切换可到达平衡点。< > u*ⅲ 的取值仅在开管曲线上切换。
注意:时间最优控制的应用中,有些实际问题并不要求将相点控制到状态空间原点,而是到某一集合,其分析方法与上类似(若二阶系统为一般的二阶系统,特征值为实数时,分析方法类似;为复数或纯虚数时,开关次数定理不成立,问题较为复杂,如无阻尼振荡二阶系统。
二、燃料最优控制问题 节约能源,减少燃料消耗在国民经济各部门中都是一项重要的技术经济课题。在航空和宇航中使用的原料是由地面起飞时带到空间去的。在空中携带的燃料是有限的,要保证长时间的飞行计划,就希望空中的控制系统消耗的燃料最小,而燃料的消耗一般是和控制力 u 的大小成正比的。 U 有正有负。因袭燃料消耗的性能指标 :
也可以以升降机系统分析,只是相应于时间最优控制,要求到达地于所用时间最小,
相应于燃料最优控制,要求达到目的地时所用燃料最小
dtuJft 0
ftdtJ
0
dtuJft 0
1 、数学描述 [ 以二阶级分模型的燃料最优控制为例 ]
系统: 约束:ux
xx
2
21
1u
要求:系统从初始状态 转移到( 0, 0 ) 使 最小, 给定。
2010 , XX
dtuJft 0
ft
解:应用极小值原理 uxuH 221
1
0
1
*u
1
11
1
2
2
2
)(2* tdezu
正常:仅在有限个点上 奇异:至少在一段时间 [t1, t2] 间隔内
1)(2 t
1)(2 t
正常: u* 可取 +1, -1, 0随着 t增大, u* 在三个值上 切换,是一种三位控制 {开关控制 } 。奇异:不能用极小值,死区函数。为使H为最小,则使 为最小uu 2
分析:①若u=+1,则 若使H最小,则 ②若u=-1,则 若使H最小,则 ③若
u21 12
uu 22 11 12
01
01
1
2
2
22
uuu
1
1
2
2
0* u
1
0
1
*u
1
11
1
2
2
2
由:1
22
21
x
H
x
H
212
11
CtC
C
和相应的最优控制 之间的关系:2
,
,
,0
fb
ba
a
ttt
ttt
tt
,1
,1
,1
2
2
2
1*
0*
1*
u
u
u
显然,燃料最优控制也是开关式控制,控制器应为一个具有死区的继电器。
*u
+1
+1
+1
+1
-1
-1
-1
-1tbta tf
at bt和 的计标ux
xx
2
21
当 时,
1u12
21
22
2
1atatx
atx
Cxx 221 2
1相平面上一组抛物线[实线]
当 时,
1u Cxx 221 2
1相平面上一组抛物线[虚线]
122
1
22
2
1dtdtx
dtx
当 时,
0u121
22
btbx
bx
121 btxx
以下两个图形画出了不同初始状态转移轨线
仅为<1>进行分析: 在t=ta处应满足:
122
12
22
2
1dtdtbtb
dtb
aaa
a
相对于X2而言,a点
相对于X1而言,a点
*u =1
*u =0
*u =-1
[1,1]
ab
*u =-1
*u =-1
*u a=0
*u =0
*u =1
*u =1
b
ba
-
在t=tb处应满足:
122
12
22
2
1atatbtb
atb
bbb
b
解方程可得ta,tb的值
习题1:设系统为ux
xx
2
21
0
10
)0(2
)0(1
x
x
0
0
)(2
)(1
f
f
t
t
x
x
1u
求最短时间控制 及最短时间)(* tu ft
提示:开关曲线:
221
221
2
1:
2
1:
xxr
xxr
对于AB段, 1* u
对于BO段, 1* u
,1,1* u 切换点为B
A[10,0)
*u =1 *u =-1
ft
B
ts
当 t=ts时
122
)(1
2)(2
2
1btbtx
btx
s
s
t
st
0
10
)0(2
)0(1
x
x
102
1
2
1 212
2)(1
)(2
ssst
st
tbtbtx
tx
s
s
BO 段: u*=+1
122
1
22
2
1atatx
atx
当 时, X1=X2=0 ,则:ftt 212 , ff tata
221
2
2
1
2
1ff
f
ttttx
ttx
在 B点应有:
sfs
sfsfs
ttt
ttttt
102
1
2
1
2
1 222
联立求解: 102,10 fs tt
fs
fsfst
ttx
ttttxs
2
22)(1 2
1
2
1
习题 2 分析:设线性状态方程为:
边界条件:12
21
xx
uxx
20)0(2
10)0(1
xx
xx
0
0
)(2
)(1
f
f
t
t
x
x
容许控制为:求最短时间控制 u*(t) 及开关曲线(做出大致图形)
1u
分析 : 根据最小值原理: 1221 )(1 xuxH
12
2
22
1
x
H
x
H
)(1sgn* tu
则: )sin(,0, 111121 tC
...1,1,1,1* u 切换周期为
当 u*=+1 时,12
21 1
xx
xx
1
2
2
1 1
x
x
dx
dx
1222
1 22
1
2
1cxxx
Cxx 22
21 )1(
是一组同心圆,圆心为( 0,1 )同理,当 u*=-1 时,可得:
Cxx 22
21 )1(
只有 NO右半圆及 MO坐半圆弧能够到达原点,, u*的切换周期为 ,曲线如图。
是一组同心圆,圆心为( 0, -1 )
1x
2x
M
O
N
箭头方向:以 u=+1 为例,当 X2>1 时,
∴ X1 ↑, X2 ↓当 X2<1 时, X1 ↓, X2 ↓所以箭头如图
0)1( 22
21 Cxx
当相点运动到 或 上的任意一点时 ,均可在相应的控制律 u=+1或 u=-1 作用下,沿 或 最快地到达原点。
0r 0
r
0r
0r
现在改查最优轨线的倒数第二段。设 u*(t) 的最后一次切换发生在 上的 A点,则倒数第二段的控制必有: u=-1 ,其最优轨线必为( 0 , -1 )为圆心的圆弧。
0r
1x
2x
R
R
1* u
1* u
1
1
0r
0r
A
A
X0
由于时间持续不超过 ,故改圆弧的长度最多等于半圆,到达 A’点,发上第二段转换进而进入倒数第三段 。
由于 A点为 上的任一点,因此 A’点形成以( -3,0 )为圆心, 1 为半径的半圆 。显然: 是 u=-1到 u=+1 的开关曲线,而 则为 u=+1到 u=-1 的开关曲线。同理可取: ,一次类推,可得一系列圆弧,可谓开关曲线。
0r
r0r
r
极小值原理的证明:一、基础证明:
针对定常系统 、),()( UXftX
、00 )( XtX ],[ 0 fttt
末端自由, )]([][min ftXUJ
得出的极小值原理的结论, < 定理 >
二、对于时变系统
),,()( tUXftX
及 ft
tff dttUXLttXuJ0
),,(]),([][
引入新状态变量的方法,将时变系统化为定常系统,利用定常系统极小值原理定理的结论进行证明。
等情况,可通过
极小值原理的应用(时间最优)
已知无阻尼振荡二阶系统的状态方程为:
uxx
xx
1
21
其中 ],0[ ftt
试求最优控制 使系统由任意初态 ),( 2010 xx 以最短时间转移到状态空间原点。
解:由极小值原理,可求取最优控制的必要条件为:
正则方程: uxxH 212211
例:
1u
*u
特征根:复数
uxx
xx
12
21
12
2
21
1
x
H
x
H
边界条件 :
0)(,0)(,)0(,)0( 21202101 ff txtxxxxx
极小值条件 : }sgn{ 2* u
解协状态方程为: )cos(cossin)( 020102 tDttt
所以 )}cos(sgn{ 0* tDu
最优控制特点:
a、 )(2 t 只在某些孤立时刻为 0 ,不存在奇异段,故 为砰 -砰控制 。
b、 的切换次数与系统阶数无关。
c、除首尾两端外,最优控制每隔 π时间切换一次。
*u
*u
20
100
220
210 ;
arctgD
下面分析开关曲线:
首先考虑相平等方程: ux
x
dx
dx
1
2
2
1
若 则:
cxx 22
21 )1( 是一组 (1,0) 为圆心的同心圆。
若 则:
cxx 22
21 )1( 是一组 (-1,0) 为圆心的同心圆。
方向如图:
2211
21 2
1
2
1xcxx
2211
21 2
1
2
1xcxx
2x
1x
or
or
-1 1
1u
1u
显然,只有 c=1 及 1c 两条曲线可到达末端而考虑到最优控制最优一段的时间
间隔≤ π,则最优轨线最后一段必位于下列两条半圆形开关线上。
}0,1)1(|),{(
}0,1)1(|),{(
222
2121
0
222
2121
0
xxxxxr
xxxxxr
当相点运动到 00 rr 或上的任一点时,均可在相应的控制律U=+1或U=-1 作用下,沿
00 rr 或 很快地到达原点。
现在考查最优轨线的倒数第二段。
设 的最优一次切换发生在 0r 的 A点,则倒数第二段的控制必为: 1* u
轨迹为 (-1,0) 为圆心的圆弧。考虑到第二段在时间上不大于 π。故设圆弧最多等于
半圆,到达 A发生倒数第二段转换,进入倒数第三段。
最优控制在某曲线上进行切换的曲线称为开关曲线。
*u
由于 A点可为 0r 上的任一点,所以 A点形成 (-3,0) 为圆心, 1 为半径的半圆。
}0,1)3(|),{( 222
2121
1 xxxxxr
显然 0r1r
: 到 的开关曲线: 到 的开关曲线
同理:对亢于 0r
}0,1)3(|),{( 222
2121
1 xxxxxr
可得:
依上述过程类推可得一系列圆弧 :
}0,1)]12([|),{(
}0,1)]12([|),{(
222
2121
222
2121
xxjxxxr
xxjxxxrj
j
1u
1u
1u
1u
开关曲线 r将相平等分为两部分 RR ,
所以
rRxx
rRxx
),(,1
),(,1
21
21
起点 ),( 2010 xx 的最优轨线
这些圆弧的全体构成了所求问题的开关曲线:
*u
所以总的控制作用: }1,1,1,1,1{* u 共转换四次。EO弧 : 回到终点。DE弧: ,(+1,0) 为圆心, EO1 为半径,交开关曲线于 E 。 CD弧 : ,(+1,0) 为圆心, CO2 为半径,交开关曲线于 D
BC弧: 1* u
,(-1,0) 为圆心,
,(-1,0) 为圆心, BO1 为半径圆弧,交开关曲线于 C
AB弧: AO2 为半径的圆弧交于开关曲线 B 1* u
1* u
1* u
1* u
1x
2x
1o
2o
E
A
B
C
D
1* u
1* uR
r
r
1* uR
1* u
),( 2010 xx
习题:已知线性定常系状态方程:
)()(
)()(.
2
2
.
1
tutx
txtx其中 , ],0[ ftt
求 使系统由任意初态 202101 )0(,)0( xxxx 以最短时间转移到目标集:
0)()](),([ 121 fff txtxtxg
习题:已知受控系统:
ux
xx.
2
2
.
1,目标集: }.0|),{( 2121 xxxxM
求满足约束条件 的时间最优控制函数,求开关曲线
1)( tu
)(* tu
1)( tu
注:在时间最优控制中,我们知道: )}(],),({[)}({* tttxsGNBtqSGNu T
rjtttxbtqu Tjjj ,...3,2,1)}(],),([sgn{)}(sgn{* 即:
可知: )()(** ttxu 及与 之间的关系
由前分析知:
0)( tq j 时,可由极值条件确定 ,正常情况; 0)( tq j 时,可为满足约束条件的任意值,为不定状态,异步情况。
但是,奇异状态并不表示时间最优控制不存在,只表明用极小值原理
不能确定最优解,需采用奇异最优控制方法,以下介绍:
*u
< 定义 1> 若在区间 [ Tt ,0 ]内,存在时间的可数集合 : jjj ttt ...., 21
即: ,3,2,1],,[ 0 Ttt j 使得对所有的 rj ,......2,1
均有:
)()( tbq Tjtj 则称时间最优控制是正常的。
< 定义 2> 若在区间 ],[ 0 Tt 内,存在一个(或多个)子区间 ],[],[ 021 Tttt ,
使得对所有 ],[ 21 ttt ,有 0)()),(()( tttXBq Tjtj 则称时间最优
],[ 21 tt控制异步。 奇异区间。
tt
tt
非零
0
如何判定系统是正常的,还是奇异的。
设计时间最优控制之前总希望知道问题是否有解?是否有唯一解?问题是正常
的,还是奇异的。初次之外,我们还希望了解时间最优控制的共同特点和性质。
这种一般规律的认识和了解会有助于具体系统的设计计算。
然而:对任意的非线性系统和任意的目标集,没有明确结论。
对于线性定常系统,可以回答上述问题,(目标集假设为坐标原点)
至于线性时变系统及一般性目标集问题,只有其中的部分结论适用。
< 问题 1> :已知线性时不变系统, )()()(.
tButAXtX 时完全能控的
求满足下列不等式或约束的 r维容许控制向量 U(t), rju tj ......2,1,1|| )(
由已知初态 00 )( XtX 转移到状态空间原点的时间最短,根据极小值原理,
使系统
< 问题 > 最优控制的必要条件如下:
)()(
)}({)]([)(
0)(
)0(
)(
)()()(
*
0
.
tBtq
tBSGNtqSGNtU
TX
XX
tA
tBUtAXtX
T
T
T
=-。
或 rjtbqtU Tjtjj ....3,2,1)}(sgn{}sgn{)( )(
*
jb 为 B 的第 j列向量
0)()()()(1)()()()(1 TBUTTAXTtButtAXtH TTTT
从上述必要条件出发,可得一些有用的结论:
< 定理 1> 当且仅当 个矩阵 rjbAbAAbbG jn
jjjj ....2,1],|......|||[ 12
中至少有一个奇异矩阵时 < 问题 1> 是奇异的。
证明:由已知条件: 0)( tATet
由 6 式知, 0)( t 否则 1 = 0 错
}sgn{}sgn{)(
][)(
00*
0*
jAtTtAT
jj
tAT
beebtU
eBSGNtUT
T
若问题正常,则对于给定的初协态 0 ,可唯一确定砰-砰控制
怎样知道是正常还是奇异呢?推证定理。
假定 < 问题 1> 是奇异的,至少存在一段时间 ],0[],[ 21 Ttt 使某 )(tq j 对所有
],[ 21 ttt 均成立: 0)( 0 j
AtTj betq
r
由此: 0)(......0)(,0)( 1...
tqtqtq njjj
考虑到 A与 Ate 可前后交换顺序,则有:
令: nnjn
jjj bAAbbG ]....||[ 1
则关于 n维待定向量 0 的代数方程组可写成: 00 j
AtT Ge
所有 ],[ 21 ttt 由于 Ate 为奇异矩阵,为使 0 ,则 jG 必为奇异矩阵,
即: 0det jG 奇异控制问题的必要条件。可以证明其为充分条件
< 定理 1> 得证:由设定理可进一步得出 < 问题 > 为正常得充分必要条件
0)()1(
0)(
0)(
0)(
)1(0
)1(1
20
..
0
.
0
jnAtTn
jn
jAtT
j
jAtT
j
jAtT
j
bAetq
bAetq
Abetq
betq
< 定理 2> :当且仅当 rjbAbAAbbG jn
jjjj ,....2,1],|.....|||[ 12 全部为非
奇异矩阵,则时间最优控制是正常得。
< 定理 1>和 < 定理 2> 得推证过程都没有设计到目标集,因此,不论目标集如何,只
要受控系统是线性时不变得,因此两个定理可用。
将满足 < 定理 2> 得系统叫做正常系统。正常受控系统,其时间最优控制问题也是正
常得,对于正常问题,由下列存在性与唯一性定理。
< 定理 3> 若受控系统 BuAxX .
是正常的,且时间最优控制存在,则最优控制
必定唯一。
证明:见“百年学书” p176页。
另外,我们知道,一个完全能控的线性定常系统: BuAxX .
必需满足
nBABAABBrankrankG n ]|....|||[ 12 n: 系统维数
若把系统表征为: rrubuBuBAxX ......2211
.
其中 ruuu ..., 21 控制分量
正常问题要求 rjbA j ...2,1),,( 都是完全能控。
即: nbAAbbrankrankG jn
jjj ]|......||[ 1
说明:每一个控制分量 )(tu j 均能单独使受控系统由任意初态在有限时间内转
移到坐标原点。
据此,常可很容易地判断问题的时间最优控制是否属于正常情况。
显然:一个输入完全能控的线性不变系统,其时间最优控制问题也一定是正常的。
燃料最优控制的一般情况,接 < 之二本>
< 问题 > 已知线性定常系统: ],0[,,....2,1,1|)(|
.
Ttrjtu
BuAxX
j
求最优控制 )(* tu ,使系统由任意初态 0)0( xx 转移到目标集:
},....2,1,0)]([|)({ piTxgTxM i
且使性能指标:
T
j
r
jjj cdttucJ
01
0,|)(| 为最小, T未知。
分析: BuAxtucH TTjj
T
j
|)(|
1
若记: rjbtq Tjj .....2,1,)(
:jb 为 B 的第 j列向量,
则H种与 U(t) 由关的部分 R(u) 为: })(
)(|)({|)(1
j
jjjj
r
j c
tqtutucuR
根据极小值原理, *u 应使H或 R( u)取极小,则:
}])(
)(|)({|min[
|})(
)()({|min)(min
|1)(|1
1)()(
j
jjj
tuj
r
j
j
jjjj
r
jvtuvtu
c
tqtutuc
c
tqtutucuR
j
求出: rjc
tqdeZtu
j
jj ....3,2,1},
)({)(* 这就是燃料最优控制。
如何判定燃料最优控制是正常还是奇异?
< 定理 >< 问题 > 为正常得充分条件为 ,对所有 j= 1 , 2 , 3 ,…… r,均有 0)det( jAG
其中 ]|....||[ )1(j
njjj bAAbbG
< 问题 > 为奇异得必要条件为 :对于某个或某些 有: 0)det( jAG
证明从略
j
注意:在燃料最优控制中,区分正常情况与时间最优控制不同。首先:
1.对时间最优 :系统正常时,最优控制问题一定是正常的。
2. 对燃料最优:即使系统正常( 0det jG ),如果系统矩阵 A是奇异得( A有零
特征值,即系统中含有积分环节),问题仍可能属于奇异情况。
只有当系统是正常得,且 A有事非奇异矩阵,才能保证燃料最优控制有正常解。
3 、另外( 1 )式为系统正常得充分条件,次条件不满足时,
系统仍可能有正常解(有可能正常或有可能奇异)视初始状态而定。
1 ) 试证明系统由初态:
2 )欲求系统由初态 X(0) 最快地转移到终态
习题:设二阶系统
ux
xx
.
2
2
.
11|| u
所消耗燃料为最小得最优控制
0
0)4(
1
1)0( XX 转移到
为:
4)35(2
11
)35(2
1)35(
2
10
)35(2
101
)(*
t
t
t
tu
*0)( ff ttx 。求
2 、二阶空间控制系统的状态方程为:
)()()()(
)()(
12
.
2
2
.
1
tutxtxtx
txtx
不等式控制约束 Utu |)(| ,试求使系统由初态 Tuxxx ],[)0( 10 达到平衡状态
0)( ftx 的最短时间最优控制。
关于“二次积分模型”的燃料最优控制问题的进一步讨论:
)()(
)()(.
2
2
.
tutx
txtx系统:
],0[,1|)(| ftttu
求 )(* tu ,使系统由任意初态( 21 , )转移到状态空间原点,且使性能指标:
T
dttuJ0
|)(| 为最小值, T自由。
解 :求解最优解的必要条件:
1 )正则方程: uxuH 221||
则:
11
.
2
1
.
1
2
.
2
.
1
0
x
H
x
H
ux
xx
2 )边界条件: 22
11
)0(
)0(
x
x
0)(
0)(
2
1
f
f
tx
tx
3 )极小值条件: uuuu 2*
2* ||||
4 )H函数变化率: 0)()()()(|)(||| *221
*221
* fffff tuttxttuuxu
则: )}({)( 2* tdeZtu
)(2 t 仅在有限个点上为 1 ,则正常; )(2 t 在一段区间上为 1 ,则奇异。
具体分析:
解协状态方程: 101 )( t 常数, tt 10202 )(
2010 , 的不同,系统有可能为正常或奇异。
<1> 奇异情况:
若 010 ,使系H的变化规律 0)(* tH 成立,必有: 1)(220 t 奇异。
无法用极小值原理求解。
<2> 当 010 时, 10202 )( t 是时间的线性函数,这时至多有两个
点满足 1|)(| 2 t 正常情况
最优控制必为三位式控制,且至多有两次切换,候选解为: {0},{+1},{-1}, {+1,0,-1}
,{-1,0,+1},{+1,0},{-1,0}, {0,-1},{0,+1} 由于 结尾的三种控制序列不可能为最优
控制。
0u
因为有状态方程知:是一组不通过原点的平行线或轴上的孤立点
所以可能的最优控制序列为:六种可能: {+1},{-1},{0,-1},{0,+1}{+1,0,-1}
{-1,0,+1}
为了进一步分析燃料最优控制解的性质,转向相平等分析:
当 u=+1,u=-1 时,有初态转移到原点的两条轨线为: rr 和
|}|2
1|),{(
}0,2
1|),{(
}0,2
1|),{(
22121
222121
222121
xxxxxrrr
xxxxxr
xxxxxr
及 1x 轴将相平等分为四部分:r
}0,2
1|),{(
}0,2
1|),{(
}0,2
1|),{(
}0,2
1|),{(
2221214
2221213
2221212
2221211
xxxxxR
xxxxxR
xxxxxR
xxxxxR
当系统初始状态位于不同区域时,解大不相同。
),( 21 1 ) 位于 r 上, 1* u 是唯一的燃料最优控制,且 || 2* J
位于 ),( 21 4R 时, }1,0{* u 时燃料最优控制,且时间最短
分析: *u的可能选择: {0,+1},{-1,0,+1}分别计算两种轨线的燃料最优值,取其
最小者,即为所求。
同理: ),( 21 位于 2R 时,
}1,0{)(* tu
}1,0{)(* tu 为转移时间 最短的燃料最优控制
2 )
ft
分析:设 r),( 21
)()(
)()(.
2
2
.
1
tutx
txtx对系统 求解积分并代入 )0,0(),,( 21 初、末条件可得:
T
dttu02 )(
进而 : TT
tuJdttudttu002 )]([|)(||)(|||
说明:燃料消耗的下限为: || 2 。因此,只要能找到 *u ,使系统由初态 ),( 21
转移到 (0,0) ,并且所消耗燃料为 || 2* J ,则此控制必为最优控制
设 ABOu ]1,0[)1( 下计算 )2()1( ,uu 两种控制所消耗燃料
T
tBOABB
dttuJJtuJ |||)(|])([ 2
1
是燃料最优
|||||)1(||||1|])([ 2200 2
2
dtdtJJJJJtuJcc tt
DOACDBCDAC
所以不是燃料最优
若 采用的控制方式为:
可以证明,其仍然三位燃料最优控制
只是:并不是时间也最优。
仅有 ABO 为燃料最优,且所用时间为最短。
)、( 21,)3 位于 31 RR或 内时,
设 121 ),( R
若燃料最优控制存在,必有: || 2* J 则在控制候选函数中,仅有 u={-1,0,+1}
可将系统转移到坐标原点。
但是,此时 || 2J ,不是燃料最优控制
所以无解,但存在 燃料最优
)(tu )()( tvtu )(tu
tct Dt Et Ft ft1x2x
AB
C
D
E
F
0
2
1x
2x A
CD0
若选用 ={-1,0} 则系统在 u=-1 作用下,将状态转移到 1x 轴上时所消耗燃料正好
为,相应状态记为 (a,0); 然后取 ,系统不在消耗燃料 ,但状态会保持在 (a,0) 不动,
不会到达坐标原点。所以 ={-1,0} 不满足要求
但可得到启示,进而有如下结论:
燃料最优控制解。
< 命题 > :若初态 121 ),( R ,则对任给 0 ,使系统 ),( 21.
2
2
.
1 由
ux
xx
转移到( 0 , 0 ),且燃料消耗量为: || 2J 的燃料最优控制为 *u= {-1,0,+1}
证明方法见书:对于 u={-1,0,+1} 分别确定各段的燃料最优值 J, 最后求和。
因此 足够小时, 燃料最优接近于燃料最优。
存在问题: 燃料最优存在,但由 C 点 D点的状态转移时间为: a
TCD2
是很长的。
)(tu
0u
)(tu
初态 321 ),( R 时,有相同的结论。
综上所述 ,可得燃料最优控制为:
注意 : 上述控制律同时也保证了转移时间最小。
4221 ),( RRxx
3121*
221*
421*
21*
21*
,
),(0
),.(0
),(1
),(1
RRxxu
Rxxu
Rxxu
rxxu
rxxu
)(无解
若不考虑转移时间 ,则 p),( 21 有唯一解 .
4221 ),( RR 有无穷多解
3121 ),( RR 无解
燃料最优控制问题虽存在最优解,但因状态转移时间 )( CDT 过长 ,从而使
系统总转移时间过长。
时间 -燃料最优控制 .自学 ,分析方法类似。
作业1:设二阶系统方程:
其中 。试确定将系统由已知初态最快地转移到 的最优控制函数
0)0(
)()(2
)(1)( 1
0
11
10
xx
ux
xx t
t
tt
1u 0ft
x )(* tu
作业2:已知系统的状态方程
试求最优控制 使系统曲任意初态最快的转移到 的状态。写出开关曲线方程,并绘出开关曲线的图形。
)(* tu1,2 )(2)(1
ff tt xx
)()(2
)(2)(1
tt
tt
ux
xx
1u
作业3:给定二阶系统
控制约束: 试确定使系统由已知初态最快地转移到坐标原点的最优控制
1,24
1,
)0(2)(2)(1)(2
)0(1)(2)(1
xuxxx
xxx
tttt
tt
11 )( tu
)(* tu
作业4:设二阶系统:
控制约束 试确定使系统由已知初态最快地转移到坐标原点的最优控制和开关曲线。
1,
1,
)0(2)(2)(2
)0(1)(2)(1
xuxx
xxx
ttt
tt
11 )( tu
作业6:系统状态方程
求时间最优控制函数,使系统由 转移到终端状态 ,并求开关曲线,绘出图形。
)()(2
)(2)(1
tt
tt
ux
xx
1u
Txxx 20100 ,0,0 )(2)(1
ff tt xx
f
T
ff
ff
ff
t
g
ttH
ttH
XJ tt
)(
)(
]),([**
**
末端受约束
末端自由
若
f
Tf
f
ft
t
t
gtH
tH
tH
dttUXLJf
)(:
0)(:
0)(:
),,(
**
**
**
0
末端受约束
末端自由
末端固定
若
沿最优轨线,哈密顿函数:
ft
tff dtUXh
ttUtXHtUXH ),,,(
),),(),([),,,( ****