第三章极小值原理及应用

第三章极小值原理及应用第三章极小值原理及应用经典变分法缺陷：

1 、应用前提： a 、控制量 u(t) 的取值不受任何限制，没有任何不等式约束。

b 、 f、 L 、等函数对其自变量有充分可微性。

2 、实际控制要求：

a 、控制量 u 受不等式约束，如： 0)( uM i ， i=1,2,3……

b 、性能指标有时并不完全可微

如：燃料最优控制： ft

tdttuJ

0

)(

20 uuu

若采用经典变分：。极小值原理。实际应为 0*

1* ;,0 UUUU

U

H

10 uuu

0U 1U

H

UJ ][

u

0U 1U 2U

H

UJ ][

u0U 1U

若采用经典变分法： 0U

H 不再适用，求不出解来

实际应为 0* UU 极小值原理

10 uuu

若在容许控制范围内， J或 H 有极值且唯一，用极小值原理与经典变分法，所得

结论一致。

0U 1U

H

UJ ][

u*U

一、 < 定理 > 极小值原理： [ 时变系统 ]

时变受控系统 ),,( tUXfX

，其中控制向量 rRtu )( ，为容许控制

域， U(t) 是在内取值的任何分段连续函数，为使状态向量由初始

00 )( XtX 转移到末端 )( ftX ， )( ftX 满足约束： 0]),([ ff ttXg

ft，

未定，并使性能指标达 ft

tff dtttUtXLttXJ0

]),(),([]),([

到极小值。设 )(* tU 和 *ft 是如上 J 为最小的最优解， )(* tX 为最优状态轨

为 0的 n 维向量 )(t ，满足 :

1 、规范方程：

X

H

tUXfX

),,(

2 、边界条件：

0)(

])(

)],([[

)(

]),([)(

)( 00

f

T

ft

f

ffT

f

fff

t

g

tH

tX

ttXg

tX

ttXt

XtX

f

线，则必存在不

3 、与 )(* tU 对应的哈密顿函数 H 取极小值。]),(),(),([min]),(),(),([ **

)(

*** tttUtXHtttUtXHtu

即 : 设 )(),( ** ttX 为满足状态方程和协状态方程的最优解。

在中。把 H 仅看作 U 的函数，若 J 为最小，必要条)(* tU 使得

]),(),(),([ *** tttUtXH

仅看作 U 的函数时也取最小值。极小值原理的证明：应用数学基础较多，有些书中用很大篇幅进行

二、极小值原理的意义：1 、容许控制条件放宽

变分法：在整个控制域，对 U 没有约束 0u

H

有时计算不易。极小值原理： H在 U 的约束闭集中取极小值。

变分法仅为极小值原理的一个特例。

]),(),(),([ *** tttUtXH

0u

H

件为

证明，省略。

且即使 U 不受限制，

2 、最优控制 *U 使哈密顿函数 H 取极小值，极小值原理由此得名。

这一原理是苏联学者 “庞特里亚金”等人首先提出，而后加以证明得。

在证明过程中：与 H 得符号与这里所定义的相反。 HH _

)](),(),([max)](),(),([ *_

)(

**_

tuttXHtUttXHtu

∴所以有的文献中也称为“极大值原理”。

3、 H对 u 没有可微要求，因此应用拓宽。4 、极小值原来是求取最优控制的必要条件，非充分条件。即：满足极小值原理不一定 J 取极小值 , 需进一步判断。

一般 : 对于实际系统有最优解有唯一解最优解－－－－－－－－根据物理意义

－－－－－－－－极小值原理－－

三、几种边界条件得讨论：上面所讨论的是 0t 和 )( 0tX 已知。 )( ftX 受约束， ft 自由的最一般

情况。若 ft 和末端状态不同，只需改变极小值原理的边界条件即可。1 ） ftt ,0 已知， ff XtXXtX )(,)( 00 边界条件为： 2) 000 )(, XtXt 给定， )( ftX 自由， ft 未给定，

边界条件： ftf X

tXtX |)(,)( 00

确定 :ft 0

f

f ttH

3) ftt ,0 已知， 00 )( XtX 给定 , 末端受约束 0]),([ ff ttXg

边界条件为 :

0]),([

)(

)( 00

ff

f

T

ff

ttXg

tX

gt

Xt

XtX

若 ft 自由 : 外加 : 0|

f

T

ft t

g

tH

f

ff XtXXtX )(,)( 00

四、例题分析 : 设一阶系统状态方程：)()()( tutxtx

x(0)=5

控制约束 : 15.0 u试求使性能指标 :

1

0)]()([ dttutxJ

为极小值的最优控制及最优性能指标 *J

解 : 定常系统 , ft 固定 , 末端自由问题)1()1()( uxuxuxH

根据极小值原理 ,使 H 绝对极小相当于使 J 为极小

所以 )(* tU5.0

1

由协状态方程 : 1)()];(1[)(

tcettX

Ht

)(* tU

1

1

由横截条件 : 1)(;;01)1( 11 tetecce

显然 : 当 1)( st 时， )(* tU 产生切换

307.0,11)( 1 s

ts tet s

所以 )(* tU5.0

1

)(tx5.0)(

1)(

tx

tx

)(tx5.0

1

2

1

t

t

ec

ec

307.00 t

1307.0 t

307.00 t

1307.0 t

307.00 t

1307.0 t

由 x(0)=5 代入 , 得 41 c

所以 14)(* tetx

令 t=0.307 可得 0.307≤t≤1时 x(t) 的初始条件 :

44.614)307.0( 307.0 ex 解得 34.42 c

所以 )(* tX5.034.4

14

t

t

e

e

将 ** ,UX 代入 J 可得 :

64.8)]()([1

0

*** dttUtXJ

307.00 t

307.00 t

1307.0 t

例 2:

10)0(

)(2

1)(min

1

0

22

x

uxx

dtuxuJ

求 *u

a)对 U 没有约束 b) |u| 3.0

解 :a)

*

22

0

)(2

1

2

1

0)1(

U

u

H

uxuxH

xuxx

xx

H

0

10)0( x

0)1(

解得 : tt

tt

eet

eetx22

22*

)12(9.9)12(1.0)(

9.91.0)(

b) |u| 3.0

由极小值原理 : }sgn{* U

当 t=1 时 0

在 [0,1] 区间 0)( t

所以 3.0)(* tU

五、极小值原理中哈密顿函数 H 的性质讨论用途：对于所求解的最优控制的验证，或帮助求解最优控制及

1 、线性定常系统： ),( UXfX

ft、)1 固定， dtUXLtXJft

tf 0

),()]([ 包括

ft

t

f

dtUXLJ

tXJ

0),(

)]([

( 与末端状态无关 )则 : )()( **

ftHtH 常数。 { t

H

dt

dH

H 中不显函 t}

ft、)2 自由，

f

f

t

t

t

tf

f

dtUXL

dtUXLtX

tX

J

0

0

),(

),()]([

)]([

沿最优控制轨线： 0)()( *** ftHtH （与末端状态无关）

因为 )(* tH 中不显函 t 所以 )()( ***ftHtH 常数

又因为 ft 自由 , 0)(;0;0)( ****

fff

f tHtt

tH

*ft

2 、对于时变系统： ),,( tUXfX

ft、)1 固定 :

f

f

t

tff

t

t

ff

dttUXLttX

dttUXL

ttX

J

0

0

),,(]),([

),,(

]),([

ft

tf dH

tHtH0

)()( **

ft、)2 自由 : ft

tff dttUXLttXJ0

),,(]),([ ，末端 0)],([ ff ttXg

0)( **

f

T

ff t

g

ttH

若末端自由 : f

f ttH

)( **

证明：见胡寿松 P91页

第四节最小值原理在实际中的应用

几个典型例子： 1. 时间最优控制问题 2. 最小燃料消耗问题 3. 最小能量控制问题 4. 线性调节问题介绍重点：时间最优控制问题（其他求解思想与此类似）

一、时间最优控制问题

所谓时间最优控制，就是把系统从初始状态转移到目标状态的时间作为性能指标，即使转移时间为最短。

这也是发展得最早的最优控制问题之一。

1 、问题提出（时变系统）已知受控系统并设 f 和 B对 X(t)和 t 连续可微。

0)0(),()),(()),(( XXtuttXBttXfX

1)( tju rj ......2,1

0)( ftxg

00

ttdtJft

t f ft

X： n×1 状态向量 u ： r×1 控制向量 f ： n×1 函数向量 B： n×r 函数值矩阵

控制向量约束条件 :

末端状态： g ： p ×1 维函数向量目标函数： : 自由

问题：寻求最优控制 u*(t) ，使系统由初态到终态，目标函数 J 为最小

应用最小值原理进行问题的求解步骤：⑴列写哈密顿函数

)(),()(),()(1

)(),(),()(1

),(),(),(

tuttxBtttxft

tuttxBttxft

tttutxH

TT

T

⑵由控制方程求 u*(t)

u 有约束， ∴ H在 u* 上取得极小值，即：

令 q:r ×1 维向量函数

[注： ]

)(),(*)(*min),(),(*),(*1

tuttxBttttutxH T

u

T

j

1)(*),(*)(* nnrT tttxBtq

TTT ABBA

r

jjj

u

T

u

T tutqtutqtutqjj 111

)()(min)()(*min)(*)(*

)()(min1 1

tutq jj

r

j u j

则有： j =1， 2…r

最优控制 u*(t) 是使为极小，则：

)()()(min1 1

tqtutq jjj

r

j u j

)()( tutq jj

)(* tu j0)(*,

0)(*,

0)(*,

tq

tq

tq

j

j

j

不定

可见：当时，有确定值，正常情况当时，不定，奇异情况

0)( tq j )(* tu j0)( tq j )(* tu j

＋１

－１t

+1

-1

u*(t)

奇异

我们仅研究正常情况u*(t)写成符号函数 sgn{ }形式则 j =1， 2…r向量形式： u*(t)=-sgn{q*(t)} =-sgn{ }

)(*sgn)(* tqtu jj

)(*),( tttxBT

⑶ 根据规范方程：

)()(

)(),(),(

tX

Ht

tuttxBttxfX

及初始条件和横截条件：

0

00

ff tt

T

Ht

g

XtX

f

ffT

f tX

ttxgt

,

可求得 x*(t) 及 )(* t

⑷求最优控制 u*(t) )(*),(*sgn)(* tttxBtu T →砰一砰控制

2 、砰一砰控制定理：要求控制量始终为最大或最小设 u*(t) 是上述问题提出的解， x*(t), 是相应的状态轨线和协状态轨线。若问题正常 ( 非奇异 ) ，则这是一个继电器控制方式，称为砰一砰控制

)(* t

)(*),(sgn)(* tttxBtu T

3 、线性定常系统的最小时间控制问题的解法：

⑴如何确定最优控制 u*(t) 设线性定常系统的状态方程为：

0)0(),()()( XXtButAXtX

其中， X： n ×1 维状态向量 u ：控制变量 A， B 分别为 n ×n， n ×1矩阵约束条件：　　　　　　　　末端条件：

1)( tu

0ftX

求　　　，使系统状态从　　　　转移到　　　　　　所用时间最短，即使　　　　　　为最小

)(* tu 00 )( XtX 0)( ff XtX

ft

ftdtJ0

⑵问题的求解①首先列写哈密顿函数：

)()()()(1 tButtAXtH TT

②根据极小值原理分析可得： )(*sgn)(* tBtu T

③有规范方程： BtBtAXtBXtAXX T )(sgn)()()( *

BtT )(sgn * 注：为标量函数，题意要求)(tu

000 )()(

0)()(

tA

TT

T

ett

tAtAX

H

代入　　　得：)(* tu

Betu

TtATo

T

sgn)(*

Be AtTo

sgn

　　可见，　　的值完全由　的符号决定　　但是，　的确定是不容易的。因为它还和系统的状态变量有关系。通常采用的方法是：

)(* tu oo

先设一个　，求出　　，求出　　，判定若为０，则　　即为所求；否则修正　　重复上述过程

o )(t )(tX ?0)( ftX

)(t 0

⑶开关次数定理：设线性系统是正常的（不存在非奇异问题），若矩阵 A 的特征值均为实数，假定时间最优控制存在，并令其为则 u*(t) 的切换次数最多不超过（ n-1 ）次，n 为系统的维数。

)()( tButAXX

,.....2,1),(* rjtu j ,1ju

以下将根据极小值定理，开关次数定理及相平于状态空间分析，求 u*

例题分析 1 ：时间最优控制问题ftJ min

ux

xx

2

21

0

1

)(1

)0(1

ftx

x0

1

)(2

)0(2

ftx

x

求 u*(t)1u

解：对象为二阶线性系统 [双积分模型的时间最优控制 ]（应用最普通最广泛的一种）

2

221

sgn*

1

u

uxH

由规范方程：

01

1

X

HX

H

11 C

12

2

X

H212 CtC

则

由ux

xx

2

21

21sgn* CtCu

C1， C2 的取值要求：保证0

1

)(1

)0(1

ftx

x

0

1

)(2

)0(2

ftx

x

*ff tt 由开关次数定理知：切换一次，设切换时间为 ts ，则令

为了求出 ts ，必须首先找出状态在平面上的转移轨线。

1

2)(2 ,0

C

Ctst

21xx

t2

t

t

0

0

1

1

ts tf

由ux

xx

2

21

设 u=1 ，则

12

21

x

xx

则： 22 atx

122

1 2

1atatx

)2

()(2

1 22

12

2a

aat

22

22

1Kx

如图 (a) 所示，为一组抛物线，当 K=0 时经过原点 [pos]

2

22

12a

aK 其中

t

s

p

0

X2

若 u=-1 ，则

12

21

x

xx

22 btx

122

1 2

1btbtx

12

22

1Kx

2111 2

1bbK

为一组抛物线，如图 (b) ，当 K1=0 时过原点[NOT]

X1

X2

u=-1

N

T

o

显然：若初始状态在 NO 或在 PO 上，可进一步转移到目标原点，称 NOP 为开关曲线

)0(2)0(1 , xx

由题意假设

它落在 u=-1 相应抛物线组中的一条上，即AQB ，这时在 u=-1 的作用下，

状态由沿 AQB

转移到 B ，进行切换， B位于 PO 上，一步可到达原点。

1

1)0(X

1

1)0(X

N

X2

o

p

X1B u=+1

u=-1

A[1,1]

因此，问题的解为 :①先以 u=-1 控制到达 Po曲线上的 B点②以 u=+1沿开关曲线 Po 到达原点从初始状态到达末端状态的轨迹为 AQBO ，即 u*= 进而，可求出转移时间 ts 及最优时间把状态轨线控制序列分成若干段，逐步算出所需时间，最后相加。求及 ts在 AQB段 ,u=-1,

切换次数为 1

-1,+1t f

*

t f

bbtxbxt

t

12

2

1

22

2

1

1

10x

121 bb

到达 B点：t=ts,

1

2

1

1

2

1

2

tttx

ttx

sss

ss

BO 段：u=+1 ， 12

21

22

2

1atatx

atx

当时，，则ftt 0)(2)(1 ff tt xx

21

2

2

1f

f

ta

ta

221 2

1

2

1ff ttttx

fttx 2

22)(1

)(2

2

1

2

1fsfst

fst

ttttx

ttx

s

s

在 B点应有：22

)(12

2

1

2

11

2

1

1

fsfsts

sfs

ttttxt

ttt

s

联立求解：即：

2

321

2

31

f

s

t

t2

321* ft

1

1*u

2

321

2

31

2

310

t

t

例题分析 2 ：二阶积分系统的最小时间控制系统

ux

x x

21u

最小时间控制问题：求 u*(t), 使系统由初态

xxxx

20

100

0

转移到末端状态的时间为最小，且满足

0

0)(t fx 1u

解：⑴列写哈密顿函数： uH x 2211 2

*sgnu

⑵求解协状态方程

12

2

11

0

x

xH

H

设

022

011

)0(

)0(

，则：

constt 011)( tt 01022

)(

⑶确定控制序列：显然，由⑵知，为一条直线，其形式有可能为 4种

)(sgn* 2 tu )(2 t

因此， u 相应的控制序列为： {-1}， {+1， -1}， {-1，+1}{+1}

2 22

2

2 2

2 2

-1 -1u u

u

u

+1

0,0 0201 0,0 0201

0,0 0201 0,0 0201

⑷状态轨线：由⑶知， u有 4 种可能的取值，其值为 ±1 ，代入状态方程： dBuexetx

t tAAt )()(0

)()0(

10

1 teAt

注： 11 AsIeAt

10

11

0

11

0

1 211

1 t

s

sss

s

)(2

1

)(1

0

10

1

10

1

10

1)(

2

02

0201

)(2

)(1

002

01

tut

tx

txx

x

x

dut

x

xttx

t

t

t

利用上式，消去中间变量 t ，可导出 x1和 x2 的关系为：

)(2

1)(

2

1)( )(

22

202011 tuxtuxxtx t 1)( tu

其在 X1， X2平面上为一组抛物线如图： u=+1 为实 u=-1 为虚

X1

X2

B

A

u=+1u=-1

⑸确定开关曲线：使系统状态直接回到末端状态的曲线AO和 BO总的开关曲线： AOB显然：

xxxxx

xxxxx

xxxxx

AOB

AO

BO

22121

2

2

2121

2

2

2121

2

1,

0,2

1,

0,2

1,

AOB 将状态平面分为两部分和R

R

显然：

xxxxxR

xxxxxR

2212,1

2212,1

2

1

2

1

X1

X2

B

A

Ou=-1R

R

⑹确定最优控制作用 u* u* 与初始状态有关

02

01

x

x

分析： ①若位于 BO 上，则 u*= +1； ②若位于 AO 上，则 u*= -1； ③若位于内，则 u*=[ -1， +1]； ④若位于内，则 u*=[ +1， -1]；

02,01 xx

02,01 xx

02,01 xx R 02,01 xx R

③④在开关曲线上为转折点

例 3 ：升降机的快速降落问题：设有一升降机W ，它的质量为 1 ，升降机一方面受重力 g 的作用，另一方面受控制器的作用力u(t) 的作用，且（M＞ g 是常数）设 x(t) 为升降机离开地面的距离，当 t= 时， [离地面距离 ] [垂直运动速度 ]

,)( Mtu

t0

xtxt

x

x0

20

0

10

)(

)(

问题：求 u*（ t） , 使升降机最快的到达地面，并且到达地面时的速度为零。即： t dtJ f t f0

最小，自由t f

0t fx 0t fx

W

u

gX(t)

解：建立升降机系统的数学模型， F=ma 即： X

dt

xdgu t

2

2

)(

令：

)(2

)(1

t

t

xx

xx

即：gux

xx

2

21

02)0(2

01)0(1

xx

xx

0

0

)(2

)(1

f

f

t

t

x

x

哈密顿函数： guxH 2211 显然，为了使 H 为最小，则 2sgn* Mu

即：

*

*

*

u

Mu

Mu

不确定 0

0

0

)(2

)(2

)(2

t

t

t

协状态方程：即：常数

12

2

21

x

H

x

H

212

11

CtC

C

相应于的 4 种可能， u* 的取值有 4 种可能{+M}， {-M}， {+M,-M}， {-M， +M}因此，下面只研究 u=±M 时升降机的状态轨线

2

设 u=M ，则状态方程为： …① …②① /② ：

是一组抛物线，图中实线箭头表示状态运动的方向

gMx

xx

2

21

CgM

xx

gM

x

dx

dx

22

1

2

2

1

2

1

在此族曲线中，只有到达原点，r

)(2:

22

1 gM

xxr

r

r

设 u=-M ，同理可得：

如图虚线所示CgM

xx

22

1 2

1

只有到达原点， r r)(2

:2

21 gM

xx

rrr 开关曲线r 将相平面分为两部分，在 r下半部的记为，包括在 r 上半部的记位，包括

R

R

r

r

u* 只取 +M或 -M ，切换最多一次，因此可得到结论：ⅰ〈〉初始状态在上，状态沿回原点

xxx 02010, r

Mu * r

ⅱ〈〉当在曲线上时，状态沿回原点

ⅲ〈〉当时，沿相应的虚线抛物线运动到时，沿回到原点。

Rxx

0201,

xx 0201, r

r

Mu *

Mu * r

马上切换r

Mu *

ⅳ〈〉当时，，沿相应的实抛物线运动到时，

Rxx

0201,

Mu * r

马上切换

总之：

xxxxxrr

xxxxxR

xxxxxR

22121

22121

22121

2

1,

2

1,

2

1,

Mu * ，沿回到原点。r

R

R

Mu *

Mu *

Mu *

Mu *

r

r

对于实际问题升降机的分析：它在地面之上，∴ ，处于相平面的右半部分，且设

01x

020x

a〉若，而时状态沿实抛物线运动与轴交于N ，这意味着升降机到达地面时，速度不为 0 ，不合要求。

Rx

0 rx

0

)0( N

<b> 当即开始以最大推力向下最用，使升降机尽快下降。当其状态检测到达时，马上改变控制，使它以的最大推力向上作用，这样升降机将以速度 0 到达地面。

,*,0 MuRX

rMu * Mu *

Mu *

Nr

从上例可以看出：快速最优控制有如下特点：< > u*ⅰ 要么最大，要么最小。< > u*ⅱ 的取值经过有限的（ n-1 ）次（可为最多次）数切换可到达平衡点。< > u*ⅲ 的取值仅在开管曲线上切换。

注意：时间最优控制的应用中，有些实际问题并不要求将相点控制到状态空间原点，而是到某一集合，其分析方法与上类似（若二阶系统为一般的二阶系统，特征值为实数时，分析方法类似；为复数或纯虚数时，开关次数定理不成立，问题较为复杂，如无阻尼振荡二阶系统。

二、燃料最优控制问题节约能源，减少燃料消耗在国民经济各部门中都是一项重要的技术经济课题。在航空和宇航中使用的原料是由地面起飞时带到空间去的。在空中携带的燃料是有限的，要保证长时间的飞行计划，就希望空中的控制系统消耗的燃料最小，而燃料的消耗一般是和控制力 u 的大小成正比的。 U 有正有负。因袭燃料消耗的性能指标：

也可以以升降机系统分析，只是相应于时间最优控制，要求到达地于所用时间最小，

相应于燃料最优控制，要求达到目的地时所用燃料最小

dtuJft 0

ftdtJ

0

dtuJft 0

1 、数学描述 [ 以二阶级分模型的燃料最优控制为例 ]

系统：约束：ux

xx

2

21

1u

要求：系统从初始状态转移到（ 0， 0 ）使最小，给定。

2010 , XX

dtuJft 0

ft

解：应用极小值原理 uxuH 221

1

0

1

*u

1

11

1

2

2

2

)(2* tdezu

正常：仅在有限个点上奇异：至少在一段时间 [t1， t2] 间隔内

1)(2 t

1)(2 t

正常： u* 可取 +1， -1， 0随着 t增大， u* 在三个值上切换，是一种三位控制 {开关控制 } 。奇异：不能用极小值，死区函数。为使Ｈ为最小，则使　　　　为最小uu 2

分析：①若ｕ＝＋１，则　　　　　　　　若使Ｈ最小，则　　　②若ｕ＝－１，则　　　　若使Ｈ最小，则　　　③若

u21 12

uu 22 11 12

01

01

1

2

2

22

uuu

1

1

2

2

0* u

1

0

1

*u

1

11

1

2

2

2

由：1

22

21

x

H

x

H

212

11

CtC

C

和相应的最优控制　　之间的关系：2

,

,

,0

fb

ba

a

ttt

ttt

tt

,1

,1

,1

2

2

2

1*

0*

1*

u

u

u

显然，燃料最优控制也是开关式控制，控制器应为一个具有死区的继电器。

*u

+1

+1

+1

+1

-1

-1

-1

-1tbta tf

at bt和　的计标ux

xx

2

21

当　　　时，　　　　　　　　　　　　　　　　　　　　　　　　　　

1u12

21

22

2

1atatx

atx

Cxx 221 2

1相平面上一组抛物线［实线］

当　　　时，　　　　　　　　　　　　　　　　　　　　　　　　　　

1u Cxx 221 2

1相平面上一组抛物线［虚线］

122

1

22

2

1dtdtx

dtx

当　　　时，　　　　　　　　　　　　　　　　　　　　　　　　　　

0u121

22

btbx

bx

121 btxx

以下两个图形画出了不同初始状态转移轨线

仅为＜１＞进行分析：　　在ｔ＝ｔａ处应满足：　　

122

12

22

2

1dtdtbtb

dtb

aaa

a

相对于Ｘ２而言，ａ点

相对于Ｘ１而言，ａ点

*u =1

*u =0

*u =-1

[1,1]

ab

*u =-1

*u =-1

*u a=0

*u =0

*u =1

*u =1

b

ba

-

在ｔ＝ｔｂ处应满足：

122

12

22

2

1atatbtb

atb

bbb

b

解方程可得ｔａ，ｔｂ的值

习题１：设系统为ux

xx

2

21

0

10

)0(2

)0(1

x

x

0

0

)(2

)(1

f

f

t

t

x

x

1u

求最短时间控制　　　及最短时间)(* tu ft

提示：开关曲线：

221

221

2

1:

2

1:

xxr

xxr

对于ＡＢ段， 1* u

对于ＢＯ段， 1* u

,1,1* u 切换点为Ｂ

A[10,0)

*u =1 *u =-1

ft

B

ts

当 t=ts时

122

)(1

2)(2

2

1btbtx

btx

s

s

t

st

0

10

)0(2

)0(1

x

x

102

1

2

1 212

2)(1

)(2

ssst

st

tbtbtx

tx

s

s

BO 段： u*=+1

122

1

22

2

1atatx

atx

当时， X1=X2=0 ，则：ftt 212 , ff tata

221

2

2

1

2

1ff

f

ttttx

ttx

在 B点应有：

sfs

sfsfs

ttt

ttttt

102

1

2

1

2

1 222

联立求解： 102,10 fs tt

fs

fsfst

ttx

ttttxs

2

22)(1 2

1

2

1

习题 2 分析：设线性状态方程为：

边界条件：12

21

xx

uxx

20)0(2

10)0(1

xx

xx

0

0

)(2

)(1

f

f

t

t

x

x

容许控制为：求最短时间控制 u*(t) 及开关曲线（做出大致图形）

1u

分析 : 根据最小值原理： 1221 )(1 xuxH

12

2

22

1

x

H

x

H

)(1sgn* tu

则： )sin(,0, 111121 tC

...1,1,1,1* u 切换周期为

当 u*=+1 时，12

21 1

xx

xx

1

2

2

1 1

x

x

dx

dx

1222

1 22

1

2

1cxxx

Cxx 22

21 )1(

是一组同心圆，圆心为（ 0，1 ）同理，当 u*=-1 时，可得：

Cxx 22

21 )1(

只有 NO右半圆及 MO坐半圆弧能够到达原点，， u*的切换周期为，曲线如图。

是一组同心圆，圆心为（ 0， -1 ）

1x

2x

M

O

N

箭头方向：以 u=+1 为例，当 X2>1 时，

∴ X1 ↑， X2 ↓当 X2<1 时， X1 ↓， X2 ↓所以箭头如图

0)1( 22

21 Cxx

当相点运动到或上的任意一点时 ,均可在相应的控制律 u=+1或 u=-1 作用下，沿或最快地到达原点。

0r 0

r

0r

0r

现在改查最优轨线的倒数第二段。设 u*(t) 的最后一次切换发生在上的 A点，则倒数第二段的控制必有： u=-1 ，其最优轨线必为（ 0 ， -1 ）为圆心的圆弧。

0r

1x

2x

R

R

1* u

1* u

1

1

0r

0r

A

A

X0

由于时间持续不超过，故改圆弧的长度最多等于半圆，到达 A’点，发上第二段转换进而进入倒数第三段。

由于 A点为上的任一点，因此 A’点形成以（ -3，0 ）为圆心， 1 为半径的半圆。显然：是 u=-1到 u=+1 的开关曲线，而则为 u=+1到 u=-1 的开关曲线。同理可取：　，一次类推，可得一系列圆弧，可谓开关曲线。

0r

r0r

r

极小值原理的证明：一、基础证明：

针对定常系统、),()( UXftX

、00 )( XtX ],[ 0 fttt

末端自由， )]([][min ftXUJ

得出的极小值原理的结论， < 定理 >

二、对于时变系统

),,()( tUXftX

及 ft

tff dttUXLttXuJ0

),,(]),([][

引入新状态变量的方法，将时变系统化为定常系统，利用定常系统极小值原理定理的结论进行证明。

等情况，可通过

极小值原理的应用（时间最优）

已知无阻尼振荡二阶系统的状态方程为：

uxx

xx

1

21

其中 ],0[ ftt

试求最优控制使系统由任意初态 ),( 2010 xx 以最短时间转移到状态空间原点。

解：由极小值原理，可求取最优控制的必要条件为：

正则方程： uxxH 212211

例：

1u

*u

特征根：复数

uxx

xx

12

21

12

2

21

1

x

H

x

H

边界条件 :

0)(,0)(,)0(,)0( 21202101 ff txtxxxxx

极小值条件 : }sgn{ 2* u

解协状态方程为： )cos(cossin)( 020102 tDttt

所以 )}cos(sgn{ 0* tDu

最优控制特点：

a、 )(2 t 只在某些孤立时刻为 0 ，不存在奇异段，故为砰 -砰控制。

b、的切换次数与系统阶数无关。

c、除首尾两端外，最优控制每隔 π时间切换一次。

*u

*u

20

100

220

210 ;

arctgD

下面分析开关曲线：

首先考虑相平等方程： ux

x

dx

dx

1

2

2

1

若则：

cxx 22

21 )1( 是一组 (1,0) 为圆心的同心圆。

若则：

cxx 22

21 )1( 是一组 (-1,0) 为圆心的同心圆。

方向如图：

2211

21 2

1

2

1xcxx

2211

21 2

1

2

1xcxx

2x

1x

or

or

-1 1

1u

1u

显然，只有 c=1 及 1c 两条曲线可到达末端而考虑到最优控制最优一段的时间

间隔≤ π，则最优轨线最后一段必位于下列两条半圆形开关线上。

}0,1)1(|),{(

}0,1)1(|),{(

222

2121

0

222

2121

0

xxxxxr

xxxxxr

当相点运动到 00 rr 或上的任一点时，均可在相应的控制律U=+1或U=-1 作用下，沿

00 rr 或很快地到达原点。

现在考查最优轨线的倒数第二段。

设的最优一次切换发生在 0r 的 A点，则倒数第二段的控制必为： 1* u

轨迹为 (-1,0) 为圆心的圆弧。考虑到第二段在时间上不大于 π。故设圆弧最多等于

半圆，到达 A发生倒数第二段转换，进入倒数第三段。

最优控制在某曲线上进行切换的曲线称为开关曲线。

*u

由于 A点可为 0r 上的任一点，所以 A点形成 (-3,0) 为圆心， 1 为半径的半圆。

}0,1)3(|),{( 222

2121

1 xxxxxr

显然 0r1r

: 到的开关曲线: 到的开关曲线

同理：对亢于 0r

}0,1)3(|),{( 222

2121

1 xxxxxr

可得：

依上述过程类推可得一系列圆弧 :

}0,1)]12([|),{(

}0,1)]12([|),{(

222

2121

222

2121

xxjxxxr

xxjxxxrj

j

1u

1u

1u

1u

开关曲线 r将相平等分为两部分 RR ,

所以

rRxx

rRxx

),(,1

),(,1

21

21

起点 ),( 2010 xx 的最优轨线

这些圆弧的全体构成了所求问题的开关曲线：

*u

所以总的控制作用： }1,1,1,1,1{* u 共转换四次。EO弧 : 回到终点。DE弧： ,(+1,0) 为圆心， EO1 为半径，交开关曲线于 E 。 CD弧 : ,(+1,0) 为圆心， CO2 为半径，交开关曲线于 D

BC弧： 1* u

,(-1,0) 为圆心，

,(-1,0) 为圆心， BO1 为半径圆弧，交开关曲线于 C

AB弧： AO2 为半径的圆弧交于开关曲线 B 1* u

1* u

1* u

1* u

1x

2x

1o

2o

E

A

B

C

D

1* u

1* uR

r

r

1* uR

1* u

),( 2010 xx

习题：已知线性定常系状态方程：

)()(

)()(.

2

2

.

1

tutx

txtx其中 , ],0[ ftt

求使系统由任意初态 202101 )0(,)0( xxxx 以最短时间转移到目标集：

0)()](),([ 121 fff txtxtxg

习题：已知受控系统：

ux

xx.

2

2

.

1，目标集： }.0|),{( 2121 xxxxM

求满足约束条件的时间最优控制函数，求开关曲线

1)( tu

)(* tu

1)( tu

注：在时间最优控制中，我们知道： )}(],),({[)}({* tttxsGNBtqSGNu T

rjtttxbtqu Tjjj ,...3,2,1)}(],),([sgn{)}(sgn{* 即：

可知： )()(** ttxu 及与之间的关系

由前分析知：

0)( tq j 时，可由极值条件确定，正常情况； 0)( tq j 时，可为满足约束条件的任意值，为不定状态，异步情况。

但是，奇异状态并不表示时间最优控制不存在，只表明用极小值原理

不能确定最优解，需采用奇异最优控制方法，以下介绍：

*u

< 定义 1> 若在区间 [ Tt ,0 ]内，存在时间的可数集合 : jjj ttt ...., 21

即： ,3,2,1],,[ 0 Ttt j 使得对所有的 rj ,......2,1

均有：

)()( tbq Tjtj 则称时间最优控制是正常的。

< 定义 2> 若在区间 ],[ 0 Tt 内，存在一个（或多个）子区间 ],[],[ 021 Tttt ，

使得对所有 ],[ 21 ttt ，有 0)()),(()( tttXBq Tjtj 则称时间最优

],[ 21 tt控制异步。奇异区间。

tt

tt

非零

0

如何判定系统是正常的，还是奇异的。

设计时间最优控制之前总希望知道问题是否有解？是否有唯一解？问题是正常

的，还是奇异的。初次之外，我们还希望了解时间最优控制的共同特点和性质。

这种一般规律的认识和了解会有助于具体系统的设计计算。

然而：对任意的非线性系统和任意的目标集，没有明确结论。

对于线性定常系统，可以回答上述问题，（目标集假设为坐标原点）

至于线性时变系统及一般性目标集问题，只有其中的部分结论适用。

< 问题 1> ：已知线性时不变系统， )()()(.

tButAXtX 时完全能控的

求满足下列不等式或约束的 r维容许控制向量 U(t), rju tj ......2,1,1|| )(

由已知初态 00 )( XtX 转移到状态空间原点的时间最短，根据极小值原理，

使系统

< 问题 > 最优控制的必要条件如下：

)()(

)}({)]([)(

0)(

)0(

)(

)()()(

*

0

.

tBtq

tBSGNtqSGNtU

TX

XX

tA

tBUtAXtX

T

T

T

＝－。

或 rjtbqtU Tjtjj ....3,2,1)}(sgn{}sgn{)( )(

*

jb 为 B 的第 j列向量

0)()()()(1)()()()(1 TBUTTAXTtButtAXtH TTTT

从上述必要条件出发，可得一些有用的结论：

< 定理 1> 当且仅当个矩阵 rjbAbAAbbG jn

jjjj ....2,1],|......|||[ 12

中至少有一个奇异矩阵时 < 问题 1> 是奇异的。

证明：由已知条件： 0)( tATet

由 6 式知， 0)( t 否则 1 ＝ 0 错

}sgn{}sgn{)(

][)(

00*

0*

jAtTtAT

jj

tAT

beebtU

eBSGNtUT

T

若问题正常，则对于给定的初协态 0 ，可唯一确定砰－砰控制

怎样知道是正常还是奇异呢？推证定理。

假定 < 问题 1> 是奇异的，至少存在一段时间 ],0[],[ 21 Ttt 使某 )(tq j 对所有

],[ 21 ttt 均成立： 0)( 0 j

AtTj betq

r

由此： 0)(......0)(,0)( 1...

tqtqtq njjj

考虑到 A与 Ate 可前后交换顺序，则有：

令： nnjn

jjj bAAbbG ]....||[ 1

则关于 n维待定向量 0 的代数方程组可写成： 00 j

AtT Ge

所有 ],[ 21 ttt 由于 Ate 为奇异矩阵，为使 0 ，则 jG 必为奇异矩阵，

即： 0det jG 奇异控制问题的必要条件。可以证明其为充分条件

< 定理 1> 得证：由设定理可进一步得出 < 问题 > 为正常得充分必要条件

0)()1(

0)(

0)(

0)(

)1(0

)1(1

20

..

0

.

0

jnAtTn

jn

jAtT

j

jAtT

j

jAtT

j

bAetq

bAetq

Abetq

betq

< 定理 2> ：当且仅当 rjbAbAAbbG jn

jjjj ,....2,1],|.....|||[ 12 全部为非

奇异矩阵，则时间最优控制是正常得。

< 定理 1>和 < 定理 2> 得推证过程都没有设计到目标集，因此，不论目标集如何，只

要受控系统是线性时不变得，因此两个定理可用。

将满足 < 定理 2> 得系统叫做正常系统。正常受控系统，其时间最优控制问题也是正

常得，对于正常问题，由下列存在性与唯一性定理。

< 定理 3> 若受控系统 BuAxX .

是正常的，且时间最优控制存在，则最优控制

必定唯一。

证明：见“百年学书” p176页。

另外，我们知道，一个完全能控的线性定常系统： BuAxX .

必需满足

nBABAABBrankrankG n ]|....|||[ 12 n: 系统维数

若把系统表征为： rrubuBuBAxX ......2211

.

其中 ruuu ..., 21 控制分量

正常问题要求 rjbA j ...2,1),,( 都是完全能控。

即： nbAAbbrankrankG jn

jjj ]|......||[ 1

说明：每一个控制分量 )(tu j 均能单独使受控系统由任意初态在有限时间内转

移到坐标原点。

据此，常可很容易地判断问题的时间最优控制是否属于正常情况。

显然：一个输入完全能控的线性不变系统，其时间最优控制问题也一定是正常的。

燃料最优控制的一般情况，接 < 之二本>

< 问题 > 已知线性定常系统： ],0[,,....2,1,1|)(|

.

Ttrjtu

BuAxX

j

求最优控制 )(* tu ，使系统由任意初态 0)0( xx 转移到目标集：

},....2,1,0)]([|)({ piTxgTxM i

且使性能指标：

T

j

r

jjj cdttucJ

01

0,|)(| 为最小， T未知。

分析： BuAxtucH TTjj

T

j

|)(|

1

若记： rjbtq Tjj .....2,1,)(

:jb 为 B 的第 j列向量，

则H种与 U(t) 由关的部分 R(u) 为： })(

)(|)({|)(1

j

jjjj

r

j c

tqtutucuR

根据极小值原理， *u 应使H或 R（ u）取极小，则：

}])(

)(|)({|min[

|})(

)()({|min)(min

|1)(|1

1)()(

j

jjj

tuj

r

j

j

jjjj

r

jvtuvtu

c

tqtutuc

c

tqtutucuR

j

求出： rjc

tqdeZtu

j

jj ....3,2,1},

)({)(* 这就是燃料最优控制。

如何判定燃料最优控制是正常还是奇异？

< 定理 >< 问题 > 为正常得充分条件为 ,对所有 j＝ 1 ， 2 ， 3 ，…… r，均有 0)det( jAG

其中 ]|....||[ )1(j

njjj bAAbbG

< 问题 > 为奇异得必要条件为：对于某个或某些有： 0)det( jAG

证明从略

j

注意：在燃料最优控制中，区分正常情况与时间最优控制不同。首先：

1.对时间最优 :系统正常时，最优控制问题一定是正常的。

2. 对燃料最优：即使系统正常（ 0det jG )，如果系统矩阵 A是奇异得（ A有零

特征值，即系统中含有积分环节），问题仍可能属于奇异情况。

只有当系统是正常得，且 A有事非奇异矩阵，才能保证燃料最优控制有正常解。

3 、另外（ 1 ）式为系统正常得充分条件，次条件不满足时，

系统仍可能有正常解（有可能正常或有可能奇异）视初始状态而定。

1 ）试证明系统由初态：

2 ）欲求系统由初态 X(0) 最快地转移到终态

习题：设二阶系统

ux

xx

.

2

2

.

11|| u

所消耗燃料为最小得最优控制

0

0)4(

1

1)0( XX 转移到

为：

4)35(2

11

)35(2

1)35(

2

10

)35(2

101

)(*

t

t

t

tu

*0)( ff ttx 。求

2 、二阶空间控制系统的状态方程为：

)()()()(

)()(

12

.

2

2

.

1

tutxtxtx

txtx

不等式控制约束 Utu |)(| ，试求使系统由初态 Tuxxx ],[)0( 10 达到平衡状态

0)( ftx 的最短时间最优控制。

关于“二次积分模型”的燃料最优控制问题的进一步讨论：

)()(

)()(.

2

2

.

tutx

txtx系统：

],0[,1|)(| ftttu

求 )(* tu ，使系统由任意初态（ 21 , ）转移到状态空间原点，且使性能指标：

T

dttuJ0

|)(| 为最小值， T自由。

解：求解最优解的必要条件：

1 ）正则方程： uxuH 221||

则：

11

.

2

1

.

1

2

.

2

.

1

0

x

H

x

H

ux

xx

2 ）边界条件： 22

11

)0(

)0(

x

x

0)(

0)(

2

1

f

f

tx

tx

3 ）极小值条件： uuuu 2*

2* ||||

4 ）H函数变化率： 0)()()()(|)(||| *221

*221

* fffff tuttxttuuxu

则： )}({)( 2* tdeZtu

)(2 t 仅在有限个点上为 1 ，则正常； )(2 t 在一段区间上为 1 ，则奇异。

具体分析：

解协状态方程： 101 )( t 常数， tt 10202 )(

2010 , 的不同，系统有可能为正常或奇异。

<1> 奇异情况：

若 010 ，使系H的变化规律 0)(* tH 成立，必有： 1)(220 t 奇异。

无法用极小值原理求解。

<2> 当 010 时， 10202 )( t 是时间的线性函数，这时至多有两个

点满足 1|)(| 2 t 正常情况

最优控制必为三位式控制，且至多有两次切换，候选解为： {0},{+1},{-1}, {+1,0,-1}

,{-1,0,+1},{+1,0},{-1,0}， {0,-1},{0,+1} 由于结尾的三种控制序列不可能为最优

控制。

0u

因为有状态方程知：是一组不通过原点的平行线或轴上的孤立点

所以可能的最优控制序列为：六种可能： {+1},{-1},{0,-1},{0,+1}{+1,0,-1}

{-1,0,+1}

为了进一步分析燃料最优控制解的性质，转向相平等分析：

当 u=+1,u=-1 时，有初态转移到原点的两条轨线为： rr 和

|}|2

1|),{(

}0,2

1|),{(

}0,2

1|),{(

22121

222121

222121

xxxxxrrr

xxxxxr

xxxxxr

及 1x 轴将相平等分为四部分：r

}0,2

1|),{(

}0,2

1|),{(

}0,2

1|),{(

}0,2

1|),{(

2221214

2221213

2221212

2221211

xxxxxR

xxxxxR

xxxxxR

xxxxxR

当系统初始状态位于不同区域时，解大不相同。

),( 21 1 ）位于 r 上， 1* u 是唯一的燃料最优控制，且 || 2* J

位于 ),( 21 4R 时， }1,0{* u 时燃料最优控制，且时间最短

分析： *u的可能选择： {0,+1},{-1,0,+1}分别计算两种轨线的燃料最优值，取其

最小者，即为所求。

同理： ),( 21 位于 2R 时，

}1,0{)(* tu

}1,0{)(* tu 为转移时间最短的燃料最优控制

2 ）

ft

分析：设 r),( 21

)()(

)()(.

2

2

.

1

tutx

txtx对系统求解积分并代入 )0,0(),,( 21 初、末条件可得：

T

dttu02 )(

进而： TT

tuJdttudttu002 )]([|)(||)(|||

说明：燃料消耗的下限为： || 2 。因此，只要能找到 *u ，使系统由初态 ),( 21

转移到 (0,0) ，并且所消耗燃料为 || 2* J ,则此控制必为最优控制

设 ABOu ]1,0[)1( 下计算 )2()1( ,uu 两种控制所消耗燃料

T

tBOABB

dttuJJtuJ |||)(|])([ 2

1

是燃料最优

|||||)1(||||1|])([ 2200 2

2

dtdtJJJJJtuJcc tt

DOACDBCDAC

所以不是燃料最优

若采用的控制方式为：

可以证明，其仍然三位燃料最优控制

只是：并不是时间也最优。

仅有 ABO 为燃料最优，且所用时间为最短。

）、（ 21,)3 位于 31 RR或内时，

设 121 ),( R

若燃料最优控制存在，必有： || 2* J 则在控制候选函数中，仅有 u={-1,0,+1}

可将系统转移到坐标原点。

但是，此时 || 2J ，不是燃料最优控制

所以无解，但存在燃料最优

)(tu )()( tvtu )(tu

tct Dt Et Ft ft1x2x

AB

C

D

E

F

0

2

1x

2x A

CD0

若选用 ={-1,0} 则系统在 u=-1 作用下，将状态转移到 1x 轴上时所消耗燃料正好

为，相应状态记为 (a,0); 然后取，系统不在消耗燃料 ,但状态会保持在 (a,0) 不动，

不会到达坐标原点。所以 ={-1,0} 不满足要求

但可得到启示，进而有如下结论：

燃料最优控制解。

< 命题 > ：若初态 121 ),( R ，则对任给 0 ，使系统 ),( 21.

2

2

.

1 由

ux

xx

转移到（ 0 ， 0 ），且燃料消耗量为： || 2J 的燃料最优控制为 *u＝ {-1,0,+1}

证明方法见书：对于 u={-1,0,+1} 分别确定各段的燃料最优值 J, 最后求和。

因此足够小时，燃料最优接近于燃料最优。

存在问题：燃料最优存在，但由 C 点 D点的状态转移时间为： a

TCD2

是很长的。

)(tu

0u

)(tu

初态 321 ),( R 时，有相同的结论。

综上所述 ,可得燃料最优控制为：

注意 : 上述控制律同时也保证了转移时间最小。

4221 ),( RRxx

3121*

221*

421*

21*

21*

,

),(0

),.(0

),(1

),(1

RRxxu

Rxxu

Rxxu

rxxu

rxxu

）（无解

若不考虑转移时间 ,则 p),( 21 有唯一解 .

4221 ),( RR 有无穷多解

3121 ),( RR 无解

燃料最优控制问题虽存在最优解，但因状态转移时间 )( CDT 过长 ,从而使

系统总转移时间过长。

时间 -燃料最优控制 .自学 ,分析方法类似。

作业１：设二阶系统方程：

其中　　　。试确定将系统由已知初态最快地转移到　　　　的最优控制函数　　　

0)0(

)()(2

)(1)( 1

0

11

10

xx

ux

xx t

t

tt

1u 0ft

x )(* tu

作业２：已知系统的状态方程

试求最优控制　　　使系统曲任意初态最快的转移到　　　　　　　　　的状态。写出开关曲线方程，并绘出开关曲线的图形。

)(* tu1,2 )(2)(1

ff tt xx

)()(2

)(2)(1

tt

tt

ux

xx

1u

作业３：给定二阶系统

控制约束：　　　　　试确定使系统由已知初态最快地转移到坐标原点的最优控制

1,24

1,

)0(2)(2)(1)(2

)0(1)(2)(1

xuxxx

xxx

tttt

tt

11 )( tu

)(* tu

作业４：设二阶系统：

控制约束　　　　　试确定使系统由已知初态最快地转移到坐标原点的最优控制和开关曲线。

1,

1,

)0(2)(2)(2

)0(1)(2)(1

xuxx

xxx

ttt

tt

11 )( tu

作业６：系统状态方程

求时间最优控制函数，使系统由　　　　　　　转移到终端状态　　　　　　　　，并求开关曲线，绘出图形。

)()(2

)(2)(1

tt

tt

ux

xx

1u

Txxx 20100 ,0,0 )(2)(1

ff tt xx

f

T

ff

ff

ff

t

g

ttH

ttH

XJ tt

)(

)(

]),([**

**

末端受约束

末端自由

若

f

Tf

f

ft

t

t

gtH

tH

tH

dttUXLJf

)(:

0)(:

0)(:

),,(

**

**

**

0

末端受约束

末端自由

末端固定

若

沿最优轨线，哈密顿函数：

ft

tff dtUXh

ttUtXHtUXH ),,,(

),),(),([),,,( ****

第三章 极小值原理及应用

Documents

第三章极小值原理及应用