オブザーバに基づく機械系の確率的軌道追従制御について計測自動制御学会論文集...

8
Vol.43, No.3, 1/8 2006 On Observer based Stochastic Trajectory Tracking Control of Mechanical Systems Satoshi Satoh and Kenji Fujimoto This paper concerns an observer based stochastic trajectory tracking control of mechanical systems. We con- sider mechanical systems in the presence of noise as stochastic systems and derive a condition for a stabilizing or tracking controller to achieve each control objective. We investigate the case that only position information can be measured and the velocity signal is reconstructed by an observer. A construction method of the combined controller-observer is derived. Since the proposed method is based on stochastic bounded stability, the norms of tracking and estimation errors remain arbitrarily small in probability. Key Words: trajectory tracking control, stochastic stability, nonlinear stochastic control, nonlinear observer, output feedback control 1. 1), 2) 3), 4) - 5) 4) 6) 7) Graduate School of Engineering, Nagoya University, Fro- cho, Chikusa-ku, Nagoya 7) 8) 10) 11), 12) 13) 12), 14) 16) TR 0003/06/4303–0001 c 2006 SICE

Upload: others

Post on 05-Mar-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: オブザーバに基づく機械系の確率的軌道追従制御について計測自動制御学会論文集 Vol.43, No.3, 1/8(2006) オブザーバに基づく機械系の確率的軌道追従制御について

計 測 自 動 制 御 学 会 論 文 集Vol.43, No.3, 1/8(2006)

オブザーバに基づく機械系の確率的軌道追従制御について

佐 藤 訓 志∗・藤 本 健 治∗

On Observer based Stochastic Trajectory Tracking Control of Mechanical Systems

Satoshi Satoh∗ and Kenji Fujimoto

This paper concerns an observer based stochastic trajectory tracking control of mechanical systems. We con-

sider mechanical systems in the presence of noise as stochastic systems and derive a condition for a stabilizing or

tracking controller to achieve each control objective. We investigate the case that only position information can

be measured and the velocity signal is reconstructed by an observer. A construction method of the combined

controller-observer is derived. Since the proposed method is based on stochastic bounded stability, the norms of

tracking and estimation errors remain arbitrarily small in probability.

Key Words: trajectory tracking control, stochastic stability, nonlinear stochastic control, nonlinear observer,

output feedback control

1. は じ め に

制御対象のモデル化誤差や観測ノイズなどの不確定性を確率

過程とみなして制御則を設計する確率システム制御 1), 2) が実

システムの制御手法の一つとして研究されており,文献 3), 4)

などのように確定システムで得られた知見を確率システムへ

と拡張する研究も盛んに行われている.筆者らのアプローチ

は,不規則雑音を含む確定システムを確率システムと見なし,

確定システムを対象に設計された補償器に対して,確率シス

テム制御理論を用いて付加的な条件を与えることで,外乱を

陽に考慮した制御を行うことである.本手法では,確定シス

テムの補償器をそのまま利用することができ,システムに作

用する外乱ポートの構造と,その外乱構造の下で制御目標を

達成するための補償器に関する定量的な条件を与えることが

できる.

筆者らは過去の結果において,電気-機械系や非ホロノミッ

ク系などの広いクラスのシステムを統一的に扱えるポート・

ハミルトン系 5)を確率ポート・ハミルトン系へと拡張し,受

動性の拡張である確率受動性 4)に基づく安定化手法を提案し

た 6).筆者らはつぎに,軌道追従制御問題について考察を行っ

た 7).提案手法は,確率受動性に基づく有界安定を達成する

ものであり,目標軌道との追従誤差を任意の大きさに抑える

ことができる.一般的に,受動性に基づく補償器の下では,

システムのエネルギから構成されたリアプノフ関数の時間微

分は半負定であり,状態の一部の関数となる.例えば機械系

では,一般化速度のみの関数となり,配位座標は現われない.

∗ 名古屋大学大学院工学研究科 名古屋市千種区不老町∗ Graduate School of Engineering, Nagoya University, Fro-

cho, Chikusa-ku, Nagoya

そのため,リアプノフ関数の時間微分だけでは状態の有界性

が評価できない.そこで文献 7) では,時間微分に全ての状

態が現われて負定となる新たなリアプノフ関数の構成を考え

た.しかし,一般的なシステムに対して構成することは難し

く,適用できる制御対象のクラスが,慣性行列が定数行列で

ある機械系という狭いものとなっていた.これが本論文の一

つ目の動機である.

もう一つの動機は,筆者らの過去の提案手法は状態フィー

ドバックであり,この補償器を設計するためには全ての状態

の情報が必要となることである.実際の機械システムでは,

速度情報は直接計測できないシステムも多く存在する.この

問題の解決方法の一つとして,計測可能な一部の状態のみを

利用した出力フィードバック手法がある.受動性に基づく出

力フィードバック安定化手法として文献 8)~10)などがあり,

さらに文献 11), 12)では,オブザーバを構成することで,位

置情報のみを利用した軌道追従制御手法が提案されている.

一方で,バックステッピングを応用した確率システムにおけ

る出力フィードバック安定化手法も提案されている13)が,こ

のような研究は少なく,特に確率システムにおける軌道追従

制御の研究はほとんど成されていない.

これら二つの動機を踏まえ,本論文では不規則雑音を含む

一般的な機械系を対象として,オブザーバを用いた軌道追従

制御について確率システム制御理論に基づく考察を行う.本

論文では,文献 12), 14)~16)で提案された補償器とオブザー

バを用いて,指定した確率以上で追従・推定誤差を任意の大き

さに抑制するための補償器とオブザーバのゲインと外乱構造

に関する定量的な条件を与える.上記の補償器とオブザーバ

を用いる理由として,これらは機械系の軌道追従制御におい

て良く用いられていることと,スライディングモード制御の

TR 0003/06/4303–0001 c© 2006 SICE

Page 2: オブザーバに基づく機械系の確率的軌道追従制御について計測自動制御学会論文集 Vol.43, No.3, 1/8(2006) オブザーバに基づく機械系の確率的軌道追従制御について

2 T. SICE Vol.43 No.3 March 2006

考え方を利用しており,システム全体のリアプノフ関数の時

間微分が負定となるためである.これを利用することで,本

論文では文献 7)では扱えなかった一般的な機械系に対する軌

道追従制御を考えることができるようになる.

与えられた補償器が抑制可能な外乱の大きさや,その構造

に関する定量的な評価を陽に行っている研究は多くなく,本

論文のような確率システムからのアプローチは実システムの

制御において有効であると考えられる.

2. 制 御 対 象

本論文では,伊藤型確率微分方程式で表される次式のシス

テムを扱う.このシステムは,不規則雑音を含む n自由度の

機械系を確率力学系としてモデル化したものである.

dq = v dt + Wq(q, v) dw1

dv = M(q)−1τ − C(q, v)v − G(q)dt + Wv(q, v) dw2

(1)

ここで,q(t), v(t) ∈ Rn はそれぞれ配位座標と一般化速度

を表し,M(q) ∈ Rn×n は慣性行列を表す正定対称行列であ

る.C(q, v)v は遠心力およびコリオリ力を表し,G(q) は重

力によるトルクを表す.また,w1(t) ∈ Rr1 , w2(t) ∈ R

r2

はそれぞれ確率空間 (Ω,F ,P) 上の標準ウィーナ過程であ

り,Ω は標本空間,F ,P はそれぞれ Ω 上の σ-加法族と確

率測度を表す.Fs を (1) 式の解過程 (q(t), v(t)) に関して,

(q(s), v(s)) | 0 ≤ s ≤ t, (q(0), v(0))=(q0, v0)から生成されるΩ上の最小のσ-加法族とする.Wq : R

n×Rn → R

n×r1 ,

Wv : Rn × R

n → Rn×r2 はそれぞれ外乱のポートを表わす

行列値関数である.

本論文では行列 A のノルムを ‖A‖ :=√

λmax(A⊤A)

で定義する.ただし,λmax(·) は最大固有値を表す.また,D(·) は (·) に関する微分作用素を表すものとする.また以降では,同一の表記 M(q) を,慣性行列と慣性テンソル両

方の意味で用いる.例えば,任意の α, β ∈ Rn に対して

M(q)(α, β) := M(q)ijαiβj ≡ α⊤M(q)β とする.ただし,

M(q)ij , αi, βj はそれぞれM(q), α, β の要素を表し,同じ添

字が上下に一つずつ現れるときはその総和をとるアインシュ

タインの規約を用いている.テンソル表記を用いると,微分

を計算する際の表記が簡単になる.例えば,DqM(q)(α, β)(·)は一階のテンソルであり,次式のように定義する.

DqM(q)(α, β)k =∂M(q)ij

∂qkαiβj

さらに,二階の対称テンソル A(·, ·) に対して転置 (·)⊤ をA⊤

ij = Aji で定義する.つまり A⊤(α, β) = A⊤ijα

iβj =

Ajiαiβj となる.

本論文で用いる,慣性行列 M(q) や遠心力およびコリオ

リ力の項 C(q, v) に関する性質を簡単に述べる.詳細は文

献 11), 12)を参照されたい.

性質 1. クリストッフェルの記号を用いて C(q, v)を定義し

たとき,DtM(q)− 2C(q, v)は歪対称行列となる.また,任

意の ξ, η, ζ ∈ Rn, a, b ∈ Rに対して,次式が成立する.

C(q, ξ)η = C(q, η)ξ

C(q, aζ + bξ)η = aC(q, ζ)η + bC(q, ξ)η

また,以下の仮定をおく.

仮定 1. 遠心力およびコリオリ力の項 C(q, v)は q に関して

有界であり,任意の q, β ∈ Rn に対して次式を満たす正定数

CM が存在する.

‖C(q, β)‖ ≤ CM‖β‖

仮定 2. 慣性テンソル M(q) および M(q) を q に関して 1

階,2階微分したテンソルは q に関して有界であり,任意の

q, ξ, η ∈ Rn に対して次式を満たす正定数 Mm, MM ,および

MM , ¯MM がそれぞれ存在する.

Mm ≤ ‖M(q)‖ ≤ MM

‖DqM(q)(ξ, ·)(·)‖ ≤ MM‖ξ‖

‖D2qM(q)(ξ, η)(·)(·)‖ ≤ ¯MM‖ξ‖‖η‖

仮定 3. 外乱のポートを表わす行列値関数 Wq, Wv は滑ら

かであり,任意の α, β ∈ Rn に対して次式を満たす正定数

Wq,M , Wv,M が存在する.

‖Wq(α, β)‖ ≤ Wq,M (1 + ‖α‖ + ‖β‖),

‖Wv(α, β)‖ ≤ Wv,M (1 + ‖α‖ + ‖β‖)

次章では,確率システム制御理論に基づき,誤差システム

の確率有界安定性を議論するため,後に必要となる事柄をこ

こで準備しておく.まずある見本過程に沿ったスカラ関数の

時間変化を計算するために,微分生成作用素 L(·) を定義する.これは次章で確率リアプノフ関数の時間変化を計算する

際に用いられる.

定義 1. 次式の伊藤型確率微分方程式を考える.

dx = f(x, t) dt + h(x, t) dw (2)

ただし,x(t) ∈ Rn であり,w(t) ∈ R

r は確率空間 (Ω,F , P )

上の標準ウィーナ過程であり,f, hは滑らかな関数とする.こ

のとき次式を満たす作用素 L(·)を微分生成作用素とよぶ.

L(·) := Dt(·) + Dx(·)f +1

2trD2

x(·)hh⊤

(3)

このとき少なくとも tに関して 1回,xに関して 2回微分

可能なスカラ関数 V (t, x) : R × Rn → R の x(t)に沿った時

間変化は,伊藤の公式 17)より次式のように計算できる.

E[V (t, x(t))]−E[V (t0, x(t0))]=

∫ t

t0

E [LV (s, x(s))] ds

ただし,E[·]は期待値演算を表わす.

つぎに,本論文で用いる確率有界安定性として,文献 3) で

Page 3: オブザーバに基づく機械系の確率的軌道追従制御について計測自動制御学会論文集 Vol.43, No.3, 1/8(2006) オブザーバに基づく機械系の確率的軌道追従制御について

計測自動制御学会論文集 第 43 巻 第 3 号 2006 年 3 月 3

提案された (Q0, Q1, ρ)-安定性の定義を示す.

定義 2. システム (2) が (Q0, Q1, ρ)-安定であるとは,初期

状態 x(0)が x(0) ∈ Q0 ならば,

P x(t) ∈ Q1, for 0 ≤ t < ∞ ≥ ρ

が成立することをいう.

最後に,主結果の証明で用いられる停止過程を定義する.

定義 3. t∩s := mint, sとし,解過程 x(t)が初めて領域 S

から出る時刻を τSとする.すなわち τS := inft ≥ 0 | x(t) /∈Sである.このとき,解過程 x(t)に対する停止過程 x(t∩τS)

を次式で定義する.

x(t ∩ τS) :=

x(t) t < τS

x(τS) t ≥ τS

3. オブザーバを用いた出力フィードバックによる軌道

追従制御

本章では,配位座標 q のみが観測できるとして,直接観測

できない残りの状態 v の代わりにオブザーバによる推定値を

用いることで,不規則雑音を伴うシステムの出力フィードバッ

クによる軌道追従制御を考える.qd, qd をそれぞれ実現可能

な目標軌道と目標速度とし,以下の仮定を満たすものとする.

仮定 4. 目標軌道 qd は時間に関して少なくとも二階微分可

能であるとする.また,qd とその目標速度 qd は有界であり,

次式を満たす正定数がそれぞれ存在する.

Nqd= sup

t

‖qd(t)‖ , Nqd= sup

t

‖qd(t)‖.

位置と速度の偏差をそれぞれ qe := q − qd, ve := v − qd

と表し,q, v をそれぞれオブザーバによる q, vの推定値とし,

真値との偏差をそれぞれ q := q− q, v := v− vと表す.また,

xd := (q⊤d , q⊤d )⊤, xe := (q⊤e , v⊤e )⊤,x := (q⊤, v⊤)⊤, x :=

(x⊤e , x⊤)⊤ という表記を用いる.

本章の目的は,追従・推定誤差が,指定した確率以上で任

意の大きさに留まり続けるという確率有界安定となるための,

補償器とオブザーバの条件を導出することである.条件導出

までの過程を簡単に述べる.本論文で用いる補償器とオブザー

バは文献 12), 16)で提案されたものであり,(4),(5)式で定義

する.これらは機械系の軌道追従制御において良く知られて

いるスライディングモード制御に基づく補償器14)を利用した

ものであり,(8)式で定義するシステム全体の確率リアプノフ

関数 3)V の時間変化 LV に全ての状態が現れる.そのため,

LV から状態の有界性を評価できることが,(4),(5)式の補償

器とオブザーバを用いる理由である.そこでまず,(3) 式で

定義した微分生成作用素L(·)を用いて LV を計算し,2章で

述べた性質や仮定を用いて LV の上限を (20) 式のように評

価する.ノイズの影響により,一般的に LV が負となる領域

は,状態空間全域ではない.そこで,補題 1において指定し

た領域内で常に LV < 0となる条件を示す.最後に,補題 1

の結果を用いて追従・推定誤差が確率有界安定となるための

条件を,定理 1において示す.

文献 12), 16)で提案された補償器とオブザーバを定義する.

τ = M(q)qd + C(q, vo)qd + G(q) − Kd(s1 − s2), (4)

dq = (z + Ldq) dt =: v dt

dz = Lpq dt + M(q)−1τ − C(q, vo)qd − G(q)

+Kd(s1 − s2)dt,

(5)

ただし,補償器のゲイン Kd,オブザーバのゲイン Ld, Lp は

それぞれ正定対称な行列であり,これらが満たすべき条件は

以降で与えられる.また,スライディング変数 s1, s2 と変数

vo は次式で定義される.

s1 := ve + Λ1qe, s2 := v + Λ2q,

vo := v − s2 = v − Λ2q

ただし,Λ1, Λ2 はそれぞれ正定な対角行列である.(1),(4)式

より,目標軌道に関する誤差システムは次式となる.

dqe = ve dt + Wq(q, p) dw1

dve = M(q)−1C(q, vo)qd − C(q, v)v − Kd(s1−s2)dt

+Wv(q, v) dw2

(6)

また,(1),(5)式より,オブザーバによる推定誤差システムは

次式となる.

dq = v dt + Wq(q, p) dw1

dv = M(q)−1C(q, vo)qd − C(q, v)v − Kd(s1−s2)dt

−(Lpq+Ldv) dt − LdWq(q, v) dw1 + Wv(q, v) dw2

(7)

本論文では,文献 12), 16)で提案された次式のリアプノフ

関数を確率リアプノフ関数 3)としてそのまま用いる.

V =1

2v⊤

e M(q)ve + v⊤e M(q)Λ1qe +

1

2q⊤e 2Λ1Kdqe

+1

2s⊤2 M(q)s2 +

1

2q⊤2Λ2Kdq

=1

2x⊤

2Λ1Kd Λ1M(q) 0 0

M(q)Λ1 M(q) 0 0

0 0 2Λ2Kd+Λ2M(q)Λ2 Λ2M(q)

0 0 M(q)Λ2 M(q)

︸ ︷︷ ︸

x

=: P (q) (8)

V が正定関数となるために,Schur complement(文献 18) 補

題 A.4)より,Kd は次式を満たすように定めるものとする.

2Kd − M(q)Λ1 > 0 (9)

Page 4: オブザーバに基づく機械系の確率的軌道追従制御について計測自動制御学会論文集 Vol.43, No.3, 1/8(2006) オブザーバに基づく機械系の確率的軌道追従制御について

4 T. SICE Vol.43 No.3 March 2006

確定システムの場合と同様に,確率リアプノフ関数の時間変

化を評価することは,確率システムの安定性を解析する際に

非常に有効である.伊藤型確率微分方程式に従う解過程に沿っ

たスカラ関数の時間変化を計算する際には,(3)式で定義した

微分生成作用素から分かる通り,不規則雑音に起因する二階

の偏微分の項を伴う.この項は確定システムの解析では存在

せず,確率解析を用いることでこのような不規則雑音の影響

を定量的に評価することができる.誤差システム (6),(7) の

解過程 x(t)に沿った,リアプノフ関数 (8)の時間変化 LV を

計算すると次式のようになる.

LV =s⊤1 C(q, vo)qd − C(q, v)v − Kd(s1 − s2)

+v⊤e M(q)Λ1ve +

1

2s⊤1 DtM(q)s1

−1

2q⊤e Λ1DtM(q)Λ1qe + 2q⊤e Λ1Kdve

+s⊤2 C(q, vo)qd − C(q, v)v − Kd(s1 − s2)

−M(q)(Lpq + Ldv) + s⊤2 M(q)Λ2v

+1

2s⊤2 DtM(q)s2 + 2q⊤Λ2Kdv + ωxe

+ ωx (10)

ここで表記の簡単化のため導入した ωxe, ωx は,システム

(6),(7)それぞれに含まれる不規則雑音の影響を表わしており,

次式で定義される.

ωxe:=

1

2trD2

qeV WqW

⊤q

+

1

2trD2

veV WvW⊤

v

,

ωx :=1

2trD2

qV WqW⊤q

+1

2trD2

vV (LdWqW⊤q L⊤

d +WvW⊤v )

(11)

これより,(10),(11)式の上限を不等式を用いて評価してい

く.以降では行列 Aに対して,AM , Am をそれぞれ ‖A‖の上限と下限を表すものとする.また,計算を簡単にするため

に,文献 12), 16)と同様の仮定をおく.

仮定 5. 行列 Ld, Lp, Λ2 は次式を満たす.

Ld = ldI + Λ2, Lp = ldΛ2,

ただし,I は単位行列であり,ld はオブザーバゲインを表わ

す正定数である.

仮定 5 と性質 1 を用いると,(10) は次式のように計算で

きる.

LV = −v⊤e (Kd−M(q)Λ1)ve−q⊤e Λ1KdΛ1qe−v⊤Kdv

− q⊤Λ2KdΛ2q − s⊤2 (ldM(q) − 2Kd)s2

− s⊤1 C(q, s2)qd + v⊤e C(q, v)Λ1qe + s⊤2 C(q, s2)ve

− s⊤2 C(q, v)ve + ωxe+ ωx (12)

(12)より,次式を満たすように補償器とオブザーバのゲイン

Kd, ld をそれぞれ定めるものとする.

Kd − M(q)Λ1 > 0,

ldM(q) − 2Kd > 0 (13)

(13)式の下では,(9)式は自動的に満たされる.このとき (12)

式の上限は,仮定 1,仮定 2,仮定 4 を用いると次式のよう

に評価できる.

LV ≤

−minKd,m−MMΛ1,M , Kd,mΛ2

1,m, Kd,mΛ22,m

‖x‖2

+ CMNqd

(

‖s1‖‖s2‖ + Λ1,M‖ve‖‖qe‖ + ‖s2‖‖ve‖)

+ CM

(

Λ1,M‖ve‖2‖qe‖ + ‖s2‖2‖ve‖ + ‖s2‖‖ve‖2)

+ ‖ωxe‖ + ‖ωx‖ (14)

相加・相乗平均の関係を用いて ‖s1‖, ‖s2‖を次式のように評価する.

‖s1‖2 ≤ ‖ve‖2 + 2Λ1,M‖ve‖‖qe‖ + Λ21,M‖qe‖2

≤ 2‖ve‖2 + 2Λ21,M‖qe‖2

≤ 2(1 + Λ21,M )‖x‖,

‖s2‖2 ≤ 2(1 + Λ22,M )‖x‖ (15)

(15)式の結果を (14)式に適用することで,次式を得る.

LV ≤

−[

minKd,m−MMΛ1,M , Kd,mΛ2

1,m, Kd,mΛ22,m

− CMNqd

(

Λ1,M +√

2(1+Λ22,M )

(√

2(1+Λ21,M )+1

))

− CM

(

Λ1,M + 2(1+Λ22,M ) +

2(1+Λ22,M )

)

‖x‖]

‖x‖2

+ ‖ωxe‖ + ‖ωx‖ (16)

続いて (16) 式中の ‖ωxe‖, ‖ωx‖ を評価していく.まず

D2ve

V = M(q)と簡単に計算ができるため,(11)式中の ωxe

の第二項目に注目すると,仮定 3と仮定 4を用いて次式のよ

うに評価できる.

trD2

veV WvW⊤

v

=

r2∑

i=1

λi

(W⊤

vMWv

)

≤ r2λmax

(W⊤

vMWv

)≤ r2

√MMWv,M (1+‖q‖+‖v‖)

≤ r2

√MMWv,M (1+‖qe‖+Nqd

+‖ve‖+Nqd) (17)

ただし,任意の行列 A ∈ Rm×m,B ∈ R

m×n に対して,

trABB⊤

= tr

B⊤AB

が成立することを用いている.

つぎに ωxeの第一項目を考えると,

D2qe

V =1

2D2

qM(q)(ve,ve)(·)(·)+DqM(q)(ve,Λ1(·))(·)

+D2qM(q)(ve, Λ1qe)(·)(·)+[DqM(q)(ve)]

⊤(·)(Λ1(·))

+2Λ1Kd

と計算できるため,仮定 1から仮定 4を用いて次式を得る.

trD2

qeV WqW

⊤q

Page 5: オブザーバに基づく機械系の確率的軌道追従制御について計測自動制御学会論文集 Vol.43, No.3, 1/8(2006) オブザーバに基づく機械系の確率的軌道追従制御について

計測自動制御学会論文集 第 43 巻 第 3 号 2006 年 3 月 5

r1

(1

2¯MM‖ve‖2+2Λ1,MMM‖ve‖+Λ1,M

¯MM‖qe‖‖ve‖

+ 2Kd,MΛ1,M

) 1

2

Wq,M (1+‖qe‖+Nqd+‖ve‖+Nqd

)

(18)

(17),(18)式と同様にして,次式のように ωx を評価できる.

trD2

qV WqW⊤q

≤ r1

2

(1

2¯MM‖s2‖2+2Λ2,MMM‖s2‖+Λ2

2,M MM

+ 2Kd,MΛ2,M

) 1

2

Wq,M (1+‖qe‖+Nqd+‖ve‖+Nqd

)

trD2

vV WqW⊤q

≤√

MM

2(r1Ld,MWq,M + r2Wv,M)

× (1+‖qe‖+Nqd+‖ve‖+Nqd

) (19)

よって,(16),(17),(18),(19)式から次式のように LV を評価

することができる.

LV ≤ −[

minKd,m−MMΛ1,M , Kd,mΛ2

1,m, Kd,mΛ22,m

− CMNqd

(

Λ1,M +√

2(1+Λ22,M )

(√

2(1+Λ21,M )+1

))

− CM

(

Λ1,M + 2(1+Λ22,M ) +

2(1+Λ22,M )

)

‖x‖]

‖x‖2

+

r1

2

(1

2¯MM‖ve‖2+2Λ1,MMM‖ve‖+Λ1,M

¯MM‖qe‖‖ve‖

+ 2Kd,MΛ1,M

) 1

2

Wq,M +r2

2

√MMWv,M

+r1

2

(1

2¯MM‖s2‖2+2Λ2,MMM‖s2‖ +Λ2

2,MMM

+ 2Kd,MΛ2,M

) 1

2

Wq,M +

√MM

2

(r1(ld+Λ2,M )Wq,M

+ r2Wv,M

)

(1+‖qe‖+Nqd+‖ve‖+Nqd

) (20)

ここからは,本章の目的である,追従誤差と推定誤差がと

もに確率有界安定となるための補償器とオブザーバの条件を

導出する.(20)式から分かる通り,不規則雑音の影響により

LV が負となる領域は,状態空間全域ではない.そこでまず

は,指定した領域内で常に LV < 0となるための条件を以下

の補題として示す.

補題 1. システム (1)に対して,(4)式の補償器と (5)式のオ

ブザーバを考える.また,仮定 1から仮定 4が成立するものと

する.このとき,任意の δ0, δ1 ∈ R, 0 < δ0 < δ1 に対して,

拡大系の状態 x に関する領域 Sδ0δ1 := x∣∣ δ0 ≤ ‖x‖ ≤ δ1

上で (8) 式のリアプノフ関数 V の時間変化 LV が負となる

ための補償器とオブザーバに関する十分条件は,次式で与え

られる.

Kd,m >max

D1(Λ1, Λ2, δ1)

Λ21,m

+D2(Kd, ld, Λ1, Λ2, δ1)

Λ21,mδ2

0

,

D1(Λ1, Λ2, δ1)

Λ22,m

+D2(Kd, ld, Λ1, Λ2, δ1)

Λ22,mδ2

0

,

D1(Λ1, Λ2, δ1) +D2(Kd, ld, Λ1, Λ2, δ1)

δ20

+MMΛ1,M

,

ldMm > 2Kd,M (21)

ここで,D1(Λ1, Λ2, δ1), D2(Kd, ld, Λ1, Λ2, δ1)は次式で定義

される.

D1(Λ1, Λ2, δ1) :=

CMNqd

(

Λ1,M +√

2(1+Λ22,M )

(√

2(1+Λ21,M )+1

))

+ CM

(

Λ1,M + 2(1+Λ22,M ) +

2(1+Λ22,M )

)

δ1

D2(Kd, ld, Λ1, Λ2, δ1) :=

r1

2

(¯MMδ2

1

(1

2+ Λ1,M

)

+2Λ1,MMMδ1+2Kd,MΛ1,M

) 1

2

× Wq,M +r2

2

√MMWv,M +

r1

2

(1

2¯MM (1+Λ2,M )2δ2

1

+2Λ2,MMM (1+Λ2,M )δ1 + Λ22,MMM + 2Kd,MΛ2,M

) 1

2

× Wq,M +

√MM

2

(r1(ld+Λ2,M )Wq,M + r2Wv,M

)

× (1+Nqd+Nqd

+2δ1) (22)

ただし,Kd は正定対称行列,ld は正の実数,Λ1, Λ2 はそれ

ぞれ正定対角行列である.

証明 (20) 式と ldMm > 2Kd,M の条件より,領域 Sδ0δ1

上では次式のように LV を評価できる.

LV ≤ −[

minKd,m−MMΛ1,M , Kd,mΛ2

1,m, Kd,mΛ22,m

− D1(Λ1, Λ2, δ1)]

δ20 + D2(Kd, ld, Λ1, Λ2, δ1) (23)

ただし,D1(Λ1, Λ2, δ1)と D2(Kd, ld, Λ1, Λ2, δ1) は (22) 式

で与えられる.(23)式より,(21)式の残りの条件が直ちに得

られる.

補題 1の条件が満たされるとき,(13)式の条件は自動的に

満たされる.

最後に以下の定理を示す.

定理 1. 任意の λ1 ∈ R, 0 < λ1, ρ ∈ R, 0 < ρ < 1 に対し

て,0 < λ0 < λ1(1 − ρ) を満たす任意の実数 λ0 を定める.

このとき,補題 1で導出した補償器の条件 (21)において

δ0 =

2λ0

PM

, δ1 =

2λ1

Pm

(24)

とした条件は,次式を満たす初期状態の集合

Qx0 := x

∣∣ λ0 < V (x) < λ1(1 − ρ) (25)

と,有界領域を表わす集合

Qx1 := x

∣∣ V (x) < λ1

Page 6: オブザーバに基づく機械系の確率的軌道追従制御について計測自動制御学会論文集 Vol.43, No.3, 1/8(2006) オブザーバに基づく機械系の確率的軌道追従制御について

6 T. SICE Vol.43 No.3 March 2006

に対して,(Qx0 , Qx

1 , ρ)-安定となるための十分条件となる.た

だし,(24)式中の Pm, PM はそれぞれ (8)式の P (q)におい

て Pm ≤ ‖P (q)‖ ≤ PM , for ∀q を満たす正定数である.

また,上記の条件が満たされるとき,次式が成立する.

P

sup0≤t<∞

‖x(t)‖ <

2λ1

PM

≥ ρ (26)

証明 (8)式より,

Pm‖x‖2

2≤ ‖V (x)‖ ≤ PM‖x‖2

2(27)

であるから,λ0 < V (x) < λ1を満たす xの領域上でLV < 0

となるための十分条件が次式のように求まる.

LV (x) < 0 on

2λ0

PM

< ‖x‖ <

2λ1

Pm

(28)

よって補題 1 を用いて,δ0, δ1 が (24) 式を満たすように設

計された補償器は,(28)式の条件を満たす.

このときディンキンの公式より,0 ≤ s ≤ tに対して

E[V (x(t ∩ τSδ0δ1))|Fs] − V (x(s))

=

∫ t∩τSδ0δ1

s

E [LV (x(u))|Fs] du < 0

となり,E[V (x(t ∩ τSδ0δ1))|Fs] < V (x(s)) から V (x(t ∩

τS)); t ≥ 0は非負優マルチンゲールとなる.そこで文献 19)

より,優マルチンゲールの不等式に関する性質を用いると,次

式が成立する.

V (x(0))

λ1≥ P

sup0≤t<∞

V (x(t ∩ τSδ0δ1)) ≥ λ1

= P

sup0≤t<∞

V (x(t)) ≥ λ1

初期状態の集合は (25)式の Qx0 であることから次式を得る.

P

sup0≤t<∞

V (x(t)) < λ1

≥ 1 − λ1(1 − ρ)

λ1= ρ

最後に (26)式は,(27)式より,

x∣∣∣ sup0≤t<∞

‖x(t)‖<

2λ1

PM

x∣∣∣ sup0≤t<∞

V (x(t)) < λ1

が成立することから示される.以上より,題意は示された.

4. 数 値 例

本章では,機械系として Fig. 1 に示すような 2 リンクロ

ボットマニピュレータを考え,シミュレーションにより提案

手法の有効性を確認する.

θ1, θ2 を Fig. 1のように定義し,Table 1に具体的なパラ

メータを示す.ただし添え字 iは,i番目のリンクを表す.ま

た,簡単のために以下の様に b1, b2, b3 を定義した.

b1 := I1 + m1l2g2 + m2l

21 =

4

3m1l

2g2 + m2l

21 ,

b2 := I2 + m2l2g2 =

4

3m2l

2g2 , b3 := l1m2lg2

q1x

y

z

q2

Fig. 1 2-link manipulator

Table 1 Parameters

θi the joint angle of the i-th link [rad]

mi the mas of the i-th link [kg]

li the length of the i-th link [m]

lgi the length to the center of gravity [m]

Ii the inertia of the i-th link [kgm2]

di the friction coefficient of the i-th link [Nms/rad]

ノイズを含むロボットマニピュレータのダイナミクスは (1)

式で表わすことができる.配位座標は q := (θ1, θ2)⊤であり,

慣性行列M(q),遠心・コリオリ力の項C(q, v)は次式で与え

られる.

M(q) =

(

b1 + b2 + 2b3 cos (q2) b2 + b3 cos (q2)

b2 + b3 cos q2 b2

)

C(q, v) =

(

2b3 sin(q2)v2 − d1 b3 sin(q2)v2

−b3 sin(q2)v1 −d2

)

(29)

本章で用いたモデルは水平面上を動く機構であるため,重

力項は G(q) = 0 としている.また,実際に用いた各パラ

メータ値は,b1 = 2.2920,b2 = 0.6000,b3 = 0.7500,

d1 = 0.2415, d2 = 0.2457 である.ノイズのポートとして

Wq(q, v), Wv(q, v)をそれぞれ

Wq(q, v) = 5 × 10−5

(

q1 + v1 + 3

q2 + v2 + 3

)

Wv(q, v) = 0.1

(

q1 + v1 + 3

q2 + v2 + 3

)

(30)

とした.また,軌道追従のための目標軌道として,

qd(t) =

(34π

cos( 2π3

t) − 34π

34π

cos( 2π3

t) − 34π

)

とした.評価のために用いた上界として,MM = 4.83, Mm =

3.00, MM = 1.82, ¯MM = 1.0 × 10−3, CM =

1.89, Wq,M = 8.90 × 10−5, Wv,M = 2.24 ×10−1, Nqd

= 0.34, Nqd= 0.71 を用いた.これらの値は,

MM , Mm, MM , ¯MM については |q2| ≤ π2として 1×10−3

刻みで数値計算により算出した値を用いている.その他の値

は,|q1|, |q2| ≤ π2, |v1|, |v2| ≤ 5 として 0.1 刻みで数値計

算により算出した.

定理 1を用いて補償器のゲインを次のように定めた.まず

λ1 = 650, ρ = 0.5として,λ0 = 324とした.確率リアプノ

Page 7: オブザーバに基づく機械系の確率的軌道追従制御について計測自動制御学会論文集 Vol.43, No.3, 1/8(2006) オブザーバに基づく機械系の確率的軌道追従制御について

計測自動制御学会論文集 第 43 巻 第 3 号 2006 年 3 月 7

フ関数 V の下限と上限 Pm, PM はそれぞれ次のように求め

た.(8)式より,

P =T⊤2 T⊤

1 diag2KdΛ−11 −M, M, 2KdΛ

−12 , MT1T2,

T1 :=

I 0 0 0

I I 0 0

0 0 I 0

0 0 I I

, T2 :=

Λ1 0 0 0

0 I 0 0

0 0 Λ2 0

0 0 0 I

と書けるため,次式を得る.

Pm =3 −

√5

2minΛ1,m, Λ2,m, 1

× min2Kd,mΛ−11,M − MM , Mm, 2Kd,mΛ−1

2,M,

PM =3 +

√5

2maxΛ1,M , Λ2,M , 1 (31)

× max2Kd,MΛ−11,m − Mm, MM , 2Kd,MΛ−1

2,m

上で定めた λ1, λ0, ρと,(31)式と補題 1より,定理 1の条件

を満たす補償器とオブザーバゲインを試行錯誤的にそれぞれ

Kd = diag1345, 1345, Λ1 = Λ2 = diag1, 1, ld = 900

のように定めた.このとき,定理 1より,

P

sup0≤t<∞

‖x(t)‖ < 0.4296

≥ 0.5 (32)

が保証される.

xの初期状態を (4.0×10−4, 1.0×10−4, 0, 0, 0, 0, 0, 0)⊤ と

して,120秒間のシミュレーションを行った結果を Fig. 2か

ら Fig. 6 に示す.Fig. 2,Fig. 3 はそれぞれ実線で q1, q2 と

v1, v2 の時間応答を,点線でそれぞれの目標軌道の時間応答

を表わしている.また,Fig. 4は (5)式のオブザーバの推定

誤差を表わし,q1− q1, q2− q2, v1−v1, v2−v2 の時間応答を

それぞれ示している.Fig. 5は目標軌道との追従誤差を表わ

し,q1−q1d, q2−q2

d, v1−q1d, v2−q2

d の時間応答をそれぞれ示し

ている.Fig. 6は ‖x(t)‖の時間応答を表わしている.シミュレーションでは 0 ≤ t ≤ 12 の有限時間の試行であるが,少

なくともこの時間区間では (32) が成立していることが確認

できる.最後に,Fig. 7に Fig. 6までの見本過程とはそれぞ

れ独立な 3 本の見本過程の ‖x(t)‖の時間応答を示す.Fig. 7

より,他の見本過程においても (32)が成立していることが確

認でき,提案手法の有効性を示すものと考えられる.

time

q1

time

q2

Fig. 2 Responses of q1 and q2

time

v1

time

v2

Fig. 3 Responses of v1 and v2

time

estimation error q1

− q1

hat

time

estimation error q2

− q2

hat

time

estimation error v1

− v1

hat

time

estimation error v2

− v2

hat

Fig. 4 Time histories of the estimation errors

time

tracking error q1

− q1

d

time

tracking error q2

− q2

d

time

tracking error v1

− D q1

d

time

tracking error v2

− D q2

d

Fig. 5 Time histories of the tracking errors

time

no

rm o

f x

λ

Fig. 6 Time history of ‖x(t)‖

5. お わ り に

本論文では,一般的な機械系を対象として,オブザーバに

基づく出力フィードバックを用いた軌道追従制御に関する考

察を行った.不規則雑音を含む機械系を確率システムとして

モデル化し,確率有界安定性に基づく軌道追従制御を達成す

るための補償器と外乱構造に関する条件を導出した.本手法

により,外乱の存在下において追従・推定誤差を任意の大き

Page 8: オブザーバに基づく機械系の確率的軌道追従制御について計測自動制御学会論文集 Vol.43, No.3, 1/8(2006) オブザーバに基づく機械系の確率的軌道追従制御について

8 T. SICE Vol.43 No.3 March 2006

time

no

rm o

f x

λ

time

no

rm o

f x

time

no

rm o

f x

Fig. 7 Time histories of ‖x(t)‖ of other 3 sample passes

さに抑えるための補償器の設計指標を得ることができる.

今後の課題として,定理の条件式を満たす補償器のゲイン

を効率的に求める方法や,そのようなゲインが常に存在する

かなどを調べたい.また,実システムの確率システムとして

の同定手法などを検討したい.さらに機械系だけでなく,電

気-機械系や非ホロノミック拘束を持つシステムなど,さらに

広いクラスのシステムに対する出力フィードバック安定化や

軌道追従制御についての考察を行いたい.

謝辞 本研究に関する貴重なご助言をいただきました

Medtronic, Inc. の H. Berghuis 博士に感謝いたします.

本研究の一部は科学研究費補助金特別研究員奨励費 (No.21・

5764) の助成を受けて行われました.ここに謝意を表します.

参 考 文 献

1)砂原善文 (編):確率システム理論 II, 朝倉書店 (1982)

2)大住晃:確率システム入門, 朝倉書店 (2002)

3)H. J. Kushner : Stochastic Stability and Control, Aca-

demic Press (1967)

4)P. Florchinger : A passive system approach to feedback

stabilization of nonlinear control stochastic systems, SIAM

J. Control Optim., 37-6, 1848/1864 (1999)

5)B. Maschke and A. J. van der Schaft : Port-controlled

Hamiltonian systems: modelling origins and system theo-

retic properties, Proc. 2nd IFAC Symp. Nonlinear Control

Systems, 282/288 (1992)

6)佐藤, 藤本:確率ポート・ハミルトン系の受動性に基づく制御,

計測自動制御学会論文集, 44-8, 670/677 (2008)

7)佐藤, 藤本:時変確率ポート・ハミルトン系の安定化と確率的

軌道追従制御への応用,第 37回 制御理論シンポジウム予稿集,

393/398 (2008)

8)M. Takegaki and S. Arimoto : A new feedback method for

dynamic control of manipulators, Trans. ASME, J. Dyn.

Syst., Meas., Control, 103, 119/125 (1981)

9)S. Stramigioli, B. M. J. Maschke and A. J. van der

Schaft : Passive output feedback and port interconnec-

tion, Proc. 4th IFAC Symp. Nonlinear Control Systems,

613/618 (1998)

10)R. Ortega, A. Lorıa, R. Kelly and L. Praly : On

passivity-based output feedback global stabilization of

Euler-Lagrange systems, Proc. 33rd IEEE Conf. on De-

cision and Control, 381/386 (1994)

11)S. Nicosia and P. Tomei : Robot control by using only

joint position measurements, IEEE Trans. Autom. Contr.,

35-9, 1058/1061 (1990)

12)H. Berghuis and H. Nijmeijer : A passivity approach

to controller-observer design for robots, IEEE Trans.

Robotics and Automation, 9-6, 740/754 (1993)

13)H. Deng and M. Krstic : Output-feedback stochastic non-

linear stabilization, IEEE Trans. Autom. Contr., 44-2,

328/333 (1999)

14)J.-J. E. Slotine and W. Li : On the adaptive control of

robot manipulators, Int. J. Robotics Research, 6-3, 49/59

(1987)

15)B. Paden and R. Panja : Globally asymptotically stable

’PD+’ controller for robot manipulators, Int. J. Control,

47-6, 1697/1712 (1988)

16)H. Berghuis : Model-based robot control: From theory

to practice, PhD thesis, Univ. Twente, Enschede, The

Netherlands (1993)

17)K. Ito : On a formula concerning stochastic differentials,

Nagoya Math. J., 3, 55/65 (1951)

18)岩崎徹也:LMI と制御, 昭晃堂 (1997)

19)H. J. Kushner : Stochastic stability, Stability of Stochastic

Dynamical Systems; Lecture Notes in Math. 294, Springer-

Verlag, Berlin and New York (1972)

[著 者 紹 介]

佐 藤 訓 志(学生会員)

2005 年名古屋大学工学部機械・航空工学科卒

業.2007 年名古屋大学大学院工学研究科博士前

期課程修了.同年同博士後期課程に進学し,現在

に至る.2009 年より日本学術振興会特別研究員

(DC2).非線形制御の研究に従事.2008年 IEEE

Robotics Automation Society Japan Chapter

Young Award, 2009 年 計測自動制御学会制御部

門研究奨励賞を受賞.IEEE, 日本ロボット学会の

会員.

[著 者 紹 介]

藤 本 健 治(正会員)

1994年京都大学工学部精密工学科卒業,96年京

都大学大学院工学研究科修士課程応用システム科

学専攻修了,97年同大学院博士後期課程を中途退

学,同年京都大学大学院工学研究科助手等を経て,

2007 年より名古屋大学大学院工学研究科准教授.

99年オーストラリア国立大学客員研究員,99-2000

年および 2002年デルフト工科大学客員研究員.非

線形制御の研究に従事.博士 (情報学).2000 年

計測自動制御学会論文賞武田賞,2003 年 計測自

動制御学会制御部門大会賞,2005 年 The IFAC

Congress Young Author Prize, 2007 年 計測自

動制御学会制御部門パイオニア賞を受賞.IEEE,

システム制御情報学会,日本機械学会,日本鉄鋼

協会の会員.