Új irányzat a modell-referenciás adaptív szabályozók … · lyapunov phd értekezésében...

11
* ** *** * ** ***

Upload: others

Post on 24-May-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Új irányzat a Modell-referenciás Adaptív Szabályozók … · Lyapunov PhD értekezésében közölt eredeti módszerét használják (Lyapunov [1892]), amely a múlt század

Új irányzat a �Modell-referenciás AdaptívSzabályozók� kialakításában: a

Lyapunov�függvények kiváltása �RobusztusFixpont Transzformációkkal�

Tar József, Nádai László ∗ Rudas Imre ∗∗

Eredics Kristóf (hallgató) ∗∗∗

∗Óbudai Egyetem, Közlekedésinformatikai és Telematikai EgyetemiTudásközpont, H-1034 Budapest, Bécsi út 96/B, Magyarország (Tel:+36-1-666-5543; e-mail: {tar.jozsef@nik. nadai@}uni�obuda.hu)∗∗Óbudai Egyetem, Intelligens Mérnöki Rendszerek Intézet, H-1034

Budapest, Bécsi út 96/B, Magyarország (Tel: +36-1-666-5543; e-mail:rudas@uni�obuda.hu)

∗∗∗Óbudai Egyetem, Bánki Donát Gépész és BiztonságtechnikaiMérnöki Kar, H-1081 Budapest, Népszínház utca 8, Magyarország

Tartalmi kivonat: A pontosan nem ismert, id®ben változó paraméterekkel rendelkez®klasszikus mechanikai rendszerek pontos szabályozása ma is kihívást jelent. A klasszikus adap-tív megoldások mint a �Adaptive Inverse Dynamics (AID)�, �Adaptive Slotine�Li Controller(ASLC)�, általában Lyapunov 2. vagy �direkt� módszerét használják a rendszer rendelkezésreálló közelít® modelljének pontossá hangolására. Gyakorlati szempontból fontos hátrányuk,hogy alkalmazhatóságuknak irreális korlátai vannak: a dinamikai paramétereknek konstansnakkell lenniük, a mozgásegyenletekben lineárisan szeparálva kell megjelenniük pontosan ismertegyütthatókkal szorozva, a szabályozott rendszert nem érhetik tartós ismeretlen küls® zavarok,továbbá hangolási módszerük sok fölösleges, önkényes szabályozó paramétert tartalmaz. Ezeknélgyakorlatiasabbak a �Model Reference Adaptive Controllers (MRAC)� jelleg¶ szabályozók,amelyek dinamikai modell�paraméterek helyett szabályozó paramétereket és gyors visszacsatolójeleket alkalmaznak, ám az irodalomból ismert változatok valamennyien Lyapunov�függvénysegítségével vannak kialakítva, ami egy matematikailag nehéz technika. Az ilyen matematikainehézségek elkerülése céljából vezettük be az igen egyszer¶, �Robusztus Fixpont Transzfor-mációk� (�Robust Fixed Point Transformations (RFPT)�) használatán alapuló adaptív sza-bályozókat, amelyek Lyapunov�függvény helyett egyszer¶ kontraktív leképezésekkel Cauchy�sorozatokat generálnak, amelyek a szabályozási probléma megoldásához konvergálnak. Magyarnyelv¶ el®adásban el®ször mutatjuk meg, hogy ez a módszer az MRAC szabályozók formaikeretében is ki tudja váltani a Lyapunov�függvény technikát. Az intelligens járm¶szabályozásszempontjából az MRAC alkalmazásának lényege, hogy segítségével a tényleges rendszer�dinamika helyett a szabályozott rendszer a �referencia modell� dinamikai sajátságait mutatja,így sokkal kényelmesebben kezelhet®vé tehet® a vezet® számára, mint az eredeti modell. Alkal-mazási paradigmának egy ún. �alulhajtott� rendszert választottunk, amelyben a szabályozotttengelyre közvetlenül nem tudunk er®t kifejteni, csupán a közvetlenül hajtott tengelyekhezköt®d® dinamikai csatolások hatásán tudjuk szabályozni azt. Az ilyen rendszerek formálisan nembírnak olyan szimmetriákkal, amelyekre az összes szabadsági fokukban szabályozott rendszerekrekiépített AID és ASLC szabályozók épülnek. A javasolt új módszer használhatóságát szimulációseredményekkel illusztráljuk.

Kulcsszavak: Modell�Referenciás Adaptív Szabályozás, Lyapunov 2. Módszere, RobusztusFixpont Transzformációk, Cauchy Sorozatok, Adaptív Paraméterhangolás.

Page 2: Új irányzat a Modell-referenciás Adaptív Szabályozók … · Lyapunov PhD értekezésében közölt eredeti módszerét használják (Lyapunov [1892]), amely a múlt század

1. BEVEZETÉS

A pontatlanul ismert, id®ben nem állandó paraméter¶dinamikai rendszerek precíz adaptív szabályozása ma iskihívást jelent. A klasszikus modell�alapú eljárások vagya megfelel® analitikus modell hiányával, vagy annak végte-len komplexitásával kerülhetnek szembe. Tipikus példaerre folyadékkal nem teljesen feltöltött tartály mozgatása,miközben a folyadék dinamikai kölcsönhatásban áll atartály falával. Valós idej¶ szabályozás céljaira nyilván-valóan semmiféle kontinuummechanikai modell értelmesfelhasználása nem remélhet®.

A rendelkezésre álló közelít® dinamikai modell adap-tív �nomhangolását megvalósító módszerek iskolapéldáiaz AID and ASLC módszerek. Ezek megtervezése Lya-punov 2. �direkt� módszerén alapul, ami egy széles kör-ben használható módszer nemautonóm dinamikai rend-szerek szabályozásában. A tipikus stabilitás�bizonyításokLyapunov PhD értekezésében közölt eredeti módszeréthasználják (Lyapunov [1892]), amely a múlt századközepén vált általánossá, s több kiadást is megért (pl.Lyapunov [1966]). Ennek nagy el®nye, hogy nem igénylia mozgásegyenletek megoldását a stabilitás eldöntéséhez,hanem csak néhány egyszer¶ becslést. (E megoldásokközismerten a legtöbb gyakorlati esetben �zárt anali-tikus formában� nem is fejezhet®k ki, csupán numerikusmegoldási lehet®ségek állnak rendelkezésünkre.) A becsléslényege, hogy a pályakövetési hibákból és a paraméter�becslés hibájából készült kvadratikus struktúrájú, pozi-tív de�nit V Lyapunov�függvény nem pozitív id® szer-inti deriváltját kell garantálni a t ∈ [0,∞) tartomány-ban. Ebb®l a Barbalat lemma értelmében (pl. Slotineet Li [1991]) következik, hogy V → 0 V egyenletesenfolytonossága miatt. Ezt általában úgy garantálják, hogymegmutatják: V vagy korlátos vagy eléggé negatív ahhoz,hogy V aszimptotikusan 0�hoz konvergáljon. Magát a Lya-punov függvényt a szabályozó természeten nem használja(a függvény nem is ismert, hiszen tartalmazza az is-meretlen paraméter�hibákat), csupán az annak szerkeze-téb®l következ® folyományokra épít. Mind az AID mindpedig az ASLC módszer valamilyen Lyapunov�függvénythasznál e szerint a megfontolás szerint. Az alábbi meg-fontolások matematikai hátterét mindkét módszerre ala-posan részleteztük a Tar et al. [2008a], Tar et al. [2009a],és Tar et al. [2009b] közleményekben, itt csak felsoroljuk®ket:

• igen ambiciózus céljuk, hogy tökéletesen megtanuljáka szabályozandó rendszer dinamikai modelljét ; enneksikeréhez az alábbi feltételek teljesülése szükséges:• sem tartós, ismeretlen küls® zavarok nem létezhetnek,sem modellezetlen, csatolt bels®, �rejtett� dinamikaialrendszer nem lehet jelen a szabályozandó rendszer-ben;• a módszerek arra a feltevésre épülnek, hogy a rendszerdinamikai modellje a nem pontosan ismert dinamikaiparaméterek lineáris kombinációját tartalmazza pon-tosan ismert együtthatókkal, amelyek a dinamika álla-potváltozó függvényei lehetnek ;• a dinamikai modell�paraméterek id®ben állandóak.

Az AID és az ASLC módszerek nagy el®nye, hogy azoka fenti feltételek teljesülése mellett a szabályozás globális

aszimptotikus stabilitását garantálják. Ugyanakkor az isvilágos, hogy ezek a feltételek gyakorlati szempontból túler®sen korlátozóak. A legtöbb komplex rendszernek van-nak olyan csatolt részrendszerei, amelyeket nem tudunkkielégít®en modellezni. A legközönségesebb súrlódási mo-dellek nem elégítik ki a lineáris leválaszthatóság feltételét(e.g. Márton et Lantos [2006]), a dinamikus Lund�Grenoble modell pedig csatolt bels® részrendszert tartal-maz, bár ennek modellje legalábbis elvben ismert (Hensenet al. [2003]). Az er®sen nemlineáris súrlódási e�ektusokf®leg a kis sebesség¶ mozgások szabályozásában nagyonzavaróak, paramétereinek valós idej¶ identi�kálása nagyonnehéz és komplex feladat, nem megfelel® kompenzálásuktartós követési hibát, túlkompenzálásuk határciklus jelleg¶oszcillációt eredményezhet (pl. Putra et al. [2007], Mártonet Lantos [2009]).

Kimutattuk továbbá, hogy a fenti korlátokon túl aLyapunov�függvények �ortodox használata� túl komplikáltés nem hatékony paraméter�hangolást eredményez. Aparaméterek hibájára vonatkozó, ugyanazon mozgásegyen-letekben meglév® információ hatékonyabb felhasználásávalgyorsabb és sokkal kevesebb önkényesen beállítható szabá-lyozó paramétert tartalmazó hangolás is megvalósítható,miközben a megoldás �kordában tartásáról� a tanulás idejealatt az eredeti Lyapunov�függvény egy töredék része isképes gondoskodni (Tar et al. [2008a], Tar et al. [2009b]).E módosított hangolású szabályozók használhatóságáhozváltozatlanul szükséges a fenti, tételesen felsorolt feltételekteljesülése. A tanulás hangsúlyozott gyorsasága miatt emódosított változatok sokkal érzékenyebben reagáltak afeltételek sérülésére, mint az eredeti AID és ASLC szabá-lyozók.

A modell�paraméterek helyett a szabályozó jeleket han-goló ún. �jel�adaptív szabályozók� a fentieknél kevésbésérülékeny konstrukciók, mivel a rendszer viselkedésébenmeg�gyelhet®, a rendelkezésre álló modell viselkedését®leltér® m¶ködést nem a modell�paraméterek hangolásá-val kívánják kompenzálni. Ebbe az osztályba tartoznakaz MRAC szabályozók, amelyek népszer¶ és hatékonymegoldásoknak bizonyultak nemlineáris rendszerek, pl.robotok szabályozásában. Számtalan, a témába ill® köz-lemény jelent meg a 90�es évek elejét®l napjainkig (pl.Slotine et Li [1991], Hosseini�Suny et al. [2010]). Nguyenet al. [1993] módszere gyakorlati áttörést jelentett egyStewart platform jelleg¶ manipulátor szabályozásában(Hardware Real-Time Emulator), amelyet a GoddardSpace Flight Center�ben használtak ¶rben végrehajtandóm¶veletek emulálásához. Az MRAC technika lényege,hogy az a visszacsatolt rendszer dinamikai m¶ködését egyún. referencia modell m¶ködéséhez közelíti. Az irodalom-ból ismert megoldások zöme (e.g. Slotine et Li [1991],Isermann et al. [1992], Somló et al. [2002]) e szabályozókatis Lyapunov�függvény segítségével konstruálja meg.

Nemrég kiderült, hogy a �Robusztus Fixpont Transzformá-ciók� (Tar et al. [2008b]) szintén felhasználhatók azMRACszabályozók egy egyszer¶ megvalósítására, Lyapunov�függvények alkalmazása nélkül Tar et al. [2010a], Taret al. [2010b])). Ezekben a korábbi közleményekben egybemenet¶ � egy kimenet¶, illetve valamennyi szabad-sági fokában hajtással rendelkez® több bemenet¶ � többkimenet¶ rendszereket vizsgáltunk. A jelen vizsgálatok

Page 3: Új irányzat a Modell-referenciás Adaptív Szabályozók … · Lyapunov PhD értekezésében közölt eredeti módszerét használják (Lyapunov [1892]), amely a múlt század

m1,L1,q1

M

m2,L2,q2

q3

Ábra 1. A kocsi+kett®s inga rendszer vázlata

tárgya egy nem teljesen meghajtott robotkocsi, amelynekmodelljét a következ® szakaszban adjuk meg.

2. AZ �ALULHAJTOTT� KOCSI + KETT�S INGARENDSZER DINAMIKAI MODELLJE

A tekintett nemlineáris dinamikai rendszer vázlata az 1.ábrán látható. A rendszernek csak a két forgási szabad-sági foka, q1 és q2 rendelkezik hajtással, e hajtásokkal adinamikai csatolásokon keresztül kívánjuk szabályozni alineáris q3 szabadsági fok menti mozgást, melyhez csakérzékel®ink vannak. A teljes rendszer impulzusa vízszin-tes komponensének megmaradása miatt e mozgásnak ter-mészetes korlátai vannak, amelyek legalább fékek beik-tatásával lennének kib®víthet®k. A jelenlegi feltételezésszerint a kocsi vízszintesen szabadon gördülhet.

A mozgásegyenletek az alábbiak: m1L21 0 −m1L1sq1

0 m2L22 −m2L2sq2

−m1L1sq1 −m2L2sq2 M +m1 +m2

×[q1

q2

q3

]+

m1L1gcq1

m2L2gcq2

−m1L1cq1q21 −m2L2cq2q

22

=

[Q1

Q2

0

](1)

, a következ® jelölésekkel: cqi = cosqi, sqi = sinqi, ga gravitációs gyorsulás állandója, és a Q3 ≡ 0 felté-tel jelenti, hogy a rendszer nem teljesen hajtott. A q3

menti mozgás szabályozása a Q1 és Q2 forgatónyomatékkomponensekhez való dinamikai csatolás kihasználásávala következ®képp történhet. Írjunk el® tetsz®leges kine-matikai megfontolások alapján egy �kívánt� (�desired�) má-sodik deriváltat a q3 menti mozgásra, jelöljük ezt qDes3 mó-don. Hasonlóan, írjunk el® egy kés®bb de�niálandó �segéd�gyorsulást� q1 mentén az egyik hajtó�tömegre is: (qDes1 ).Ezeket behelyettesítve (1)�be a modell alapján megkapjukazt a szükséges qDes2 gyorsulást, amely a Q3 ≡ 0 feltételmellett az el®z® két érték megvalósulását lehet®vé teszi.Mivel a szabályozónak nincs pontos dinamikai modellje,e számításokhoz a valódi adatok helyett a közelít® m1,m2 és M értékeket használja (ésszer¶ feltételezni, hogylegalább a gravitációs gyorsulás és a kar�hosszak pontosanismertek, azaz L1 = L1, L2 = L2, és g = g). Az ígykiszámított Q1 és Q2 forgatónyomaték komponenseketezután a hajtások �ráeresztik� a valóságos rendszerre, ame-

lynek a válaszát a megvalósult [q1, q2, q3] értékek jelen-tik (1) szerint. A �válaszhiba�, azaz a [qDes1 , qDes3 ] és a[q1, q3] értékek különbsége alapján a 3. szakaszban leírtmechanizmus megkísérli a kívánt értékek realizálását (aqDes2 mennyiség értéke számunkra érdektelen.) E programvégrehajtásánál a következ® nehézségekbe ütközünk (aválasztott paradigma érdekességét épp ezek a nehézségekjelentik): qDes2 kiszámításához (1) utolsó sorában oszta-nunk kell az m2L2sq2 mennyiséggel, amely nyilván szingu-laritásra vezet q2 = ±π, 0 értékek körül. Hasonló gondjainkvannak q1 = ±π, 0 környezetében is. Hogy ezekt®l a szi-tuációktól megszabaduljunk, használjuk a két hajtósúly,m1 és m2 reakcióerejét a következ® módon: a) mindkétkar induljon a �legjobb� π/2 érték¶ pozícióból; b) ha q1

még a �biztonságos zónában� van, azaz q1 ∈ [π/4, 3π/4],akkor q1 pillanatnyi értéke még nem érdekes, így q2 arrakényszeríthet®, hogy a legjobb pozíció (π/2) felé mozogjona qDes2 = −C2(q2 − π/2) − 2Cq2 (C > 0) szabály szerint,és qDes1 ennek megfelel®en határozható meg; c) ha q1 kívülesik a biztonságos zónán, akkor a qDes1 = −C2(q1−π/2)−2Cq1 szabály szerint ® kényszeríthet® az ideális érték feléés qDes2 ennek megfelel®en határozható meg. A jelen szi-mulációkban ezt a módszert használtuk, noha ennél sokkalcizelláltabb megoldások is kidolgozhatók lennének.

3. AZ ELVÁRT�MEGVALÓSULT VÁLASZONALAPULÓ ADAPTÍV SZABÁLYOZÁS

Számos szabályozási feladat megfogalmazható úgy, hogy aszabályozandó rendszer valamilyen pontatlan és részlegesmodellje (ϕ) alapján a rendszer egy �kívánt válaszából �(rd) kiszámítunk valamilyen Q = ϕ(rd) �gerjesztést�,melyre a rendszer (akár modellhibák, akár küls® zavarok,akár mindkét körülmény szimultán fennállása miatt)valamilyen �megvalósult választ� rr ≡ ψ(ϕ(rd)) ≡ f(rd) 6=rd produkál, ahol ψ jelöli a tényleges rendszer�dinamikát.A legegyszer¶bb szabályozási mód vagy a ϕ modell mó-dosítása, vagy az ennél is egyszer¶bb eljárás, az rd be-meneti válasz deformálása rd? értékre lenne úgy, hogy fent-álljon az rd = f(rd?) összefüggés. Egy ilyen helyzet fent-tartható lehet lokális deformációk bevezetésével, amelyeka rendszer állapotát valamilyen trajektória mentén mint-egy maguk után húzzák. Egy ilyen lokális deformációtjavasoltunk egy �bemenet¶�egy kimenet¶ � (SISO � SingleInput � Single Output) rendszerekre (Tar et al. [2008b]),amely viszonylag robusztus volt a szabályozott rendsz-erre érvényes f() függvény speciális sajátságaira nézve. Erobusztusság matematikailag az f(x) függvény x? körülia�n közelítésével értelmezhet® mint a tanh(x) függvényer®s nemlineáris telít®déséb®l ered® tulajdonság az alábbimódon:

G(x|xd) := (x+K)××[1 +B tanh(A[f(x)− xd])

]−K (2)

G(x?|xd) = x? ha f(x?) = xd,G(−K|xd) = −K, (3)

G(x|xd)′ =(x+K)ABf ′(x)

cosh(A[f(x)− xd])2+

+1 +B tanh(A[f(x)− xd]),G(x?|xd)′ = (x? +K)ABf ′(x?) + 1.

(4)

Page 4: Új irányzat a Modell-referenciás Adaptív Szabályozók … · Lyapunov PhD értekezésében közölt eredeti módszerét használják (Lyapunov [1892]), amely a múlt század

Világos, hogy az (2)-ben de�niált leképezésnek van egy�megfelel®� (x?) és egy �hamis� (−K) �xpontja, s hogy azA, B, és K szabályozási paraméterek megfelel® manipu-lálásával számos �zikai rendszer esetében elérhet® lehet,hogy az {x0, x1 = G(x0), ..., xn+1 = G(xn), ...} egyszer¶iterációval nyert sorozat x?-hoz konvergáljon egy körülöttekialakított vonzási medencén belül. Ennek érdekében ele-gend® a |G′| ≤ H < 1 [0 ≤ H < 1] feltétel biz-tosítása x?-ban és környezetében (4) szerint, ami �kontrak-tív leképezésként� az (xn → x?) konvergenciára vezethet:

|G(x?)− x?| ≤ |G(x?)− xn|+ |xn − x?| == |G(x?)−G(xn−1)|+ |xn − x?| ≤

≤ H|x? − xn−1|+ |xn − x?| → 0, xn → x?.(5)

A (2)�ben adott módszer egy lehetséges kiterjesztése �többbemenet¶ � több kimenet¶� [Multiple Input � MultipleOutput (MIMO)] rendszerekre a következ®képp történhet.Egy egyváltozós szigmoid függvény segítségével, amely 0bemenetnél 0 kimenetet ad [erre a (2)-ben adott tanhfüggvényen kívül számtalan lehet®ség van, például aσ(x) := x/(1 + |x|)) függvény], leképezést végzünk a�válaszhiba� irányában az n. szabályozási ciklusban: legyena vektor jelleg¶ válaszhiba h := f(rn) − rd, e :=h/||h||, B = Bσ(A||h||), s a leképezés kimenete legyenrn+1 = (1 + B)rn + BKe. A K,B, és A paraméterekmeghatározására egy adott alkalmazás céljaira szimulá-ciós számítások végezhet®k durván megbecsült paraméter�hibákra egy egyszer¶ PID szabályozóval az el®fordulóválaszok maximumára nézve ||f ||. Ekkor beállítható aK ≈ −10 vagy −1000 × ||f ||max, B = ±1 (a ∂f

∂r gra-diens jellegét®l függ®en), és A elég kicsivé tehet® ahhoz,hogy fennálljon a következ® becslés: |KA| · ||∂f

∂r || ≈ 0.5.A szabályozás konvergenciájának fenntartása érdekében amozgásnak belül kell maradnia az iteráció vonzási tar-tományában. Ezt kézenfekv® az egyetlen A paraméterhangolásával biztosítani, ha K és B már be vannak állítva.Észrevehetjük, hogy a �xpont közelében B � 1 and Be =σ (A||h||) h/||h|| ≈ Ah, következésképp ||Br|| � ||KBe||.Emiatt (2) pontos másolása helyett az (n+1). szabályozásiciklusban MIMO rendszerekre alkalmazható a következ®�xpont transzformáció:

r(n+ 1) = r(n) +KBσ(A||h(n)||)||h(n)||

h(n)

h(n) := f(r(n)− rd(n+ 1)). (6)

A �xpont közelében, mid®n az iterációban a ||r(n + 1) −r(n)|| különbségek értéke már csekély, h változása els®rendig való sorfejtéssel becsülhet®:

f(rn+1) ≈ f(rn) +∂f

∂r(n)KBAhn,

f(rn+1)− rdn+2 ≈ f(rn)− rdn+1 − rdn+2 + rdn+1+

+∂f

∂r(n)KBAhn

, (7)

ami úgy értelmezhet®, hogy hn+1 =[I +KBA∂f

∂r (n)]hn−

(rdn+2− rdn+1). Mivel normális esetekben a kívánt szabály-ozó jel csak lassan változik, a rdn+2 − rdn+1 járulék nemlehet nagyon jelent®s, s az els® tagot kell megfelel®enbeállítani. Például, ha el®re tudható, hogy ∂f/∂r is pozitív

de�nit, kis A > 0 és B = 1 esetén KBA(∂f/∂r)hnegy kis vektor, ami közel hn irányával ellentétes iránybamutat, ami megfelel a válaszhiba ciklusról ciklusra valócsökkenésének. Ez akkor is igaz, ha ∂f/∂r nem szim-metrikus, de szimmetrikus része pozitív de�nit. Míg azantiszimmetrikus rész hn�re ortogonális komponenst gene-rál, a szimmetrikus rész közel ellentétes irányú járulékot.(Negatív de�nit esetben a B = −1 megoldás hasonló ered-ményre vezet.) Ha a szabályozó elment néhány múltbéliadatot, az (n + 2). szabályozási ciklusban a következ®becslés tehet®:

hTn[hn+1 − hn + (rdn+2 − rdn+1)

]hTnhn

=

=KBAhTn

∂f∂r hn

hTnhn:= εest

. (8)

Pozitív de�nit ∂f/∂r feltételezésével ebb®l meg tudjukmondani, hogy A értéke növelend® vagy csökkentend®.Ehhez egy kvázi�exponenciális hangolás dolgozható ki akövetkez®képp:

• az exponenciális függvény diszkrét közelítéséhez ve-zessünk be egy 0 < γ < 1 paramétert a következ®képp:csökkentend® A esetén legyen An+1 = γAn; ha adiszkrét id®�felbontás lépésköze ∆cycle ez megfelel akövetkez® deriváltnak: An ≈ An+1−An

∆cycle= γ−1

∆cycleAn

egy τ id®állandóval mint 1/τ := γ−1∆cycle

az A(t) =A0 exp(t/τ) függvénnyel, ami a γ = ∆cycle/τ + 1becslésre vezet;• növelend® A esetén legyen An+1 = An/γ;• a csökkenés sebessége növelhet® egy cfactor > 1paraméter bevezetésével: An+1 = γAn/cfactor;• hogy elkerüljük a numerikusan fenyeget® A = 0esetet a csökkentéseknél, A értékét nem engedjük egynagyon kis, de numerikusan még jól kezelhet® limitalá csökkenni;• kritikusan kis nevez®, azaz túl kicsi ||hn|| érték el®-fordulása ellen a nevez® (hTnhn + %eps) értékre valómódosításával védekezhetünk (%eps itt a SCILABszoftver �kis� numerikus értékét jelenti).

A fenti módszer az MRAC technikába a következ®képpépíthet® be (2. ábra).

A kívánt gyorsulásokat behelyettesítjük a referencia mo-dellbe, majd az abból számolt általánosított er®ket �ereszt-jük rá� a valódi rendszerre. A kapott választ (esetünkbengyorsulásokat) a mérhet®, aktuális állapot adataival együttvisszahelyettesítjük a referencia modellbe, és a fenti itera-tív folyamatot a q koordináták helyett a Q = U szabá-lyozó ágensek terében hajtjuk végre. A várható eredménya valóságos rendszer viselkedésének olyan torzítása lesz,amely azt a látszatot kelti, mintha a referencia modellb®lszámolt nyomatékok/er®k hatására a valódi rendszer isúgy gyorsulna, mint maga a referencia modell, miközbena pályakövetési hiba is relaxálódik. A következ® sza-kaszban a módszer m¶ködését szimulációs eredményekkelillusztráljuk.

Page 5: Új irányzat a Modell-referenciás Adaptív Szabályozók … · Lyapunov PhD értekezésében közölt eredeti módszerét használják (Lyapunov [1892]), amely a múlt század

Reference Model

Dq&&

Deformation

DU

ReqU

System

Reference ModelDelay

Delay

q&&

q&&

The Adaptive Part of the Controller

The „Deformed System”

Ábra 2. Az új adaptív módszer beépítése az MRAC sémába (azábrán látható késleltetés a szabályozás ciklusidejének felel meg)

4. SZIMULÁCIÓS EREDMÉNYEK

Szimulációs vizsgálatok céljára a SCILAB 5.1.1 verzió-számú szoftver alól futtatható SCICOS ver. 4.2 szimulációscsomagot használtuk, amely kutatási célokra szabadonhasználható. E szoftver többféle numerikus integrációsmódszert is használ, s ezeket a probléma merevségét®lfügg®en automatikusan határozza meg. A megengedhet®legkisebb lépésközt az integrátor számára 10−4 s�ra állí-tottuk, míg ∆cycle = 10−3 s volt. A kívánt pályakövetésta

ξ(t) :=∫ t

0

[qN (ζ)− q(ζ)]dζ,(d

dt+ Λ

)3

ξ(t) = 0. (9)

PID jelleg¶ szabály szerint írtuk el® Λ > 0 id®állandóval.

A számításokban a következ® értékeket használtuk: Λ =12/s, C = 10/s, s a rendszer tényleges adatai az aláb-biak voltak: m1 = m2 = 8kg, M = 20kg, L1 =L2 = 2m, g = 9.81m/s2. A referencia modell függetlenadatai a következ®k voltak: m1 = 4kg, m2 = 8kg,M = 18kg. A nominális pályának harmadrend¶ spline�függvényt írtunk el®, amelynek 2. id® szerinti deriváltjaiszakaszonként lineárisan változnak id®ben. Az adaptív sza-bályozás paraméterei az els®, nem hangolt, �x esetben azalábbi konstansok voltak: K = −47, B = 1, A ≡ 2.5 ×10−8.

Tipikus futási eredmények láthatók a 3. és 4. ábrákon,amelyek igazolják, hogy az új adaptív módszer az alulhaj-tott rendszer esetében is MRAC szabályozóként m¶ködik:a nominális pályára a második deriváltakig mintegy�rásimul� a megvalósult pálya, miközben a ténylegesrendszerre a referencia modellb®l számolt nyomatékoktóllényegesen különböz® nyomatékok hatnak.

A 5. és 6. ábrák a közönséges PID szabályozó m¶ködésétmutatják. A nominális és a megvalósult pálya ekkor isösszesimul egymással, bár az állandósuló pályakövetésihiba (amely a nominális és valódi kezdeti sebesség egy-mástól való eltérésének lecsengése után adódik) kb. dup-lája az adaptív módszerének. A megvalósult gyorsulásokazonban nem pontosan a kívánt, kinematikai PID séma

y

t21 876540

0.4

0.2

0.0

-0.2

-0.4

3

Graphic 1

y

5432t

8710

2.0

1.5

1.0

0.5

0.0

-0.56

Graphic 2

876543210

3.5e-0083.0e-0082.5e-0082.0e-0081.5e-0081.0e-0085.0e-009

0.0e+000

y

Graphic 3

y

0.150.100.050.00x

0.300.25

0.3

0.2

0.1

0.0

-0.1

-0.2

-0.3

-0.4

0.20

Graphic 1

y

5432t

8710

1.5e-003

1.0e-003

5.0e-004

0.0e+000

-5.0e-004

-1.0e-0036

Graphic 1

t876543210

0.4

0.2

0.0

-0.2

-0.4

y

Graphic 2

Ábra 3. Az új adaptív módszer �x A paraméter mellett: a nominálisqN3 (t) [m] pálya (legfels® fekete vonal), a számított q1(t) [rad](zöld), q2(t) [rad] (piros), és q3(t) [m] (sárga) értékek, az Aparaméter értéke (kék vonal), a nominális és a megvalósult {q3[m/s] értékek a q3 [m]} értékek függvényében, a pályakövetésihiba [m], valamint a nominális (zöld) és megvalósult (piros)pályák fedése

szerint alakulnak, a referencia modellb®l számolt nyoma-tékok közvetlenül vannak kifejtve a valódi rendszerre, slényegesen különböznek a megvalósult gyorsulásokból és areferencia modellb®l visszaszámolt nyomatékoktól.

Page 6: Új irányzat a Modell-referenciás Adaptív Szabályozók … · Lyapunov PhD értekezésében közölt eredeti módszerét használják (Lyapunov [1892]), amely a múlt század

y

5432t

8710

3

2

1

0

-1

6

Graphic 1

y

5432t

8710

100

50

0

-50

-100

-150

6

Graphic 1

Ábra 4. Az új adaptív módszer m¶ködése �x A paraméter mellett: aqN3 (t) (fekete), a qDes

3 (t) (zöld) és a realizált q3(t) [m/s2] (piros)értékek az id® függvényében (fels® ábra); a referencia modell

nyomatékai QRef1 (fekete), QRef

2 (kék), a valóságos gyorsulá-sokból és a referencia modellb®l visszaszámolt QReCalc

1 (zöld),QReCalc

2 (világoskék), valamint a �zikai rendszerre ténylegesenkifejtett Q1 (piros), Q2 (sárga) nyomaték értékek [N ×m] azid® függvényében (alsó ábra)

Az A paraméter leírt hangolásának hatását mutatják a7. és 8. ábrák. Ezek az eredmények összemérhet®k a�x paraméterrel kapott eredményekkel, ami elméletileg isvárható, hiszen a �xpont közelében m¶köd® szabályozás-nak a gyorsasága függ kissé ezekt®l az adatoktól.

Mindazonáltal jelent®s eredmény az A paraméter jelent®sid®függése, ami jól mutatja, hogy a hangolás követi akívánt �xpont vándorlását, és számottev®en hozzájárul aszabályozás stabilitásának biztosításához is. A 9. ábra ajobb skálázhatóság érdekében a σ(εest) függvény értékétmutatja, amit a szabályozó igyekszik kis negatív értékkörül tartani.

Tanulságos a kívánt qDes3 és a megvalósuló q3 értékekkapcsolata, amelyet a vizsgált esetekben a 10., 11., és a12. ábrák mutatnak. Mindegyik esetben a kapott ered-mény az ideális 45 fokos meredekség¶ egyenes környékénbolyong, az adaptív szabályozóban azonban gyors tenden-

y

0.150.100.050.00x

0.300.25

0.3

0.2

0.1

0.0

-0.1

-0.2

-0.3

-0.4

0.20

Graphic 1

y

4321t

760

1.5e-003

1.0e-003

5.0e-004

0.0e+000

-5.0e-004

-1.0e-0035

Graphic 1

t876543210

0.4

0.2

0.0

-0.2

-0.4

y

Graphic 2

Ábra 5. A nem adaptív, közönséges PID szabályozó m¶ködése areferencia modell és a valódi rendszer paramétereinek eltérésemellett: a nominális és a megvalósult {q3 [m/s] értékek a q3[m]} értékek függvényében (fels® ábra), a pályakövetési hiba[m], valamint a nominális (zöld) és megvalósult (piros) pályákfedése (alsó ábra)

ciák m¶ködnek, amelyek a kapott megoldást rá akarjákszorítani az ideálisra.

A 7. ábra alapján nyilvánvaló, hogy a tekintett nominálispálya nem merítette ki a rendszer lehet®ségeit: a q2 ko-ordinátát sikerült végig megtartani az ideális q2 = π/2értéken, míg q1 volt felhasználva a reakció�er®k keltésében,s az a biztonságos tartományon belül maradt. Tanulságosmegvizsgálni, mi történik, ha a nominális pálya jobbanmegközelíti a rendszer lehet®ségének határait, miközbenaz egyéb paraméterek beállításán nem változtattunk.

A 13. ábra jól mutatja, hogy q1 értékét csak egy darabiglehetett felhasználni szabályozásra (eddig q2 az ideálisértéken maradt), majd miután q1 megközelítette a biz-tonságos zóna határát, a q2 értéket kellett felhasználniq1 visszaterelésére a biztonságos zónába, és a kocsi moz-gatásához kell csatolt reakció�er® keltésére. A q1 értékhatár környékén való tartása az adott C értékt®l függ®oszcillációra vezetett a q1 és q2 koordinátákban, a kocsimozgására ezekb®l viszonylag kevés tev®dött át. (Azegymással közel ellentétes Q1 és Q2 nyomatékok csekélyeltérése mozgatta megfelel®en a kocsit egészen addig, amígmindkét hajtósúly tengelyállása visszatérhetett a biztonsá-

Page 7: Új irányzat a Modell-referenciás Adaptív Szabályozók … · Lyapunov PhD értekezésében közölt eredeti módszerét használják (Lyapunov [1892]), amely a múlt század

y

5432t

8710

3

2

1

0

-1

-2

6

Graphic 1

y

5432t

8710

100

50

0

-50

-100

-150

6

Graphic 1

Ábra 6. A nem adaptív, közönséges PID szabályozó m¶ködése areferencia modell és a valódi rendszer paramétereinek eltérésemellett: a qN

3 (t) (fekete), a

Page 8: Új irányzat a Modell-referenciás Adaptív Szabályozók … · Lyapunov PhD értekezésében közölt eredeti módszerét használják (Lyapunov [1892]), amely a múlt század

y

5432t

871

2.0

1.5

1.0

0.5

0.0

-0.5

-1.0

-1.5

6

Graphic 1

y

4321t

76

100

50

0

-50

-100

-150

5

Graphic 1

Ábra 8. Az új adaptív módszer m¶ködése hangolt A paramétermellett: a qN

3 (t) (fekete), a qDes3 (t) (zöld) és a realizált q3(t)

[m/s2] (piros) értékek az id® függvényében (fels® ábra); a

referencia modell nyomatékai QRef1 (fekete), QRef

2 (kék), avalóságos gyorsulásokból és a referencia modellb®l visszaszá-molt QReCalc

1 (zöld), QReCalc2 (világoskék), valamint a �zikai

rendszerre ténylegesen kifejtett Q1 (piros), Q2 (sárga) ny-omaték értékek [N ×m] az id® függvényében (alsó ábra)

Megmutattuk, hogy egyetlen adaptív szabályozó paramé-ter, A gyors hangolásával s szabályozás a stabilitást biz-tosító �xpont környezetében tartható egymástól dinamikairészleteiben er®sen eltér® mozgások esetén is.

További kutatási lehet®séget jelent a két hajtósúly szere-pének egyenletesebb eloszlásának kimunkálása, valaminta kvalitatív vonatkozások tekintetében csak nagyjábólde�niált paraméter�hangolási módszer lehetséges, cizel-láltabb variánsainak vizsgálata.

Hangsúlyozzuk, hogy az MRAC m¶ködési mód érvényesü-lése igen fontos, hiszen ezáltal biztosítható egy kényelmes,�nominális� dinamika olyan szabályozások esetén, ame-lyekben a kívánt gyorsulásokat nem egy egyszer¶ PID jel-leg¶ szabályozás szabja meg, hanem pl. azok egy embert®l,pl. egy gépjárm¶ vezet®jét®l származnak. A továbbiak-ban szeretnénk a módszert dinamikai járm¶�modellre istesztelni.

y

5432t

871

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.06

Graphic 1

Ábra 9. Az új adaptív módszer m¶ködése hangolt A paramétermellett: a (8)�ban de�niált becslés id®függése: σ(εest) az id®függvényében

y

-1-2

2.5

2.0

x21

1.5

1.0

0.5

0.0

-0.5

-1.0

0

Graphic 1

Ábra 10. A közönséges PID jelleg¶ szabályozó m¶ködése: a kívántqDes3 és a megvalósuló q3 értékek kapcsolata (ideális esetben 45fokos meredekség¶ egyenes)

KÖSZÖNETNYILVÁNÍTÁS

Szerz®k hálás köszönetünket fejezik ki az NKTH általa CNK 78168 sz. OTKA projekt keretében folyósítotttámogatásáért.

REFERENCIÁK

H.A. Hensen, M.J.G. van de Molengraft and M. Steinbuch.Friction induced hunting limit cycles: A comparisonbetween the LuGre and switch friction modell. Auto-matica, pp. 2131�2137, vol. 39, 2003.

K. Hosseini�Suny, H. Momeni, and F. Janabi�Shari�.Model Reference Adaptive Control Design for a Teleop-eration System with Output Prediction. J Intell RobotSyst, DOI 10.1007/s10846-010-9400-4, pages 1�21, 2010.

R. Isermann, K.H. Lachmann, and D. Matko. AdaptiveControl Systems, New York DC, USA: Prentice-Hall,1992.

A.M. Lyapunow. A general task about the stability ofmotion (in Russian). PhD Thesis, 1892.

Page 9: Új irányzat a Modell-referenciás Adaptív Szabályozók … · Lyapunov PhD értekezésében közölt eredeti módszerét használják (Lyapunov [1892]), amely a múlt század

y

1.00.50.0-0.5x

2.52.0-1.0-1.5

3

2

1

0

-1

1.5

Graphic 1

Ábra 11. Az adaptív, �x A paramétert alkalmazó szabályozóm¶ködése: a kívánt qDes

3 és a megvalósuló q3 értékek kapcsolata(ideális esetben 45 fokos meredekség¶ egyenes)

y

1.00.50.0-0.5x

2.52.0-1.0-1.5

2.5

2.0

1.5

1.0

0.5

0.0

-0.5

-1.0

-1.5

1.5

Graphic 1

Ábra 12. Az adaptív, hangolt A paramétert alkalmazó szabályozóm¶ködése: a kívánt qDes

3 és a megvalósuló q3 értékek kapcsolata(ideális esetben 45 fokos meredekség¶ egyenes)

A.M. Lyapunov, Stability of motion. New�York andLondon: Academic Press, 1966.

L. Márton, B. Lantos. Identi�cation and Model�basedCompensation of Striebeck Friction. Acta PolytechnicaHungarica, pp. 45�58, Vol. 3, No. 3, 2006.

L. Márton, B. Lantos. Friction and backlash induced limitcycles in mechanical control systems. Proc. of EuropeanControl Conference 2009, 23�26 August 2009, Budapest,Hungary, pp. 3875�3880, 2009.

Charles C. Nguyen, Sami S. Antrazi, Zhen�Lei Zhou,Charles E. Campbell Jr. Adaptive control of a stewartplatform-based manipulator. Journal of Robotic Sys-tems, volume 10, no. 5, pp. 657�687, 1993.

D. Putra, H. Nijmeijer and N. van deWouw. Analysisof undercompensation and overcompensation of frictionin 1DOF mechanical systems. Automatica, vol. 43, pp.1387�1394, 2007.

Jean-Jacques E. Slotine, W. Li. Applied Nonlinear Con-trol. Prentice Hall International, Inc., Englewood Cli�s,New Jersey, 1991.

J. Somló, B. Lantos, P.T. Cát. Advanced robot control.Budapest, Hungary: Akadémiai Kiadó, 2002.

y

t21 87654

0.8

0.6

0.4

0.2

0.0

-0.23

Graphic 1

y

5432t

871

2.0

1.5

1.0

0.5

0.0

-0.56

Graphic 2

876543210

2.5e-008

2.0e-008

1.5e-008

1.0e-008

5.0e-009

0.0e+000

y

Graphic 3

y

0.40.30.20.1x

0.70.60.0

0.5

0.0

-0.5

-1.0

0.5

Graphic 1

y

5432t

8710

0.004

0.002

0.000

-0.002

-0.004

6

Graphic 1

t87654321

0.8

0.6

0.4

0.2

0.0

-0.2

y

Graphic 2

Ábra 13. Az új adaptív módszer m¶ködése hangolt A paraméterés megnövelt nominális pálya mellett: a nominális qN

3 (t) [m]pálya (legfels® fekete vonal), a számított q1(t) [rad] (zöld), q2(t)[rad] (piros), és q3(t) [m] (sárga) értékek, az A paraméter értéke(kék vonal), a nominális és a megvalósult {q3 [m/s] értékek a q3[m]} értékek függvényében, a pályakövetési hiba [m], valaminta nominális (zöld) és megvalósult (piros) pályák fedése

J.K. Tar, I.J. Rudas and K.R. Kozªowski. Fixed pointtransformations-based approach in adaptive control ofsmooth systems. Lecture Notes in Control and Infor-mation Sciences 360 (Eds. M. Thoma and M. Morari),

Page 10: Új irányzat a Modell-referenciás Adaptív Szabályozók … · Lyapunov PhD értekezésében közölt eredeti módszerét használják (Lyapunov [1892]), amely a múlt század

Robot Motion and Control 2007 (Ed. Krzysztof R.Kozªowski), Springer Verlag London Ltd., pp. 157�166,2007.

J.K. Tar, I.J. Rudas, Gy. Hermann, J.F. Bitó, and J.A.Tenreiro Machado (2008a). On the robustness ofthe Slotine-Li and the FPT/SVD-based adaptive con-trollers. WSEAS Transactions on Systems and Control,Issue 9, Volume 3, September 2008, pp. 686�700, 2008.

J.K. Tar, J.F. Bitó, I.J. Rudas, K.R. Kozªowski, and J.A.Tenreiro Machado (2008b). Possible adaptive controlby tangent hyperbolic �xed point transformations usedfor controlling the Φ6-type Van der Pol oscillator. Proc.of the 6th IEEE International Conference on Compu-tational Cybernetics (ICCC 2008), November 27�29,2008, Stará Lesná, Slovakia, pp. 15�20, 2008.

J.K. Tar, J.F. Bitó, I.J. Rudas, S. Preitl and R.�E. Pecup(2009a). An SVD Based Modi�cation of the AdaptiveInverse Dynamics Controller. Proc. of 5th InternationalSymposium on Applied Computational Intelligence andInformatics, Timi³oara, Romania, 2009, pp. 193�198,2009.

J.K. Tar, I.J. Rudas, J. Gáti (2009b). Improvementsof the Adaptive Slotine & Li Controller � Compara-tive Analysis with Solutions Using Local Robust FixedPoint Transformations. Proc. of the 14th WSEAS In-ternational Conference on APPLIED MATHEMATICS(MATH'09), Puerto De La Cruz, Canary Islands, Spain,December 14-16, 2009, pp. 305�311, 2009.

J.K. Tar, J.F. Bitó, I.J. Rudas (2010a). Replacement ofLyapunov's Direct Method in Model Reference Adap-tive Control with Robust Fixed Point Transformations.Proc. of the 14th IEEE International Conference onIntelligent Engineering Systems 2010, May 5-7, 2010,Las Palmas of Gran Canaria, Spain, pp. 231�235, 2010.

J.K. Tar, I.J. Rudas, J.F. Bitó, K.R. Kozªowski andC. Pozna (2010b). A Novel Approach to the ModelReference Adaptive Control of MIMO Systems. Proc. ofthe IEEE 2010 Robotics in Alpe�Adria�Danube Region(RAAD 2010) Conference, June 23�25 2010, Budapest,Hungary, pp. 31�36, 2010.

y

5432t

8710

6

4

2

0

-2

-4

-6

6

Graphic 1

y

5432t

871

4000

2000

0

-2000

-4000

6

Graphic 1

y

1.5

600

400

200

t3.02.5

0

-200

-400

-600

2.0

Graphic 1

Ábra 14. Az új adaptív módszer m¶ködése hangolt A paraméter ésmegnövelt nominális pálya mellett: a qN

3 (t) (fekete), a qDes3 (t)

(zöld) és a realizált q3(t) [m/s2] (piros) értékek az id® füg-

gvényében (fels® ábra); a referencia modell nyomatékai QRef1

(fekete), QRef2 (kék), a valóságos gyorsulásokból és a referencia

modellb®l visszaszámolt QReCalc1 (zöld), QReCalc

2 (világoskék),valamint a �zikai rendszerre ténylegesen kifejtettQ1 (piros),Q2

(sárga) nyomaték értékek [N×m] az id® függvényében (középs®ábra), valamint ennek kinagyított részletei (alsó ábra)

Page 11: Új irányzat a Modell-referenciás Adaptív Szabályozók … · Lyapunov PhD értekezésében közölt eredeti módszerét használják (Lyapunov [1892]), amely a múlt század

y

5432t

871

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

6

Graphic 1

Ábra 15. Az új adaptív módszer m¶ködése hangolt A paraméter ésmegnövelt nominális pálya mellett: a (8)�ban de�niált becslésid®függése: σ(εest) az id® függvényében

y

0.40.30.20.1x

0.70.60.0

0.5

0.0

-0.5

-1.0

0.5

Graphic 1

y

5432t

871

0.004

0.003

0.002

0.001

0.000

-0.001

-0.002

-0.003

-0.0046

Graphic 1

t876543210

0.5

0.0

y

Graphic 2

Ábra 16. Az egyszer¶ PID jelleg¶ módszer m¶ködése megnöveltnominális pálya mellett: a nominális qN

3 (t) [m] pálya (legfels®fekete vonal), a számított q1(t) [rad] (zöld), q2(t) [rad] (piros),és q3(t) [m] (sárga) értékek, az A paraméter értéke (kék vonal),a nominális és a megvalósult {q3 [m/s] értékek a q3 [m]} értékekfüggvényében, a pályakövetési hiba [m], valamint a nominális(zöld) és megvalósult (piros) pályák fedése

y

5432t

871

4

2

0

-2

-4

-66

Graphic 1

y

1.5

200

100

0

t3.02.5

-100

-200

-300

-400

2.0

Graphic 1

Ábra 17. Az egyszer¶ PID jelleg¶ módszer m¶ködése megnöveltnominális pálya mellett: a qN

3 (t) (fekete), a qDes3 (t) (zöld) és a

realizált q3(t) [m/s2] (piros) értékek az id® függvényében (fels®

ábra); a referencia modell nyomatékai QRef1 (fekete), QRef

2(kék), a valóságos gyorsulásokból és a referencia modellb®lvisszaszámolt QReCalc

1 (zöld), QReCalc2 (világoskék), valamint

a �zikai rendszerre ténylegesen kifejtett Q1 (piros), Q2 (sárga)nyomaték értékek [N ×m] az id® függvényében (alsó ábra)