08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 1/100
Optimisation de la Commande Code : AC431, Auteur Damien Koenig
Plan de la présentation
– Principe d’optimalité de Bellman Application: recherche du plus court chemin
– Synthèse LQ Commande LQ, Stabilité et Robustesse
Observateur LQ, Filtre de Kalman
– Synthèse LQG/LTR
– Commande LQ à pondérations fréquentielles Étude de cas
8sc cours, 4 sc TD, 3 sc TP
Pondérations 25%TP, 75%Exam
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 2/100
Principe d’optimalité de Bellman
• Principe d’optimalité de Bellman
Dans un processus d'optimisation dynamique, une suite de décisions est
optimale si, quels que soient l'état et l'instant considérés sur la trajectoire qui lui est associée, les décisions ultérieures constituent une suite optimale de décisions pour le sous-problème dynamique ayant cet état et cet instant comme conditions initiales.
• Rappel : pour un système MIMO à n états et m commandes, le gain K solution du problème de commande présente :
• n*m paramètres dont n*m-n paramètres libres
Il y a donc une infinité de solutions.
On propose ici de rechercher les paramètres du gain tels que la commande obtenue minimise un critère énergétique …
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 3/100
Exemples de problèmes d’optimisation
Problème 1
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 4/100
Problème 2: Gestion de stock
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 5/100
Critère énergétique
Problème LQ : On considère le système
L’objectif est de déterminer le gain optimal K tel que la commande u=Kx
minimise le critère
où
sont des matrices de pondérations fixées selon les objectifs souhaités …
tCxty
tButAxtx
dttRututQxtx2
1uJmin
0
TT
u
0QQ T 0RR T
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 6/100
Problème 3: Estimateur optimal de Kalman
• Horizon fini : on considère à nouveau le critère
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 7/100
Application du principe d’optimalité de Bellman
On s’intéresse ici à rechercher le chemin de distribution de l’eau
le moins couteux entre les villes A et G, lesquelles sont reliées
par différentes villes
Chaque arrête représente le coût d’acheminement de l’eau entre
2 villes, par exemple entre F1 et G, le coût est de 10 euros
A
B2
B1
C1
C2
C3
D1
D2
E1
E2
E3
F1
F2
G
3
3
2
1
6
3 2 6
10 5
7
7
8
4 3
5
4
5
3
4
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 8/100
Exemple : Recherche du chemin à coût minimal
On considère le réseau de distribution d’eau suivant :
• Déterminer d’après le principe de Bellman le chemin de coût minimal (plus court chemin) qui permet de relier A à G.
• On notera :
– d(P,Q) la distance entre P et Q
– L(P) la longueur du plus court chemin (coût optimal) entre un point P quelconque du graphe et le point G.
– On recherche donc L(A).
A
B2
B1
C1
C2
C3
D1
D2
E1
E2
E3
F1
F2
G
3
3
2
1
6
3 2 6
10 5
7
7
8
4 3
5
4
5
3
4
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 9/100
Solution
• Etape 1 :
– de F1, on a L(F1) = d(F1,G) = 10
– de F2, on a L(F2) =d(F2,G) = 3
• Etape 2 :
– de E1, on a L(E1) = d(E1,F1)+L(F1)=16
– de E2, on a L(E2) = min{d(E2,F1)+L(F1), d(E2,F2)+L(F2)}
= min{4+10, 7+3)}=10
– de E3, on a L(E3) = d(E3,F2)+L(F2)=8
• Etape 3 :
– de D1, on a L(D1) = min{d(D1,E1)+L(E1), d(D1,E2)+L(E2)}
= min{2+16, 5+10)} = 15
– de D2, on a L(D2) = min{d(D2,E2)+L(E2), d(D2,E3)+L(E3)}
= min{4+10, 7+8)} = 14
A
B2
B1
C1
C2
C3
D1
D2
E1
E2
E3
F1
F2
G
3
3
2
1
6
3 2 6
10 5
7
7
8
4 3
5
4
5
3
4
Etape 1 Etape 2
Etape 3
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 10/100
Suite de l’exercice
• Etape 4 :
– de C1, on a L(C1) = d(C1,D1)+L(D1) = 3+15 = 18
– de C2, on a L(C2) = min{d(C2,D1)+L(D1), d(C2,D2)+L(D2)}
= min{5+15, 8+14)} = 20
– de C3, on a L(C3) = d(C3,D2)+L(D2) = 3+14 = 17
• Etape 5 :
– de B1, on a L(B1) = min{d(B1,C1)+L(C1), d(B1,C2)+L(C2)}
= min{2+18, 1+20)} = 20
– de B2, on a L(B2) = min{d(B2,C2)+L(C2), d(B2,C3)+L(C3)}
= min{6+20, 4+17)} = 21
• Etape 6 :
– de A, on a L(A) = min{d(A,B1)+L(B1), d(A,B2)+L(B2)}
= min{3+20, 3+21)}=23
A
B2
B1
C1
C2
C3
D1
D2
E1
E2
E3
F1
F2
G 3
3
2
1
6
3 2 6
10 5
7
7
8
4 3
5
4
5
3
4
Etape 1 Etape 2
Etape 3 Etape 4
Etape 5 Etape 6
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 11/100
Parallèle avec l’Automatique : Commande LQ
On considère le système à temps discret
kk1k BuAxx
fff
f
TT
T
T
T
kj
jj
T
jjj
T
ju
xPxuRuxQxkkxJuJ2
1
2
1,min
1
0
kk1k BuAxx
où le critère à minimiser est :
Le problème consiste à déterminer la trajectoire unique reliant les
points x(k0) et x(Tf) telle que cette trajectoire est optimale au
sens où elle minimise le critère énergétique J sous la contrainte de
la dynamique du modèle kk1k BuAxx
Remarque : J représente la somme des coûts pour aller de x(k0) à x(Tf), notre travail consiste à trouver u telle que ce coût soit le plus petit possible.
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 12/100
Rappel: recherche du minimum de f(x)
Hyp: f de classe C2
Si x* est un minimum local de la fonction f alors
= 0 pour h = 0
On applique un DL à l’ordre 2 de f(x*+h) autour de x*,
0** xfhxf
3
2*
*22
*
***
2
1O
x
xfh
x
xfhxfhxf
0
2
10
2*
*22
*
***
x
xfh
x
xfhxfhxfsoit
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 13/100
Recherche du minimum
• h > 0, on en déduit
• h < 0, on en déduit
• comme, h est proche de 0 alors
0
2
12*
*2
*
*
x
xfh
x
xf
0
2
12*
*2
*
*
x
xfh
x
xf
0
*
*
x
xf est une condition nécessaire
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 14/100
Conditions pour un minimum
Pour que x* soit un minimum et non un maximum il faut de plus
Soit les conditions suivantes :
0
x
xf*
*
0
x
xf2*
*2
0
x
xf2*
*2
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 15/100
Application à la commande LQ
Notations :
Le coût associé au point final est
où le poids final Ptf est donné par le designer.
Le coût associé pour aller du point x(k) au point final est
où Pk est un coût à déterminer
fff
TTTTff
*ffopt xPx
2
1T,TxJT,TxJ
kk
T
kTT
T
T
T
kj
jj
T
jjj
T
ju
xPxxPxuRuxQxkkxJuJfff
f
2
1
2
1
2
1,min
1
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 16/100
Application du principe de Bellman
• Partant de pt final x(Tf) connu au point précédent x(Tf-1). La
dernière trajectoire à minimiser est alors donnée par le coût
suivant :
• sous la contrainte de la dynamique du système
fffffffff
TTTT1T1T
T1T1T1T
T1T
ffu
xPx2
1uRuxQx
2
1
1T,1TxJuJmin
kk1k BuAxx
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 17/100
Solution
• Etape 1
• On obtient une commande linéaire fonction de l’état
• Etape 2
Soit
01Tu
1T,1TxJ
*uuf
ff
1TfTT1
TT
1T*
1Tf AxPBBPBRufff
0
u
1T,1TxJ2
1T
ff2
f
0BPBR
1Tu
1T,1TxJff T
T1T
f2
ff2
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 18/100
Solution
• Etape 3 : On remplace la solution u* dans le critère partiel que
l’on identifie au coût minimal désirée, i.e,
– Soit
1T1TT
1Tf*
1Tf ffffxPx
2
11T,u,1TxJ
APBBPBRBPAAPAQP
APBLAPAQP
fffffff
fffff
TT1
TT
1TTT
TT
1T1T
TTT
1TTT
1T1T
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 19/100
Temps rétrograde
• EARD à temps rétrograde, déterminée hors ligne, i.e.,
...uLPuLPPQ 2T2T2T1T1T1TTT ffffffff
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 20/100
Exercice
• Pour xk+1= 2xk+uk déterminer la commande u qui stabilise x et
minimise
• Avec Tf=3 et PTf=1, montrer respectivement pour R=1, R=10 et
R =1000 l'influence de la pondération R sur les pôles de la BF.
fff
f
kk TT
T
T
T
k
T
k
T
ku
xPxRuuxxxJuJ2
1
2
10,0min
1
0
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 21/96
Solution de l’exercice
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 22/96
Solution de l’exercice
Soit pour une commande optimale u2* = -x2
un coût optimisé égale à
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 23/96
Solution de l’exercice
• Si l’on itère les résultats précédents selon le principe de
Hamilton Jacobi Bellman on trouve les résultats suivants :
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 24/96
LQ à horizon infini : cas discret
• Critère
• Contrainte
• Solution
– Gain
– EAR
1T
0kkk
Tkkk
Tk
Tu
f
f
uRuxQx2
1lim,xJuJmin
kk1k BuAxx
APBBPBRBPAAPAQP T1TTT
AxPBBPBRu T1T*
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 25/96
Application LQ à horizon infini : cas discret
Exercice: Pour xk+1= 2xk+uk déterminer la commande u qui stabilise x et minimise
1
02
1lim,min
f
f
T
k
k
T
kk
T
kTu
RuuxxxJuJ
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 26/96
Résultat fondamental : cas discret
• Critère
• Contrainte
• Solution
D’après le principe de Bellman, ce problème se réduit à trouver une
fonctionnelle V(x(t), t) définie sur [0, Tf] solution de
fTT
1T
0kkk1T10 T,xLk,u,xLu,u,uJ
ff
f
f
k,u,xFx kk1k
1,,,,,min
1,1,,min,
ttuxFVtuxL
ttxVtuxLttxV
ttttu
ttu
coût immédiat + coût optimisé
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 27/96
Résolution
• u* est la solution qui donne le min de la fonctionnelle V(x(t),t)
• Rappel
0
u
t,txVet0
u
t,txV
1t,t,u,xFVt,u,xLminargu
2
2
uu
ttttu
*
*
f
min
x*
fminargxx
*
0
x
xf*
*
0
x
xf2*
*2
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 28/96
LQ à horizon fini : par res. de l’eq aux différences
• Pb : Déterminer une fonctionnelle V(x(Tf-1), Tf-1) solution de
• Résolution
avec
Il reste à rendre la fonctionnelle V(x(Tf-1), Tf-1) la plus petite possible
fffffff TTxVTTuTxLTTxV ,1,1,11,1
fffffffff TT
T
TTT
T
TTT
T
Tff xPxuRuxQxTTxV2
1
2
11,1 111111
111
2
11,1
fff TT
T
Tff xPxTTxV
0
2u
1fT,1fTxV2
et0
*uuu
1fT,1fTxV
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 29/96
Résultat fondamental : cas continu
• LQ:
– contrainte
• Cas général
– Minimiser
– Sous la contrainte
f
fff
T
tTT
TTtt
Ttt
Tt xPx
2
1dtuRuQxx
2
1uJ
fTT
T
t
T,xLdtt,u,xLuJff
f
t,u,xFx
BuAxx
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 30/96
Hamilton Jacobi Bellman (HJB)
• D’après le principe de Bellman ce problème ramené au cas
continu se réduit à trouver une fonctionnelle V(x(t), t) solution
de l’eq. HJB
• Solution
t,u,xFx
Vt,u,xLmin
t
Vt,u,xLmint,txV
uu
0u
HJBet0
u
HJB
t,u,xFx
Vt,u,xLminargu
2
2
uu
ttu
*
*
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 31/96
LQ à horizon fini par résolution de l’éq HJB
• Critère
– Contrainte
• Résolution
– avec
f
fff
T
tTT
TTtt
Ttt
Tt xPx
2
1dtuRuQxx
2
1uJ
BuAxx
ttTtt
Tt uRuQxx
2
1t,txV
f
fff
T
tTT
TTtt
Ttt
Tt xPx
2
1dtuRuQxx
2
1t,txV
ttTt xPx
2
1t,txV
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 32/96
Solution
• On détermine l’eq HJB
Où
• On obtient
HJBuRuQxxxPxxPxxPx tt
T
tt
T
ttt
T
ttt
T
ttt
T
t 2
1
2
1
2
1
2
1
0u
HJBet0
u
HJB2
2
uu *
ttT1
t*t xPBRu
0Ru
HJBt2
2
tT1
ttttT
tt PBBRPAPPAQP
ff TT QP
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 33/96
LQ à horizon infini : cas continu
• Critère
• Contrainte
• Solution
f
f
T
t
T
tt
T
tTu
dtuRuxQxxJuJ0
2
1lim,min
BuAxx
t
T
t PxBRu 1*
PBPBRPAPAQ TT 10
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 34/96
Stabilité : continu
• Système bouclé
– Où la commande est donnée par
– avec
– est stable au sens de Lyapunov ssi
il existe une fonction de Lyapunov candidate > 0
dont sa dérivée le long des trajectoires non nulles de (1) est < 0
– Preuve
tt*t xLu
PBRL T1tt
ttt xBLAx
0xPxxV ttTtt
0xLRLQx2
1uRuxQx
2
1xV ttt
Ttt
Tttt
Tttt
Ttt
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 35/96
Propriétés de robustesse d’une commande LQ
• Le transfert de boucle s’écrit
• avec
On pose
On montre après quelques manipulations algébriques sur l’EAR que
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 36/96
Application: propriétés de robustesse
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 37/96
Application: propriétés de robustesse
On obtient la commande optimale suivante
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 38/96
Application: propriétés de robustesse
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 39/96
Commande Optimale par maximisation de l’Hamiltonien
PMP: Principe du Maximum de Pontryaguine
• On défini l’Hamiltonien
– Rq:
• Cas général
– Continu
avec
– Discret
avec
BuAxRuuQxx2
1u,x,H TTT
f
TT
fff
T
0
RuuQxx2
1
TTT
TT
dtBuAxu,x,HxPx2
1uJ
t,u,xFt,u,xLt,,u,xH T
k,u,xFk,u,xLH T1k1k
k,u,xFx 1k
k,u,xFx
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 40/96
Équations canonique de Hamilton
• Conditions au 1er ordre :
Avec la condition terminale
+conditions
Hx
x
H
fffT
TT
TT
Pxx
finalCoût
0u
H
*uu
0u
H2
2
1k
1k1k
Hx
k
1kk
x
H
0u
H
*kk uuk
1k
0u
H2k
1k2
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 41/96
Application: Exercices
• Exercice 1: On considère le système
• Aide : on pose l’Hamiltonien
• Avec les conditions
x
H
0
u
H
*uu
0u
H2
2
BuAxRuuQxx2
1u,x,H TTT
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 42/96
Exercice 1: Maximisation de l’Hamiltonien
• Solution de l’exercice 1
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 43/96
Exercice 2: Véhicule à essence
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 44/96
Eléments de réponse : exercice 2
• Rappel : Résolution par maximisation de l’Hamiltonien : H
– Cas continu
avec
– Application : Véhicule à essence
avec
On désire maximiser x(T) et on souhaite S(T) = 0 pour dépenser tout le carburant. est
un multiplicateur constant de Lagrange utilisé pour dualiser la containte S(T)=0.
– Le PMP affirme que si u est une solution optimale, alors :
t,u,xFt,u,xLt,,u,xH T
kuxFx ,,
2
2 22
10,,, uuu
u
tuxH sxsx
fTT
fTf
T
fTPx
Tx
finalCoût
0
*
uuu
H
0
2
2
u
H
CteTSTxfinalCoût
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 45/96
Eléments de réponse : suite
• Les variables adjointes sont solutions des équations adjointes
• u(t) réalise le maximum instantané de
• Il reste à déterminer le paramètre de Lagrange
Sachant on obtient
sx
Sxx
TT
TtTTtTTx
TSTx
Tx
finalCoût
CteCtes
H
x
H
x
H
T
fSfxT
fT
ffSffxf
ff
f
T
fT
SSxxSx
,0;,01
0;0;
100
*
t
ttutut
u
H
s
xsx
uu
2
2uuH s
x
12
10
2
1
2
1222
tSttStS
2
101
2
11 2
2
TSor
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 46/96
Conclusion de l’exercice 2
• Seul le choix
a un sens physique car il correspond à une vitesse u positive
On note que cette vitesse est constante.
La distance maximale parcourue est
2
1
41.121
tu
41.12022)( Txxttxtutx
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 47/96
Exercice 3: Gestion de stock
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 48/96
Exercice 3: éléments de réponses
• Exercice : Gestion de stock
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 49/96
Exercice 3: éléments de réponses
• Application du principe du maximum de Pontryaguine
t,u,xFt,u,xLt,,u,xH T
)()(0,,,
121 tutx
utuxH xx
Les variables adjointes sont solutions des équations adjointes 21 xx
21
2
11
21
21
222121
,01;0
0;
xxx
TT
TtTTTx
Tx
Tx
finalCoût
Ctex
H
x
H
x
H
T
fxfxTT
ffxfxf
f
f
TT
xxxxxx
f
f
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 50/96
Exercice 3: éléments de réponses
• On en déduit que
– Soit
– D’où
• Le principe du maximum de Pontryaguine dit que cette fonction doit être
maximisée à chaque instant t [0,Tf=10]
– Tant que 9-t>0, la maximisation de H est obtenue pour u(t)=x1(t), on
réinvestit tout dans la production sous forme d’engrais
– Tant que t [9, 10], la maximisation de H est obtenue pour u(t)=0,
c’est-à-dire on stocke toute la production de la dernière période.
– A partir de u on en déduit l’évolution du stock pour t [0, 10], …
1
100
2
11
x
fxx tTtt
1121 xx
)()9()(
)()()()10()()(,,,
1
1121
tuttxH
tutxtuttutxutuxH xx
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 51/96
Poursuite Optimale
• On considère le système
– Avec
Première partie :
– La référence yref(t) est constante
Seconde partie :
– La référence yref(t) est variable et correspond par exemple à une
trajectoire prédéfinie à suivre
tCxty
tButAxtx
tytyt ref
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 52/96
Première partie : référence constante
• Il suffit d’appliquer la commande optimale
– Où L est le gain optimal :
– et P la solution positive de l’ARE
– Le paramètre h est un pré filtre égal à l’inverse du gain statique
de la BF optimisée, soit :
thytLxtu ref
PBRL T1
01 PBPBRPAPAQ TT
11 BBLACh
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 53/96
Deuxième partie : référence variable
• Nous nous intéressons au problème de poursuite suivant :
• Ce problème est équivalent au sens de Bellman à l’équation suivante :
– Il faut donc trouver une fonctionnelle V solution de l’équation
précédente. Cette fonctionnelle est de la forme suivante :
• Que l’on dérive le long des trajectoires du process
tCxty
tButAxtx
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 54/96
Deuxième partie : suivi de trajectoire (suite)
• D’après l’équation de HJB
– Et de la fonctionnelle candidate
– On trouve après quelques manipulations
– Le système d’équations :
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 55/96
Exemple
On considère le système suivant :
où le critère de performance vise à effectuer un compromis entre l’écart de régulation et le coût de commande :
yref une consigne constante et un paramètre à régler.
Solution
On obtient
1
2
ppU
pYpG
duyyJ ref
0
222
2
1
0
0
0
1
1
refTreft
TTt
refT
tTT
tT
t
Tt
Tttt
Tt
QyygBBRgh
yQCgBLAg
QCCPBBRPAPPAP
0142142
0142
042
04140
222222
2222
2422
22222
PP
P
P
PPPP
xy
uxx
2
142 222 P
ref
TTTt
T yQCBLAg1
2221 gygBBRgQyy reftTT
trefTref
gLxu tt2*
reft
TTTt
T
reftt hyLx
QCBLA
yLxu
1
*
142142 2122211
T
tT BRPBRL
TTt
T BLAh
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 56/96
Partie 2: Observateur LQ
• Un système est complètement observable si à partir d’un état
quelconque pris à l’instant t on sait déterminer son évolution
jusqu’à l’état initial.
• On propose la structure de l’observateur Identité
• Objectif, trouver x tel que :
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 57/96
Approche selon le principe de dualité
• Analyse de converge de l’erreur d’estimation d’état :
– Sachant que les valeurs propres de A-GC sont également les
valeurs propres de AT-CTGT
– Le problème d’estimation est par dualité équivalent à un
problème de commande du système fictif suivant :
– Avec
– Cette commande optimale assure la stabilité de AT-CTGT et donc de A-GC et donc
celle de l’erreur d’estimation d’état
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 58/96
Approche selon le principe de dualité
• On s’ait finalement ramené à un problème de commande
optimale identique à la première partie du cours.
• En conclusion, il suffit d’appliquer le principe de dualité et
remplacer les matrices par les relations suivantes :
– Rappel de la structure de l’observateur
– Critère
– Système fictif
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 59/96
Synthèse d’un observateur selon le principe
d’optimalité de Bellman
• L’observateur
– Est un observateur à gain optimal au sens où son gain est
solution du problème d’optimalité
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 60/96
Résolution par minimisation du critère
• On propose d’écrire l’observateur sous la forme
– où
– L’erreur d’estimation d’état
s’écrit alors sous la forme
Et le critère se réduit à la forme suivante
yyGw ˆ
xxe ˆ
wAee
00
0
111))(,(T
TT
t
T
TTT eSedwQwCeRCetetV
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 61/96
1ère approche : Minimisation de l’HJB
• Solution optimale proposée :
– où
– avec
• Preuve : On considère la fonctionnelle
– On cherche Mt telle que
avec
xCyRCMBuxAx Tt ˆˆˆ 1
tT
ttT
tt CMRCMQAMAM
dt
dM 1
00 STtM
00
0
111))(,(T
TT
t
T
TTT eSedwQwCeRCetetV
ttTt eMetetV 1))(,(
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 62/96
1ère approche : Minimisation de l’HJB
• On se ramène à un problème de commande optimale de t à T0 + coût
final, en posant le changement de variable
• Le critère se réécrit sous la forme classique
• Ou encore sous la forme équivalente de l’eq HJB
– avec
'tt
'1''
1'
'
11
00
0
))'(,'(
ttT
t
TT
T
T
t
TTT
eMe
eSedtwQwCeRCetetV
wQwCeRCetetV TTT 11))'(,'(
'
'1''
' dt
eMed
dt
dV ttT
t
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 63/96
1ère approche : Minimisation de l’HJB
• Après quelques manipulations, nous obtenons
• Il reste à minimiser le coût précédent :
• Soit
• Que l’on réinjecte dans
wQwCeRCe
dt
eMed TTTttT
t 11
''
1''
wQweMweCRCAMMAedt
eMdMMe T
t
TT
tt
TTttttT
t 11111
''
1''
1''
''' 2
0*22
211
*
11
'
'
wQeMdw
wQweMwd
t
ww
T
t
T
eQMwt
1'*
wQweMweCRCAMMAedt
eMdMMe T
t
TT
tt
TTttttT
t 11111
''
1''
1''
''' 2
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 64/96
1ère approche : Minimisation de l’HJB
• On obtient après factorisation et identification terme à terme
• Il reste à revenir à la variable temporel t=-t’ et l’on obtient la dare
• Deuxième solution : par maximisation de l’Hamiltonien (voir poly)
• Troisième solution : par le calcul de variation (voir poly)
'1
''''
tT
ttT
tt CMRCMQAMAM
dt
dM
tT
ttT
tt CMRCMQAMAM
dt
dM 1
xCyRCMBuxAx Tt ˆˆˆ 1
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 65/96
Observation : Cas stochastique
• Le processus aléatoire considéré est
• Où w et v sont des bruits blancs centrés, de matrice de covariance connue et
non corrélés entre eux :
• Objectif : Déterminer un estimateur de x non biaisé et à variance minimale
vCxy
wbuAxx
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 66/96
Filtre de Kalman
• Horizon fini : on considère à nouveau le critère
- On obtient les mêmes résultats que précédemment avec l’interprétation fort
intéressante que :
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 67/96
Filtre de Wiener
• Horizon infini
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 68/96
Méthode Linéaire Quadratique Gaussienne (LQG)
• Structure de la commande LQG
• Selon le principe de séparation
– On cherche le gain de Kalman Kf et le gain de Correction Kc
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 69/96
Commande LQG
• On considère le modèle de synthèse
• Le problème revient à déterminer u fonction de l’estimé de x
telle que :
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 70/96
Commande LQG
• Partie 1 : on recherche l’estime de x en appliquant les résultats
du filtre de Wiener :
• Partie 2 : on recherche Kc en appliquant le principe de Bellman
au critère
Et l’on déduit
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 71/96
Commande LQG
• La synthèse LQG exige donc la résolution des équations de Riccati duales et l’on peut facilement se ramener au schéma bloc usuel avec une gain dynamique K(s) et le process G(s)
• Il suffit de repérer sur le schéma de synthèse l’entrée et la sortie du bloc K(s) et de donner la représentation d’état associé
• Soit
• Il reste à étudier le transfert de boucle et faire tendre ce transfert au transfert sans l’observateur afin de conserver les propriétés de robustesse d’une commande LQ: il s’agit dès lors du principe de la commande LTR
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 72/96
Exemple
• On considère le système stochastique
– Où w et v sont des bruits blancs
– Pour la commande on considèrera un poids R=3 et Q=1
1. Déterminer la synthèse de commande LQG solution de problème
2. Déterminer le transfert de boucle avec et sans observateur
3. En déduire les fonctions de sensibilité
4. Tracé le module des fonctions de sensibilité et du transfert de boucle avec
et sans observateur
5. Conclure
1,03,0 NvNw
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 73/96
Résolution
• Selon le principe de séparation : on synthétise premièrement
l’observateur puis la commande ou inversement
• Observateur :
• Commande :
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 74/96
Transferts de boucle
• Sachant que
• On en déduit le transfert de boucle
– avec observateur
– sans observateur
3
1)(
ssK
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 75/96
Fonctions de sensibilité
• Fonction de sensibilité avec observateur
• Fonction de sensibilité sans observateur
• Fonction de sensibilité complémentaire avec observateur
• Fonction de sensibilité complémentaire sans observateur
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 76/96
Tracés des modules
• Fonctions de sensibilité
On constate que le compromis Performance / Robustesse de la commande LQG (avec
observateur) est moins bon que celui de la commande LQ (sans observateur)
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 77/96
Tracés des modules
• Transferts de boucle / Fonctions de sensibilité complémentaire
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 78/96
Synthèse LTR
• Le régulateur LQ et l’observateur LQ (Filtre de Kalman ou Wiener) étudiés
séparément montrent une très bonne robustesse (MG , MP > 60°), cependant
l’association des deux induit une perte de robustesse.
• Pour conserver les excellentes propriétés de robustesse de la synthèse LQ, il
convient naturellement de faire tendre asymptotiquement le transfert de
boucle avec observateur vers le transfert de boucle sans observateur.
– Principe de base de la commande LTR
La modélisation de nature stochastique du système disparaît au profit d’une meilleur
robustesse associée à des performances nominales imposées.
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 79/96
Recouvrement asymptotique à l’entrée
• Procédure :
1. Synthèse du correcteur LQ par un choix approprié des poids
Q et R pour un bon comportement en basse fréquence des
valeurs singulières du transfert de boucle
2. Synthèse LQ de l’observateur en fixant premièrement les
poids W0 et V0 du filtre de Kalman et en augmentant
graduellement le poids
tel que le transfert de boucle LLQG(s) tend asymptotiquement
vers le transfert de boucle LLQ(s).
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 80/96
Passage d’un régulateur/obseravateur LQ à une
synthèse RST
• On considère le système (A,B,C) perturbé en sortie par une perturbation b constante.
– On propose d’ajouter un état z égal à l’intégrale de l’erreur de poursuite à asservir et un observateur identité de l’état x du système.
– Il convient alors de rechercher par synthèse LQ et selon le principe de séparation respectivement le gain augmenté L et le gain G de la commande et de l’observateur.
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 81/96
Synthèse RST équivalente
• On obtient le système augmenté
– où la fonction « dlqr » de Matlab donne directement L en
minimisant le critère
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 82/96
Synthèse RST équivalente
• Par dualité on obtient le gain de l’observateur LQ et on obtient au final le système augmenté
• Que l’on identifie à la synthèse de commande RST
• On obtient dès lors les polynômes inconnus T et S par le calcul du transfert u/yc associé au système ci-dessus et le polynôme -R par le calcul du numérateur du transfert u/y.
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 83/96
Commande LQ à pondérations fréquentielles
• Principe
– Modeler le transfert de boucle afin de satisfaire au mieux le
compromis Performance/Robustesse.
• Solution
– Appliquer le principe du théorème de Parseval
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 84/96
Commande LQ à pondérations fréquentielles
• On montre que le problème de synthèse LQ à pondération
fréquentielle, peut se ramener à un problème de synthèse LQ
temporel à pondération unitaire.
• Explication:
– Le critère
peut se réécrire sous la forme
En posant
on obtient le critère temporel à pondération unitaire suivant :
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 85/96
Commande LQ à pondérations fréquentielles
• Conclusion
– La synthèse se réduit à un problème de commande LQ à
pondération unitaire :
– sous la contrainte du système augmenté:
K(p) 0 u y
pG
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 86/96
Commande LQ à pondérations fréquentielles
• Le système augmenté
peut être décomposé selon la représentation d’état suivante :
où les pré et post filtres R-1/2 et Q1/2 prennent généralement la
forme suivante
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 87/96
Commande LQ à pondérations fréquentielles
• Le pré filtre R-1/2(s) permet une décroissance plus rapide hors de
la bande passante du système et donc une amélioration de la
Robustesse.
• Le post filtre Q1/2(s) permet un accroissement de la pente dans la
bande passante du système (augmentation du gain en basse
fréquence) et donc une amélioration des performances.
• Exemple :
– Poser R-1/2(s) =k/(p+1) et Q1/2(s) =(p+1)/p donne un transfert
intégrateur dont le paramètre k permet d’ajuster la
bande passante et le compromis P/R.
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 88/96
Exemple : Etude de cas
• Transmission élastique composée de 3 poulies
• On considère un système de transmission élastique composé de 3 poulies reliées par deux courroies métalliques comportant chacune deux ressorts. Le problème de commande considéré est celui de l’asservissement en position de la troisième poulie à partir de la position de la première poulie.
• Pour la synthèse du régulateur, un modèle du système nominal à vide obtenu par identification est donné par le transfert suivant
• Ce système est supposé soumis à une référence yref et à une perturbation en sortie dy. On propose de comparer les performances d’un régulateur LQG sans pondération fréquentielle et d’un régulateur LQG à pondération fréquentiel incluant un intégrateur dans la boucle.
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 89/96
Exemple : Etude de cas
• Régulateur LQG sans pondération fréquentielle, donc à
pondérations fixes Qr = CTC et Rr = 1 pour le régulateur optimal
LQ et avec Q0 = BBT et R0 = 1
• Sous matlab :
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 90/96
Régulateur LQG sans pondération fréquentielle
• Il reste à déduire K(s)
Où la fonction reg retourne directement K(s)
On en déduit directement le tracé des fonctions usuelles
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 91/96
Régulateur LQG avec pondération fréquentielle
• On se propose d’ajouter un effet intégrateur avec l’aide des pré
et post filtres R-1/2(s) et Q1/2(s) .
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 92/96
Régulateur LQG avec pondération fréquentielle
Il reste à déterminer par synthèse LQ ordinaire le gain du
contrôleur et de l’observateur sur le système augmenté
On en déduit le régulateur K(s)
Que l’on augmente de l’effet intégrateur k/p
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 93/96
Tracés des fonctions de sensibilités usuelles
• Calcul de S et T
• Tracés
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 94/96
Solutions obtenues
• Modules des transferts S, SK, SG et T avec le régulateur 1 (sans
pondérations)
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 95/100
Solutions obtenues
• Modules des transferts S, SK, SG et T avec le régulateur 2 (avec
pondérations fréquentielles de type intégrateur)
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 96/96
Conclusion
• Synthèse LQ (norme H2)
– Régulateur (robustesse MG , MM > 1, MP > 60°)
– Observateur
• Extension
– Synthèse LQG
– Synthèse LTR (On souhaite que le transfert de boucle avec observateur tend asymptotique vers le
transfert de boucle sans observateur, afin de conserver les propriétés de robustesse)
– Synthèse LQG à pondération fréquentielle – (Permet de modeler « loop schape » le transfert de boucle pour obtenir un bon
compromis P/R)
• Perspective : Commande robuste à synthèse H
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 97/100
Synthèse
• Régulateur LQ :
– Critère cas discret
– Sous la contrainte
– Critère cas continu
– Sous la contrainte
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 98/100
Synthèse
• Résolution du problème LQ :
– Critère cas discret
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 99/100
Synthèse
08/09/2017 Auteur: Damien Koenig
http://koenig-damien.jimdo.com 100/100
Synthèse