livre de cours d’automatique - francois-bateman.e...
TRANSCRIPT
ECOLE D’OFFICIERS DE L’ARMEE DE L’AIR
DEPARTEMENT DES VEHICULES AEROSPATIAUX
LIVRE DE COURS
D’AUTOMATIQUE
Monsieur BATEMAN
Table des matieres
Table des matieres i
1 ANALYSE DES SYSTEMES 1
2 SYSTEMES SIMPLES 25
3 SYSTEMES ASSERVIS 49
4 CORRECTION DES SYSTEMES 71
5 REPRESENTATION D’ETAT DES SYSTEMES 87
6 COMMANDE PAR RETOUR D’ETAT 101
7 OBSERVATEURS 115
8 FILTRE DE KALMAN 125
A Linearisation d’un systeme 157
B Transformee de Laplace 161
C Systemes simples remarquables 165
D Critere de Nyquist 171
E Equivalence a un systeme a retour unitaire 175
F A propos de la representation d’etat 177
G Codes MATLAB 179
i
CHAPITRE 1
ANALYSE DES SYSTEMES
1.1 NOTION DE SYSTEME
1.1.1 Definition et exemples
Un systeme dynamique S est une entite constituee d’elements logiquement inteconnectes.
On peut agir sur ce systeme en modifiant les valeurs de ses entrees. Pratiquement on distingue
les commandes qui sont des entrees controlees des perturbations qui sont des entrees non contro-
lees. On visualise les effets obtenus en observant les sorties ou reponses. Ces observations sont
realisees par des capteurs qui mesurent les valeurs prises par ces sorties. Un systeme S est dit
deterministe si son comportement futur peut etre determine de facon unique a partir d’une
complete connaissance du passe de S et de ses entrees futures. Un systeme est dit causal si le
comportement present du systeme ne depend pas des entrees futures.
1.1.2 Exemples de systeme
Les systemes suivants feront l’objet d’etudes lors des seances de bureaux d’etudes et de
travaux pratiques. Compte-tenu de leur complexite, des hypotheses restrictives seront faites et
leur nombre de degre de liberte sera volontairement limite.
Quadrirotor : On s’interesse au comportement d’un quadrirotor autour de son axe de tangage
(l’etude est analogue pour l’axe de roulis). Les entrees de commande sont des moments qui
procedent du differentiel de poussee produit par les helices. Des rafales de vent peuvent agir
comme des entrees de perturbation. Les sorties sont les angles d’assiette et de gıte mesures par
une centrale d’attitude.
1
Chapitre 1. ANALYSE DES SYSTEMES
Figure 1.1 – Le quadrirotor U130 de Novadem
Amortisseur de lacet ou yaw damper : On s’attache a decrire le mouvement d’un avion
autour de l’axe de lacet consecutif a une action sur la commande de direction. Le lacet est mesure
par un gyrometre. Des rafales de vent peuvent agir comme des entrees de perturbation.
x
x ab > 0
d < 0n
y
x
x ax ab > 0
d < 0n
y
r > 0
Figure 1.2 – Effets de la commande de direction sur le lacet et le derapage
Regulateur de distance pour vehicule automobile : On etudie un systeme constitue de
deux vehicules evoluant en ligne droite et l’on cherche a controler la distance entre ces deux
vehicules. L’accelerateur et le frein sont les entrees de commande du vehicule suiveur tandis que
la vitesse du vehicule suivi est une entree de perturbation.
1.2 ANALYSE DES SYSTEME
1.2.1 Signaux pour l’analyse des systemes
En vue d’etudier le comportement d’un systeme, ses entrees sont soumises a des signaux
types. L’analyse des reponses permet de caracteriser le comportement du systemes et d’evaluer
ses performances. Ces entrees types ne sont pas celles auxquelles est soumis le systeme dans
les conditions reelles de fonctionnement mais elles ont un spectre frequentiel 1 suffisament riche
pour rendre compte des proprietes et des performances du systeme etudie.
1. Voir le cours de traitement du signal.
2
1.2. ANALYSE DES SYSTEME
De meme que les realisations physiques de ces signaux 2 sont utilisees sur les systemes reels
pour evaluer leurs performances, les modeles mathematiques de ces signaux sont appliques aux
modeles mathematiques des systemes etudies pour predire leur comportement.
1.2.1.1 Signaux pour l’analyse temporelle
L’echelon : L’echelon d’Heaviside represente sur la figure 1.3 a pour expression :
e(t) = e0U(t) ={
0 si t < 0
e0 si t > 0(1.1)
Figure 1.3 – Echelon d’Heaviside
La reponse a un echelon est appelee reponse indicielle.
L’impulsion : L’impulsion de Dirac representee sur la figure 1.4 a pour expression :
e(t) = Aδ(t) = A limk→∞
k
(
U(t)− U(t− 1
k)
)
(1.2)
Figure 1.4 – Impulsion
A est appele poids de l’impulsion, celle-ci a les proprietes suivantes :
{
δ(t) = 0 si t 6= 0∫ +∞−∞ δ(t)dt = 1
(1.3)
Au sens des distributions, l’impulsion est la derivee de l’echelon. La reponse a une impulsion
est appelee reponse impulsionnelle.
2. Obtenues par exemple au moyen d’un generateur basse frequence (GBF)
3
Chapitre 1. ANALYSE DES SYSTEMES
La rampe : La rampe ou echelon de vitesse represente sur la figure 1.5 a pour expression :
e(t) = αtU(t) (1.4)
Figure 1.5 – Rampe ou echelon de vitesse
La reponse a une rampe est appelee reponse en vitesse.
1.2.1.2 Signaux pour l’analyse frequentielle
Entree harmonique : L’entree harmonique representee sur la figure 1.6 a pour expression :
e(t) = e0 sin(ωt+ φ)U(t) (1.5)
Figure 1.6 – Entree harmonique
1.2.2 Performances d’un systeme
1.2.2.1 Regimes permanent et transitoire
La sortie du systeme est initialement dans un etat d’equilibre. Soumis a une entree type et
apres un certain temps, le systeme finit en general par presenter une sortie constante, lineaire,
parabolique, harmonique, etc. On dit alors que le systeme a atteint son regime permanent. Le
regime permanent peut etre un regime :
— d’equilibre si l’entree et la sortie sont constantes,
— d’oscillations entretenues si l’entree et la sortie sont harmoniques,
— d’oscillations libres si l’entree est constante.
4
1.2. ANALYSE DES SYSTEME
Pendant la duree mise par le systeme pour atteindre son regime permanent, le systeme est
en regime transitoire. Ce regime est caracterise par sa duree et son amortissement. Enfin, il faut
noter que de nombreux systemes travaillent pratiquement toujours en regime transitoire a cause
du caractere aleatoire de leurs entrees.
1.2.2.2 Stabilite
— Un systeme est qualifie d’asymptotiquement stable si, sous l’effet d’une entree (commande
ou perturbation) ou pour une valeur initiale de la sortie differente de sa valeur d’equilibre,
la sortie est ecartee de sa position d’equilibre et y revient.
— La sortie d’un systeme stable ecarte de sa valeur d’equilibre reste bornee autour de cet
equilibre.
— La sortie d’un systeme instable diverge.La figure 1.7 illustre ces notions.
0 5 10 15 20 25−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
Asymptotiquement stable
Temps (sec)
Am
plitu
de
0 5 10−4
−2
0
2
4
6
8
10
Instable
Temps (sec)
Am
plitu
de
0 5 10 15 20 250
0.5
1
1.5
Stable
Temps (sec)
Am
plitu
de
Figure 1.7 – Reponses impulsionnelles de systemes asymptotiquement stable, juste stable et instable
— En theorie, on peut remarquer qu’un systeme instable n’atteint jamais son regime per-
manent. En pratique, la duree du transitoire est limitee du fait des saturations des sorties
ou de la destruction du systeme.
— Les MIRAGE 2000 et le RAFALE, avec des centres de gravite recules en arriere du foyer
aerodynamique, sont des avions instables.
1.2.2.3 Amortissement
L’amortissement d’un regime transitoire est caracterise par les depassements successifs D1,
D2, etc. de la reponse indicielle du systeme et est illustre sur la figure 1.8. On calcule en
particulier l’amplitude relative du premier depassement :
D1% = 100xmax − x(∞)
x(∞)(1.6)
5
Chapitre 1. ANALYSE DES SYSTEMES
Step Response
Time (sec)
Am
plitu
de
0 2 4 6 8 10 12 14 160
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4 xmax
x(∞)réponse mal amortie
réponse très amortie
Figure 1.8 – Reponse amortie Vs. mal amortie
Un systeme correctement amorti aura un depassement n’excedant pas un pourcentage fixe
de la valeur finale du signal de sortie. Les depassements toleres dependent du systeme et de ce
que l’on veut en faire.
1.2.3 Rapidite
La rapidite d’un systeme vise a quantifier la duree du transitoire et est mise en evidence lors
d’un essai indiciel illustre sur la figure 1.9. Elle est definie par le temps de reponse a N% qui est
le temps mis par la reponse pour atteindre l’intervalle compris entre ±N% de la valeur finale et
ne plus s’en ecarter. Generalement on adopte N = 5.
Tr5% = mint0
{
∀t > t0x(t)− x(∞)
x(∞)< 5%
}
(1.7)
Réponse indicielle
Temps (sec)
Am
plitu
de
0 5 10 15 20 250
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
TR5%x(0)
x(∞)
1,05(x(∞)−x(0))
0,95(x(∞)−x(0))
Figure 1.9 – Illustration du temps de reponse a 5%
6
1.2. ANALYSE DES SYSTEME
1.2.4 HYPOTHESES SUR LE SYSTEME
Ces hypotheses fournissent un cadre dans lequel la description des relations entrees-sortie se
prete a une representation mathematique simple.
1.2.5 Continu
Un systeme continu traite et delivre a ses sorties des signaux a temps continu. Par opposition,
les systemes a temps discrets voient les valeurs prises par leurs signaux changer a des intervalles
de temps donnes.
La notion de continuite porte sur la variable temps. Si sur un intervalle donne ces signaux
peuvent prendre toutes les valeurs possibles, ils sont dits analogiques. Si au contraire ils ne
peuvent prendre qu’un nombre fini de valeurs, ils sont qualifies de numeriques.
— Un aeronef dont les entrees sont les commandes de vol et la sortie est la position est un
systeme continu.
— Le recepteur GPS qui procede a la mesure, toutes les secondes, de la position de cet
aeronef est un systeme a temps discret et l’information de position est numerique.
— La mesure par le calculateur bord de la position de la gouverne, realisee par un potentio-
metre a des intervalles de temps reguliers, est un signal analogique a temps discret plus
communement appele signal echantillonne.
1.2.6 Invariance
On dit qu’un systeme est invariant lorsque soumis a la meme entree a deux instants distincts,
les caracteristiques de la reponse sont inchangees. Pratiquement, cela traduit le fait que les
parametres du systeme ne varient pas au fil du temps.
— Un avion, du fait de la consommation de kerosene voit ses performances changer au cours
du vol et ne peut pas etre considere comme un systeme invariant.
— Plus generalement, du fait de l’usure et du vieillissement des composants qui le consti-
tuent, les systemes physiques ne sont pas invariants.
1.2.7 Linearite
1.2.7.1 Obtention d’un equilibre
Le systeme etudie est suppose stable et les signaux appliques aux entrees E sont constantes,
soit E = E0. Des lors que les valeurs prises par les signaux de sortie S ne varient plus, soit
S = S0, le systeme est dans un etat d’equilibre. Les valeurs prises par les entrees et les sorties
definissent le point d’equilibre de coordonnees {E0, S0}.— Cas d’un avion volant en palier a vitesse et altitude de croisiere. Le point d’equilibre est
defini par les positions des commandes des gaz et de profondeur, l’altitude et la vitesse
de l’avion.
— Cas d’un helicoptere en vol stationnaire.
7
Chapitre 1. ANALYSE DES SYSTEMES
1.2.7.2 Hypothese de linearite - Gain statique
Pour de petites et lentes variations des entrees e autour de leur position d’equilibre E0,
on fait l’hypothese que les variations des sorties s autour de leur valeur d’equilibre S0 sont
proportionnelles a celles des entrees.
s = k(E0, S0)e (1.8)
Pour le point d’equilibre considere, k est le gain statique du systeme.
Outre le caractere simple de la relation entree-sortie, la linearite permet pour un systeme
possedant plusieurs entrees d’appliquer, comme on le verra ulterieurement, le principe de super-
position.
— Autour de sa vitesse de croisiere, on corrige la vitesse de l’avion par de petites actions
sur la commande de profondeur. Sous l’hypothese de linearite, les variations de vitesse
sont supposees proportionnelles a celles de la position de la commande de profondeur.
1.3 MODELES D’UN SYSTEME
1.3.1 Notion de modele
Dans le cadre de ce cours, un modele est une structure mathematique pouvant representer
le systeme etudie. Par representer, on entend la capacite qu’a le modele a repliquer fidelement
le comportement du systeme. Toutefois, le modele doit rester simple pour pouvoir etre exploite.
Dans ce cours, on distingue :
— le modele de connaissance qui procede de la mise en equation du systeme au moyen des
lois de la physique,
— le modele de representation ou boite noire obtenu, pour des entrees donnees, par identi-
fication des reponses a une classe de modeles,
— le modele de synthese, il procede d’une simplification du modele de connaissance en vue
de la synthese d’une loi de commande pour le systeme,
— le modele de simulation, implemente sur un logiciel de simulation a l’instar de MATLAB-
SIMULINK, il permet de decrire des phenomenes difficiles a representer dans le modele
de connaissance, e.g. la prise en compte de sous-systemes a temps continus et discrets au
sein d’un meme systeme.
1.3.2 Modele d’un systeme lineaire invariant continu
Dans ce cours, le systeme est continu et le modele de connaissance, pas necessairement
stationnaire, s’ecrit avec une equation differentielle 3. Dans le cas d’un systeme monovariable
i.e. qui possede une entree E(t) et une sortie S(t) l’equation differentielle d’ordre n suivante est
supposee rendre compte du comportement du systeme :
dnS(t)
dtn= f
(dn−1S(t)
dtn−1, . . . , S(t),
dm−1E(t)
dtm−1, . . . , E(t), t
)
(1.9)
3. Il serait decrit par une equation de recurrence dans le cas d’un systeme a temps discret.
8
1.3. MODELES D’UN SYSTEME
Sous l’hypothese de stationnarite, le modele devient :
dnS(t)
dtn= f
(dn−1S(t)
dtn−1, . . . , S(t),
dm−1E(t)
dtm−1, . . . , E(t)
)
(1.10)
et un point d’equilibre {E0, S0} peut etre obtenu en posantdjS(t)
dtj= 0 ou j ∈ {1, . . . , n} et
dkE(t)
dtkou k ∈ {1, . . . ,m} en resolvant l’equation :
0 = f (S(t), E(t)) (1.11)
En considerant de petites variations de l’entree e(t) et de la sortie s(t) autour du point
d’equilibre {E0, S0}, de sorte que E(t) = E0+ e(t) et S(t) = S0+ s(t), le modele linearise s’ecrit
au moyen d’une equation differentielle lineaire a coefficients contants 4 :
andns(t)
dtn+ ...+ a1
ds
dt+ a0s(t) = bm
dme
dtm+ ...+ b1
de(t)
dt+ b0e(t) (1.12)
— Les coefficients constants traduisent le caractere invariant du modele.
— Soumis a une entree e(t) en echelon d’amplitude e1, s’il est stable, la sortie en regime
permanent :
limt→+∞
s(t) =b0a0e1 (1.13)
oub0a0
est le gain statique deja entrevu (1.8).
1.3.3 Transformee de Laplace de la reponse
La methode de resolution temporelle se revele parfois delicate et souvent laborieuse compte
tenu de l’ordre (qui peut etre eleve) des equations. L’utilisation de la transformee de Laplace
permet de ramener les problemes integro-differentiels a des problemes algebriques plus faciles a
traiter. Les proprietes de la transformee de Laplace figurent en annexe B. Cette transformation
permet une elimination rapide des variables intermediaires et l’obtention d’une relation liant
l’entree et la sortie du systeme.
X(p) = L [x(t)], fonction de la variable complexe p, designe la transformee de Laplace de
x(t) . Ainsi, la transformee de Laplace de l’equation (1.12) s’ecrit :
an
(
pnS(p)− pn−1s(0−)− · · · − s(n−1)(0−))
+ . . . + a1(pS(p)− s(0−)
)+ a0S(p)
= (1.14)
bm
(
pmE(p)− pm−1e(0−)− · · · − e(m−1)(0−))
+ . . . + b1(pE(p)− e(0−)
)+ b0E(p)
4. Le calcul est detaille en annexe A.
9
Chapitre 1. ANALYSE DES SYSTEMES
S(p) =bmp
m + bm−1pm−1 + · · ·+ b1p+ b0
anpn + an−1pn−1 + · · ·+ a1p+ a0E(p)
︸ ︷︷ ︸
regime force
+g(s(0−), . . . , s(n−1)(0−), e(0−), . . . , e(m−1)(0−)
)
anpn + an−1pn−1 + · · ·+ a1p+ a0︸ ︷︷ ︸
regime libre
(1.15)
Les deriveees successives de e(t) et de s(t) sont calculees au sens des distributions et s(0−),s(1)(0−),. . . ,s(n−1)(0−),e(0−), e(1)(0−),. . . ,e(n−1)(0−) sont les conditions initiales qui quantifientles ecarts de l’entree, de la sortie et de leurs derivees successives respectives par rapport a
l’equilibre.
Comme le montre l’equation (1.15), la reponse est la somme de deux termes. Le premier
correspond au regime force qui est la partie de la reponse forcee par l’entree (commande, per-
turbation). Le second terme correspond au regime libre, c’est la contribution des conditions
initiales a la reponse. En l’absence d’entree de commande ou de perturbation, soit e(t) = 0,
le regime libre n’est autre que la reponse du systeme abandonne a lui-meme. Par exemple, un
avion au decollage, par vent nul est en regime force pur alors que l’altitude d’un planeur apres
le largage, en l’absence de vent et de phenomenes aerologiques, est un regime libre pur.
1.3.4 Fonction de transfert
1.3.4.1 Fonction de transfert operationnelle
Les conditions initiales etant toutes nulles, autrement dit, le systeme est initialement dans
son etat d’equilibre, la fonction de transfert definit la relation entree-sortie du systeme :
H(p) =S(p)
E(p)=bmp
m + bm−1pm−1 + · · ·+ b1p+ b0
anpn + an−1pn−1 + · · ·+ a1p+ a0(1.16)
De sorte que :
S(p) = H(p)E(p) (1.17)
Ainsi, la relation entree-sortie s’exprime grace a la fonction de transfert simplement au moyen
d’un produit. A cet egard, il a ete vu en traitement du signal que cette relation s’exprimait dans
le domaine temporel au moyen d’un produit de convolution.
Une fonction de transfert est caracterisee par :
— les poles qui sont les racines du denominateur, ils permettent de decrire les performances
en regime transitoire,
— les zeros qui sont les racines du numerateur,
— le gain statique H(0) =b0a0
qui est le facteur d’amplification d’une entree echelon en re-
gime permanent et dont l’expression a deja ete presentee. On a en effet S(p) = H(p)E(p),
pour une entree en echelon e(t) = e0U(t), il vient en utilisant le theoreme de la valeur
finale :
limt→+∞
s(t) = limp→0
pS(p) = limp→0
pH(p)e0p
= H(0)
10
1.3. MODELES D’UN SYSTEME
Remarque : le numerateur et le denominateur de la fonction de transfert sont des polynomes
a coefficients reels, par consequent les poles et les zeros peuvent etre reels et/ou complexes
conjugues.
L’expression de la reponse s(t) peut etre obtenue par le calcul de la transformee de Laplace
inverse de S(p). Toutefois l’utilisation des tables de transformee fournies en annexe suffit a traiter
l’ensemble des problemes qui seront traites.
Remarque : La fonction de transfert est la transformee de Laplace de la reponse impulsion-
nelle. En effet, la reponse impulsionnelle a pour expression
S(p) = H(p)L [δ(t)] (1.18)
Comme L [δ(t)] = 1, il vient S(p) = H(p) et par consequent s(t)U(t) = h(t)U(t). La fonction
de transfert temporel h(t) est notamment utilise lorsqu’on calcule la reponse d’un systeme au
moyen d’un produit de convolution.
1.3.4.2 Fonction de transfert harmonique
Il est possible, pourvu qu’elle existe, de calculer la transformee de Laplace d’un grand nombre
de classes de signaux. En particulier, au moyen de la fonction de transfert operationnelle, celle
de la reponse S(p). Toutefois, l’utilisation de signaux sinusoıdaux ou harmoniques non causals 5
offre un cadre mathematique simple pour exprimer les fonctions de transfert et les representer
graphiquement.
Le systeme est decrit par (1.12) et on lui applique les signaux :
e(t) = e0 cosωt et ˜e(t) = e0 sinωt (1.19)
Comme le systeme est lineaire, les sorties ont respectivement pour expression :
s(t) = s0 cos(ωt+ φ) et ˜s(t) = s0 sin(ωt+ φ)
Il convient de rappeler que e0 et s0 designent de petites variations des signaux d’entree et de
sortie autour de leurs valeurs d’equilibre respectives.
Si l’on applique a l’entree le signal 6 e(t) = e(t) + j ˜e(t), on a, d’apres le principe de superpo-
sition, s(t) = s(t) + j ˜s(t), que l’on peut encore ecrire :
e(t) = e0ejωt et s(t) = s0e
(jωt+φ) (1.20)
Si l’on injecte ces signaux dans (1.12), il vient :
andns0e
(jωt+φ)
dtn+ · · ·+ a0s0e
(jωt+φ) = bmdme0e
jωt
dtm+ · · ·+ b0e0e
jωt (1.21)
5. Le regime permanent de la reponse est deja etabli a t = 0.
6. Il s’agit d’un signal mathematique qui n’a pas de realite physique.
11
Chapitre 1. ANALYSE DES SYSTEMES
an(jω)ns0e
(jωt+φ) + · · ·+ a0s0e(jωt+φ) = bm(jω)me0e
jωt · · ·+ b0e0ejωt (1.22)
(an(jω)n + · · ·+ a0) s0e
jωtejφ = (bm(jω)m + · · ·+ b0) e0ejωt (1.23)
H(jω) =s0e0ejφ =
bm(jω)m + · · ·+ b1jω + b0an(jω)n + · · ·+ a1jω + a0
(1.24)
— Le module |H(jω)| = s0e0
de H(jω) n’est autre que le rapport de l’amplitude de s(t) sur
celle de e(t)
— L’argument < H(jω) >= φ de H(jω) est le dephasage de s(t) par rapport a e(t).
Remarque : le caractere non causal du signal harmonique ne permet pas de deduire les
decalages temporels de signaux par l’observation de leur decalage angulaire. Une avance de
phase de π/4 peut aussi etre un retard de phase de 7π/4 mod 2π.
0 2 4 6 8 10 12 14−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
φ
e(t)s(t)
Figure 1.10 – Reponse harmonique
Interet de la fonction de transfert harmonique : La transformation de Fourier montre
qu’un signal x(t) 7 peut s’ecrire comme une somme continue de fonctions harmoniques X(ω) re-
presentee par son spectre frequentiel. Ainsi, comme le systeme est lineaire, la fonction de transfert
harmonique permet d’etudier la contribution de chacun des harmoniques du spectre de l’entree
E(ω) a la reponse S(ω). Le spectre complet de la reponse etant la somme des harmoniques de
la reponse. L’exemple suivant illustre ce propos :
7. sous reserve que :
— x(t) soit borne,
—∫ +∞−∞ |x(t)|dt existe,
— x(t) admet un nombre fini de discontinuites.
12
1.3. MODELES D’UN SYSTEME
ω H(jω) |H(jω)| < H(jω) > s(ω) < s(ω >
1 e−jπ
6 1 −π6
1× 1 0− π
6
2 3e−jπ
2 3 −π2
3× 0.25π
3− π
24 0.4e−jπ 0.4 −π 0.4× 0.05
π
2− π
Tableau 1.1 – Reponse d’un systeme lineaire a des signaux harmoniques
Exemple : soit le signal e(t) = 1 sin(t) + 0.25 sin(2t+ π/3) + 0.05 sin(4t+ π/2) et la fonction
de transfert H(jω) aux pulsations ω = {1, 2, 4} en rad/s. L’amplitude s(ω) et la phase de
chaque harmonique < s(ω > de la reponse sont donnes dans le tableau Ce tableau montre que
le fondamental de pulsation 1rad/s est propage au travers du systeme sans amplification ni
attenuation mais avec un retard de phase. L’harmonique de pulsation 2rad/s est amplifie et le
retard de phase s’accroıt ; quant a l’harmonique de de pulsation 3rad/s, il est attenue.
Ainsi, la reponse a pour expression s(t) = 1 sin(t− π/6)+ 0.75 sin(2t− π/6)+ 0.02 sin(4t− π/2)
et est representee sur la figure 1.11.
0 5 10 15−1.5
−1
−0.5
0
0.5
1Le signal d’entrée et ses harmoniques
0 5 10 15−2
−1.5
−1
−0.5
0
0.5
1
1.5Le signal de sortie et ses harmoniques
e(t)e
1(t)
e2(t)
e3(t)
s(t)s
1(t)
s2(t)
s3(t)
Figure 1.11 – Illustration du temps de reponse a 5%
1.3.4.3 Representation graphique des fonctions de transfert
L’exemple precedent montre que l’etude des valeurs du module et de l’argumentde H(jω)
pour differentes valeurs de ω permet de decrire le comportement du systeme. Dans le but d’ap-
prehender de maniere globale ce comportement, il est avantageux de donner de H(jω) une
representation graphique. Les paragraphes suivants presentent les representations graphiques
les plus usitees en automatique, a savoir le lieux de Nyquist, le lieu de Black-Nichols et les
diagrammes de Bode.
13
Chapitre 1. ANALYSE DES SYSTEMES
Lieu de Nyquist : Le lieu de Nyquist se trace dans le plan complexe, la partie reelle ℜ(H(jω))
et la partie imaginaire ℑ(H(jω)) sont portees respectivement sur l’axe des abscisses et des
ordonnees. Un tel lieu est represente sur la figure 1.12 et est parametre en ω.
−3 −2 −1 0 1 2 3 4−6
−5
−4
−3
−2
−1
0
ℜ
ℑ
φ
ω croissants
ω=0
ω=ωr
|H(jω)|
|H(0)|
Figure 1.12 – Lieu de Nyquist
Sur cette figure, on lit le gain statique pour ω = 0, soit |H(0)| qui represente le facteur
d’amplification du systeme pour une entree constante (dans ce cas, un signal sinusoıdal de
pulsation nulle). Si pour ω > 0, le module |H(jω)| > |H(0)|, cela revele un phenomene de
resonance. La pulsation de resonance ωr est celle pour laquelle |H(jω)| est maximum et on
definit le facteur de surtension Q comme le rapport de |H(jωr)| sur |H(0)|.
Q =|H(jωr)||H(0)| (1.25)
Diagramme de Bode : Les diagrammes de Bode representent les evolutions du module
|H(jω)| (ou rapport des amplitudes du signal de sortie sur celle du signal d’entree) et celle de
l’argument < H(jω) = φ(ω) > (ou dephasage du sigal de sortie par rapport au signal d’entree)
en fonction de la pulsation ω ou de la frequence f (ω = 2πf). Pratiquement on represente deux
diagrammes :
— le diagramme du gain defini par |H(jω)|dB = 20 log10 |H(jω)|,— le diagramme de phase < H(jω) >= φ(ω).
Remarque : Pour des raisons de commodite, le gain est exprime en decibels. Ainsi des varia-
tions de gains consequentes s’expriment et se representent plus aisement sur un graphique.
Remarque : La fonction de transfert est generalement etudiee sur des plages de frequences
etendues, aussi porte-t-on les pulsations sur une echelle logarithmique.
Pour construire le diagramme de Bode d’une fonction de transfert, il faut :
— factoriser la fonction de transfert pour transformer le numerateur et le denominateur en
produits de termes du premier et/ou du second degre,
14
1.3. MODELES D’UN SYSTEME
— placer les pulsations particulieres en abcisse (celles-ci seront identifiees au chapitre dedie
a l’etude des systemes d’ordre un et d’ordre deux),
— tracer les diagrammes asymptotiques de gain et de phase qui traduisent le comportement
du gain et de la phase quand ω tend vers 0 et +∞,
— affiner le trace si les diagrammes asymptotiques ne suffisent pas, en particulier au voisi-
nage des pulsations de resonance.
La figure 1.13 illustre le trace d’un diagramme de bode sur lequel sont mis en evidence les
principales caracteristiques.En particulier :
— le gain statique en dB,
— la pente en dB/decade,
— la phase a l’origine,
— la phase minimale,
— pour ce systeme, la presence d’une resonance.
−40
−30
−20
−10
0
10
20
gain
(dB
)
10−1
100
101
−180
−135
−90
−45
0
phas
e (d
eg)
pulsation (rad/sec)
ωr
|H(ωr)|
dB le gain à la résonance
<H(j∞)>
<H(0)> phase à l’origine
une décade
variation gain
variation phase
|H(0)|dB
gain
statique
QdB
Figure 1.13 – Diagramme de Bode
En automatique, un diagramme de Bode permet de visualiser la plage de frequences au sein
de laquelle il convient de faire fonctionner le systeme etudie. Le diagramme de Bode asympto-
tique du gain, trace a partir de la fonction de transfert harmonique H(jω) montre que le systeme
a un comportement de type passe-bas. Cela signifie que les amplitudes des composantes “basses
frequences” du spectre du signal d’entree ebf (celles inferieures a ωr) sont amplifiees ; en effet
le gain |H(0)|dB > 0 et par suite, les composantes “basses frequences” du spectre de la reponse
sbf = 10|H(0)|dB
20 ebf → sbf = |H(0)|ebf . Sur le diagramme asymptotique de la phase, pour les
basses frequences, la phase est nulle, par consequent, le systeme n’introduit pas de retard de la
sortie sur l’entree.
Aux pulsations superieures a ωr, le gain decroıt lineairement 8, les composantes hautes frequences
du spectre du signal d’entree sont d’autant plus attenuees que la pulsation croıt. Pour les valeurs
8. Cela est du fait que l’axe des abcisses est gradue avec une echelle logarithmique.
15
Chapitre 1. ANALYSE DES SYSTEMES
|H(0)|dB < 0, les amplitude des composantes du spectre de la reponse sont inferieures a celles
du signal d’entree. Lorsque ω >> ωr ces composantes ont des amplitudes proches de 0 ce qui
signifie que les composantes correspondantes du signal d’entree n’agissent pas sur le systeme. Sur
le diagramme asymptotique de la phase, pour les “hautes frequences”, la phase tend a diminuer,
par consequent, le systeme introduit un retard qui tend a augmenter.
On observe une resonance localisee a la pulsation ωr, comme le gain a la resonance est supe-
rieure au gain statique, les composantes du spectre du signal d’entree eres localisees a cette
pulsation et dans son voisinage sont amplifiees d’un facteur sres = 10|H(ωr)|dB
20 eres. Comme
|H(jωr)|dB = |H(0)|dB +QdB, il vient sres = 10|H(0)|dB
20 10QdB20 eres soit sres = 10
QdB20 |H(0)|eres.
En conclusion, il conviendra d’appliquer a ce systeme des signaux de commande dont les compo-
santes du spectre sont inferieures a ωr. De tels signaux ont un effet sur la reponse. En revanche,
les signaux presentant des composantes spectrales proches de ωr sont fortement amplifiees et a
l’origine d’oscillations sur la reponse. Enfin, les signaux dont les composantes du spectre sont
superieures a ωr n’ont aucun effet.
Remarque : pratiquement, il faut etre capable de tracer le diagramme de Bode a partir
du modele H(jω) et reciproquement de determiner le modele a partir des caracteritiques du
diagramme.
Remarque : Les diagrammes de Bode et le lieu de Black-Nichols etudies aux paragraphes
suivants representent la meme fonction de transfert.
Lieu de Black-Nichols : Le lieu de Black-Nichols d’un systeme ayant pour fonction de
transfert harmonique H(jω) est une representation graphique de la fonction de transfert. Ce
lieu se construit en portant :
— en abcisse, l’argument < H(jω) >= φ(ω) encore appele phase,
— en ordonnee, le gain |H(jω)|dB.Le lieu est parametre en ω et le sens des pulsations croissantes est indique par une fleche.
Un tel lieu est represente sur la figure 1.14, ses caracteristiques sont les memes que celles lues
sur le diagramme de Bode.
−180 −135 −90 −45 0−50
−40
−30
−20
−10
0
10
20
Nichols Chart
Open−Loop Phase (deg)
Ope
n−Lo
op G
ain
(dB
)
|H(ωr)|
dB le gain à la résonance
QdB
<H(j∞)>
ωr
ω<H(0)> phase à l’origine
|H(0)|dB
gain
statique
Figure 1.14 – Lieu de Black-Nichols
16
1.3. MODELES D’UN SYSTEME
A propos de la construction des lieux et diagrammes : L’etude des limites de la fonction
de transfert harmonique au voisinage de 0 et de +∞ est a mener lors de la construction des
differents lieux et diagrammes, elle permet de degager quelques resultats interessants :
Soit la fonction de transfert (1.24). Dans le cas ou celle-ci possede k poles nuls et m < n, elle
peut s’ecrire :
H(jω) =bm(jω)m + · · ·+ b1jω + b0
(jω)k(an(jω)n−k + · · ·+ ak+1jω + ak)(1.26)
il vient : limω→0
H(jω) → b0ak(jω)k
k 0 1 2 p
|H(jω)| b0a0
b0a1ω
→ +∞ b0a2ω2 → +∞ b0
apωp → +∞|H(jω)|dB 20 log | b0a0 | ≈ −20 logω ≈ −40 logω ≈ −p× 20 logω
< H(jω) > 0 −π2 −π −p×π
2
Tableau 1.2 – Limites d’une fonction de transfert harmonique en zero
il vient : limω→+∞
H(jω) → bman(jω)n−m
n−m 1 2 p
|H(jω)| bmanω
→ 0 bmanω2 → 0 bm
anωp → 0
|H(jω)|dB −20 logω ≈ −40 logω ≈ −p× 20 logω
< H(jω) > −π2 −π −p×π
2
Tableau 1.3 – Limites d’une fonction de transfert harmonique a l’infini
1.3.5 Schemas fonctionnels
La figure 1.15 traduit la representation souvent adoptee en automatique pour representer les
systemes. Ces derniers sont decomposes en sous-systemes elementaires et chaque bloc contient
la fonction de transfert afferente. Cette representation met egalement en evidence les differents
signaux : entrees de commande, de perturbation, reponses, etc.
+
-
e1(p)
e2(p)
e1(p)− e2(p) e(p) H(p) s(p) = H(p)e(p)
Figure 1.15 – Elements pour la construction de schemas fonctionnels
17
Chapitre 1. ANALYSE DES SYSTEMES
~V~F
~x
Figure 1.16 – Le systeme etudie
1.4 EXEMPLE
Dans cet exemple simple, on se propose de mettre en application les notions etudiees prece-
demment. Le systeme etudie et represente sur la figure 1.16 est un vehicule automobile
Pour simplifier cette etude, on pose les hypotheses suivantes :
— la voiture se deplace vers l’avant a la vitesse V ,
— une seule commande : la force motrice/freinage U ,
— le modele adopte pour les frottements aerodynamiques : −fV 2,
— la reponse est la position X du vehicule,
— a l’instant initial, X(0) est quelconque et V (0) = Ve est la vitesse d’equilibre.
Le modele est etabli en appliquant le principe fondamental de la dynamique :
mdV
dt= U − fV 2 (1.27)
On a par ailleurs, la relation cinematique :
dX
dt= V (1.28)
L’etude de l’equilibre pour ce systeme n’est pas interessante, cela supposerait d’etudier le
vehicule a l’arret, en effet a l’equilibre, la conditiondX
dt= 0 doit etre satisfaite. On s’attache
donc a l’etude d’un pseudo-equilibre pour lequel la vitesse V est constante. D’apres (1.27) :
0 = U − fV 2 (1.29)
et par suite :
Ve =
√
Ue
f(1.30)
Comme le montre la figure 1.17, il existe pour ce systeme une infinite de points d’equilibre.
18
1.4. EXEMPLE
0 500 1000 1500 2000 2500 30000
10
20
30
40
50
60
Ue (N)
Ve
(m/s
)
Figure 1.17 – Carte des equilibres du vehicule automobile
Dans la suite de l’etude, un point d’equilibre est choisi arbitrairement, soit {Ue, Ve} et on
considere de petites variations de la commande u << Ue engendrant de petites variations de la
vitesse v << Ve autour de cet equilibre, de sorte que :
U = Ue + u (1.31)
V = Ve + v (1.32)
Ainsi, l’equation (1.27) s’ecrit :
md(Ve + v)
dt= (Ue + u)− f(Ve + v)2 (1.33)
apres developpement et en eliminant les termes de degre 2 (comme v << Ve ⇒ v2 << vVe), on
obtient les equations du systeme linearise :
mdVedt
︸ ︷︷ ︸
=0
+mdv
dt= Ue − fV 2
e︸ ︷︷ ︸
=0
+u− 2fVev (1.34)
d’ou
mdv
dt= u− 2fVev (1.35)
Comme Ve = cte, (1.28) s’ecrit :
dX
dt= V = Ve + v = Ve +
dx
dt(1.36)
il vient :
dx
dt= v (1.37)
19
Chapitre 1. ANALYSE DES SYSTEMES
On calcule ensuite les transformees de Laplace de ces equations :
mpV (p)−mv(0) = U(p)− 2fVeV (p) (1.38)
pX(p)− x(0) = V (p) (1.39)
Signalons que x(t) et v(t) sont des fonctions continues et que par consequent x(0−) = x(0)
et v(0−) = v(0) = 0 9. En couplant ces equations, il vient :
X(p) =U(p)
p(mp+ 2fVe)+x0p
(1.40)
Expression dans laquelle on reconnaıt dans le premier terme du membre de gauche le regime
force et le regime libre dans le dernier termes. La fonction de transfert est etablie pour des
conditions initiales nulles :
X(p)
U(p)=
1
p(mp+ 2fVe)(1.41)
En reponse a un echelon de commande d’amplitude u0 :
X(p) =1
p(mp+ 2fVe)
(u0p
)
+x0p
(1.42)
X(p) est decomposee en elements simples pour faire apparaıtre des transformees de Laplace
elementaires :
X(p) =A
p2+B
p+
C
p+ 2fVe
m
+x0p
(1.43)
avec A =u0
2fVeet B = −C = − u0m
4f2V 2e
La position x(t) est etablie au moyen des tables de transformees fournies en annexe B. Elle
est representee sur la figure 1.18
x(t) = x0︸︷︷︸
ci
+
At−B
︸ ︷︷ ︸
permanent
+Ce−2fVet
m︸ ︷︷ ︸
transitoire
U(t) (1.44)
9. Et surtout pas V (0) = Ve, en effet la transformee de Laplace des equations differentielles est ecrite pour de
petites variations v de V autour de l’equilibre. A l’instant initial, le vehicule roule a la vitesse Ve et l’ecart v(0) a
l’equilibre est nul.
20
1.4. EXEMPLE
0 5 10 15 20 25 300
50
100
150
200
250
300
350
400
450
Temps (s)
Pos
ition
x(t
) (m
)x
0+(At−B)U(t)
Figure 1.18 – Reponse de la voiture a un echelon d’amplitude u0 = 1000N et x0 = 100m
La fonction de transfert harmonique est obtenue immediatement en substituant jω a p dans
(1.41), il convient toutefois d’avoir a l’esprit qu’elle n’est operante que pour les signaux harmo-
niques en regime permanent.
X(jω)
U(jω)=
(1
2fVe
)
jω
(
jωm
2fVe+ 1
) (1.45)
Pour construire une representation graphique de cette fonction de transfert, on utilise les
resultats etablis precedemment et portant sur les limites de la fonction de transfert pour ω ten-
dant vers 0 et vers +∞. Dans cet exemple, le numerateur est un polynome de degre 0 et le
numerateur un polynome de degre 2.
La pulsation ωc =2fVem
est remarquable 10 et a ce titre, on calcule le module, le gain et l’argu-
ment de H(jωc) (cf. Tableau 1.4).
Pour les valeurs suivantes des parametres : Ve = 20ms−1, f = 1kgm−1 et m = 1000kg, on
trace le diagramme de Bode (figure 1.19) et le lieu de Black-Nichols (figure 1.20) de la fonction
de transfert :
X(jω)
U(jω)=
0.025
jω(jω
0.04+ 1)
(1.46)
10. La raison en est la suivante, a la pulsation ωc la fonction de transfert elementaire1
jω m2fVe
+ 1a sa partie
reelle egale a sa partie imaginaire. Par consequent,
— pour ω << ωc, elle tend vers 1, nombre reel, et n’a aucun effet sur l’amplitude et la phase,
— pour ω >> ωc, elle tend vers2fVe
jmω, imaginaire pur, elle fait donc tendre l’amplitude vers 0 mais surtout,
elle produit un retard de phase qui tend vers −π2,
— ainsi ω = ωc traduit la pulsation a laquelle le comportement de cette fonction de transfert change.
21
Chapitre 1. ANALYSE DES SYSTEMES
ω 0 2fVe
m +∞|H(jω)| 1
2fVeωm
4f2V 2e
√2
1
mω2
|H(jω)|dB −20 logω 20 log(
m4f2V 2
e
)
− 3dB −40 logω
< H(jω) > −π2 −3π
4 −π
Tableau 1.4 – Module, gain et argument de la fonction de transfert du vehicule en fonction de ω
−60
−40
−20
0
20
40
Gai
n (d
B)
10−3
10−2
10−1
100
−180
−135
−90
Pha
se (
deg)
Pulsation (rad/sec)
−40dB/dec
−20dB/dec
ωc
Figure 1.19 – Diagramme de Bode de la voiture
−180 −150 −120 −90−70
−60
−50
−40
−30
−20
−10
0
10
20
30
Nichols Chart
Phase (deg)
Gai
n (d
B) ω
c
Figure 1.20 – Lieu de Black-Nichols de la voiture
Ces diagammes revelent un gain statique qui tend vers +∞, cela traduit le fait qu’une
force motrice constante (de pulsation nulle) fait augmenter continument la position du vehicule,
autrement dit la voiture se deplace et x(t) augmente. Si la force motrice varie sinusoıdalement
autour de sa valeur d’equilibre Ue, a des pulsations telles que |H(jω)|dB ≤ 0dB, la position de
la voiture ne serait pas affectee par l’effet de cette commande, la voiture roulerait donc a V =
22
1.4. EXEMPLE
Ve et la position continuerait a augmenter proportionnellement au temps. Cette etude montre
qu’il ne sert a rien d’appliquer une force motrice dont l’analyse du signal revelerait la presence
d’harmoniques de pulsation trop elevee. Plus simplement, ecraser la pedale d’accelerateur ne fait
pas reagir le vehicule plus rapidement.
23
Chapitre 1. ANALYSE DES SYSTEMES
24
CHAPITRE 2
SYSTEMES SIMPLES
2.1 INTRODUCTION
L’experience montre que les reponses aux entrees-types de nombreux systemes presentent
des similitudes. Ainsi les reponses indicielles representees sur la figure 2.1 sont frequemment
observees.
0 2 4 60
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Réponse indicielle
Temps (sec)
Am
plitu
de
0 5 10 150
0.2
0.4
0.6
0.8
1
1.2
1.4
Réponse indicielle
Temps (sec)
Am
plitu
de
Figure 2.1 – Reponses indicielles frequemment observees
D’autre part, l’etablissement d’un modele de connaissance, sous les hypotheses de continuite,
d’invariance et de linearite, conduit tres souvent a representer les systemes etudies par des
equations differentielles lineaires a coefficients constants d’ordre un et deux.
Dans ce chapitre, on etablit les modeles et les proprietes de ces systemes, qualifies d’ordre un
et d’ordre deux, et dont les reponses indicielles peuvent avoir les allures illustrees sur la figure
2.1.
25
Chapitre 2. SYSTEMES SIMPLES
2.2 SYSTEME DU PREMIER ORDRE
2.2.1 Modele
On appelle systeme du premier ordre un systeme dont l’entree e(t) et la sortie s(t) sont liees
par une equation differentielle lineaire du premier ordre de la forme :
τds(t)
dt+ s(t) = ke(t) (2.1)
— τ est la constante de temps,
— k est le gain statique.
Un tel modele rend compte d’un systeme possedant un reservoir d’energie. C’est par exemple
le cas du vehicule automobile etudie au chapitre un pour lequel l’entree de commande est la
force motrice/freinage et la reponse la vitesse (1.35). Ce systeme possede un reservoir d’energie
cinetique : la masse de la voiture.
Certains aspects du comportement d’un avion peuvent etre decrits par des modeles du premier
ordre, c’est le cas du mode de roulis pur et du mode spiral.
2.2.2 Fonctions de transfert
La transformation de Laplace de (2.1) avec la condition initiale s(0−) :
pτS(p)− τs(0−) + S(p) = kE(p) (2.2)
S(p) =k(p)
τp+ 1E(p)
︸ ︷︷ ︸
regime force
+τs(0−)τp+ 1︸ ︷︷ ︸
regime libre
(2.3)
2.2.2.1 Fonction de transfert operationnelle
Avec la condition initiale s(0−) = 0, la fonction de transfert d’un systeme du premier ordre :
H(p) =S(p)
E(p)=
k
τp+ 1(2.4)
Les parametres de cette fonction de transfert sont :
— le pole reel : p1 = −1
τ— le gain statique H(0) = k
2.2.2.2 Fonction de transfert harmonique
La fonction de transfert harmonique a pour expression :
H(jω) =S(jω)
E(jω)=
k
jωτ + 1(2.5)
26
2.2. SYSTEME DU PREMIER ORDRE
Caracterisee par le module et l’argument de H(jω) :
|H(jω)| =|k|√
ω2τ2 + 1(2.6)
< H(jω) > = < k > − tan−1(ωτ)
2.2.3 Reponses aux entrees types
2.2.3.1 Reponse impulsionnelle
On applique a l’entree de ce systeme l’impulsion de dirac de poids e0, soit e(t) = e0δ(t) et
L [e(t)] = e0, il vient :
S(p) =kτ
p+ 1τ
e0 (2.7)
dont l’original figure dans les tables de transformees de l’annexe B,
s(t) =ke0τe−
tτ U(t) (2.8)
Un tel systeme est asymptotiquement stable pour τ > 0. Dans le cas ou τ < 0, la reponse
diverge.
Remarque : la reponse de ce systeme en regime libre a la condition initiale s(0−) = ke0τ est
identique a celle de la reponse a une impulsion de poids e0 avec une condition initiale nulle.
Remarque : un regime transitoire tel que (2.8) et illustre sur la figure 2.2 caracterise un
mode 1 du premier ordre.
2.2.3.2 Reponse indicielle
On applique a l’entree de ce systeme l’echelon d’amplitude e1, soit e(t) = e1U(t) et L [e(t)] =e1p, il vient :
S(p) = k1τ
p+ 1τ
e1p
(2.9)
Apres decomposition en elements simples :
S(p) = ke1
(
1
p− 1
p+ 1τ
)
(2.10)
dont les transformees de Laplace inverse figurent dans les tables de l’annexe B,
s(t) = ke1
(
1− e−tτ
)
U(t) (2.11)
— le regime permanent ke1U(t) correspond bien au produit du gain statique par l’amplitude
de l’echelon,
— le regime transitoire −ke1e−tτ U(t) tend a s’eteindre pour τ > 0,
— aux instants t = τ , t = 3τ , la reponse est egale a :
— s(τ) = 0, 63ke1,
— s(3τ) = 0, 95ke1 et t = 3τ correspond approximativement a la duree du transitoire.
La reponse indicielle est illustree sur la figure 2.2.
1. Un mode est en fait un comportement.
27
Chapitre 2. SYSTEMES SIMPLES
2.2.3.3 Reponse en vitesse
On applique a l’entree de ce systeme l’echelon de vitesse d’amplitude e2 ou la rampe de pente
e2, soit e(t) = e2tU(t) et L [e(t)] =e2p2
, il vient :
S(p) = k1τ
p+ 1τ
e2p2
(2.12)
apres decomposition en elements simples :
S(p) = ke2
(
1
p2− τ
p+
τ
p+ 1τ
)
(2.13)
s(t) = ke2
(
t− τ + τe−tτ
)
U(t) (2.14)
— le regime permanent ke2(t − τ)U(t) correspond bien au produit du gain statique par
l’amplitude de l’echelon de vitesse d’amplitude e2, il presente un retard τ ,
— le regime transitoire ke2τe− t
τ U(t) tend a s’eteindre pour τ > 0 en environ 3τ .
La reponse en vitesse est illustree sur la figure 2.2.
0 2 4 60
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Temps (sec)
Am
plitu
de
0 2 4 60
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Temps (sec)
Am
plitu
de
0 2 4 60
1
2
3
4
5
6
Temps (sec)
Am
plitu
de
3τ3ττ
τ
0,63ke1
0,05ke0/τ
ke0/τ
ke2(t−τ)U(t)
ke1
0,95ke1
Figure 2.2 – Reponses impulsionnelle, indicielle et en vitesse d’un systeme du premier ordre
2.2.3.4 Reponse harmonique
La fonction de transfert harmonique (2.5) permet d’etudier le comportement du systeme en
regime permanent pour une entree harmonique. Le numerateur est de degre zero et le denomi-
nateur de degre un, on utilise les tableaux 1.2 et 1.3 pour etudier le comportement du systeme
28
2.2. SYSTEME DU PREMIER ORDRE
lorsque ω tend vers zero et +∞.
Pour la pulsation ω = ωc =1
τ, la partie reelle du denominateur de H(jω) est egale a la partie
imaginaire et marque un changement de comportement du systeme. Cette pulsation est appelee
pulsation de coupure 2.
Tous ces resultats sont rapportes dans le tableau 2.1 pour τ > 0 3, les valeurs particulieres sont
calculees d’apres les relations 2.6.
ω 0 ωc =1τ +∞
|H(jω)| |k| |k|√2
|k|ωτ
|H(jω)|dB 20 log |k| 20 log |k| − 3dB ≈ −20 logω
< H(jω) > < k > < k > −π4
< k > −π2
Tableau 2.1 – Analyse de la fonction de transfert harmonique d’un premier ordre
2.2.4 Diagrammes frequentiels
Le lieu de Nyquist, les diagrammes de Bode et le lieu de Black-Nichols d’un systeme du
premier ordre sont representes sur les figures 2.3, 2.4 et 2.5, ils ont ete traces pour k > 0. La
pulsation ωc = 1τ est appelee pulsation de coupure et l’intervalle [0, ωc] est la bande passante
du systeme. Pratiquement, il convient d’appliquer a un systeme du premier ordre un signal de
commande dont le spectre frequentiel soit contenu dans la bande passante, les composantes du
spectre dont la pulsation est superieure a ωc n’ayant peu ou pas d’effet sur la reponse.
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
−0.6
−0.5
−0.4
−0.3
−0.2
−0.1
0
0.1
partie réelle
part
ie im
gina
ire
ωc
|k|
ω
Figure 2.3 – Lieu de Nyquist d’un systeme du premier ordre
2. Pour un systeme a gain statique unitaire, la pulsation de coupure verifie la propriete suivante : le signal
d’entree etant un signal sinusoıdal de pulsation ωc etabli depuis un temps infini. Alors, la puissance du signal de
sortie est egale a la moitie de celle du signal d’entree. En effet, |S(ωc)| = |E(ωc)|√2
, d’apres le theoreme de Parseval
la puissance de ces signaux |S(ωc)|2 =(
|E(ωc)|√2
)2
= |E(ωc)|22
.
3. dans le cas ou τ est negatif, comme on l’a vu plus haut, la reponse diverge.
29
Chapitre 2. SYSTEMES SIMPLES
−40
−30
−20
−10
0
Gai
n (d
B)
10−2
10−1
100
101
102
−90
−60
−30
0
Pha
se (
deg)
Pulsation (rad/sec)
ωc
−20dB/decade
20log|k|
Figure 2.4 – Diagrames de Bode d’un systeme du premier ordre
−90 −60 −30 0−45
−40
−35
−30
−25
−20
−15
−10
−5
0
Phase (deg)
Gai
n (d
B)
20log|k|
ωc
ω
Figure 2.5 – Lieu de Black-Nichols d’un systeme du premier ordre
2.2.5 Relation temps-frequence
Pour un systeme du premier ordre, le temps de reponse a 5% est egal a 3τ et la bande passante
est definie par l’intervalle [0, 1τ ]. Ainsi il apparaıt que le systeme est d’autant plus rapide que sa
bande passante est grande, c’est ce que montre la figure 2.6. En effet, un signal dont la bande
passante est large transmet les harmoniques de rang eleve, lesquels sont les composantes rapides
de ce signal.
30
2.3. SYSTEMES DU SECOND ORDRE
0 1 2 3 4 5 60
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Réponse indicielle
Temps (sec)
Am
plitu
de
2ττ
10−2
10−1
100
101
102
−40
−35
−30
−25
−20
−15
−10
−5
0
Mag
nitu
de (
dB)
Diagramme de Bode
Pulsation (rad/sec)
1/2τ1/τ
Figure 2.6 – Correspondance temps-frequence pour un systeme d’ordre un
2.2.6 Relation temps-poles
Pour un systeme du premier ordre stable, i.e. dont le transitoire tend a s’eteindre, le pole
p = − 1τ est a gauche de l’axe imaginaire. Il en est d’autant plus eloigne que le temps de reponse
est court.
0 1 2 3 4 5 60
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Réponse indicielle
Temps (sec)
Am
plitu
de
2ττ
−3 −2.5 −2 −1.5 −1 −0.5 0−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
Carte des poles
axe réel
axe
imag
inai
re
−1/2τ−1/τ
Figure 2.7 – Correspondance temps-poles pour un systeme d’ordre un
2.3 SYSTEMES DU SECOND ORDRE
On appelle systeme du second ordre un systeme dont l’entree e(t) et la sortie s(t) sont liees
par une equation differentielle lineaire du second ordre de la forme :
a2ds2(t)
dt2+ a1
ds(t)
dt+ a0s(t) = b0e(t) (2.15)
31
Chapitre 2. SYSTEMES SIMPLES
Un tel modele rend compte d’un systeme possedant deux reservoirs d’energie et d’un element
susceptible de la dissiper, par exemple le circuit RLC en electricite ou le systeme masse-ressort
avec frottements en mecanique.
Certains aspects du comportement d’un avion peuvent etre decrits par des modeles du second
ordre, c’est le cas des modes de roulis hollandais, d’incidence et de la phugoıde.
On ecrira systematiquement (2.15) sous la forme :
1
ω2n
ds2(t)
dt2+
2ξ
ωn
ds(t)
dt+ s(t) = ke(t) (2.16)
ou les parametres du systeme du second ordre sont :
— ξ le facteur d’amortissement,
— ωn la pulsation propre non-amortie,
— k le gain statique.
2.3.1 Fonctions de transfert
La transformation de Laplace de (2.16) avec les conditions initiales s(0−), s′(0−) qui pour unsysteme mecanique pourraient representer la position et la vitesse initiale 4 du systeme etudie a
pour expression :
1
ω2n
(p2S(p)− ps(0−)− s′(0−)) +2ξ
ωn(pS(p)− s(0−)) + S(p) = kE(p) (2.17)
S(p) =k(p)
p2
ω2n
+2ξ
ωnp+ 1
E(p)
︸ ︷︷ ︸
regime force
+
s(0−)
(p
ω2n
+2ξ
ωn
)
+s′(0−)ω2n
p2
ω2n
+2ξ
ωnp+ 1
︸ ︷︷ ︸
regime libre
(2.18)
2.3.1.1 Fonction de transfert operationnelle
Avec les conditions initiales s(0−) = s′(0−) = 0, la fonction de transfert d’un systeme du
second ordre :
S(p)
E(p)=
kω2n
p2 + 2ξωnp+ ω2n
(2.19)
Cette fonction de transfert est caracterisee par :
— ses poles, ces derniers sont :
— reels distincts lorsque ξ > 1 :
p1 = −ξωn + ωn
√
ξ2 − 1 (2.20)
p2 = −ξωn − ωn
√
ξ2 − 1
4. En prenant toutefois garde au fait qu’il s’agit de variations de position et de vitesse par rapport a la position
et a la vitesse d’equilibre.
32
2.3. SYSTEMES DU SECOND ORDRE
— reels doubles lorsque ξ = 1 :
p1 = p2 = −ωn (2.21)
— complexes conjugues lorsque 0 ≤ ξ < 1 :
p1 = −ξωn + jωn
√
1− ξ2 (2.22)
p2 = −ξωn − jωn
√
1− ξ2
Ce dernier cas est represente sur la figure 2.8.
— son gain statique H(0) = k
Comme on le verra ulterieurement, la nature et la valeur des poles conditionnent les allures des
reponses temporelles et frequentielles.
ℜ
ℑ
p1
p2
ψ
jωn
√
1− ξ2
−jωn
√
1− ξ2
−ξωn
jωn
−jωn
−ωn
Figure 2.8 – Images des poles dans le plan complexe pour 1 > ξ ≥ 0
2.3.1.2 Fonction de transfert harmonique
La fonction de transfert harmonique a pour expression :
H(jω) =S(jω)
E(jω)=
kω2n
ω2n − ω2 + j2ξωnω
(2.23)
2.3.2 Reponses aux entrees types
2.3.2.1 Reponse indicielle
On applique a l’entree de ce systeme l’echelon d’amplitude e1, soit e(t) = e1U(t) et L [e(t)] =e1p, il vient :
S(p) =ke1ω
2n
p(p2 + 2ξωnp+ ω2n)
(2.24)
que l’on ecrit :
S(p) =ke1ω
2n
p(p− p1)(p− p2)(2.25)
33
Chapitre 2. SYSTEMES SIMPLES
Poles reels distincts : On decompose (2.25) en elements simples :
S(p) = ke1
(
1
p+
p2p1−p2
p− p1−
p1p1−p2
p− p2
)
(2.26)
On pose p1 = − 1
τ1> p2 = − 1
τ2. Comme pour les systemes du premier ordre, les τi, i = 1, 2
sont homogenes a des constantes de temps. Apres calcul, il vient :
S(p) = ke1
(
1
p−
τ1τ1−τ2
p+ 1τ1
+τ2
τ1−τ2
p+ 1τ2
)
(2.27)
D’apres les tables de transformee,
s(t) = ke1
1︸︷︷︸
permanent
− τ1τ1 − τ2
e− t
τ1 +τ2
τ1 − τ2e− t
τ2
︸ ︷︷ ︸
transitoire
U(t) (2.28)
L’expression de s(t) montre que le regime transitoire est la somme de deux regimes transitoires
du premier ordre de constantes de temps τ1 et τ2 avec τ1 > τ2. Le premier regime transitoire a
une duree approximative de 3τ1 et dure plus longtemps que le second regime transitoire dont la
duree vaut 3τ2. On dit que la reponse du systeme comporte deux modes aperiodiques.
En outre, les amplitudes maximales (en valeur absolue) de ces transitoires calculees a t = 0 sont
telles queτ1
τ1 − τ2>
τ2τ1 − τ2
.
Pour ces raisons, le transitoire associe a la constante de temps τ1 (au pole p1) est qualifie de
mode dominant et p1 de pole dominant.
Poles reels doubles : On decompose (2.25) en elements simples :
S(p) = ke1ω21
( 1p21
p−
1p21
p− p1+
1p1
(p− p1)2
)
(2.29)
On pose p1 = −ωn = − 1
τ1et (2.29) s’ecrit :
S(p) = ke1
(
1
p− 1
p+ 1τ1
−1τ1
(p+ 1τ1)2
)
(2.30)
qui admet la transformee de Laplace inverse :
s(t) =
1︸︷︷︸
permanent
− e− t
τ1 − t
τ1e− t
τ1
︸ ︷︷ ︸
transitoire
U(t) (2.31)
Ce systeme comporte un seul mode aperiodique et on qualifie son comportement de regime
critique.
34
2.3. SYSTEMES DU SECOND ORDRE
Poles complexes conjugues : La decomposition en elements simples de (2.25) est identique
a celle de (2.26). On l’exprime avantageusement en utilisant pour p1 et p2 la forme exponentielle.
p1 = −ξωn + jωn
√
1− ξ2 = ωnejφ
p2 = −ξωn − jωn
√
1− ξ2 = ωne−jφ
φ = − tan−1
(√1−ξ2
ξ
) (2.32)
S(p) = ke1
(
1
p+
e−jφ
2j√
1− ξ21
p+ ξωn − jωn
√
1− ξ2− ejφ
2j√
1− ξ21
p+ ξωn + jωn
√
1− ξ2
)
(2.33)
On pose ωp = ωn
√
1− ξ2 et la transformee de Laplace inverse de (2.33) s’ecrit :
s(t) = ke1
(
1− e−ξωnt
√
1− ξ2
(ej(ωpt−φ) − e−j(ωpt−φ)
)
2j
)
U(t) (2.34)
s(t) = ke1U(t)︸ ︷︷ ︸
permanent
− ke1e−ξωnt
√
1− ξ2sin(ωpt− φ)U(t)
︸ ︷︷ ︸
transitoire
(2.35)
La reponse montre que la partie reelle du pole est responsable de l’extinction du transitoire
alors que la partie imaginaire l’est du regime oscillant de pulsation ωp. On dit que le systeme
comporte un mode pseudo-periodique ou oscillatoire amorti.
La figure 2.9 montre les reponses de systemes du second ordre pour differentes valeurs du
facteur d’amortissement ξ. Ces reponses sont d’autant plus mal amorties que ξ est petit.
0 5 10 150
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
Temps (sec)
Am
plitu
de
ξ=00,1
0,3
0,7
1
2,5
5
Figure 2.9 – Reponses indicielles d’un systeme du second ordre fonction de ξ
35
Chapitre 2. SYSTEMES SIMPLES
2.3.2.2 Analyse des performances
Les resultats suivants ont ete etablis pour une entree en echelon. Ils permettent a partir :
— d’un modele d’un systeme d’ordre deux, de predire l’allure de la reponse indicielle,
— d’un releve de la reponse indicielle d’identifier, les parametres du modele d’un systeme.
Lorsque 0 ≤ ξ < 1, l’analyse deds(t)
dtmontre que l’amplitude du premier depassement a
pour expression :
D1 = ke1e− ξπ√
1−ξ2 (2.36)
Ce maximum est atteint a a l’instant
tpic =π
ωn
√
1− ξ2(2.37)
La courbe 2.10 montre l’evolution du depassement, exprime en % en fonction du facteur
d’amortissement ξ.
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10
10
20
30
40
50
60
70
80
90Second ordre − Abaque de dépassement
ξ
D%
Figure 2.10 – Depassement relatif d’un systeme du second ordre en fonction de ξ
De meme, la reponse indicielle presente une oscillation dont la pulsation ωp est appelee
pseudo-pulsation et la periode est qualifiee de pseudo-periode Tp =2π
ωp.
Enfin, le temps de reponse a 5% est donne par la formule (2.38), quel que soit ξ > 0.
1√
1− ξ2e−ξωntr5% sin(ωptr5% + φ) = ±0.05 (2.38)
Pratiquement, on utilise l’abaque 2.11.
36
2.3. SYSTEMES DU SECOND ORDRE
Figure 2.11 – Temps de reponse a 5% d’un systeme du second ordre en fonction de ξ
2.3.2.3 Reponse harmonique
La fonction de transfert harmonique (2.23) a
— pour module : |H(jω)| = |k|ω2n
√
(ω2n − ω2)2 + (2ξωn)2
— pour argument :
< H(jω) >=< k > − tan−1
(2ξωωn
ω2n − ω2
)
pour ω < ωn
< H(jω) >=< k > − tan−1
(2ξωωn
ω2n − ω2
)
− π pour ω > ωn5
On utilise la aussi les resultats resumes dans les tableaux 1.2 et 1.3 pour etudier le comportement
du systeme lorsque ω tend vers zero, vers plus l’infini et en ωn. L’etude de |H(jω)| montre que
ω 0 ωn +∞|H(jω)| |k| |k|
2ξ|k|ω2
nω2
|H(jω)|dB 20 log |k| 20 log |k| − 20 log ξ − 6dB ≈ −40 logω
< H(jω) > < k > < k > −π2
< k > −π
Tableau 2.2 – Analyse de la fonction de transfert harmonique d’un second ordre
cette fonction presente un maximum pour ω 6= 0 si et seulement si ξ <√22 . Ce maximum est
atteint pour la pulsation ωr dite pulsation de resonance :
ωr = ωn
√
1− 2ξ2 (2.39)
il vaut :
|k| 1
2ξ√
1− ξ2(2.40)
5. Ceci afin de garantir la continuite de l’argument au voisinage de ωn.
37
Chapitre 2. SYSTEMES SIMPLES
Relativement au gain statique k, a la pulsation de resonance, le gain est amplifie d’un facteur
Q =1
2ξ√
1− ξ2appele facteur de sutension et d’autant plus grand que ξ est petit.
Le gain a la pulsation ωr exprime en dB :
20 log |k|︸ ︷︷ ︸
gain statique
+20 log1
2ξ√
1− ξ2︸ ︷︷ ︸
QdB
(2.41)
2.3.2.4 Diagrammes frequentiels
Les figures 2.12 et 2.13 illustrent les traces des diagrammes de Bode et lieux de Black de
systeme du second ordre pour differentes valeurs de ξ. Ces graphiques montrent que l’on peut
appliquer a ces systemes des signaux de commande dont le spectre est contenu dans la bande
[0, ωn] lorsque ξ ≥√22 , mais qu’il convient de reduire la bande passante de ces signaux pour
ξ <√22 . Il reste cependant qu’on ne maıtrise pas le spectre des entrees de perturbation, lesquelles
peuvent, lorsque ξ <√22 , etre a l’origine de phenomenes de resonance.
On observe qu’a la pulsation ωn la phase est egale a −π2, et ce quelque soit la valeur de ξ.
Pratiquement, on identifie ωn en reglant la pulsation du signal d’entree de sorte que la sortie
presente un retard de phase deπ
2sur l’entree.
On observe egalement que QdB augmente tandis que ξ diminue. Il en va de meme de la variation
de phase.
−80
−70
−60
−50
−40
−30
−20
−10
0
10
20
Gai
n (d
B)
10−2
10−1
100
101
102
−180
−135
−90
−45
0
Pha
se (
deg)
pulsation (rad/sec)
ξ=0,1ξ=0,3ξ=0,7ξ=1ξ=2,5ξ=5
ωr
QdB
20log|k|
−40dB/dec
ωn
Figure 2.12 – Diagrammes de Bode d’un systeme du systeme du second ordre traces en fonction de ξ
38
2.4. STABILITE DES SYSTEMES LINEAIRES INVARIANTS CONTINUS
−180 −135 −90 −45 0−100
−80
−60
−40
−20
0
20
Phase (deg)
Gai
n (d
B)
ξ=0,1ξ=0,3ξ=0,7ξ=1ξ=2,5ξ=5sys6sys6
20log|k|
QdB
ωrω
n
Figure 2.13 – Lieux de Black d’un systeme du systeme du second ordre traces en fonction de ξ
2.4 STABILITE DES SYSTEMES LINEAIRES INVARIANTS
CONTINUS
On se propose dans ce paragraphe d’etablir les conditions sous lesquelles un systemes LIC
est asymptotiquement stable. Dans le cas general, on a vu (1.16) qu’un tel systeme pouvait etre
decrit par une fonction de transfert de la forme :
H(p) =S(p)
E(p)=bmp
m + bm−1pm−1 + · · ·+ b1p+ b0
anpn + an−1pn−1 + · · ·+ a1p+ a0(2.42)
qu’on met sous la forme :
H(p) =S(p)
E(p)=
1
an
bmpm + bm−1p
m−1 + · · ·+ b1p+ b0pn + an−1
anpn−1 + · · ·+ a1
anp+ a0
an
(2.43)
Ses poles sont reels pri et/ou poles complexes conjugues ℜpj ± ℑpj . Sans perte de generalites
et pour alleger les ecritures, on ne considere que des poles distincts. On peut donc ecrire le
denominateur comme un produit de facteurs :
H(p) =S(p)
E(p)=
bmpm + bm−1p
m−1 + · · ·+ b1p+ b0(p− pr1) · · ·+ (p−ℜpc1 + jℑpc1)(p−ℜpc1 − jℑpc1) . . .
(2.44)
pour n > m, apres decomposition en elements simples :
H(p) =S(p)
E(p)=
A1
p− pr1· · ·+ B1
p−ℜpc1 − jℑpc1− B1
p−ℜpc1 + jℑpc1. . . (2.45)
Pour une entree impulsionnelle de poids unitaire, la fonction de transfert H(p) est egale a la
reponse impulsionnelle S(p), de sorte que la transforme de Laplace inverse de (2.45) s’ecrive :
s(t) = A1epr1 t + · · ·+B1e
ℜpc1 t(
eℑpc1 t − e−ℑpc1 t)
+ . . . (2.46)
39
Chapitre 2. SYSTEMES SIMPLES
Conformement a la definition de la stabilite asymptotique qui precise qu’ecarte de son
etat d’equilibre la reponse tend a y revenir, un systeme LIC est asymptotiquement stable si et
seulement si tous les poles de H(p) ont leur partie reelle strictement negative.
Si un ou plusieurs poles reels ou complexes conjugues sont nuls ou ont leur partie reelle nulle, le
systeme est juste stable et la reponse impulsionnelle est bornee.
Si un ou plusieurs poles reels ou complexes conjugues sont positifs ou ont leur partie reelle
positive, le systeme est instable et la reponse diverge.
2.5 SYSTEMES D’ORDRE SUPERIEURS A DEUX
Dans cette partie, on va montrer que le comportement d’un systeme d’ordre superieur a deux
peut, sous certaines reserves, s’etudier comme la superposition de sous-systemes d’ordre un et
deux.
Le systeme decrit par l’equation (2.42) peut en lieu et place d’etre ecrit comme (2.44) etre
mis sous la forme :
H(p) =S(p)
E(p)=
b′mpm + b′m−1p
m−1 + · · ·+ b′1p+ b′0(p− pr1) . . . (p− prℓ)(p2 + 2ξ1ωn1 + ω2
n1) . . . (p2 + 2ξmωnm + ω2
nm)
(2.47)
ou b′j =bjan
et qui admet la decomposition en elements simples suivante :
H(p) =S(p)
E(p)=∑
i
kip− pri
︸ ︷︷ ︸
poles reels
+∑
j
kjω2nj
p2 + 2ξjωnj + ω2nj
︸ ︷︷ ︸
poles complexes conjugues
(2.48)
Le systeme complet apparaıt donc comme la somme de plusieurs sous-systemes simples et la
reponse d’un tel systeme est la somme des reponses de chacun des sous-systemes soumis a la
meme entree 6 :
6. La decomposition en elements simples du sous-systeme du second ordre
G(p) =kω2
n
p2 + 2ξωn + ω2n
=kω2
n
2j√
1− ξ2
(
1
p+ ξωn − jωn
√
1− ξ2− 1
p+ ξωn + jωn
√
1− ξ2
)
(2.49)
qui admet pour reponse impulsionelle :
g(t) =kωn
√
1− ξ2
(
e(−ξωn+jωn
√1−ξ2)t − e(−ξωn−jωn
√1−ξ2)t
2j
)
U(t) = kωne−ξωnt
√
1− ξ2sin(ωn
√
1− ξ2t)U(t) (2.50)
40
2.5. SYSTEMES D’ORDRE SUPERIEURS A DEUX
++
++
S(p)E(p)
k1τ1p+ 1
kiτip+ 1
kjω2j
p2 + 2ξjωjp+ ω2j
Figure 2.14 – Decomposition d’un systeme d’ordre superieur a deux en sous-systemes d’ordre un et deux
En particulier, la reponse impulsionnelle a pour expression :
s(t) =
∑
i
kie−prit +
∑
j
kjωnj√
1− ξ2j
e−ξjωnj t sinωnj
√
1− ξ2j t
U(t) (2.51)
L’extinction des modes du premier ordre est fonction de pri = − 1
τiet la duree de ces transi-
toires est environ egale a 3τi7. Ces transitoires du premier ordre sont d’autant plus courts que
τi ou pri sont petits. L’extinction des modes du second ordre est fonction de −ξjωnj , la partie
reelle des poles complexes conjugues. La duree de ces transitoires est d’autant plus courte que
−ξjωnj est petit.
Comme la reponse du systeme est la somme des reponses de chacun des sous-systemes, le transi-
toire qui dure le plus longtemps est celui qui est associe au(x) pole(s) dont la partie reelle est la
plus grande, autrement dit, le(s) pole(s) le(s) plus proche(s) de l’axe imaginaire. Si le pole le plus
proche de l’axe imaginaire est reel, le systeme presente un mode dominant du premier ordre. Si
les poles les plus proches sont complexes conjugues, le systeme presente un mode dominant du
second ordre.
La carte des poles d’un systeme d’ordre trois est representee sur la figure 2.15 ou il apparaıt
que les poles les plus proches de l’axe imaginaire sont les poles complexes conjugues, ces poles
sont qualifies de dominants et la reponse impulsionnelle de ce systeme, illustree par la figure 2.16
montre que la reponse ressemble a celle d’un systeme d’ordre deux. Les figures intermediaires
montrent les reponses impulsionnelles des sous-systemes d’ordre un et deux qui composent ce
systeme, il apparaıt que le transitoire du systeme du premier ordre est beaucoup plus court que
celui du systeme du second ordre. Ceci est vrai a la condition que les poles soient suffisament
decouples.
7. En realite, cette duree est infinie.
41
Chapitre 2. SYSTEMES SIMPLES
✲
✻
ℜ
ℑ
p1
p2
ψ
jωn
√
1− ξ2
−jωn
√
1− ξ2
−ξωnp3 = − 1
τ3
Figure 2.15 – Images des poles dans le plan complexe pour 1 > ξ ≥ 0
0 5 10 15−1
−0.5
0
0.5
1
Impulse Response
Time (sec)
Am
plitu
de
0 5 10 15−1
−0.5
0
0.5
1
Impulse Response
Time (sec)
Am
plitu
de
0 0.1 0.2 0.3 0.4 0.5 0.60
0.5
1
Impulse Response
Time (sec)
Am
plitu
de mode du premier ordre
mode du second ordre
reponse du systeme complet
Figure 2.16 – Reponse impulsionnelle d’un systeme d’ordre trois presentant un mode dominant d’ordre
deux
2.6 AUTRES SYSTEMES SIMPLES REMARQUABLES
Les proprietes des systemes d’ordre un et deux remarquables, a l’instar de l’integrateur, du
double integrateur, de l’approximation au premier ordre d’un retard pur et du systeme du second
ordre avec zero sont decrits dans l’annexe C.
42
2.7. Exemple
2.7 Exemple
Dans cet exemple, on etudie le comportement d’un avion volant en palier autour de son axe
de tangage. Cet avion est controle par la gouverne de profondeur, laquelle est pilotee par un
systeme compose d’un distributeur et d’un verin.
On note d la demande de position de la gouverne et δ la position effective de la gouverne,
ces variables sont regies par la relation :
τδ(t)
dt= −δ(t) + d(t) (2.52)
dont la fonction de transfert a pour expression :
δ(p)
d(p)=
1
τp+ 1(2.53)
Cette fonction de transfert du premier ordre montre qu’en reponse a un echelon de demande,
la gouverne reproduit fidelement la position demandee (le gain statique vaut un) avec un temps
de reponse de l’ordre de 3τ .
On note α l’angle d’incidence et q la vitesse de tangage. JT , kα, kq, kδ designent respective-
ment le moment principal d’inertie en tangage et les coefficients de moment de tangage de sorte
que le theoreme du moment cinetique s’ecrive :
JTdq(t)
dt= −kαα(t)− kqq(t) + kδδ(t) (2.54)
on suppose d’autre part (ce qui n’est pas tout a fait exact ) :
q(t) =dα(t)
dt(2.55)
En couplant (2.54) et (2.55), le modele de l’avion est decrit par une equation differentielle
du second ordre :
JTd2α(t)
dt2= −kαα(t)− kq
dα(t)
dt+ kδδ(t) (2.56)
dont la transformee de Laplace, pour des conditions initiales nulles est :
JT p2α(p) = −kαα(p)− kqpα(p) + kδδ(p) (2.57)
la fonction de transfert :
α(p)
δ(p)=
kdJT p2 + kqp+ kα
(2.58)
que l’on met sous la forme standard d’un systeme du second ordre (2.19) ou :
43
Chapitre 2. SYSTEMES SIMPLES
— k =kdkα
— ωn =
√kαJT
— ξ =kq√JT
2√kα
La fonction de transfert complete de ce systeme d’ordre trois :
α(p)
d(p)=
kω2n
(τp+ 1)(p2 + 2ξωnp+ ω2n)
(2.59)
Pour cette etude, on suppose τ = 0.1s, k = 2, ωn = 0, 5rad/s et ξ = 0, 5. Ainsi les poles de ce
systeme ont pour expression :
p1,2 = −0, 25± j0, 433
p3 = −10
Il s’agit d’un systeme presentant un mode dominant d’ordre deux comme le montre la carte des
poles sur la figure 2.17.
−11 −10 −9 −8 −7 −6 −5 −4 −3 −2 −1 0−0.5
−0.4
−0.3
−0.2
−0.1
0
0.1
0.2
0.3
0.4
0.50.5
0.5
0.5
Axe réel
Axe
imag
inai
re
Figure 2.17 – Carte des poles et mise en evidence des poles dominants
Ainsi, la reponse indicielle a un echelon d’amplitude d0 de ce systeme devrait avoir des carac-
teristiques voisines de celles du systeme du second ordre qui decrit le comportement de l’angle
d’incidence en reponse au braquage de la profondeur. Ce systeme ayant un facteur d’amortisse-
ment egal a 0, 5 et une pulsation propre non amortie egale a 0, 5rad/s. Les abaques des figures
2.11 et 2.10 permettent de predire :
— l’amplitude relative du premier depassement : D1% = 16%
— le temps de reponse a 5% tel que ωntr5% ≈ 5, 5 et par suite tr5% ≈ 11s
Ces predictions sont confirmees par la simulation realisee sur le systeme d’ordre trois et
illustree sur la figure 2.18.
44
2.7. Exemple
Temps (sec)
α(t)
0 5 10 15 20 250
0.5
1
1.5
2
2.5
System: sysFinal Value: 2
System: sysSettling Time (sec): 10.7
System: sysPeak amplitude: 2.33Overshoot (%): 16.3At time (sec): 7.34
Figure 2.18 – Reponse indicielle du systeme etudie
On peut toutefois mener le calcul exact de la reponse :
α(p) =kω2
nτ
(p+ 1τ )(p
2 + 2ξωnp+ ω2n)
d0p
(2.60)
qui admet la decomposition en elements simples :
α(p) = k
(
A
p+ 1τ
+Bp+ C
p2 + 2ξωnp+ ω2n
+D
p
)
(2.61)
Apres calculs, on obtient : A = −0, 0026, B = −0, 9974, C = −0, 5212 et D = 1.
La transformee de Laplace inverse de (2.61)
α(t) = k
(
Ae−tτ +Be−ξωnt cosωpt+
C − ξωnB
ωpe−ξωnt sin(ωpt) +D
)
U(t) (2.62)
La reponse de l’angle d’incidence a un echelon unitaire de demande est representee sur la
figure 2.18, les releves du temps de reponse et du depassement montrent que l’approximation de
ce systeme par le sous systeme d’ordre deux dominant et possedant un gain statique equivalent
produit des resultats tout a fait satisfaisants tout en s’affranchissant de calculs laborieux.
La fonction de transfert harmonique est obtenue pratiquement en posant p = jω dans (2.59)
H(jω) =α(jω)
d(jω)=
kω2n
(jωτ + 1)(ω2n − ω2 + 2jξωnω)
(2.63)
Le module
|H(jω)| = kω2n
√
(ω2n − ω2)2 + (2ξωnω)2
1√
(ωτ)2 + 1(2.64)
45
Chapitre 2. SYSTEMES SIMPLES
Le calcul du gain :
|H(jω)|dB = 20log
(
kω2n
√
(ω2n − ω2)2 + (2ξωnω)2
)(
1√
(ωτ)2 + 1
)
(2.65)
Le diagramme du gain est la somme des diagrammes de gain du sous-systeme du premier ordre
et du sous-systeme du second ordre. Pour le trace, on reprend les traces des figures 2.4 et 2.12.
Le calcul de l’argument :
< H(jω) >=
⟨kω2
n
(ω2n − ω2 + 2jξωnω)
⟩
+
⟨1
(jωτ + 1)
⟩
(2.66)
Le diagramme de la phase est la somme des diagrammes de phase du sous-systeme du premier
ordre et du sous-systeme du second ordre.
−100
−80
−60
−40
−20
0
Gai
n (d
B)
10−2
10−1
100
101
102
103
−180
−135
−90
−45
0
Pha
se (
deg)
Pulsation (rad/sec)
sous−système d’ordre 2sous−système d’ordre 1
1/τ
ωn
Figure 2.19 – Diagrammes de Bode des sous-systemes d’ordre un et deux
46
2.7. Exemple
10−2
10−1
100
101
102
103
−270
−225
−180
−135
−90
−45
0
Pha
se (
deg)
Pulsation (rad/sec)
−200
−150
−100
−50
0
Gai
n (d
B)
ωn
1/τ
−40dB/dec
−60dB/dec
20log2
Figure 2.20 – Diagrammes de Bode du systeme complet d’ordre trois
Le diagramme de Bode du systeme complet represente sur la figure 2.20 montre que le sous-
systeme du premier ordre compose du tiroir et du verin n’affecte pas le comportement de l’avion
tant que le spectre du signal de demande d est dans l’intervalle [0, ωn]. S’il s’averait que la
constante de temps de ce sous systeme etait plus grande, autrement dit, si l’on utilisait une
servocommande plus lente, on ne pourrait plus decoupler les dynamiques de la servocommande
et de l’avion ce qui pourrait degrader le comportement de l’ensemble.
47
Chapitre 2. SYSTEMES SIMPLES
48
CHAPITRE 3
SYSTEMES ASSERVIS
3.1 BOUCLE OUVERTE VS. BOUCLE FERMEE
Soit un systeme dont on cherche a controler la sortie s(t) en agissant sur l’entree de commande
u(t). Il est possible, connaissant le modele ou le comportement du systeme de predeterminer une
loi de commande permettant d’amener la reponse dans l’etat desire sdes(t). L’elaboration d’une
telle commande ne requiert pas d’utiliser la sortie mesuree et le systeme est dit en boucle ouverte.
Plus formellement, pour un systeme LIC decrit par sa fonction de transfert H(p), l’expression
de cette commande s’obtient de la maniere suivante :
S(p) = H(p)U(p) (3.1)
et par consequent :
U(p) = H(p)−1Sdes(p) (3.2)
Pour que le signal u(t) puisse exister, il faut que le numerateur de U(p) soit de degre inferieur ou
egal a son denominateur. Une fois cette loi de commande realisee, elle est appliquee au systeme
et la sortie doit theoriquement tendre vers la valeur desiree.
En pratique, le modele du systeme procede d’une identification qui comporte des approxima-
tions, de meme le systeme est soumis a des entrees de perturbation qui ne sont pas toujours
correctement identifiees, de sorte que la commande calculee ne permet pas a la sortie d’atteindre
la valeur desiree. En supposant la fonction de transfert exacte du systeme egale a H(p)+ δH(p)
et Hγ(p) la fonction de transfert qui rend compte de l’effet de la perturbation γ sur la reponse
du systeme, il vient :
S(p) = (H(p) + δH(p))U(p) +Hγ(p)γ(p) (3.3)
S(p) =
(
1 +δH(p)
H(p)
)
Sdes(p) +Hγ(p)γ(p) (3.4)
49
Chapitre 3. SYSTEMES ASSERVIS
de sorte que s(t) ne peut pas etre egale a sdes(p), en particulier en regime permanent. Ainsi, la
commande en boucle ouverte est peu performante est n’est generalement pas utilisee. Toutefois,
certains systemes sont controles en boucle ouverte a l’instar des moteurs pas a pas utilises dans
les imprimantes ; on peut egalement citer le tir de bombes sur coordonnees.
Pour amener la sortie a sa valeur desiree, il semble plus judicieux d’exploiter la mesure de
la sortie pour elaborer la commande. Pratiquement, on elabore le signal d’erreur ε(t) qui est la
difference entre la consigne (image de la sortie desiree) et la mesure (image de la sortie reelle). Le
signal d’erreur est traite (au sens du traitement du signal) par un correcteur en vue de produire
le signal de commande u(t) applique au systeme. Un tel systeme est qualifie d’asservi, il a la
propriete de se corriger lui-meme. La figure 3.1 represente un tel systeme.
La tenue de vitesse air d’un planeur procede d’une telle approche, apres avoir regle sa vitesse
d’equilibre au moyen du trim, le pilote qui souhaite tenir cette vitesse (ici vitesse d’equilibre et
consigne sont confondues) observe l’anemometre, compare la vitesse desiree a celle mesuree et
agit sur le manche en consequence. Il tend a tirer le manche si l’erreur est negative, a le pousser
si elle est positive. Dans ce systeme, on dit que le pilote est dans la boucle puisqu’il elabore le
signal d’ereur et delivre la commande.
La tenue de vitesse d’un avion d’arme peut etre realisee par une automanette. Le pilote affiche une
vitesse de consigne, c’est le calculteur qui elabore l’erreur de vitesse et qui definit les commandes
a appliquer aux gaz. Dans ce cas le pilote est a l’exterieur de la boucle.
3.2 SYSTEMES ASSERVIS
3.2.1 Structure d’un systeme asservi
Un systeme asservi est represente sur la figure 3.1, il est generalement constitue des elements
suivants :
— le transducteur : il elabore un signal image de la consigne, il est parfois associe a un pre-
filtre qui traite le signal de consigne pour que celui-ci ne soit pas directement applique a
la boucle, cela peut par exemple permettre d’adoucir des consignes ayant des variations
trop brutales.
— le comparateur : il elabore le signal d’ecart entre l’image de la consigne et l’image de la
mesure
— la chaıne directe, elle est constituee par :
— le systeme a commander : generalement mal identifie et soumis a des perturbations,
— un organe de puissance : amplificateur, distributeur, etc. qui realise l’adaptation de
puissance entre le correcteur et le systeme a commander. Cet element est generalement
mal identifie et a un gain eleve,
— le correcteur : il traite le signal d’erreur en vue de generer un signal de commande
qui confere au systeme a commander de bonnes performances en termes de stabilite,
de rapidite, d’amortissement et de precision 1. Sur les systemes modernes, c’est un
algorithme implemente sur un calculateur.
1. Cette notion sera precisee ulterieurement
50
3.2. SYSTEMES ASSERVIS
— la chaıne de retour : elle est constituee par le capteur et la chaıne de traitement du signal
de mesure (amplificateur, filtre). C’est un organe fidele et precis qui delivre un signal
image de la reponse mesuree.
+
−
correcteurreponse+
+
capteur
amplificateur
commandeerreurconsigne
perturbation
systeme
retour
prefiltre
Figure 3.1 – Structure d’un systeme asservi
3.2.1.1 Exemples de systemes asservis
Un avion comporte des systemes asservis imbriques sur plusieurs niveaux.
— Les modes superieurs du pilote automatique (PA) qui permettent de controler la trajec-
toire de l’avion. Par exemple une tenue de cap. Dans ce cas, la variable a asservir est le
cap de l’avion, l’entree de commande est l’angle de gıte et la sortie le cap mesure par la
centrale inertielle. Le vent est une entree de perturbation pour ce systeme. La consigne
de cap est affichee par le pilote.
— Le mode de base du PA qui permet de controler l’angle de gıte. La consigne d’angle
de gıte est calculee par le mode superieur du PA. Le systeme a pour entree de com-
mande le braquage des ailerons et pour sortie l’angle de gıte mesure par le gyroscope
de verticale. L’organe de puissance est realise par le systeme {distributeur a commande
electrique+verin} qui actionne les commandes de vol. Un prefiltre peut interdire a l’avion
des inclinaisons de consigne excessives pour le maintenir dans un domaine de vol donne.
— les positions des ailerons sont asservies a des consignes de position calculees par le mode
de base du PA. L’entree est le courant de commande du distributeur, la position des
ailerons est mesuree par des potentiometres de recopie de gouverne, l’organe de puissance
est realise par un amplificateur qui delivre le courant necessaire au bon fonctionnement
du tiroir electrique. Les entrees de perturbation sont les efforts aerodynamiques exerces
sur les gouvernes.
3.2.2 Fonctions de transfert en boucle ouverte et en boucle fermee
Le schema fonctionnel du systeme asservi de la figure 3.1 est represente sur la figure 3.2. La
perturbation peut entrer en n’importe quel point de la boucle et le choix retenu ici est arbitraire.
51
Chapitre 3. SYSTEMES ASSERVIS
+
−
C(p)+
+
M(p)
H1(p)
U(p)ε(p)
Γ(p)
H2(p)F (p)
E(p) S(p)
R(p)
Figure 3.2 – Schema fonctionnel d’un systeme asservi
On definit la fonction de transfert en boucle ouverte (FTBO) comme etant le rapport deR(p)
ε(p), la boucle etant ouverte au niveau de R(p) et la perturbation Γ(p) portee egale a zero
comme cela est indique sur la figure 3.3.
+
−
C(p)+
+
M(p)
H1(p)
U(p)ε(p)
H2(p)F (p)
E(p) S(p)
R(p)
0
Figure 3.3 – Boucle ouverte
FTBO(p) =R(p)
ε(p)= C(p)H1(p)H2(p)M(p) = C(p)H(p)M(p) (3.5)
en posant H(p) = H1(p)H2(p). On observe que F (p) n’appartient pas a la boucle et n’apparaıt
donc pas dans (3.5). Dans la suite, on pose F (p) = 1.
La FTBO joue un role essentiel dans l’analyse des systemes asservis. En particulier, l’analyse
de la stabilite, de l’amortissement, de la rapidite et de la precision du systeme boucle seront
conduites a partir de l’etude de la FTBO.
La boucle etant desormais fermee, la fonction de transfert en boucle fermee (FTBF) definit
la relation entre E(p) et S(p), les perturbations etant nulles :
FTBF (p) =S(p)
E(p)Γ(p)=0
=C(p)H1(p)H2(p)
1 + C(p)H1(p)H2(p)M(p)=
C(p)H(p)
1 + FTBO(p)(3.6)
On peut egalement calculer la relation entre S(p) et Γ(p) :
S(p)
Γ(p)E(p)=0
=H2(p)
1 + C(p)H1(p)H2(p)M(p)=
H2(p)
1 + FTBO(p)(3.7)
52
3.3. STABILITE DES SYSTEMES ASSERVIS
3.2.3 Performances attendues d’un systeme asservi
Le but d’un asservissement est double, d’une part, la sortie doit suivre les variations de la
consigne, d’autre part, la sortie ne doit pas etre sensible aux perturbations.
Lorsque le gain de la chaıne directe est grand, soit C(p)H1(p)H2(p) >> 1, (3.6) montre que
FTBF (p) → 1
M(p). Pratiquement, cela signifie que c’est le capteur et la chaıne de traitement
qui definissent le gain de la boucle. Par consequent, meme si la chaıne directe est mal identifiee,
cela affectera peu le comportement du systeme boucle. Il y a donc interet, pour maıtriser le
transfert entre la consigne et la sortie, a utiliser des capteurs performants. Par exemple, la
qualite de la tenue d’altitude pour un avion depend moins du type d’avion considere, tous sont
capables de le faire, que de la precision de l’altimetre utilise.
Concernant le rejet des perturbations, la fonction de transfert (3.7) doit tendre vers zero. Pour
y parvenir, il faut C(p)H1(p)M(p) >> 1. Pratiquement, on inserera un gain eleve en amont de
la perturbation, soit C(p)H1(p) >> 1 pour garantir son rejet. En planeur, pour tenir une route
au sol en presence d’un vent lateral constant, le pilote braque la gouverne de direction pour
corriger la derive de trajectoire. Il se doit de poursuivre cette correction tant qu’il ne suit pas
la route desiree. Lorsque l’erreur de trajectoire s’annule, il maintient la gouverne de direction
en position. La relation qui existe entre l’erreur de route et l’action au pied du pilote est de
type integral 2, elle possede par consequent un gain statique infini qui permet le rejet complet
de la perturbation. Autrement dit, le pilote est capable, en presence d’une perturbation (le vent
lateral) de suivre une consigne (la route de reference).
3.3 STABILITE DES SYSTEMES ASSERVIS
Un systeme LIC, asservi ou non, peut etre decrit par une fonction de transfert. Un tel systeme
est asymptotiquement stable si tous ses poles sont a partie reelle negative. Le critere de Nyquist
est un critere graphique qui permet de conclure quant a la stabilite d’un systeme en boucle
fermee, lequel peut etre stable ou instable en boucle ouverte, et ce, sans avoir a calculer les poles
de la FTBF.
3.3.1 Critere de Nyquist
Considerons le systeme ayant pour fonction de transfert en boucle ouverte FTBO(p) et
faisons decrire a la variable complexe p le contour (C), denomme contour de Bromwich represente
sur la figure 3.4.
2. La sortie d’un integrateur varie tant que le signal applique a son entree est different de zero.
53
Chapitre 3. SYSTEMES ASSERVIS
ℜ
ℑ
0
Figure 3.4 – Contour de Bromwich
Ce systeme est stable en boucle fermee si et seulement si le contour parcouru par FTBO(p),
effectue, dans le sens trigonometrique, autour du point critique {−1, 0} un nombre de tours egal
au nombre de poles a partie reelle positive de FTBO(p) (comptes avec leur ordre de multiplicite).
La demonstration de ce resultat est presentee dans l’annexe D.2.
3.3.2 Critere du revers
3.3.2.1 Dans le plan de Nyquist
Dans le cas de systemes stables en boucle ouverte (aucun pole a partie reelle positive) et du
fait de la symetrie du lieu de Nyquist par rapport a l’axe reel, le critere du revers qui est un cas
particulier du critere de Nyquist permet de conclure quant a la stabilite de la boucle fermee a
partir du trace du lieu de Nyquist de la FTBO.
Un systeme stable en boucle ouverte est stable en boucle fermee si et seulement si le lieu de
Nyquist de sa FTBO, parcouru dans le sens des pulsations croissantes, laisse a gauche le point
critique {−1, 0}.Ce resultat est illustre sur la figure 3.5
3.3.2.2 Dans le plan de Black
Un systeme stable en boucle ouverte est stable en boucle fermee si et seulement si le lieu de
Black de sa FTBO, parcouru dans le sens des pulsations croissantes, laisse sur sa droite le point
critique {−180 , 0dB}.Ce resultat est illustre sur la figure 3.6
3.3.2.3 Sur un diagramme de Bode
Un systeme stable en boucle ouverte est stable en boucle fermee si et seulement pour la
pulsation ωπ telle que < FTBO(jωπ) >= −180 , le gain correspondant a cette pulsation est
negatif.
Ce resultat est illustre sur la figure 3.7
54
3.3. STABILITE DES SYSTEMES ASSERVIS
Figure 3.5 – systeme stable Vs. instable dans le plan de Nyquist
−270 −225 −180 −135 −90−60
−50
−40
−30
−20
−10
0
10
20
Phase en boucle ouverte (deg)
Gai
n en
bou
cle
ouve
rte
(dB
)
système stable en boucle ferméesystème instable en boucle fermée
point critique
ω croissants
Figure 3.6 – systeme stable Vs. instable dans le plan de Black
55
Chapitre 3. SYSTEMES ASSERVIS
−120
−100
−80
−60
−40
−20
0
20
40G
ain
(dB
)
10−2
10−1
100
101
102
−270
−225
−180
−135
−90
Pha
se (
deg)
Diagramme de Bode
Pulsation (rad/sec)
système stable en boucle ferméesystème instable en boucle fermée
ωπ
G(ωπ)>0
G(ωπ)<0
Figure 3.7 – systeme stable Vs. instable sur un diagramme de Bode
3.3.3 Marges de stabilite
Les erreurs de modelisation de la FTBO peuvent conduire a sous-estimer son gain ou a
negliger des retards. Ces erreurs peuvent conduire a supposer qu’un systeme boucle est stable
alors qu’il ne l’est pas.
Les regles qui suivent s’appliquent a des systemes a dephasage minimal i.e. dont tous les
poles et tous les zeros sont a partie reelle negative.
Marge de phase : La marge de phase MΦ est la reserve de dephasage qui conduirait le
systeme a devenir instable. Sa connaissance permet calculer le retard maximal admissible dans
une boucle d’asservissement de sorte que celle-ci reste stable. En effet, on deduit de la figure 3.8
que le retard maximal admissible vaut MΦω0dB
. Pratiquement, une marge de phase satisfaisante est
comprise entre 45 et 60 .
Marge de gain : La marge de gain MG est le gain (en dB) qui ajoute a celui de la FTBO
conduirait le systeme a devenir instable, ce qu’illustre egalement la figure 3.8. Pratiquement,
une bonne marge de gain doit etre superieure a 10dB.
56
3.3. STABILITE DES SYSTEMES ASSERVIS
−270 −225 −180 −135 −90−60
−50
−40
−30
−20
−10
0
10
20
Phase en boucle ouverte (deg)
Gai
n en
bou
cle
ouve
rte
(dB
)
MG
Mφ
ωπ
ω0dB
Figure 3.8 – Marges de stabilite dans le plan de Black
−80
−60
−40
−20
0
20
Gai
n (d
B)
10−2
10−1
100
101
102
−270
−225
−180
−135
−90
Pha
se (
deg)
Diagramme de Bode
Pulsation (rad/sec)
MG
ω0dB ω
π
MΦ
Figure 3.9 – Marges de stabilite sur un diagramme de Bode
57
Chapitre 3. SYSTEMES ASSERVIS
3.4 ANALYSE DE LA DYNAMIQUE DES SYSTEMES AS-
SERVIS
3.4.1 Abaque de Black-Nichols
Cette construction graphique permet de caracteriser les performances dynamiques et sta-
tiques de la FTBF a partir du trace du lieu de black de la FTBO.
On considere un systeme boucle a retour unitaire, sachant, comme cela est montre a l’annexe
E, qu’il est toujours possible de se ramener a ce cas. On peut ecrire :
FTBF (jω) =FTBO(jω)
1 + FTBO(jω)(3.8)
soit
FTBO(jω) =FTBF (jω)
1− FTBF (jω)(3.9)
Ainsi, pour chaque valeur de ω, la connaissance de FTBO(jω) en module et argument permet
de determiner FTBF (jω) en module et argument. En utilisant ce resultat, Nichols a construit
un abaque dans le plan de Black, constituee de deux reseaux orthogonaux de courbes qui sont
les lieux des points pour lesquels |FTBF (jω)|dB et < FTBF (jω) > sont constants.
L’abaque de Nichols permet donc de lire simultanement, en un point donne d’un lieu de
transfert, |FTBO(jω)|dB , < FTBO(jω) >, |FTBF (jω)|dB et < FTBF (jω) >.
Le lieu de Black represente sur la figure 3.10 est caracteristique d’un systeme du troisieme
ordre (voir tableau 1.3) qui possede un pole nul (voir tableau 1.2), on lit le gain et l’argument
de la FTBO en coordonnees cartesiennes, soit a la pusation ω = 0, 7rad/s, (−144 ,−1.68dB),
ce systeme boucle sur un retour unitaire presente a cette meme pulsation un gain de +3dB et
un argument de −90 .
On lit pour ω → 0 que l’argument et le gain en boucle ouverte tendend vers (−90 ,+∞), tan-
dis qu’en boucle fermee, le systeme presente un gain statique qui tend vers 0dB et un argument
qui tend vers 0 .
Grace a cet abaque, on peut aussi mettre en evidence les resonances du systeme en boucle
fermee. En effet, il y a resonance en boucle fermee lorsque FTBF (jω) presente un maximum
local, c’est a dire lorsque le lieu de Black de la FTBO tangente une courbe de gain constante,
dans cet exemple, c’est l’isogain +3dB qui est tangentee. Comme ce gain est superieur au gain
statique, il y a au voisinage de ω = 0, 7rad/s une resonance. Ce phenomene est caracteristique
des systemes d’ordre deux, dans le cas present, en boucle fermee, le facteur de surtension vaut
3dB−0dB = 3dB et ne depend que du facteur d’amortissement (2.41) qui vaut environ 0, 38. On
peut donc considerer que ce systeme d’ordre trois est la superposition d’un systeme du premier
ordre et d’un systeme du second ordre. Pour ce dernier, le dephasage a la pulsation propre vaut
−90 . On lit cette pulsation a l’intersection du lieu de Black de la FTBO et de l’isophase −90 .
Dans cet exemple ωn vaut environ 0, 7rad/s. On note que la pulsation propre est sensiblement
egale a la pulsation de resonance, ce qui est logique compte tenu de la faible valeur du facteur
d’amortissement ξ.
58
3.4. ANALYSE DE LA DYNAMIQUE DES SYSTEMES ASSERVIS
−270 −225 −180 −135 −90 −45−80
−60
−40
−20
0
20
40
6 dB
3 dB
1 dB
0.5 dB
0.25 dB
0 dB
X: −144Y: −1.683
Phase en boucle ouverte (deg)
Gai
n en
bou
cle
ouve
rte
(dB
)
ω
isogain 3dB
isogain 0dB
Figure 3.10 – Lecture d’une FTBF a partir d’une FTBO avec l’abaque de Black-Nichols
3.4.2 Methode du lieu des racines
La methode du lieu des racines permet d’evaluer et de regler graphiquement les performances
d’un systeme en boucle fermee par la seule connaissance de sa FTBO. Cette methode developpee
chez North American Aviation par W.R. Evans au debut des annees cinquante s’est revelee un
outil remarquable pour la conception de pilotes automatiques d’avions a reaction et la synthese
de lois de commande pour missiles.
On raisonne sur un systeme boucle a retour unitaire sachant qu’il est toujours possible de se
ramener a ce cas ; k est un gain reglable et la FTBO est mise sous la forme :
H(p) =S(p)
E(p)= k
bmpm + bm−1p
m−1 + · · ·+ b1p+ b0anpn + an−1pn−1 + · · ·+ a1p+ a0
(3.10)
qu’on met sous la forme :
FTBO(p) =S(p)
E(p)= k
(bman
)pm + bm−1
bmpm−1 + · · ·+ b1
bmp+ b0
bm
pn + an−1
anpn−1 + · · ·+ a1
anp+ a0
an
(3.11)
on appelle gain d’Evans :
ke = k
(bman
)
(3.12)
dont le signe joue un role important lors de la construction du lieu des racines.
59
Chapitre 3. SYSTEMES ASSERVIS
on met (3.11) sous la forme poles-zeros :
FTBO(p) = ke(p− z1)(p− z2) . . . (p− zm)
(p− p1)(p− p2) . . . (p− pm)= ke
m∏
i=1(p− zi)
n∏
j=1(p− pj)
= keN(p)
D(p)(3.13)
La FTBF a pour expression :
FTBF (p) =keN(p)
D(p) + keN(p)(3.14)
Les poles de 3.14 sont les racines de :
D(p) + keN(p) = 0 (3.15)
Ce calcul de la FTBF met en evidence le role de ke dans le comportement dynamique
du systeme boucle puisque la nature et la valeur des poles 3 dependent de ce gain qui peut
theoriquement varier sur ]−∞,+∞[.
Definition 1 Le lieu des racines ou lieu d’Evans represente, dans le plan complexe, les images
des poles reels et/ou complexes conjugues de la FTBF tandis que l’on fait varier le gain ke sur
]−∞,+∞[.
D’apres 3.15 :
N(p)
D(p)=
n∏
i=1(p− zi)
n∏
j=1(p− pj)
= − 1
ke(3.16)
Ainsi, pour appartenir au lieu, le point M d’affixe p (3.16) doit verifier les conditions sur
l’argument et le module suivantes
m∑
i=1< p− zi > −
n∑
j=1< p− pj > = (2λ+ 1)π+ < ke >
n∏
i=1|p− zi|
n∏
j=1|p− pj |
=1
|ke|(3.17)
Ces conditions sont illustrees sur la figure 3.11.
3. dont on rappelle qu’ils conditionnent la stabilite, la rapidite et l’amortissement.
60
3.4. ANALYSE DE LA DYNAMIQUE DES SYSTEMES ASSERVIS
ℜe
ℑm
p1
p2
z1
< p− p2 >
< p− p1 >
< p− z1 >
M
|p− z1||p− p2|
|p− p1|
Figure 3.11 – Representation vectorielle des conditions sur le module et l’argument
Des regles pratiques permettent d’ebaucher la construction du lieu et sont generalement
suffisantes pour discuter du comportement du systeme en boucle fermee.
3.4.2.1 Construction pratique du lieu d’Evans
Un exemple detaille de construction d’un lieu d’Evans est presente a la fin de ce chapitre.
1. Mettre la FTBO sous la forme (3.13) et identifier le signe du gain d’Evans ke.
2. Les points de depart du lieu sont les solutions de l’equation D(p) + keN(p) = 0 obtenues
lorsque ke → 0. Autrement dit, les points de depart du lieu sont les n racines de D(p) ou
encore les poles de la FTBO.
3. Les points d’arrivee du lieu sont les solutions de D(p) + keN(p) = 0 obtenues lorsque
ke → ±∞. Ce sont donc les racines de D(p)ke
+N(p) = 0 pour ke → ±∞. Autrement dit,
les points d’arrivee du lieu sont les m zeros de la FTBO.
4. Comme generalement m < n, il y a davantage de points de depart que de points d’arrivee
et lorsque ke → ±∞, n − m branches n’ont pas d’arrivees et correspondent a n − m
asymptotes definies par :
— Les angles formes par ces branches et l’axe reel :
θa =(2λ+ 1)π
n−mpour ke > 0
θa =2λπ
n−mpour ke < 0
(3.18)
— Ces asymptotes se coupent sur l’axe reel au point d’abcisse :
σ =
n∑
i=1pi −
m∑
j=1zj
n−m(3.19)
5. On determine quels sont les points de l’axe reel qui appartiennent au lieu d’Evans en
appliquant les regles enoncees ci-apres :
61
Chapitre 3. SYSTEMES ASSERVIS
— Si ke > 0, un point de l’axe reel appartient au lieu s’il laisse a sa droite un nombre
impair de poles et de zeros, comptes avec leur ordre de multiplicite. Zero est considere
comme un nombre pair.
— Si ke < 0, un point de l’axe reel appartient au lieu s’il laisse a sa droite un nombre
pair de poles et de zeros, comptes avec leur ordre de multiplicite.
Nota important : le nombre 0 est considere comme pair dans l’application de cette regle.
6. Lorsque l’on fait varier le gain d’Evans ke de 0 a ±∞, des poles reels peuvent devenir
complexes conjugues et inversement. Ceci revele dans l’equation D(p) + keN(p) = 0 la
presence de racines reelles doubles se traduisant sur le lieu par des points de jonction
et/ou de separation. Ces points verifient donc :
D(p) + keN(p) = 0 (3.20)
dD(p)
dp+ ke
dN(p)
dp= 0 (3.21)
avec p reel.
7. Les points du lieu situes sur l’axe imaginaire determinent la limite de stabilite, ils veri-
fient :
D(jω) + keN(jω) = 0 (3.22)
3.4.2.2 Exploitation du lieu d’Evans
La figure 3.12 represente le lieu des poles de la fonction de transfertq(p)
δm(p)d’un avion de type
Mirage 2000 trace pour une variation de centrage ∆C autour du centrage normal de l’avion. Les
variables q(t) et δm(t) representent respectivement le tangage et la position de la commande de
profondeur. Le modele retenu correspond a celui d’un avion volant a Mach 0.65 et a une altitude
de 1000 pieds.
Pour cet exemple la variation de centrage ∆C ∈ [−100%, 100%] et joue un role analogue au
gain k ∈ [−1, 1].
— centrage nul : les poles sont a partie reelle negative et l’avion est stable. Il est cependant
mal amorti (ξ = 0, 14) et sa pulsation propre non-amortie est egale a 1, 15rad/s. Les
resultats etablis au chapitre 2 permettent de predire les caracteristiques de la reponse a
un echelon de profondeur.
— centrage avant : le lieu montre que pour ∆C = −100%, l’avion reste stable mais le
facteur d’amortissement tend a diminuer alors que la pulsation propre non-amortie tend
a augmenter.
— centrage arriere egal a 40%, l’avion est stable et les poles sont reels doubles, ce qui
correspond au regime critique (ξ = 1).
— centrage arriere egal a 41%, l’avion est instable car l’un des poles est a partie reel nulle.
Si l’on recule encore le centre de gravite, la partie reelle de ce pole est positive, l’avion
est instable.
Les reponses indicielles en tangage de cet avion pour ∆C ∈ [−100%, 40%] sont representees sur
la figure 3.13 4.
4. Pour tracer ces chronogrammes les gains statiques ont ete normalises a moins un. A ce propos le gain
62
3.4. ANALYSE DE LA DYNAMIQUE DES SYSTEMES ASSERVIS
−2 −1.5 −1 −0.5 0 0.5 1 1.5−2.5
−2
−1.5
−1
−0.5
0
0.5
1
1.5
2
2.5
Root Locus
Real Axis
Imag
inar
y A
xis ∆C=100%
∆C=−100%
∆C=−100%
∆C=100%
ωn=1,15
ξ=0,14
∆C=0%
∆C=40%
∆C=0%
∆C=41%∆C=41%
Figure 3.12 – Lieu des poles caracteristiques du mode d’incidence en fonction du centrage pour un
Mirage 2000
Réponse indicielle
Temps (sec)
Tan
gage
0 5 10 15 20 25 30 35−1.8
−1.6
−1.4
−1.2
−1
−0.8
−0.6
−0.4
−0.2
0
∆C=−100%
∆C=0%
∆C=40%
Figure 3.13 – Effet du centrage sur la reponse en tangage d’un Mirage 2000
63
Chapitre 3. SYSTEMES ASSERVIS
3.5 PRECISION DES SYSTEMES ASSERVIS
3.5.1 Notion d’erreur
Soit un systeme asservi dont un schema fonctionnel est represente sur la figure 3.2. Un tel
systeme est qualifie de precis si l’erreur permanente limt→∞
ε(t) = 0. Pour ce systeme et pour
F (p) = 1, le calcul de l’erreur montre que celle-ci a pour expression :
ε(p) =1
1 + C(p)H1(p)H2(p)M(p)E(p)− M(p)H2(p)
1 + C(p)M(p)H1(p)H2(p)Γ(p) (3.23)
Compte tenu de la definition de la FTBO (3.5), il vient :
ε(p) =1
1 + FTBO(p)E(p)− M(p)H2(p)
1 + FTBO(p)Γ(p) (3.24)
L’erreur procede de la consigne E(p), de la perturbation Γ(p) et du systeme, notamment au
travers de FTBO(p). L’erreur, en regime permanent, est calculee en appliquant le theoreme de
la valeur finale.
3.5.2 Expression de l’erreur en regime permanent
Comme le systeme est lineaire, on peut appliquer le principe de superposition et calculer :
1. l’erreur en regime permanent due a la consigne seule (Γ(p) = 0)
limt→∞
ε(t) = limp→0
p1
1 + FTBO(p)E(p) (3.25)
2. l’erreur due a la perturbation seule (E(p) = 0)
limt→∞
ε(t) = limp→0
p−M(p)H2(p)
1 + FTBO(p)Γ(p) (3.26)
Les fonctions de transfert qui apparaissent dans (3.25) et (3.26) doivent etre evaluees en p = 0.
Dans le cas general, elles ont une expression de la forme :
G(p) =bmp
m + · · ·+ b1p+ b0pk(anpn−k + · · ·+ ak+1p+ ak)
(3.27)
G(p) possede k poles nuls et est qualifiee de classe k.
limp→0
G(p) → b0akpk
(3.28)
statique est negatif, cela traduit le fait qu’un braquage negatif de la gouverne genere une variation positive de
l’angle d’incidence.
64
3.5. PRECISION DES SYSTEMES ASSERVIS
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10
0.2
0.4
0.6
0.8
1
Temps (sec)
Rép
onse
ε0(∞)
0 0.5 1 1.5 2 2.5 3 3.5 40
0.5
1
1.5
2
2.5
3
3.5
4
Temps (sec)
Rép
onse
ε1(∞)
Figure 3.14 – Erreur de position et de trainage
3.5.2.1 Erreur due a la consigne
Dans le cas d’un systeme dont la FTBO a la meme structure que celle de G(p), (3.25) a pour
expression :
limt→∞
ε(t) = limp→0
p1
1 +b0akpk
E(p) = limp→0
akpk+1
akpk + b0E(p) (3.29)
On discute alors de la valeur de l’erreur en fonction du type de l’entree de consigne et de
la classe du systeme. Les resultats sont rapportes dans le tableau 3.1 ou K = b0a0, Kv = b0
a1et
Ka = b0a2
designent respectivement le gain statique, le gain en vitesse et le gain en acceleration.
Les erreurs de position et de trainage sont representees pour un systeme a retour unitaire sur la
figure 3.14 .
Classe 0 Classe 1 Classe 2
Entree E(p) FTBO(p) ∼p→0K FTBO(p) ∼
p→0Kv
pFTBO(p) ∼
p→0Ka
p2e0p
ε0 =e0
1 +Kε0 = 0 ε0 = 0
erreur de positionV0p2
ε1 = ∞ ε1 =V0Kv
ε1 = 0
erreur de vitesseγ
p3ε2 = ∞ ε2 = ∞ ε2 =
γ
Ka
erreur d’acceleration
Tableau 3.1 – Erreur en fonction de la consigne et de la classe de la FTBO
65
Chapitre 3. SYSTEMES ASSERVIS
3.5.2.2 Erreur due a la perturbation
Dans le cas d’un systeme dont la FTBO et H2(p) ont une structure analogue a celle de G(p) 5,
(3.26) a pour expression :
limt→∞
ε(t) = limp→0
p
−M(p)β0αjpj
1 +b0akpk
Γ(p) (3.30)
On rappelle que M(p) est la fonction de transfert de la chaıne de retour qui inclue le capteur
et le traitement du signal mesure. Cette fonction de transfert est celle d’un gain pur, d’un
systeme d’ordre un, voire d’ordre deux et par consequent de classe zero. Dans ces conditions
(3.30) s’ecrit :
limt→∞
ε(t) = limp→0
−M(0)β0akp
k−j+1
αj
akpk + b0Γ(p) (3.31)
k est le nombre de poles nuls de la FTBO, j est le nombre de poles nuls de H2(p) et M(p)
est supposee de classe zero. Par consequent, k− j est le nombre de poles nuls de C(p)H1(p), on
dit aussi que c’est le nombre d’integration en amont de la perturbation. On discute alors de la
precision vis-a-vis de la perturbation en fonction de k − j et de la nature de l’entree.
On retiendra en particulier que pour une perturbation en echelon, il faut une integration
k − j = 1 en amont de l’entree de perturbation pour annuler l’erreur due a cette perturbation.
3.5.2.3 En quoi la presence d’un integration permet-elle d’annuler l’erreur sta-
tique ?
On sait que l’integrale d’une fonction du temps positive croıt au fil du temps, qu’elle decroıt
pour une fonction negative et qu’elle est constante pour une fonction nulle. Si la fonction du
temps consideree est l’erreur et son integrale la commande, alors tant que l’erreur est positive,
la commande ne cesse d’augmenter entrainant une augmentation de la sortie et par suite, une
diminution de l’erreur. Lorsque cette derniere s’annule, la commande se stabilise, la sortie ne
varie plus et est egale a la consigne.
3.6 Exemple
Dans cet exemple, on etudie le comportement en derapage β(t) d’un Mirage 2000 consecutif
au braquage δn de la gouverne de direction. Pour cette etude l’avion vole a Mach 0,6 et a une
altitude de 20000 pieds. L’etude de la reponse impulsionnelle met en evidence la presence d’un
mode du second ordre appele mode de roulis hollandais ou dutch roll mode qu’il convient, pour
5. Comme FTBO(p) = H1(p)H2(p)M(p), la classe de H2(p) est necessairement inferieure ou egale a celle de
FTBO(p)
66
3.6. Exemple
le confort du pilote, de corriger. On realise ainsi un amortisseur de lacet ou yaw damper 6 La
fonction de transfert :
β(p)
δn(p)=
0.026p+ 3.727
p2 + 0.6479p+ 11.14(3.32)
Comme le montre la figure, un braquage positif du drapeau produit du lacet negatif et un angle
de derapage positif. D’autre part, le facteur d’amortissement de ce systeme du second ordre est
egal a 0,097, de ce fait l’avion est mal amorti et difficile a piloter. On insere ce systeme dans une
boucle d’asservissement en vue d’asservir le derapage β(t) a une consigne βc(t), pratiquement,
la gouverne de direction n’est plus controlee par le pilote mais son braquage procede d’un signal
de commande issu du traitement de l’erreur de derapage β(t). Le derapage est mesure par une
palette d’incidence de gain unitaire, soit βm(t) cette mesure. Pour cette etude le correcteur est
de type proportionnel, de sorte que δn(t) = kε(t) = k(βc(t)− βm(t)).
La fonction de transfert en boucle ouverte :
FTBO(p) =βm(p)
ε(p)= k
0.026p+ 3.727
p2 + 0.6479p+ 11.14(3.33)
Le lieu de Black de la fonction de transfert harmonique de FTBO(jω) est trace pour k = 1
et represente sur la figure 3.15. D’apres le critere du revers, le lieu parcouru dans le sens des
pulsations croissantes laisse le point critique sur sa droite. Ainsi, l’avion insere dans la boucle
d’asservissement est stable ∀ω ≥ 0. La marge de gain est infinie et la marge de phase est egale
a 57 .
On regle le comportement dynamique du yaw damper par la methode du lieu d’Evans que
l’on trace en suivant les regles definies au §3.4.2. On rappelle qu’il s’agit de tracer dans le plan
complexe le lieu des poles de la FTBF :
FTBF (p) =β(p)
βc(p)=
ke(p+ 143)
p2 + (0.6479 + ke)p+ 123ke + 11, 14(3.34)
Plutot que de calculer les racines du denominateur de le FTBF (p) et de representer leurs images
dans le plan complexe en fonction de ke, on applique la methode de construction du lieu d’Evans
qui exploite FTBO(p) mise sous forme poles-zeros :
1. Sous forme poles-zeros,
FTBO(p) = 0.026kp+ 143
(p+ 0.32 + 3.33j)(p+ 0.32− 3.33j)(3.35)
et ke = 0.026k > 0
2. deux points de depart : {−0.32± 3.33j},3. un point d’arrivee : {−143},4. asymptotes
— pour ke > 0 il y a une asymptote de direction : θa =(2λ+ 1)π
2− 1avec λ = 0 soit θa = π,
6. En pratique l’amortisseur de lacet controle la vitesse angulaire autour de l’axe de lacet. Dans un souci de
simplicite le systeme etudie vise a asservir le derapage et n’est pas a proprement parler un yaw damper.
67
Chapitre 3. SYSTEMES ASSERVIS
Lieu de Black
Phase en boucle ouverte (deg)
Gai
n en
bou
cle
ouve
rte
(dB
)
−270 −225 −180 −135 −90 −45 0−120
−100
−80
−60
−40
−20
0
20
40
60
80
System: FTBO(j\omega)Phase Margin (deg): 57.7Delay Margin (sec): 0.276At frequency (rad/sec): 3.65Closed Loop Stable? Yes
6 dB 3 dB
1 dB 0.5 dB
0.25 dB 0 dB
−1 dB
−3 dB −6 dB
−12 dB −20 dB
−40 dB
−60 dB
−80 dB
−100 dB
−120 dB
FTBO(jω)kFTBO(jω) 0dB
Figure 3.15 – Lieu de Black-Nichols caracteristique de la dynamique laterale d’un Mirage 2000
— l’asymptote est sur l’axe reel, il n’y a donc pas lieu de calculer l’abcisse du point
d’intersection des asymptotes,
— pour ke < 0 il y a une asymptote de direction : θa =(2λ)π
2− 1avec λ = 0 soit θa = 0,
— l’asymptote est sur l’axe reel, comme pour ke > 0 il n’y a pas lieu de calculer l’abcisse
du point d’intersection des asymptotes,
5. les points de l’axe reel qui appartiennent au lieu :
— pour ke > 0 : il y a un seul zero et aucun pole sur l’axe reel. Ainsi, tous les points de
l’axe reel situes a gauche du point d’abcisse −143 sont des points du lieu. La branche
tracee tend vers l’asymptote de direction π,
— pour ke < 0 : il y a un seul zero et aucun pole sur l’axe reel. Ainsi, tous les points de
l’axe reel situes a droite du point d’abcisse −143 sont des points du lieu. La branche
tracee tend vers l’asymptote de direction 0,
6. les poins de jonction separation verifient :
ke(p+ 143) + (p2 + 0.6479p+ 11.14) = 0
(kep) + (2p+ 0.6479) = 0 (3.36)
equations qui admet pour solutions reelles :{−285,−0.0028} pour ke egal a {21953,−3}7. limite de stabilite : le trace montre que l’instabilite procede d’un pole reel qui devient
superieur ou egal a zero. Le denominateur de FTBF (p) verifie :
D(p) = p2+(0.6479+ke)p+123ke+11, 14 = p2+(0.6479+ke)p+0 = p(p+0.6479+ke)
68
3.6. Exemple
(3.37)
L’instabilite se produit pour ke = −0.6479.
−400 −350 −300 −250 −200 −150 −100 −50 0 50 100−150
−100
−50
0
50
100
150
Axe réel
Axe
imag
inai
re
point d’arrivéepoints de départ
asymptote
réglage ξ=0,4
−150 −100 −50 0 50 100 150−15
−10
−5
0
5
10
15
Lieu des racines
Axe réel
Axe
imag
inai
reFigure 3.16 – Traces du lieu d’Evans pour ke > 0 et ke < 0
Interpretation du lieu d’Evans
— ke ≥ 0
— ke ∈ [0, 21953[, les poles sont complexes conjugues et au fur et a mesure que keaugmente, le facteur d’amortissement initialement egal a 0, 097 decroıt, atteint un
minimum (point de coordonnees {−143, 143j}) puis tend vers un, la pulsation propre
non amortie quant a elle ne cesse d’augmenter.
— ke = 21953, les poles de la boucle fermee se situent au point de jonction et on a un
pole reel double. Ce qui correspond au regime critique.
— ke > 21953, les poles sont reels et le systeme presente une dynamique de premier ordre
dominant. Le pole dominant augmente et la constante de temps afferente egalement.
On peut toutefois noter que le zero ”bloque”le pole, empechant par la-meme le systeme
de devenir instable.
— ke < 0
— ke ∈]0,−0.0028[, le systeme est stable et presente une dynamique d’ordre deux. Le
facteur d’amortissement est acceptable mais le module des poles qui est egal a la
pulsation propre non-amortie de ce second ordre est petite et par consequent, le temps
de reponse est lent. D’autre part, le gain statique de la boucle est negatif, ce qu’il
faudrait corriger avec un prefiltre de gain egal a −1.
— ke = −0.0028, c’est un point de jonction, les poles sont reels double et c’est encore un
regime critique. Du fait de la proximite des poles de l’axe imaginaire (−0.0028), on
peut s’ttendre a un temps de reponse de l’ordre de tr5% ≈ 30.385 ≈ 8s
— ke ∈] − 0.0028,−0.6479[, le systeme presente un mode dominant du premier ordre
encore stable.
69
Chapitre 3. SYSTEMES ASSERVIS
— ke < −0.6479, l’un des poles est reel positif et le systeme est instable.
On regle le gain ke, et par suite k, de sorte que la reponse en boucle fermee presente un
premier depassement relatif inferieur a 25%, ce qui d’apres l’abaque 2.10 correspond a un facteur
d’amortissement egal a 0, 4. Dans (3.34) :
p2 + (0.6479 + ke)p+ 143ke + 11.14 = p2 + 2ξωnp+ ω2n (3.38)
Soit ke = 90.29 et k = 3472. Cette valeur du gain est tres importante et il conviendrait de
s’interroger sur la pertinence de ce choix. En effet, la commande de direction δn(t) = k(βc(t)−β(t)) et on pressent qu’un gain eleve risque de mettre la gouverne en butee.
Le lieu de Black de la FTBO corrigee avec cette valeur du gain est representee sur la figure
3.15. La marge de phase de la FTBO ainsi corrigee est de l’ordre de 45 . On peut egalement
exploiter les abaques de Nichols pour decrire le comportement du systeme boucle, toutefois cette
approche n’est pas tres precise. Le gain statique en boucle fermee est compris entre 0dB et −1dB.
On observe que le lieu de kFTBOjω) passe entre les isogains 3dB et 6dB, ce qui donne une idee
du gain a la resonance qui est compris entre ces deux valeurs.
Calcul de l’erreur : le gain etant regle a k = 3472, comme la fonction en boucle ouverte de
ce systeme est de classe zero, en reponse a un echelon de consigne de derapage de 1 , il existe
une erreur de position. D’apres le tableau 3.1 et l’expression de la FTBO (3.33), cette derniere
est egale a :
limt→+∞
ε(t) =
1
1 + 34723, 727
11, 14
0.017 = 1, 46.10−5 (3.39)
La figure 3.17 montre l’angle de derapage en reponse a un echelon de consigne unitaire. L’erreur
etant tres faible, et ce du fait que k est grand, la sortie tend vers la consigne.
0 0.02 0.04 0.06 0.08 0.1 0.120
0.2
0.4
0.6
0.8
1
1.2
1.4
Réponse indicielle
Temps (sec)
Dér
apag
e
Figure 3.17 – Reponse indicielle a une consigne de derapage de 1
70
CHAPITRE 4
CORRECTION DES SYSTEMES
4.1 Objectifs de la correction et methodes
La mise en œuvre d’une boucle d’asservissement (figure 4.1) vise a a asservir la reponse
d’un systeme a une consigne et a rejeter les perturations. De plus, les regimes transitoires, tant
vis-a-vis de la consigne que des perturbations doivent etre maıtrises.
Pour atteindre ces objectifs, il convient d’appliquer au systeme une commande adaptee. Dans
le cadre de la theorie des asservissements, celle-ci est elaboree par le correcteur a partir du signal
d’erreur.
Differentes approches peuvent etre retenues pour synthetiser un correcteur :
1. la poursuite d’un modele de reference. On desire que la FTBF tende vers une fonction de
transfert particuliere FTBFm(p). D’apres (3.6) On a :
C(p) =FTBFm(p)
FTBO(p)(1− FTBFm(p))(4.1)
Il faut toutefois s’assurer que le correcteur obtenu est realisable, i.e. que le degre du
numerateur de C(p) soit inferieur ou egal a celui de son denominateur.
2. la poursuite d’une trajectoire de reference. La reponse doit satisfaire a des contraintes
exprimees dans le domaine temporel, par exemple, une erreur de position nulle, un temps
de reponse, un premier depassement relatif donnes.
Dans ce cours, on s’interesse plus particuliere a la synthese de correcteurs visant a poursuivre
une trajectoire de reference. Toutefois, quelques methodes de synthese fondees sur la poursuite
d’un modele seront abordees.
71
Chapitre 4. CORRECTION DES SYSTEMES
+
−
C(p)+
+
M(p)
H1(p)
U(p)ε(p)
Γ(p)
H2(p)E(p) S(p)
R(p)
Figure 4.1 – Schema fonctionnel d’un systeme asservi muni d’un correcteur
4.1.1 Syntheses de correcteurs dans le plan de Black
— FTBONC(p) = H1(p)H2(p)M(p) designe la fonction de transfert en boucle ouverte du
systeme corrige,
— FTBOC(p) = C(p)H1(p)H2(p)M(p) designe la fonction de transfert en boucle ouverte
du systeme muni d’un correcteur.
La synthese des correcteurs est avantageusement menee dans le plan de Black, dans lequel
les effets du correcteur sur le lieu de Black de la FTBO sont faciles a representer et a interpreter.
En regime harmonique :
FTBOC(jω) = C(jω)FTBONC(jω) (4.2)
— effet du correcteur sur le gain :
|FTBOC(jω)|dB = |C(jω)|dB + |FTBONC(jω)|dB
— effet du correcteur sur la phase :
< FTBOC(jω) >=< C(jω) > + < FTBONC(jω) >
La figure 4.2, montre le lieu de Black corrige d’un systeme du second ordre par un correcteur a
action integrale.
72
4.2. Correction : les actions a mener
−270 −225 −180 −135 −90 −45 0−40
−30
−20
−10
0
10
20
System: sys1Gain (dB): −6.67Phase (deg): −90Frequency (rad/sec): 2.15
System: untitled1Gain (dB): 2.81Phase (deg): −107Frequency (rad/sec): 0.84
Nichols Chart
Open−Loop Phase (deg)
Ope
n−Lo
op G
ain
(dB
)−90°−108°=−198°3,16dB+(−6,67dB)=−3,5dB
Figure 4.2 – Lieu de Black d’un systeme d’ordre deux corrige par un integrateur pur
Pour synthetiser un correcteur, on procedera de la maniere suivante :
1. Donnee : le lieu de Black de la FTBONC du systeme a corriger,
2. Profiler le lieu de la FTBOC en fonction des perfomances attendues en boucle fermee,
3. identifier le correcteur qui realise ce profil et calculer ses parametres.
4.2 Correction : les actions a mener
Le correcteur permet de modifier le gain et la phase de la FTBOC :
1. Stabilite : diminution du gain |C(jω)| < 0 et ajout d’une avance de phase < C(jω) > > 0
en vue par exemple de regler une marge de gain, une marge de phase. Ce point est illustre
sur la figure 4.3.
2. Amortissement : memes actions, en vue de regler le point de tangence du lieu de FTBOC(jω)
et d’une isogain, et cela afin de regler, de maniere implicite, un coefficient d’amortisse-
ment.
3. Rapidite : a gain statique egal, un systeme est d’autant plus rapide que sa bande passante
est elevee.
4. Precision : augmentation du gain statique.
Il apparaıt que les reglages 1, 2 et 3 concernent le regime transitoire et qu’ils sont operes pour
des points du lieu proches du point critique, a des pulsations dans le voisinage de [ω0dB, ωπ]. En
revanche, le reglage 4 concerne les points du lieu situes aux pulsations proches de 0 rad/s.
73
Chapitre 4. CORRECTION DES SYSTEMES
−270 −225 −180 −135 −90 −45 0−30
−20
−10
0
10
20
30
40
6 dB
3 dB
1 dB
0.5 dB
0.25 dB
0 dB
−1 dB
−3 dB
−6 dB
−12 dB
−20 dB
Gain en boucle ouverte (deg)
Pha
se e
n bo
ucle
ouv
erte
(dB
)
|C(jω)|<0
<C(jω)> > 0
ω0dBω
π
Figure 4.3 – Actions du correcteur pour accroıtre la stabilite
4.3 Correction proportionnelle
Le correcteur proportionnel est un simple gain, de sorte que la commande est proportionnelle
a l’erreur :
u(t) = kε(t) (4.3)
dont la transformee de Laplace s’ecrit :
U(p) = kε(p) (4.4)
La fonction de transfert du correcteur C(p) = k montre que ce dernier agit a toutes les frequences,
sur le regime transitoire comme sur le regime permanent. La figure 4.4 montre le diagramme
de Bode d’un tel correcteur et son effet sur la FTBO d’un systeme dans le plan de Black. Ce
correcteur n’offre qu’un seul degre de liberte et ne permet pas de regler simulanement toutes les
performances du systeme asservi.
Dans l’exemple presente, le gain est choisi inferieur a un pour permettre au lieu de Black de
tangenter l’isogain 0dB. Toutefois, le gain statique en boucle fermee etant avec ce reglage egal a
−7dB en boucle fermee, le facteur de surtension est egal a +7dB et le facteur d’amortissement
correspondant est egal a 0, 22. Pour ce systeme, cette correction n’est pas satisfaisante. Le gain
statique en boucle fermee et le facteur d’amortissement sont petits ce qui affecte la precision et
l’amortissement de la reponse indicielle representee sur la figure 4.4. Ce type de correcteur peut
egalement etre regle par la methode du lieu d’Evans presentee au chapitre 3.
74
4.3. Correction proportionnelle
−3
−2.5
−2
−1.5
−1
−0.5
Gai
n (d
B)
−180 −135 −90 −45 0−40
−30
−20
−10
0
10
20
6 dB
3 dB
1 dB −1 dB
−3 dB
−6 dB
−12 dB
−20 dB
−40 dB
Lieu de Black−Nichols
Phase en BO (deg)
Gai
n en
BO
(dB
)
100
101
−1
−0.5
0
0.5
1
Pha
se (
deg)
Diagramme de Bode C(p)=k
Pulsation (rad/sec)
FTBONC
FTBOC
0dB
Figure 4.4 – Correction proportionnelle visant a tangenter l’isogain 0dB
Am
plitu
deA
mpl
itude
0 1 2 3 4 5 6 7 8 9 100.2
0.4
0.6
0.8
1
0 1 2 3 4 5 6 7 8 9 100
0.1
0.2
0.3
0.4
0.5
0.6
Figure 4.5 – Reponse indicielle et commande pour le correcteur proportionnel
75
Chapitre 4. CORRECTION DES SYSTEMES
4.4 Corriger la stabilite et l’amortissement
4.4.1 Correcteur a action proportionnelle derivee
Le correcteur a action derivee genere une commande qui est la derivee de l’erreur :
u(t) = Tddε(t)
dt(4.5)
dont la transformee de Laplace s’ecrit :
U(p) = pTdε(p) (4.6)
La fonction de transfert du correcteur est C(p) = Tdp. La figure 4.6 montre le diagramme de
Bode d’un tel correcteur et son effet sur la FTBO d’un systeme dans le plan de Black.
Lieu de Black−Nichols
Phase BO (deg)
Gai
n B
O (
dB)
−10
−5
0
5
10
15
Gai
n (d
B)
100
101
89
89.5
90
90.5
91
Pha
se (
deg)
Diagramme de Bode
Pulsation (rad/sec)−180 −135 −90 −45 0 45 90
−40
−30
−20
−10
0
10
20
6 dB
3 dB
1 dB −1 dB
−3 dB
−6 dB
−12 dB
−20 dB
−40 dB
FTBO_CFTBO_NC
Figure 4.6 – Correcteur a action derivee et effets de cette correction dans le plan de Black
Ce correcteur genere sur toute la plage de frequence une avance de phase de +90◦, en parti-
culier pour les points du lieu proches du point critique. Ceci a pour effet d’augmenter la marge
de phase. Dans le domaine temporel, cela peut permettre de stabiliser un systeme initialement
instable et d’augmenter le facteur d’amortissement. En revanche, le gain en dB aux basses fre-
quences tend vers moins l’infini, autrement dit, en regime statique, le signal d’erreur n’est plus
amplifie, le signal de commande tend vers zero et le systeme cesse d’etre commande.
On peut donner du sens physique a l’action derivee en observant que le signal de commande
genere par cette correction est proportionnel (facteur Td) a la vitesse de l’erreur. Ainsi, si l’er-
reur converge vers zero par valeurs croissantes (resp.decroissantes), le signal de commande est
negatif (resp. positif), il tend a s’opposer (a freiner) l’evolution de la reponse et cela d’autant
plus fortement que l’erreur varie rapidement. C’est ce que montre la figure 4.7.
76
4.4. Corriger la stabilite et l’amortissement
u(t) = Tddε
dt
ε(t)
u(t) = Tddε
dt
ε(t)
t
s(t)
e(t)
t
s(t)
e(t)
Figure 4.7 – Profils des signaux de commande generes par un correcteur a action derivee
4.4.2 Correcteur a action proportionnelle derivee
Le correcteur a action proportionnelle derivee n’a pas, aux pulsations proches de zero (ou
en regime permanent), les inconvenients du correcteur a action derivee. Il delivre, a partir de
l’erreur, une commande qui a pour expression :
u(t) = kε(t) + kddε(t)
dt(4.7)
en posant Td =kdk, la transformee de Laplace de u(t) s’ecrit :
U(p) = k(1 + Tdp)ε(p) (4.8)
4.4.3 Reglage dans le plan de Black Nichols
La fonction de transfert du correcteur est C(p) = k(1 + Tdp). La figure 4.8 montre le dia-
gramme de Bode d’un tel correcteur. Il se comporte :
— comme un correcteur proportionnel aux pulsations inferieures a1
Td, ainsi le gain statique
de la FTBO tend vers kFTBONC(0). Contrairement a l’action derivee pure, le gain
statique n’est pas nul. Pratiquement, k peut servir a regler la valeur de l’erreur en regime
permanent (voir le tableau 3.1).
— comme un correcteur a action derivee aux pulsations superieures1
Tdpour lesquelles il
ajoute une avance de phase. Celle-ci permet d’eloigner le lieu de Black de la FTBO du
point critique, contribuant ainsi a accroıtre la stabilite du systeme boucle. Pratiquement,
on regle1
Td<< ω0dB pour beneficier d’une avance de phase suffisante. Il faut toutefois
prendre garde au fait que, pour les pulsations superieurs a1
Td, le correcteur introduit un
gain. Plus exactement :
— l’avance de phase Ap produite par le correcteur a ω0dB : Ap = tan−1 ω0dBTd.
— le gain ajoute par correcteur a cette pulsation : GdB = 20logk+20log√
1 + (Tdω0dB)2.
77
Chapitre 4. CORRECTION DES SYSTEMES
0
10
20
30
40
Gai
n (d
B)
10−1
100
101
102
0
45
90
Pha
se (
deg)
Pulsation (rad/sec) −180 −135 −90 −45 0−40
−30
−20
−10
0
10
20
6 dB
3 dB
1 dB −1 dB
−3 dB
−6 dB
−12 dB
−20 dB
−40 dB
Phase BO (deg)
Gai
n B
O (
dB)
FTBO_CFTBO_NC
1/Td
ω0dB
1/Td
Ap
GdB
GdB
Ap
Figure 4.8 – Diagramme de Bode d’un correcteur proportionnel derive trace pour kp = 1 et son effet
sur le lieu de Black
4.4.4 Poursuite d’un modele de reference
Considerons un systeme a regler ayant pour fonction de transfert en boucle ouverte non
corrigee :
FTBONC(p) =k′
p(τp+ 1)(4.9)
Pratiquement, les systemes dont on cherche a controler la position (verins, servomoteurs, etc.)
presentent une fonction de transfert de ce type. Ce systeme est instable en boucle ouverte, et
cela du fait de la presence du pole nul. On l’insere dans une boucle d’asservissement a retour
unitaire, le correcteur retenu est du type proportionnel derivee, il vient :
FTBOC(p) =k′k(1 + Tdp)
p(τp+ 1)(4.10)
La fonction de transfert en boucle fermee :
FTBF (p) =k′kτ (1 + Tdp)
p2 + (1+k′kTd)τ p+ k′k
τ
(4.11)
Pour un tel systeme, k′ permet de regler la pulsation propre non-amortie et Td le facteur
d’amortissement reduit. Le gain statique est egal a un, independamment de la valeur des para-
metres, et ce du fait que le systeme etudie est de classe une.
4.4.5 Correcteur a avance de phase
Pratiquement, le correcteur a action proportionnelle derivee n’est pas realisable, le degre
du numerateur etant superieur a celui du denominateur. D’autre part, l’avance de phase est
78
4.4. Corriger la stabilite et l’amortissement
seulement necessaire pour les points du lieu de la FTBO proches du point critique. Enfin, il
n’est ni necessaire ni souhaitable de deriver les composantes hautes frequences du signal d’erreur.
En effet, celui-ci contient la mesure qui est generalement bruitee. L’erreur est donc elle-meme
bruitee, comme le bruit peut contenir des signaux a des frequences elevees (autrement dit des
signaux qui varient rapidement), il n’est pas souhaitable de les deriver. Le correcteur a avance
de phase pallie ces differents inconvenients, sa fonction de transfert a pour expression :
C(p) = kaτp+ 1
τp+ 1a > 1 (4.12)
Le diagramme de Bode de ce correcteur represente sur la figure 4.9 montre qu’il se comporte
comme un correcteur proportionnel 1 sur les plages de pulsation [0,1
aτ] ∪ [
1
τ,+∞[ et comme
un correcteur a action derivee dans l’intervalle [1
aτ,1
τ] 2. Ce correcteur genere localement une
avance de phase mise a profit pour eloigner du point critique les points du lieu de la FTBO qui
en sont proches.
L’etude du gain |C(jω)|dB et de l’argument < C(jω) > montrent que ce dernier admet un
maximum a la pulsation :
ωmax =1
τ√a
(4.13)
A cette pulsation :
|C(jωmax|dB = 20 log k + 10 log a (4.14)
< C(jωmax) > = sin−1
(a− 1
a+ 1
)
(4.15)
Pratiquement, on dimensionne le correcteur de la maniere suivante :
1. on se fixe l’avance de phase Ap que l’on veut creer pour les points du lieu proches du
point critique, en particulier au point dont la pulsation vaut ω0dB,
2. le correcteur est regle pour que le maximum d’avance de phase soit cree a ω0dB, de sorte
que ωmax coıncinde avec ω0dB,
3. l’equation (4.15) permet de determiner la valeur de a qui permet de generer l’avance de
phase maximale desiree,
4. comme ω0dB coıncide avec ωmax =1√aτ
, on en deduit la valeur de τ .
Le diagramme de Bode de la figure 4.10 montre qu’a la pulsation ωmax le correcteur introduit
un gain egal a 10 log a. Ainsi, le point du lieu ω0dB de la FTBO non corrige est translate hori-
zontalement vers la droite d’une avance de phase egale < C(jωmax) > mais aussi verticalement
vers le haut d’un gain egal a 10 log a. Pour anticiper ce phenomene, on peut mener l’etude avec
la pulsation de resonance de la boucle fermee non corrigee ωr a la place de ω0dB.
1. Le gain est constant et la phase est nulle.
2. Le gain croıt avec une pente de +20dB/decade et la phase est positive.
79
Chapitre 4. CORRECTION DES SYSTEMES
0
5
10
15G
ain
(dB
)
100
102
0
10
20
30
40
Pha
se (
deg)
Pulsation (rad/sec) −180 −135 −90 −45 0−60
−50
−40
−30
−20
−10
0
10
20
6 dB
3 dB
1 dB −1 dB
−3 dB
−6 dB
−12 dB
−20 dB
−40 dB
−60 dB
Phase BO (deg)
Gai
n B
O (
dB)
FTBO_NC
FTBO_Cωmax
1/τ
10 log a
20 log a
<C(jωmax
)>
ωr
ω0dB
1/(aτ)
Figure 4.9 – Diagramme de Bode d’un correcteur a avance de phase trace pour k = 1 et son effet sur le
lieu de Black
−120 −90
−15
−10
−5
0
5
Nichols Chart
Open−Loop Phase (deg)
Ope
n−Lo
op G
ain
(dB
)
10 log a
Ap
FTBONC
FTBOC
ω0dBω
r
Figure 4.10 – Effets du correcteur a avance de phase sur le gain et la phase
80
4.5. Corriger la precision
4.5 Corriger la precision
4.5.1 Correction integrale
Du point de vue de la precision, les effets d’un integrateur dans le domaine temporel ont ete
decrits au chapitre 3. Un integrateur permet d’augmenter la classe de la FTBO, ce qui en boucle
fermee permet de reduire voire d’annuler les erreurs en regime permanent.
La commande du systeme en boucle fermee est proportionnelle a l’integrale de l’erreur :
u(t) =1
Ti
∫ t
t0
ε(θ)dθ (4.16)
La transformee de Laplace de cette expression permet d’etablir la fonction de transfert du
correcteur a action integrale :
C(p) =1
Tip(4.17)
Le diagramme de Bode et les effets de ce correcteur sur la FTBO d’un systeme sont illustres sur
la figure 4.11.
−20
−15
−10
−5
0
5
Gai
n (d
B)
100
101
−91
−90.5
−90
−89.5
−89
Pha
se (
deg)
Pulsation (rad/sec)
−180 −135 −90 −45 0−40
−30
−20
−10
0
10
20
30
40
6 dB
3 dB
1 dB
0.5 dB
0.25 dB
0 dB
−1 dB
−3 dB
−6 dB
−12 dB
−20 dB
−40 dB
Phase BO (deg)
Gai
n B
O (
dB)
FTBO_CFTBO_NC
1/Ti
Figure 4.11 – Diagramme de Bode du corrcteur integral et ses effets sur le lieu de Black de la FTBO
On observe que ce correcteur introduit dans la boucle ouverte un gain statique infini, ce qui
est benefique a la precision. En revanche, il cree un retard de phase deπ
2a toutes les frequences
qui affecte la stabilite de la boucle. On constate que le lieu de Black de la FTBO corrigee
tangente l’isogain 0dB lorsque la pulsation tend vers zero mais qu’il tangente egalement isogain
6dB. Ainsi, en boucle fermee, le systeme est resonant et la reponse indicielle presente un fort
depassement.
81
Chapitre 4. CORRECTION DES SYSTEMES
4.5.2 Correcteur proportionnel integral
4.5.2.1 Reglage dans le plan de Black-Nichols
L’action integrale n’est necessaire qu’aux basses frequences, ses effets sur les points du lieu
proches du point critique nuisent a la stabilite et a l’amortissement. Le correcteur proportionnel
integral (PI) pallie cet inconvenient en ne generant de l’effet integral qu’aux basses frequences.
Pour les frequences qui correspondent aux points du lieu proches du point critique, ce correcteur
a un effet integral. La commande du systeme en boucle fermee est proportionnelle a l’erreur et
a l’integrale de l’erreur :
u(t) = kε(t) +k
Ti
∫ t
t0
ε(θ)dθ (4.18)
La fonction de transfert du correcteur PI :
C(p) = k
(
1 +1
Tip
)
(4.19)
Le diagramme de Bode de ce correcteur et ses effets sur le lieu de Black de la FTBO sont
representes sur la figure 4.12.
−180 −135 −90 −45 0−40
−30
−20
−10
0
10
20
30
40
6 dB
3 dB
1 dB
0.5 dB
0.25 dB
0 dB
−1 dB
−3 dB
−6 dB
−12 dB
−20 dB
−40 dB
Phase BO (deg)
Gai
n B
O (
dB)
0
5
10
15
20
25
Gai
n (d
B)
10−2
10−1
100
101
−90
−45
0
Pha
se (
deg)
Pulsation (rad/sec)
FTBO_CFTBO_NC
1/Ti
ω0dB
Figure 4.12 – Diagramme de Bode du correcteur PI et ses effets sur le lieu de Black de la FTBO
Le correcteur se comporte comporte comme un correcteur a action integrale pour les pulsa-
tions inferieures a1
Ti. 3 Aux pulsations superieures a
1
Ti, il agit comme un correcteur propor-
tionnel de gain k 4.
3. Dans cette plage de frequences, le gain decroıt avec une pende de -20dB/decade et l’argument vaut −π
2.
4. Dans cette plage de frequences, le gain est constant et le dephasage est nul.
82
4.5. Corriger la precision
Pratiquement, on regle Ti de sorte que1
Ti<< ω0dB. Ainsi, on beneficie d’un gain statique
qui tend vers l’infini, ce qui est favorable a la precision. Aux pulsations superieures a1
Ti, le
correcteur n’introduit qu’un faible retard de phase, ce qui a pour effet de ne pas degrader la
stabilite de la boucle.
4.5.2.2 Poursuite d’un modele de reference
Cette technique vise a conferer au systeme en boucle fermee une fonction de transfert donnee.
A ce propos, la correction proportionnelle integrale permet de regler efficacement les systemes
en boucle ouverte decrits par des fonctions de transfert du type :
S(p)
U(p)=
A
(τp+ 1)(4.20)
En particulier, ces fonctions de transfert decrivent les systemes dont on souhaite controler la
position. La FTBO du systeme corrige :
S(p)
ε(p)= C(p)
A
(τp+ 1)=k(Tip+ 1)
Tip
A
(τp+ 1)(4.21)
La constante de temps Ti est choisie egale a la constante de temps du systeme τ prealablement
identifiee ; de sorte qu’en boucle fermee sur un retour unitaire :
FTBF (p) =S(p)
E(p)=
1TiAk
p+ 1(4.22)
Le systeme boucle se comporte alors comme un systeme du premier ordre de gain statique
unitaire et dont la constante de temps peut etre reglee avec le gain k du correcteur. La diminution
de la constante de temps et par suite du temps de reponse a 5% s’opere en augmentant k. Il
faut toutefois prendre garde au fait que l’amplitude du signal de commande est d’autant plus
elevee que k est grand. On montre en effet que u(0) = ke0 ou u(0) et e0 sont respectivement le
signal de commande applique au systeme et l’amplitude de l’echelon de consigne. Pratiquement
les actionneurs qui delivrent les signaux de commande admettent des limitations (par exemple
la course d’une gouverne de vol, l’intensite du courant electrique delivree par une source, etc.)
et lorsque le signal de commande est sature, l’hypothese d’un systeme lineaire ne tient plus.
4.5.3 Correcteur a retard de phase
La precision d’un systeme asservi est d’autant meilleure que le gain statique est grand. Dans
le cas des correcteurs a action integrale, ce gain tend vers l’infini. Toutefois, et pour certaines
applications, l’insertion d’un grand gain dans la boucle ne vas pas sans poser de problemes.
Considerons par exemple le cas du vehicule a voilure tournante decrit sur la figure 1.1 au chapitre
1, il convient d’asservir les angles de gıtes et d’assiette a une consigne. Celle-ci est generalement
nulle lors la phase de decollage. Cependant, tandis que les helices ne tournent pas encore suffisa-
ment vite pour l’arracher au sol qui n’est pas parfaitement a niveau, la boucle d’asservissement
83
Chapitre 4. CORRECTION DES SYSTEMES
va agir sur les vitesses de rotations des helices pour tenter d’amener l’appareil a plat. Comme
l’appareil est au sol et qu’il n’a pas de degre de liberte en rotation, pour corriger l’attitude au
sol, certaines helices vont accelerer et l’appareil se retourner.
Le correcteur a retard de phase permet de regler la precison d’un systeme asservi en lui
apportant un gain statique eleve mais fini, sans toutefois degrader la stabilite. Ce correcteur a
pour fonction de transfert :
C(p) = kτp+ 1
bτp+ 1b > 1 (4.23)
Le diagramme de Bode de ce correcteur represente sur la figure 4.13 montre qu’il se comporte
comme un correcteur proportionnel 5 sur les plages de pulsation [0,1
bτ] ∪ [
1
τ,+∞[ et comme un
correcteur a action integrale dans l’intervalle [1
bτ,1
τ] 6.
L’etude du gain |C(jω)|dB et de l’argument < C(jω) > montrent que ce dernier admet un
minimum a la pulsation :
ωmax =1
τ√b
(4.24)
A cette pulsation :
|C(jωmax|dB = 20 log k − 10 log b (4.25)
< C(jωmax) > = sin−1
(1− b
1 + b
)
(4.26)
Pratiquement, on dimensionne le correcteur de la maniere suivante :
1. on s’impose le gain statique K que l’on veut apporter a la FTBO ,
2. on choisit K = b de sorte que pour les pulsations superieures a 1τ , le correcteur apporte
un gain en dB nul,
3. on choisit τ de sorte que les points du lieu de la FTBO qui risquent, du fait de l’effet
correcteur, de tangenter des isogains trop elevees ou de passer a proximite du point
critique (points ≈ [ω1, ω2] sur la figure 4.13), ne soient pas affectes par l’effet correcteur,
on peut par exemple choisir 1τ = ω1
5. Le gain est constant et la phase est nulle.
6. Le gain decroıt avec une pente de +20dB/decade et la phase est negative.
84
4.5. Corriger la precision
0
2
4
6
8
10
12
14
16
18
20
Gai
n (d
B)
10−2
100
102
−60
−30
0
Pha
se (
deg)
Diagramme de Bode
Pulsation (rad/sec)
0 45 90 135 180 225 270 315 360−60
−50
−40
−30
−20
−10
0
10
20
30
40
6 dB
3 dB
1 dB
0.5 dB
0.25 dB
0 dB
−1 dB
−3 dB
−6 dB
−12 dB
−20 dB
−40 dB
−60 dB
Lieu de Black−Nichols
Phase en BO (deg)
Gai
n en
BO
(dB
)
FTBO_NCFTBO
points du lieu qu’on ne souhaitepas approcher trop près desisogains élevées et du point critique
ω1
ω2
Figure 4.13 – Diagramme de Bode d’un correcteur a retard de phase trace pour k = 10 et son effet sur
le lieu de Black
85
Chapitre 4. CORRECTION DES SYSTEMES
86
CHAPITRE 5
REPRESENTATION D’ETAT DES SYSTEMES
5.1 EXEMPLE INTRODUCTIF
ω4
motor 1 + propeller 1
motor 3+ propeller 3
motor2+propeller2
ω1
ω2
ω3
xb
yb
x (dirige vers le Nord)
y dirige vers l’Est
Figure 5.1 – Vue de dessus du quadrirotor
On s’interesse au quadrirotor represente sur la figure 5.1 et controle autour de son axe de
roulis seul. Dans le repere lie au vehicule, le vecteur qui materialise cet axe est note xb. La mise
en rotation du drone autour de son axe de roulis produit deux composantes du vecteur poussee
reperees, dans un referentiel lie au pilote, par les vecteurs x et z = x ∧ y. L’appareil se deplace
alors en translation dans les directions definies par ces vecteurs.
m designe la masse du drone en kg, Ixx le moment principal d’inertie autour de l’axe de
roulis en kg.m2, k est le coefficient de poussee des helices en N.s2, ℓ la distance du centre de
gravite du quadrirotor au point d’application de la poussee d’une helice en metres, ω1, ω2 les
vitesses de rotation des helices 1 et 2 en rad.s−1,
p designe la vitesse de roulis en rad.s−1 dans le repere attache au vehicule, φ est l’angle de gıte,
vy, vz sont les vitesses de translation du drone dans le repere lie au pilote et y et z designent la
position du centre de gravite du drone dans ce meme repere.
87
Chapitre 5. REPRESENTATION D’ETAT DES SYSTEMES
D’apres le principe fondamental de la dynamique, le theoreme du moment dynamique et les
relations cinematiques afferentes, ce modele a pour expression :
p =kℓ
Ixx
(ω24 − ω2
2
)
vy = − k
m
(ω22 + ω2
4
)sinφ
vz = g − km
(ω22 + ω2
4
)cosφ
φ = p
y = vyz = vz
de la forme X = f(X,U) (5.1)
Ou X =(
p vy vz φ y z)T
et U =(
ω2 ω4
)T.
Le quadrirotor est un systeme dynamique, c’est a dire, dont l’evolution des variables qui le
caracterisent est fonction du temps. Il est decrit par un modele continu, nonlineaire et invariant.
X ∈ R6 designe le vecteur d’etat et ses coordonnees sont appelees variables d’etat, U ∈ R
2
designe le vecteur des commandes. Le choix des variables d’etat ou de commande pour un
systeme donne n’est pas exclusif. A titre d’exemple, on aurait pu definir la poussee P = ω22 +ω
24
et une commande en roulis R = ω24−ω2
2 comme variables constitutives du vecteur de commande.
Si on suppose ce drone equipe d’une centrale d’attitude pour la mesure de la vitesse de
roulis p et de l’angle de gıte, d’un recepteur GPS pour la mesure de la latitude Lat et d’un
telemetre a ultrasons pour la mesure de la hauteur h. Ces capteurs sont supposes parfaits. En
supposant la terre localement assimilable a un plan et RT le rayon terrestre, il vient l’equation
dite d’observation qui exprime les mesures notees avec l’indice m en fonction des variables d’etat
et de commande.
pm = p
φm = p
Latm = atan
(y
RT
)
+ Lat(O)
hm = −z
de la forme Y = h(X,U) (5.2)
Ou Y =(
pm φm Latm hm
)Test appele vecteur des mesures et dont les coordonnees
sont les grandeurs observees au moyen des capteurs qui equipent le quadrirotor. Les mesures ne
s’expriment pas necessairement comme des combinaisons lineaires des etats. On notera egalement
que toutes les variables d’etat ne sont pas necessairement mesurees, cela peut proceder d’une
impossibilite technologique, de contraintes de cout, de masse, d’encombrement, etc.
5.2 EQUATIONS D’ETAT ET D’OBSERVATION
Dans le cas general, le systeme est decrit par n variables d’etat et X est un vecteur de Rn, le
systeme possede m entrees, il peut s’agir d’entrees de commande ou de perturbation, et U est
un vecteur de Rm. Enfin, q variables etant observees Y est un vecteur de R
q.
88
5.2. EQUATIONS D’ETAT ET D’OBSERVATION
5.2.1 Definition d’un point d’equilibre
A l’equilibre {Xe,Ue}, le systeme verifie f(Xe,Ue) = 0. Pour le quadrirotor, un cas parti-
culier d’equilibre est celui correspondant au vol stationnaire.
5.2.2 Linearisation des equations d’etat et d’observation
On se reportera a l’annexe A pour la linearisation des equations. Dans ce qui suit, on notera
x = X − Xe, u = U − Ue et y = Y − Ye respectivement les variations des vecteurs d’etat,
de commande et de mesure autour de leurs valeurs d’equilibre. Ainsi le systeme linearise a pour
expression :
{
x = Ax+Bu
y = Cx+Du(5.3)
Des dimensions des differents vecteurs d’etat, de commande et de mesures, on peut etablir
celles des differentes matrices :
A ∈ Rn×n La matrice d’etat
B ∈ Rn×m La matrice de commande
C ∈ Rq×n La matrice de sortie
D ∈ Rq×m La matrice de transfert direct
(5.4)
5.2.3 Obtention d’une fonction de transfert a partir d’une representation
d’etat
Pour un systeme multivariables, les fonctions de transfert definissent m×q relations entre lesm entrees du vecteur u et les q sorties du vecteur y. Elles donnent du systeme une representation
externe. La transformee de Laplace est appliquee aux equations d’etat et d’observation, les
conditions initiales sont supposees toutes nulles.
pX(p) = AX(p) +BU(p)
⇔ (pIn −A)X(p) = BU(p)
⇔ X(p) = (pIn −A)−1BU(p)
⇒ Y(p) =(
C (pIn −A)−1B+D)
U(p)
(5.5)
ou In designe la matrice identite de dimension n.
C (pIn −A)−1B+D ∈ Cq×m est une matrice de fonctions de transfert qui definit les relations
entre lesm entrees et les q sorties. On observe que le denominateur commun a toutes ces fonctions
de transfert est le polynome caracteristique de la matrice d’etat A et par consequent les valeurs
propres de A sont les poles du systeme. On rappelle, cf. chapitre2, que ces poles, reels et/ou
complexes conjugues, caracterisent les dynamiques de systemes, respectivement d’ordre un et/ou
deux.
89
Chapitre 5. REPRESENTATION D’ETAT DES SYSTEMES
5.3 INTEGRATION DE L’EQUATION D’ETAT
5.3.1 Methode de variation de la constante
On demontre que (Cf. Annexe F) l’equation d’etat (5.3) admet pour solution :
x(t) = eA(t−t0)x(t0) +
∫ t
t0
eA(t−τ)Bu(τ)dτ (5.6)
eAt est une exponentielle de matrice qui peut etre calculee avec la formule de Sylvester (Cf.
Annexe F), elle est appelee matrice de transition et possede les proprietes de l’exponentielle
scalaire.
5.3.2 Integration de l’equation d’etat dans la base modale
Cette methode sera decrite dans la section suivante.
5.4 CHANGEMENT DE BASE
Pratiquement, un meme systeme, peut etre decrit par differents jeux de vecteurs d’etat. Ainsi,
un circuit RLC, classiquement decrit par l’intensite du courant electrique dans l’inductance et la
tension aux bornes du condensateur peut aussi l’etre au moyen du flux magnetique et la charge
electrique.
De meme, il est frequent dans la litterature de trouver des modeles d’aeronefs decrits dans
le repere aerodynamique par la vitesse aerodynamique, les angles d’incidence et de derapage ;
d’autres par les vitesses projetees dans le repere avion 1 .
Ainsi, le modele donne sous forme de representation d’etat pour un systeme n’est pas unique.
En effet, mathematiquement on peut toujours trouver une matrice de passage P qui permette
d’exprimer le vecteur d’etat x decrit dans la base originelle a partir du vecteur d’etat z decrit
dans la nouvelle base :
x = Pz et P admet une inverse (5.7)
Expression que l’on substitue dans (5.3), il vient :
Pz+Pz = APz+Bu
y = CPz+Du(5.8)
En multipliant a gauche par P−1 :
z = P−1APz+P−1Bu
y = CPz+Du(5.9)
1. Il convient de souligner que contrairement a l’exemple precedent les relations qui lient vitesse aerodynamique,
angles d’incidence et de derapage aux vitesses projetees dans le repere avion ne sont pas lineaires.
90
5.5. ANALYSE DU SYSTEME DANS LA BASE MODALE
Il vient :
z = Az+ Bu
y = Cz+ Du(5.10)
Ainsi les matrices d’etat, de commande, de sortie et de transfert directe verifient :
A = P−1AP
B = P−1B
C = CP
D = D
(5.11)
On montre (Cf. Annexe F) que la matrice de fonction de transfert est invariante par chan-
gement de base.
5.5 ANALYSE DU SYSTEME DANS LA BASE MODALE
Si l’on suppose les valeurs propres de A distinctes, au moyen de la matrice de passage P
constituee des vecteurs propres associees aux valeurs propres de A, on peut exprimer le vecteur
d’etat x dans la base originelle a partir du vecteur d’etat z dans la base modale et donner une
representation d’etat du systeme dans cette base. Son interet est fondamental, l’integration de
l’equation d’etat, l’analyse du comportement du systeme en regime dynamique et des proprietes
essentielles telles que la commandabilite et l’observabilite peuvent y etre mises en evidence.
5.5.1 Resolution de l’equation d’etat
Dans la base modale, les valeurs propres {λ1, . . . , λn} etant distinctes, l’equation d’etat
s’ecrit :
⇔
d
dt
z1...
zn
=
λ1. . .
λn
z1...
zn
+
β11 . . . β1m... . . .
...
βn1 . . . βnm
u1. . .
um
y1. . .
yq
=
γ11 . . . γq1
. . . . . ....
γ1n . . . γqn
z1. . .
zn
(5.12)
On a ainsi substitue a un systeme de n equations differentielles du premier ordre couplees
entre elles, n equations differentielles du premier ordre, ce qu’illustre la figure 5.2. On peut
resoudre ces equations avec la methode de variation de la constante. Ainsi, apres integration de
(5.12), il vient :
91
Chapitre 5. REPRESENTATION D’ETAT DES SYSTEMES
z1(t) = eλ1(t−t0)z1(t0) +
∫ t
t0
eλ1(τ−t) (β11u1(τ) + · · ·+ β1mum(τ)) dτ
. . . = . . .
zi(t) = eλi(t−t0)zi(t0) +
∫ t
t0
eλi(τ−t) (βi1u1(τ) + · · ·+ βimum(τ)) dτ
. . . = . . .
(5.13)
zn(t) = eλn(t−t0)zn(t0) +
∫ t
t0
eλn(τ−t) (βn1u1(τ) + · · ·+ βnmum(τ)) dτ
5.5.2 Du sens des valeurs propres
Les poles sont les valeurs propres de la matrice d’etat, ces dernieres conditionnent les per-
formances dynamiques du systeme, stabilite, rapidite, amortissement Cf.2.
5.5.3 Du sens des vecteurs propres
Dans la base originelle x = Pz avec P = pij ∈ C et i, j ∈ [1, n] la matrice des vecteurs
propres. En regime libre, et sans perte de generalites u = 0, les coordonnees du vecteur d’etat
ont pour expression :
x1(t) = p11eλ1tz1(t0) · · ·+ · · ·+ p1je
λjtzj(t0) · · ·+ · · ·+ p1neλntzn(t0)
. . . = . . .
xi(t) = pi1eλ1tz1(t0) · · ·+ · · ·+ pije
λjtzj(t0) · · ·+ · · ·+ pineλntzn(t0)
. . . = . . .
xn(t) = pn1eλ1tz1(t0) · · ·+ · · ·+ pnje
λjtzj(t0) · · ·+ · · ·+ pnneλntzn(t0)
On observe que le je vecteur propre distribue la je valeur propre (ou pole) sur les coordonnees
du vecteur d’etat. Ainsi, le pole λj contribuera d’autant plus a la dynamique de la variable d’etat
✲ ✲ ✲
✻
✲ γ1∫
λ1
+
+β1
✲ ✲ ✲
✻
✲ γn∫
λn
+
+βn
✲ ✲ ✲
✻
✲ γi∫
λi
+
+βi
u y
z1
zi
zn
Figure 5.2 – Representation d’un systeme mono-entree, mono-sortie dans la base modale
92
5.5. ANALYSE DU SYSTEME DANS LA BASE MODALE
xi que le module du coefficient pij est grand, relativement aux autres coefficients du je vecteur
propre.
5.5.4 Exemple : analyse des modes d’un aeronefs
Le modele de la dynamique laterale d’un Boeing 747 evoluant a Mach 0.8 et 40000 pieds est
decrit par les vecteurs d’etat(
β r p φ)
, de commande(
δn δℓ
)
et les matrices suivantes
ou β est l’angle de derapage, p la vitesse de roulis, r la vitesse de lacet, φ l’angle de gıte, δnl’angle de braquage de la gouverne de direction et δℓ l’angle de braquage des ailerons.
A =
−.0558 −.9968 .0802 .0415
.598 −.115 −.0318 0
−3.05 .388 −.4650 0
0 0.0805 1 0
B =
.00729 0
−0.475 0.00775
0.153 0.143
0 0
(5.14)
Spe(A) designe les valeurs propres de A : Spe(A) = {−0.0329± 0.94i,−0.5627,−0.0073} et P
la matrice de passage constituee des vecteurs propres associees.
P =
0.22e±28i 0.0172e180i 0.0067
0.15e±120i 0.0118e180i 0.0404
0.66e±91i 0.4895e180i 0.0105
0.69 0.8717 0.999
(5.15)
Les arguments sont en degres. On exploite ces donnees dans le tableau 6.1.
Etat
Poles −0.0329± 0.394i −0.5627 −0.0073
β 0.22e±28i 0.0172e180i 0.0067
r 0.15e±120i 0.0118e180i 0.0404
p 0.66e±91i 0.4895e180i 0.0105
φ 0.69 0.8717 0.999
ordre 2 1 1
Tableau 5.1 – Poles (valeurs propres) et vecteurs propres de la matrice d’etat
L’analyse des valeurs propres de la matrice d’etat montre que les dynamiques des variables
d’etat procedent de la superposition de deux modes d’ordre un et d’un mode d’ordre deux
tous stables, ce que confirment les chronogrammes de la figure 5.3. L’analyse de la matrice de
passage dans la base modale revele que le mode le plus lent est associe a la quatrieme valeur
propre −0.0073, la structure du quatrieme vecteur propre montre que cette valeur propre affecte
principalement l’angle de gıte φ (module du coefficient egal a 0.999). Le quatrieme chronogramme
de la figure 5.3 montre que l’angle de gıte est principalement affecte par une dynamique du
premier ordre lente.
93
Chapitre 5. REPRESENTATION D’ETAT DES SYSTEMES
0 50 100 150 200 250 300 350 400 450 5000
0.5
1
To:
φ
−0.2
0
0.2
To:
p
0
0.02
0.04
0.06
To:
r
−0.05
0
0.05
To:
β
Figure 5.3 – Reponses a un angle de gıte initial de 1
L’utilisation des arguments se fait comme suit, par exemple, pour le mode d’ordre deux,
la phase de reference etant celle correspondant a l’angle de gıte φ, il apparaıt que l’oscillation
associee a ce mode est pour le roulis p dephasee de 91 , pour le lacet r de 120 pour le derapage β
de 28 . Ce que confirme les chronogrammes obtenus en regime libre pour un angle de gıte initial
φ(0) = 1 .
0 5 10 15 20 25 300.4
0.6
0.8
1
To:
φ
−0.2
0
0.2
To:
p
0
0.02
0.04
0.06
To:
r
−0.05
0
0.05
To:
β
−0.2
0
0.2
To:
p
120°
28°
91°
Figure 5.4 – Mise en evidence du mode d’orde deux
5.5.5 Commandabilite
Definition 2 Un systeme est commandable sur un horizon [t0, tf ] si sur cet intervalle il existe
une commande u(t) qui permette d’amener le vecteur d’etat depuis un etat initial x(t0) choisi
quelconque vers un etat final x(tf ) choisi quelconque. C’est ce qu’illustre la figure 5.5
94
5.5. ANALYSE DU SYSTEME DANS LA BASE MODALE
x(t0)
x(tf )
x1
x2
x3
Figure 5.5 – Illustration de la notion de commandabilite
Pratiquement, pour un systeme, le domaine de commandabilite est ferme et borne sur Rn,
ce sera par exemple le domaine de vol d’un aeronef.
Lorsque le systeme est decrit dans la base modale, s’il apparaıt que la je ligne de la matrice
B est nulle, alors la commande ne permet pas d’agir sur le mode associe au pole λj . Comme
x = Pz, ce que l’equation (5.14) detaille en regime libre, a priori puisque le pole λj contribue
a tous les etats et que son evolution ne peut etre maıtrisee au moyen de la commande, ce sont
donc toutes les coordonnees du vecteur d’etat qui ne peuvent etre controlees. Le systeme est
alors qualifie de non commandable. La figure 5.6 illustre la notion de non commandabilite dans
la base modale pour un systeme mono-entree, mono-sortie.
✲ ✲ ✲
✻
✲ γ1∫
λ1
+
+β1
✲ ✲ ✲
✻
✲ γn∫
λn
+
+βn
✲ ✲ ✲
✻
✲ γj∫
λj
+
+βj = 0
u y
z1
zj
z3
+
++
Figure 5.6 – Notion de commandabilite illustree dans la base modale
Si dans la base modale la matrice B presente plusieurs lignes nulles, le systeme est evidem-
ment non commandable. Pratiquement, on peut s’assurer de la commandabilite du systeme en
verifiant que B n’a pas de lignes nulles 2.
En pratique, un systeme est non commandable s’il est mal concu du fait que le nombre d’ac-
tionneurs qu’il comporte est insuffisant ou parce que des actionneurs sont defaillants.
Les modules des coefficients de la matrice de commande du Boeing 747 deja etudie, exprimee
dans la base modale au moyen des formules de changement de base (5.11) ont pour expression
numerique :
2. Il existe d’autre criteres pour etablir la commandabilite d’un systeme, en particulier, le critere de Kalman.
95
Chapitre 5. REPRESENTATION D’ETAT DES SYSTEMES
Poles
Commandeδn δℓ
−0.0329± 0.394i 1.0994 0.0188
−0.0329± 0.394i 1.0994 0.0188
−0.5627 2.1477 0.2469
−0.0073 2.7555 0.2218
Tableau 5.2 – Sensibilite des modes du Boeing 747 aux commandes de direction et aux ailerons
Ce tableau montre que le controle du mode d’ordre deux dont on a precedemment vu qu’il
etait a l’origine d’une oscillation mal amortie sur toutes les coordonnees du vecteur d’etat (Cf.
figure 5.3 ) est principalement controle par la commande de direction δn (coefficient egal a
1.0994). Au niveau du modele, la perte la commande de direction se traduit par la suppression de
la colonne associee a δn, dans ces conditions, la commande des ailerons δℓ serait particulierement
inefficace pour effacer cette oscillation (coefficient egal a 0.0188).
Pour un systeme presentant k poles non commandables, on montre que les q ×m fonctions
de transfert ne contiennent pas les poles non commandables. Ainsi, le degre du denominateur du
polynome des fonctions de transfert est egal a n− k et est inferieur a la dimension n du vecteur
d’etat.
Un pole λj non commandable mais stable revient naturellement a sa valeur d’equilibre, il
n’y a donc pas de danger pour le systeme. En revanche un pole λj instable non commandable
verra, dans la base modale, la variable d’etat zj diverger sans pouvoir etre controlee. Par suite,
c’est tout le vecteur d’etat x qui diverge sans qu’aucun controle puisse etre opere.
5.5.6 Observabilite
Definition 3 Un systeme est dit completement observable sur l’intervalle de temps [t0, tf ] si
l’observation de la commande u(t) et de la sortie y(t) permet de determiner l’etat initial x(t0).
Cette notion est fondamentale en sciences de l’ingenieur. En effet, si le systeme est observable,
la connaissance de la sequence de commandes qui lui est appliquee et le releve des mesure
permettent d’acceder aux coordonnees du vecteur d’etat qui ne sont pas mesurees. Pratiquement,
cela peut permettre d’estimer des variables qui, pour des raisons liees a des contraintes de cout,
de masse et d’encombrement ne peuvent etre mesurees. Ou encore, d’estimer les valeurs de
parametres inconnus d’un systeme.
Lorsque le systeme est decrit dans la base modale, s’il apparaıt que la je colonne de la matrice
C est nulle, alors la sortie y ne porte aucune information sur le mode associe au pole λj . Comme
x = Pz, alors le mode decrit par λj contribue a tous les etats. Il n’est donc pas possible d’acceder
aux coordonnees du vecteur d’etat. Le systeme est alors qualifie de non observable. La figure
5.7 illustre la notion de non observabilite dans la base modale pour un systeme mono-entree,
mono-sortie.
Si dans la base modale la matrice C presente plusieurs colonnes nulles, le systeme est evi-
demment non observable. Pratiquement, le systeme peut etre mal concu et ne pas etre equipe
des capteurs necessaires. La perte d’observabilite a plus souvent comme origine la perte due a
une panne d’un ou plusieurs capteurs.
96
5.6. Representation d’etat des systemes a temps discret
Pour un systeme presentant k poles non observables, on montre que les q × m fonctions
de transfert ne contiennent pas les poles non observables. Ainsi, le degre du denominateur du
polynome des fonctions de transfert est egal a n− k et est inferieur a la dimension n du vecteur
d’etat.
Un pole λj non observable mais stable revient naturellement a sa sa valeur d’equilibre sans
qu’il y ait a le mesurer pour s’en assurer, il n’y a donc pas de danger pour le systeme. En
revanche un pole λj instable et non observable verra, dans la base modale, la variable d’etat zjdiverger sans que cela puisse etre constate. Par suite, c’est tout le vecteur d’etat x qui diverge
sans que le mode responsable puisse etre observe. Dans ces conditions le systeme ne peut etre
controle. On a en effet vu au chapitre 3 que la commande est elaboree a partir des mesures.
5.6 Representation d’etat des systemes a temps discret
La plupart des systemes, meme s’ils sont continus, sont controles par calculateur. De fait, les
mesures relevees et les commandes qui leurs sont appliquees le sont a des intervalles de temps
discrets. Cet intervalle de temps est appele periode d’echantillonnage. D’autre part, le calculateur
traite et elabore des signaux numeriques discrets dont la resolution est definie par le quantum.
La figure 5.8 illustre un systeme asservi (a), un systeme asservi controle par calculateur dans le
cas ou le capteur est analogique (b), un systeme asservi controle par calculateur dans le cas ou
le capteur est numerique(c).
Generalement, le systeme a commander a un comportement de type passe-bas. Pour respecter
le theoreme de Shanon, la frequence d’echantillonnage doit etre superieure a la frequence de
coupure du systeme a commander.
Dans ce qui suit on note T la periode d’echantillonnage, les notations suivantes sont equiva-
lentes : x(kT ) = xk.
γ1∫
λ1
+
+β1
γn∫
λn
+
+βn
γj = 0∫
λj
+
+βj
u y
z1
zj
z3
+
++
Figure 5.7 – Notion d’observabilite illustree dans la base modale
97
Chapitre 5. REPRESENTATION D’ETAT DES SYSTEMES
5.6.1 Discretisation du modele lineaire invariant continu
Le systeme est decrit par les equations (5.3), dont la solution a pour expression (5.6). Comme
le systeme n’est ”vu” par le calculateur qu’aux instants d’echantillonnage et que la commande
qui lui est appliquee entre deux instants d’echantillonnage est, du fait du bloqueur d’ordre zero,
constante, en choisissant kT = t0 et t = (k + 1)T , (5.6) s’ecrit :
x ((k + 1)T ) = eATx(kT ) +
∫ (k+1)T
kTeA((k+1)T−τ)Bdτ u(kT ) (5.16)
On pose v = τ − kT , il vient :
x ((k + 1)T ) = eATx(kT ) +
∫ T
0eA(T−v)Bdv u(kT ) (5.17)
que l’on identifie a :
xk+1 = Fxk +Guk (5.18)
L’equation d’observation (5.3) devient :
y(kT ) = Cx(kT ) +Du(kT ) (5.19)
que l’on ecrit :
yk = Cxk +Duk (5.20)
IHM
CNA
CAN
Ampli Systeme
Filtreanti-aliasing
data
data
bus
bus
calculateurBOZ+
Capteur
consigne
retour
correcteur Ampli Systeme
Capteur
+
-consigne er
reur
commande
reponsemesure
IHM
CNAAmpli Systeme
data
data
bus
bus
calculateurBOZ+
Capteur
consigne
retour
(a)
(b)
(c)Figure 5.8 – Systeme asservi : (a) temps continu, (b)
98
5.7. RESOLUTION DE L’EQUATION D’ETAT
Le calcul de matrices F et G necessite celui de la matrice de transion eAt. On peut toutefois,
a condition que la periode d’echantillonnage soit tres inferieure a la plus petite constante de
temps du systeme, considerer que eAt ≈ I+At, ainsi :
F ≈ I+AT (5.21)
G ≈ BT (5.22)
Le systeme a temps discret, decrit par sa representation d’etat a pour expression :
xk+1 = Fxk +Guk
yk = Cxk +Duk(5.23)
5.7 RESOLUTION DE L’EQUATION D’ETAT
Le calcul de l’etat xn+1 a partir de la condition initiale x0 est obtenu par iteration de
l’equation d’etat (5.18) :
x(1) = Fx0 +Gu0
x(2) = F2x0 + FGu0 +Gu1
x(3) = . . .
(5.24)
le terme general de la suite a pour expression :
xn+1 = Fn+1x0 +n∑
i=0
Fn−iGui (5.25)
5.7.1 A propos de la stabilite
Les formules de changement de base etablies au §5.4 restent valables.
Dans la base modale, les valeurs propres de F etant supposees toutes distinctes, F est une matrice
diagonale. En regime libre (uk = 0) et soumis a des conditions initiales non nulles z0 6= 0, le
systeme revient a l’equilibre z∞ = 0 si et seulement si |λj | < 1 avec j ∈ {1, . . . , n}.Par suite x = Pz revient a l’equilibre puisque les coordonnees du vecteur d’etat s’ecrivent comme
une combinaison lineaire des modes qui sont tous stables.
On retrouve la condition de stabilite des systemes lineaires a temps discret selon laquelle un tel
systeme est stable si et seulement si le module de ses poles sont tous inferieurs a l’unite.
99
Chapitre 5. REPRESENTATION D’ETAT DES SYSTEMES
−3 −2 −1 0−3
−2
−1
0
1
2
3
0.280.380.50.64
0.8
0.94
0.5
1
1.5
2
2.5
3
0.5
1
1.5
2
2.5
3
0.080.170.280.380.50.64
0.8
0.94
0.080.17
Carte des pôles (continu)
Axe Réel (seconds−1)
Axe
Imag
inai
re (
seco
nds−
1 )
Carte des pôles (discret)
Axe Réel
Axe
Imag
inai
re
−1 −0.5 0 0.5 1−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
0.1π/T
0.2π/T
0.3π/T
0.4π/T0.5π/T
0.6π/T
0.7π/T
0.8π/T
0.9π/T
1π/T
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0.1π/T
0.2π/T
0.3π/T
0.4π/T0.5π/T
0.6π/T
0.7π/T
0.8π/T
0.9π/T
1π/T
p1*
p1
p2
z2=epT
z1=epT
z1* =epT
Figure 5.9 – Poles : cas continu et discret
100
CHAPITRE 6
COMMANDE PAR RETOUR D’ETAT
6.1 EXEMPLE INTRODUCTIF
On etudie la commande d’un avion qui vole a vitesse constante v0 et doit suivre une trajectoire
de reference. On controle l’angle de gıte φ pour amener l’appareil selon un cap ψ donne avec un
ecart de position y nul a la route de reference. Une vue de dessus de ce systeme est representee
sur la figure 6.1. L’angle de gıte φ est positif lorsque l’aile droite est plus basse que l’aile gauche.
Pour etudier ce systeme, on suppose de petites variations de φ, ψ et y autour de leur position
d’equilibre posees egale a zero. Ainsi, les equations linearisees qui decrivent le mouvement de
l’avion s’ecrivent :
ψ =gφ
v0(6.1)
y = v0ψ(t)
ψ < 0
y > 0
couloir aerien
Figure 6.1 – Suivi d’une trajectoire de reference par controle de l’angle de gıte
101
Chapitre 6. COMMANDE PAR RETOUR D’ETAT
Le cap ψ et la distance a la route de reference y sont les variables d’etat, g designe l’acce-
leration de pesanteur. Ces dernieres sont supposees toutes mesurees. Pratiquement ces mesures
peuvent etre obtenues par des releves radiogoniometriques operes sur des balises VOR 1 et l’angle
de gıte φ est la commande de ce systeme.
Pratiquement, l’angle de gıte φ controle par le pilote est regle en fonction de la distance y a
la route de reference et le pilote inclinera d’autant plus les ailes de l’appareil que l’avion en sera
eloigne. Sur la figure 6.1 φ doit etre regle negatif. Cette commande agit a la maniere d’une force
rappel qui vise a ramener l’appareil vers sa position d’equilibre.
Le controle de l’angle de gıte doit egalement tenir compte de la vitesse a laquelle l’appareil
approche de la route de reference ; s’il arrive trop vite, il risque de la depasser. L’equation d’etat
(6.1) montre qu’a vitesse constante, la vitesse d’approche est proportionnelle au cap ψ. Plus
l’avion arrive vite a la route de reference, plus il faut incliner les ailes. Sur la figure φ doit etre
regle positif. Cette commande vise a freiner l’appareil dans son mouvement vers la route de
reference.
Finalement, l’angle de gıte procede de ces deux effets antagonistes. Une loi de commande simple
pourrait s’ecrire :
φ = k1y + k2ψ (6.2)
Avec k1, k2 < 0 pour tenir compte des remarques precedentes. Une telle commande procede
d’une combinaison lineaire des variables d’etat. Elle realise une commande par retour d’etat.
Differentes methodes permettent de determiner les coeffcients k1 et k2 (en fait des gains). Celle
etudiee dans ce cours vise a regler les dynamiques des variables d’etat, il s’agit d’un technique
de commande par placement de poles (valeurs propres) et de vecteurs propres.
6.2 STRUCTURED’UNE COMMANDE PARRETOURD’ETAT
6.2.1 Conditions a la mise en œuvre d’une commande par retour d’etat
Le systeme est decrit par l’equation d’etat (6.3) :
{
x = Ax+Bu
y = Cx+Du(6.3)
Le systeme est suppose commandable et tout le vecteur d’etat est mesure, de fait C = In.
Le systeme dispose de m entrees de commande et u ∈ Rm. On souhaite par ailleurs controler p
variables, soit ζ le vecteurs des variables controlees. Comme on peut controler plus de variables
qu’on ne dispose d’entrees de commande, on a p ≤ m.
Le comportement dynamique du systeme non corrige (en boucle ouverte) est defini par
l’ensemble des valeurs propres de A note spe(A).
La structure retenue pour la commande par retour d’etat :
u = He−Kx (6.4)
avec
1. VHF Omnidirectionnal Range
102
6.3. CALCUL DES MATRICES DE CONTRE-REACTION ET DEPRE-COMMANDE : LE CAS DE LA COMMANDE MODALE
— e : les consignes avec dim(e) = dim(ζ)=p,
— H : la matrice de precommande H ∈ Rm×p,
— K : la matrice de contre-reaction K ∈ Rn×m.
Elle est illustree sur la figure 6.2. En substituant l’equation de la commande (6.4) dans
l’equation d’etat (6.3), on obtient la representation d’etat du systeme corrige :
x = (A−BK)x+BHe
y = Cx+Du
ζ = Mx
(6.5)
Systeme
-
y = x
K
e +
+B C
A
∫+
x
xu
M ζ
H y
Figure 6.2 – Structure de la commande par retour d’etat (D = 0)
6.3 CALCUL DES MATRICES DE CONTRE-REACTION ET
DE PRE-COMMANDE : LE CAS DE LA COMMANDE
MODALE
Le modele est donne, les matrices A, B, C = In, D et M ∈ Rp×n sont supposees connues.
On veut pour le systeme corrige pouvoir regler :
— un comportement dynamique donne, soit des reponses des variables d’etat stables, bien
amorties et rapides,
— le suivi des consignes e en regime permanent.
Or, la dynamique du systeme corrige est definie par les valeurs propres de la matrice d’etat
A−BK (les poles du systeme corrige). Pratiquement :
— on choisit les poles du systeme corrige νi avec i ∈ [1..n] en vue d’atteindre certaines
performances dynamiques (Cf. Chapitre 2),
— on calcule K de sorte que spe(A−BK) = {νi} avec i ∈ [1, ..., n],
— determination de H de sorte qu’en regime permanent (x = 0) on ait par exemple z = e.
103
Chapitre 6. COMMANDE PAR RETOUR D’ETAT
Re
Imξmin
− 1
τ1− 1
τ2
Figure 6.3 – Region du plan complexe ou sont places les poles du systeme corrige
6.3.1 Cas mono-commande
Il s’agit, pour un systeme muni d’une seule entree de commande (u ∈ R) de reguler les n
variables d’etat du vecteur x et de controler une variable de sortie ζ ∈ R . La commandabilite
du systeme doit etre etablie.
Comme le systeme est muni d’une seule entree de commande, la matrice d’entree :
BT =(
b1 . . . bn
)
(6.6)
Puisqu’il s’agit de generer une commande a partir des n variables d’etat, la matrice K recherchee
a la structure suivante :
K =(
k1 . . . kn
)
(6.7)
Les poles regissant la dynamique des variables d’etat x sont les valeurs propres de la matrice
d’etat spe(A−BK) = νj sont fixes, ils garantissent la stabilite, l’amortissement et la rapidite
des regimes transitoires des variables d’etat. Pratiquement, ils sont choisis dans la zone du plan
complexe representee sur la figure 6.3.1.
Le polynome caracteristique de cette matrice a pour expression :
PA−BK(ν) = (ν − ν1) . . . (ν − νn) = νn + an−1νn−1 + . . . a1ν + a0 (6.8)
Ce polynome caracteristique est le determinant de la matrice :
PA−BK(ν) = |νIn − (A−BK)| (6.9)
Dans cette derniere expression, les coefficients de PA−BK(ν) dependent des coefficients ki de
K. Par identification des deux expressions de PA−BK(ν) on en deduit K.
104
6.3. CALCUL DES MATRICES DE CONTRE-REACTION ET DEPRE-COMMANDE : LE CAS DE LA COMMANDE MODALE
Exemple : Apres s’etre assure que le systeme etait commandable et que tout le vecteur d’etat
est mesure, on recherche une matrice de contre-reaction K ayant la structure suivante K =(
k1 k2
)
.
Le calcul et l’analyse des poles du systeme decrit au §6.1 montrent que les deux valeurs
propres de la matrice d’etat sont nulles. Par consequent un tel systeme est instable, on ne peut
donc esperer attendre de l’avion qu’il longe la trajectoire de reference. On envisage donc un
controle de l’angle de gıte opere a partir des mesures du cap ψ et de la distance de l’avion a
la route de reference y. C’est un probleme de regulation puisqu’il s’agit de ramener le vecteur
d’etat a sa valeur d’equilibre, soit ψ = y = 0.
On souhaite que l’appareil revienne a l’equilibre en temps minimum, un depassement de la
trajectoire de reference est tolere. En s’appuyant sur les resultats etablis au chapitre 2 pour
les systemes d’ordre deux, on choisit un facteur d’amortissement ξ = 0.7. Le choix de ωn est
plus delicat, en effet l’abaque 2.11 du tr5% montre que pour ξ = 0.7, le produit ωntr5% ≈ 3.
Or on concoit qu’a vitesse v0 donnee, le temps de retour de l’appareil a l’equilibre depend de
y(0). On observe la une des limites de l’approche lineaire pour laquelle le temps de reponse est
completement independant des conditions initiales ou de la consigne a tenir. Pratiquement, on
choisit y(0) ≤ 100m, compte-tenu du fait que v0 a ete choisie constante et egale a 20m s−1, le
temps minimal mis par l’appareil pour revenir a l’equilibre avec un cap 2 ψ ≤ 30 est de l’ordre
de 10s. On se fixe donc tr5% =, il vient ωn = 0.3rad s−1.
On peut soit :
— calculer les valeurs propres complexes conjuguees de la matrice d’etat corrige spe(A −BK) = {ν1, ν1} = −ξωn ± iωn
√
1− ξ2 (2.22) puis calculer le polynome caracteristique
PA−BK(ν) = ν2 − 2ℜ(ν1) + |ν1|2— ou ce qui revient au meme, calculer directement le polynome caracteristique de cette
matrice en se rappelant que PA−BK(ν) = ν2 + 2ξωnν + ω2n (2.19).
Numeriquement :
PA−BK(ν) = ν2 + 0.42ν + 0.09 (6.10)
a identifier a :
PA−BK(ν) =
∣∣∣∣∣
(
ν 0
0 ν
)
−(
0 0
v0 0
)
+
(gv0
0
)(
k1 k2
)∣∣∣∣∣
(6.11)
PA−BK(ν) = ν2 +gk1v0
ν + gk2 (6.12)
il vient :
K =(
0.84 0.009)
(6.13)
2. On se place dans le cas de petites variations des variables d’etat et de commande autour de leur valeur
d’equilibre.
105
Chapitre 6. COMMANDE PAR RETOUR D’ETAT
La trajectoire de l’avion realisee avec ce reglage est, pour les conditions initiales ψ(0) = 0 et
y(0) = 50m, representee sur la figure 6.4.
0 100 200 300 400 500 600 700−10
0
10
20
30
40
50
x (m)
y (m
)
Trajectoire réelleTrajectoire de consigne
Figure 6.4 – Trajectoire obtenue pour une commande par placement de poles : cas mono-entree
6.3.2 Cas multi-commandes
Si νi est la ie valeur propre de (A −BK) avec i ∈ [1, ..., n] et vi le vecteur propre non nul
associe, on a par definition :
(A−BK)vi = νivi (6.14)
(A− νiIn)vi = BKvi (6.15)
on pose :
wi = Kvi (6.16)
il vient :
(
A− νiIn −B)(
vi
wi
)
= 0 (6.17)
(
A− νiIn −B)
est une matrice de dimension n×(n+m) et definit une application lineaire
de Rn+m → Rn. Le noyau engendre un sous-espace de dimension m. Le vecteur
(
vi wi
)Tpeut
a priori etre choisi quelconque dans le sous-espace engendre par le noyau. Toutefois, la structure
de ce vecteur peut etre reglee pour accentuer ou effacer la dependance de certaines variables
d’etat et de commande a certains modes.
106
6.3. CALCUL DES MATRICES DE CONTRE-REACTION ET DEPRE-COMMANDE : LE CAS DE LA COMMANDE MODALE
Ce calcul est mene pour les n valeurs propres νj et n afin d’obtenir n vecteurs(
vi wi
)T.
On construit les matrices de passage dans la base modale P et la matrice W :
P =(
v1 ... vn
)
(6.18)
W =(
w1 ... wn
)
(6.19)
D’apres (6.16) :
K = WP−1 (6.20)
Si les vi traduisent la sensibilite des commandes aux poles νi, les wi quant a eux traduisent
celles des commandes a ces memes poles, en effet :
u = e−Kx (6.21)
u = e−WP−1x (6.22)
u = e−WP−1Pz d’apres les formules de changement de base (5.11) (6.23)
u = e−Wz (6.24)
(6.25)
Comme dans la base modale les coordonnees zi du vecteur d’etat s’expriment en fonction des
modes (5.13), ces derniers sont distribues sur les commandes de u au travers des vecteurs wi de
W.
Exemple : Cette methode est appliquee au modele du Boeing 747 etudie au chapitre 5 dont
l’analyse des modes decrite dans le tableau 6.1 a revele la presence d’un mode d’ordre deux mal
amorti affectant principalement l’axe de roulis (il s’agit du mode de roulis hollandais ou dutch
roll mode).
On propose dans un premier temps un placement de poles simple, sans se preoccuper de
la structure des vecteurs propres. Les poles corriges sont : spe(A − BK) = {−1 − i,−1 +
i,−1,−0.0075}. Dans ce probleme A ∈ R4×4 et B ∈ R
4×2. Les matrices(
A− νiIn −B)
sont
de dimension 4 × 6 et le calcul du sous-espace nul ou noyau de ces matrices renvoie, pour
chaque valeur propre νi, deux vecteurs(
v1i w1
i
)Tet(
v2i w2
i
)T∈ C
6. Les quatre premieres
composantes de ces vecteurs definissent la sensibilite des variables d’etat aux modes, les deux
dernieres la sensibilite des commandes aux modes.
107
Chapitre 6. COMMANDE PAR RETOUR D’ETAT
poles ν −1± i −1 −0.0075
vecteur propre ~v v11 v2
1 v12 v2
2 v13 v2
3
β 0.1884e±i124 0.0156e±i161 0.1538ei180 0.0303ei180 0.0109ei180 0.0497ei180
p 0.2564e±i166 0.0191e±i136 0.1715ei180 0.0241ei180 0.0401ei180 0.0052
r 0.4362e±i42 0.0982e±i47 0.5889ei180 0.1363 0.0107 0.0010ei180
φ 0.3006e±i179 0.0695ei180 0.6027ei180 0.1343ei180 0.9956ei180 0.0838
vecteur ~w w11 w2
1 w12 w2
2 w13 w2
3
δn 0.7843e±i17 0.0564e±i48 0.4754 0.1081 0.0068 0.0799
δℓ 0.0548e±i140 0.9908 0.1037 0.9748 0.0832 0.9920
Tableau 6.1 – Poles (valeurs propres) et vecteurs propres de la matrice d’etat
A priori toute combinaison lineaire des vecteur convient pour generer les vecteurs ~vi et ~wi
avec i ∈ [1, ..., 4] :
(
vi
wi
)
= γ1
(
v1i
w1i
)
+ γ2
(
v2i
w2i
)
(6.26)
avec γ1, γ2 ∈ R.
Pour cet exemple, on a dans un premier temps retenu γ1 = 1, γ2 = 0. On calcule ensuite les
matrices de passage P (6.18) et W (6.19) dont procede le calcul de la matrice de contre-reaction
K.
K =
β p r φ( )3.8563 −5.0818 −0.1777 0.1536 δn0.4296 −0.2895 −0.2855 −0.0797 δℓ
(6.27)
Les figures 6.5 et 6.6 montrent les vecteurs d’etat et de commande en reponse a un angle de
gıte initial de 20 . La reponse des variables d’etat est a comparer a celle de l’avion non corrige
et illustree sur la figure 5.3. Le mode de roulis hollandais est significativement amorti et le mode
spiral evolue avec une dynamique du premier ordre lente. Ce meme mode spiral affecte tout
autant l’angle de gıte et de roulis que l’angle de derapage et le lacet, mettant ainsi en evidence
un couplage entre les axes de roulis et de lacet. Il faut enfin s’assurer que les debattements des
gouvernes obtenus en calculant u = −Kx sont compatibles avec les amplitudes minimales et
maximales des gouvernes de direction et les ailerons du Boeing 747.
6.3.3 Les techniques de placement de structures propres
Dans le cas d’un systeme possedant m > 1 entrees, la matrice de contre-reaction K contient
m×n coefficients (en fait des gains) alors qu’il y a n poles a regler. On dispose donc de davantage
de parametres de reglage que de reglages a effectuer. On peut mettre a profit cet excedent de
gains pour regler la structure des vecteurs propres. Pratiquement, cela peut permettre de jouer
108
6.3. CALCUL DES MATRICES DE CONTRE-REACTION ET DEPRE-COMMANDE : LE CAS DE LA COMMANDE MODALE
0
0.005
0.01
To:
β
0
0.02
0.04
To:
r
−0.02
−0.01
0
To:
p
0 50 100 150 200 250 300 350 4000
0.5
1
To:
φ
Réponse à un angle de gîte initial de 0.5 rad
Temps (seconds)
Am
plitu
de
Figure 6.5 – Reponses du vecteur d’etat et commandes du Boeing 747
0 1 2 3 4 5 6 7 8
−0.1
−0.08
−0.06
−0.04
−0.02
0
Temps (s)
δ n (rad)
0 50 100 150 200 250 300 350 4000
0.01
0.02
0.03
0.04
0.05
Temps (s)
δ l (rad)
Figure 6.6 – Reponses du vecteur d’etat et commandes du Boeing 747
109
Chapitre 6. COMMANDE PAR RETOUR D’ETAT
sur la sensibilite d’une variable d’etat ou d’une commande a un mode. Par exemple, dans le
cas de la commande de la dynamique laterale du Boeing 747, on pourra rendre l’axe de lacet
independant du mode spiral, ce qui aura pour effet de decoupler les effets des commandes sur
les axes.
L’equation (6.28) montre une structure pour les vecteurs vi etwi choisie telle que les variables
d’etat xj et de commande uk ne contiennent pas le mode caracterise par la valeur propre νi. Pour
un systeme possedant m commandes, on peut annuler m−1 lignes ; × designe un coefficient non
nul.
νi
vi
×0
×
x1xjxn
wi
×0
×
u1ukum
(6.28)
Si on definit les m− 1 vecteurs de contraintes suivants :
cji =1 . . . j . . . n+m( )0 0 1 0 0 (6.29)
cn+ki =
1 . . . . . . n+ k n+m( )0 0 0 1 0 (6.30)
(6.31)
Alors, les m− 1 produits scalaires (6.32) sont nuls :
cji .
(
vi
wi
)
= 0 (6.32)
cn+ki .
(
vi
wi
)
= 0 (6.33)
On a vu precedemment que la resolution des systemes (6.17) renvoyait, pour chaque valeur
propre νi avec i ∈ [1, ..., n], m vecteurs de dimension n+m. Pour que la solution soit un vecteur
unique et ayant la structure definie dans (6.28), on ajoute les m− 1 equations de contraintes de
sorte que l’on ait a resoudre un systeme de n+m− 1 equations a n+m inconnues :
A− νiIn −B
cjicn+ki
(
vi
wi
)
= 0 (6.34)
110
6.3. CALCUL DES MATRICES DE CONTRE-REACTION ET DEPRE-COMMANDE : LE CAS DE LA COMMANDE MODALE
On reitere l’operation pour les n valeurs propres (poles du systeme corrige) et pour chacune
d’elle on s’impose la structure du vecteur propre. Comme precedemment, on construit ensuite
les matrices P et W a partir desquelles on calcule la matrice de contre-reaction K = WP−1.
Le choix des structures des vecteurs propres est souvent delicat. En particulier, on ne peut
contraindre le systeme muni de sa commande par retour d’etat a adopter un comportement
radicalement different de celui qu’il a en boucle ouverte. Par exemple, si l’on se refere au tableau
5.2, il semble fortement deconseille de chercher a decoupler le mode d’ordre deux de la commande
de direction. Sur un modele lineaire de l’appareil, cette commande necessiterait pour la matrice
K des gains tres grands, lesquels conduiraient probablement a une instabilite du systeme si on
testait cette commande sur un modele non lineaire.
6.3.4 Calcul de la pre-commande
La matrice de precommande H est calculee de sorte qu’en regime permanent et pour des
echelons de consigne e ∈ Rp, les p sorties controlees ζ soient a proportionnelles aux consignes :
ζ = diag(
γ1 . . . γp
)
e (6.35)
Pratiquement on choisira diag(
γ1 . . . γp
)
= Ip. En regime permanent, le systeme corrige
etant suppose stable, il vient :
{
0 = (A−BK)x∞ +BHe
ζ∞ = Mx∞(6.36)
ζ∞ = −M(A−BK)−1BHe (6.37)
Comme on cherche a obtenir z∞ = e, on choisit :
— dans le cas ou le nombre d’entrees a controler p est egal au nombre de commande :
H = −(M(A−BK)−1B
)−1(6.38)
— dans le cas ou le nombre d’entrees a controler p est inferieur au nombre de commande :
H = −(M(A−BK)−1B
)†(6.39)
ou A† designe la matrice pseudo-inverse 3 de A.
6.3.5 LA COMMANDE PAR RETOUR DE SORTIE
Pratiquement, il n’est pas toujours possible de mesurer tout le vecteur d’etat. Dans le cas
ou le nombre de capteurs q < n, on envisage dans cette partie une commande de la forme :
u = He−Ky (6.40)
3. Cette matrice verifie A ∈ Re×f et e < f alors AA
†A = A.
111
Chapitre 6. COMMANDE PAR RETOUR D’ETAT
ou K ∈ Rq×n. Dans le cas d’une equation d’observation de la forme 4 :
y = Cx (6.41)
u = He−KCx (6.42)
On reporte (6.38) dans l’equation d’etat (6.3), il vient l’equation d’etat du systeme commande
par retour de sortie :
x = (A−BKC)x+BHe (6.43)
Si νi est la ie valeur propre de (A−BKC) avec i ∈ [1, ..., q] et vi le vecteur propre non nul
associe, on a par definition :
(A−BKC)vi = νivi (6.44)
on pose :
wi = KCvi (6.45)
(
A− νiIn −B)(
vi
wi
)
= 0 (6.46)
Ce calcul est mene pour q valeurs propres νj afin d’obtenir q vecteurs(
vi wi
)T. Comme
pour la commande par retour d’etat, on construit la matrice de passage dans la base modale P
et la matrice W :
P =(
v1 ... vq
)
(6.47)
W =(
w1 ... wq
)
(6.48)
D’apres (6.45) :
K = W(CP)−1 (6.49)
Comme on ne peut fixer que q < n valeurs propres, les n−q valeurs propres restantes prennentdes valeurs quelconques dans R et/ou C avec le risque de faire apparaıtre des dynamiques mal
amorties ou instables. Ces aspect sera etudie pendant les seances de travaux diriges.
4. Dans la plupart des cas la matrice D = 0
112
6.4. LE CAS DISCRET
6.4 LE CAS DISCRET
Le principe et le calcul de la commande des systemes a temps discret sont identiques au cas
continu. Il convient de placer les poles de la matrice d’etat corrige F−BK a l’interieur du cercle
unite. La figure 5.9 rappelle la correspondance entre les poles dans le plan complexe pour des
systemes continus et leur image dans le plan complexe pour des systemes a temps discret.
113
Chapitre 6. COMMANDE PAR RETOUR D’ETAT
114
CHAPITRE 7
OBSERVATEURS
7.1 EXEMPLE INTRODUCTIF
On souhaite acceder a la vitesse ascencionnelle v d’un mobile qui se deplace verticalement, par
exemple un drone a voilure tournante. Pratiquement, deux types de capteurs sont disponibles :
— un accelerometre qui mesure l’acceleration verticale a,
— un capteur a ultrason qui renvoie la hauteur h.
Ces mesures ne sont disponibles qu’a des intervalles de temps discrets T , cependant les
cinematiques qui decrivent le systeme sont elles continues. On choisit pour vecteur d’etat x =(
h v)T
et d’entree u =(
a)
, il vient :
(
h
v
)
=
(
0 1
0 0
)(
h
v
)
+
(
0
1
)(
a)
(7.1)
(
h)
=(
1 0)(
h
v
)
+(
0)(
a)
(7.2)
Le systeme a temps discret (T=50ms) a pour expression approchee :
(
hk+1
vk+1
)
=
(
1 T
0 1
)(
hkvk
)
+
(
0
T
)(
ak
)
(7.3)
(
hk
)
=(
1 0)(
hkvk
)
+(
0)(
ak
)
(7.4)
On peut evidemment tenter d’estimer la vitesse en integrant une fois la mesure de l’accelera-
tion comme le montre la figure 7.1 (gauche) ou en derivant celle de la position (droite). La figure
de gauche montre la vitesse obtenue tandis qu’il existe une erreur d’estimation de la position
initiale. Celle de droite, la vitesse obtenue a partir de la position tandis que la mesure de celle-ci
115
Chapitre 7. OBSERVATEURS
0 0.5 1 1.5 2 2.5 3−1
−0.5
0
0.5
1
1.5
Temps(s)
v\hat{v}a
0 0.5 1 1.5 2 2.5 3−3
−2
−1
0
1
2
3
4
5
Temps (s)
\hat{v}v
Figure 7.1 – Estimation de la vitesse par integration de l’acceleration et derivation de la position
est bruitee par un bruit blanc gaussien de variance egale a 1.10−4m2. Dans les deux cas, par
comparaison a la vitesse reelle, on constate que l’estimation de la vitesse presente des erreurs
qui rendent son exploitation difficilement exploitable.
Dans ce qui suit, des observateurs, systemes dynamiques charges d’estimer les variables d’etat
qu’on ne sait ou ne peut mesurer sont etudies. Dans un premier temps, tous les signaux seront
supposes deterministes.
Les systemes etudies sont pour la plupart a temps continu. Cependant les observateurs sont
implementes sur des calculateurs et exploitent des mesures echantillonnees 1. Ils realisent donc
des systemes dynamiques a temps discret. Les observateurs sont parfois appeles capteurs logiciels.
Le observateurs presentent de nombreux interets :
— Dans le cas de la commande par retour d’etat, celle-ci requiert que l’on ait acces a tout le
vecteur d’etat u = He−Kx. Pratiquement, pour des raisons de cout, d’encombrement, de
masse, on ne peut disposer de tous les capteurs necessaires pour mesurer tous le vecteur
d’etat. Un observateur permet d’estimer les etats que l’on ne mesure pas, la commande
est alors realisee a partir des etats estimes. On parle alors de commande par retour d’etat
estime.
— Certains parametres d’un systeme peuvent etre inconnus, neanmoins la loi qui regit leur
evolution au cours du temps en fonction des variables d’etat est quant a elle connue,
c’est par exemple le cas d’un parametre p inconnu mais dont la valeur est constante dans
le temps. Dans ce cas, on augmente le vecteur d’etat en ajoutant a l’equation d’etat
l’equation d’evolution p = 0. Sous reserve que le systeme augmente soit observable, un
observateur permet d’estimer le vecteur d’etat et en particulier le parametre inconuu p.
— Les methodes de diagnostic de defaut utilisent des observateurs en vue d’estimer le vecteur
d’etat des systemes surveilles. Par comparaison de ces estimations aux mesures operees
sur le systeme, un traitement ad’hoc des signaux permet de detecter et de localiser les
elements defaillants.
1. Il est evidemment possible d’etudier et de realiser des observateurs a temps continu.
116
7.2. EQUATIONS DE L’OBSERVATEUR
7.2 EQUATIONS DE L’OBSERVATEUR
Le systeme dont on desire estimer le vecteur d’etat a pour modele (7.5), en outre il est
observable.
xk+1 = Fxk +Guk (7.5)
yk = Cxk +Duk
L’observateur est un systeme dynamique, lui-meme decrit par une representation d’etat.
L’estimation du vecteur d’etat notee x procede des entrees u et des mesures y respectivement
appliquees et prelevees sur le systeme. Les equations de l’observateur :
xk+1 = Sxk +Muk + Lyk (7.6)
yk = Cxk +Duk
On definit l’erreur d’estimation εk = xk − xk dont on desire qu’elle tende vers zero lorsque k
tend vers l’infini. Ainsi les etats estimes tendent vers les etats reels. Il convient de souligner que
le vecteur εk n’est pas accessible en ce sens ou les variables d’etat ne sont pas toutes mesurees.
εk+1 = xk+1 − xk+1
εk+1 = Fxk +Guk − Sxk −Muk − Lykεk+1 = Fxk +Guk − Sxk −Muk − L(Cxk +Duk)
εk+1 = (F− LC)xk + (G−M− LD)uk − Sxk − Sxk + Sxk
εk+1 = (F− LC− S)xk + (G−M− LD)uk + Sεk
(7.7)
Les matrices S, M, L sont choisies de sorte que εk+1 ne depende ni du vecteur d’etat xk ni du
vecteur d’entrees uk. Si les conditions :
F− LC− S = 0
G−M− LD = 0 (7.8)
sont verifiees. Il vient :
εk+1 = (F− LC)εk (7.9)
Les matrices F et C etant donnees, les erreurs d’estimations tendent vers zero lorsque k tend
vers l’infini si le choix de la matrice L garantit que toutes les valeurs propres de F − LC ont
leur module inferieur a l’unite.
En outre, l’observateur doit etre plus rapide que le systeme observe, la matrice L doit etre
choisie de telle sorte que les dynamiques des erreurs soit plus rapides que celles des etats. Au-
trement dit, dans le plan complexe, pour un systeme a temps discret, le plus grand module des
117
Chapitre 7. OBSERVATEURS
valeurs propres de la matrice d’etat de l’observateur F−LC doit etre plus petit que le plus petit
module des valeurs propres de F.
spe(F) = λi avec i ∈ [1, . . . , n], spe(F− LC) = µj avec j ∈ [1, ..., n] alors min |λi| > max |µj |Toutefois, on observe que, plus les valeurs propres de F− LC sont choisies petites, plus les
coefficients de la matrice L (qui en fait sont des gains) sont grands. Or ces gains traitent les
mesures y, si ces dernieres sont bruitees, le vecteur d’etat estime sera alors entache de bruits.
Finalement, l’equation d’etat de l’observateur s’ecrit :
xk+1 = Fxk +Guk︸ ︷︷ ︸
prediction
+L(yk − yk)︸ ︷︷ ︸
innovation
(7.10)
yk = Cxk +Duk︸ ︷︷ ︸
prediction
Ces equations montrent que l’estimation du vecteur d’etat procede d’une part du modele du
systeme, c’est la prediction. La prediction du vecteur d’etat peut etre realisee alors meme que le
systeme ne fonctionne pas, en s’appuyant sur le seul modele. On parle egalement d’estimation a
priori.
L’ecart entre les mesures reelles et les mesures predites est exploite et realise l’innovation en
ce sens ou les mesures apportent de la nouveaute et contribuent a une meilleure estimation du
vecteur d’etat. L’estimation obtenue apres traitement des mesures est qualifiee d’estimation a
posteriori.
Systeme
retardT
+
+ +
+
-
yk
yk
xk
L
G C
F
uk
xk+1
Figure 7.2 – Structure de l’observateur a temps discret
7.2.1 OBSERVATEUR IDENTITE
Il s’agit, pour un systeme muni d’un seul capteur (y ∈ R) d’estimer les n variables d’etat du
vecteur x ∈ Rn. L’observabilite du systeme doit etre etablie.
Comme le systeme est muni d’un seul capteur, le vecteur de mesure est reduit a un scalaire.
C =(
c1 . . . cn
)
(7.11)
118
7.2. EQUATIONS DE L’OBSERVATEUR
Puisqu’il s’agit d’estimer les n variables d’etat a partir d’une seule mesure, la matrice L
recherchee a la structure suivante :
LT =(
ℓ1 . . . ℓn
)
(7.12)
On suppose en outre la matrice de transfert direct D = 0.
Les poles regissant la dynamique des erreurs d’estimation ε qui sont les valeurs propres de
la matrice d’etat spe(F− LC) = µj sont fixes, ils verifient les conditions enoncees supra. Le
polynome caracteristique de cette matrice a pour expression :
PF−LC(µ) = (µ− µ1) . . . (µ− µn) = µn + an−1µn−1 + . . . a1µ+ a0 (7.13)
Ce polynome caracteristique est le determinant de la matrice :
PF−LC(µ) = |µIn − (F− LC)| (7.14)
Dans cette derniere expression, les coefficients de PF−LC(µ) dependent des coefficients ℓi de
L. Par identification des deux expressions de PF−LC(µ) on en deduit L.
7.2.1.1 Exemple : estimation de vitesse (suite)
Le systeme etudie dans l’exemple indroductif est observable. Il possede une entree, l’acce-
leration mesuree et une sortie, la position mesuree par le capteur a ultrasons. On peut donc
estimer la vitesse verticale en mettant en œuvre un observateur identite.
Les poles de ce systeme sont les valeurs propres de la matrice d’etat spe(F) = {1, 1}. On
choisit pour regler la dynamique des erreurs les valeurs propres de F−LC a l’interieur du cercle
unite, soit spe(F− LC) = {−0.5, 0.5}.Le polynome caracteristique de F− LC :
PF−LC(µ) = (µ+ 0.5)(µ− 0.5) = µ2 + 0.25 (7.15)
a identifier a :
PF−LC(µ) =
∣∣∣∣∣
(
µ 0
0 µ
)
−(
1 T
0 1
)
+
(
ℓ1ℓ2
)(
1 0)∣∣∣∣∣
(7.16)
PF−LC(µ) =
∣∣∣∣∣
(
µ 0
0 µ
)
−(
1 T
0 1
)
+
(
ℓ1ℓ2
)(
1 0)∣∣∣∣∣
(7.17)
PF−LC(µ) =
∣∣∣∣∣
(
µ− 1 + ℓ1 −Tℓ2 µ− 1
)∣∣∣∣∣= µ2 + (ℓ1 − 2)µ+ Tℓ2 + 1− ℓ1 (7.18)
119
Chapitre 7. OBSERVATEURS
Figure 7.3 – Le systeme continu et l’observateur a temps discret representes sous SIMULINK
120
7.3. OBSERVATEUR DE LUENBERGER
0 0.5 1 1.5 2 2.5 3−1
0
1
2
3
4
5
hv\hat{h}\hat{v}
Figure 7.4 – Les etats reels (h, v)T et estimes (h, v)T simules
Il vient ℓ1 = 2, ℓ2 = 15. Cet observateur est simule sous SIMULINK (cf. 7.3).
Les resultats des simulations sur la figure 7.4 montrent que les conditions initiales des etats
estimes, toutes deux choisies a zeros, different ce celles des etats reels h(0) = 0.3m et v(0) =
−0.2m/s. Toutefois, apres 0.5s et quelques oscillations, le vecteur d’etat estime tend vers le
vecteur d’etat reel. La dynamique des erreurs d’estimation illustree sur la figure 7.5 depend du
choix des poles de l’observateur, dans le cas present, le fait d’avoir choisi un pole reel negatif
conduit a des suites alternees pour les erreurs.
7.3 OBSERVATEUR DE LUENBERGER
Dans le cas ou q > 1 capteurs equipent le systeme, la methode precedente pour determiner
le gain L ne peut plus etre utilisee. On procede comme dans le cas de la commande par retour
d’etat d’un systeme MIMO en utilisant une technique de placement de poles (valeurs propres)
et de vecteurs propres. La matrice C ∈ Rq×n est de rang colonne m. La methode presentee infra
peut aussi etre utilisee pour un systeme equipe de q = 1 capteur.
On utilise la propriete
spe(F− LC) = spe(F− LC)T (7.19)
Si µi est la ie valeur propre de (F − LC)T (µi est egalement valeur propre de F− LC avec
i ∈ [1, ..., n]) et −→v i le vecteur propre non nul associe, on a par definition :
121
Chapitre 7. OBSERVATEURS
0 0.5 1 1.5 2 2.5 3−5
−4
−3
−2
−1
0
1
εv
εv
Figure 7.5 – Les erreurs d’estimation
(F− LC)T~vi = µi~vi (7.20)
(FT −CTLT )~vi = µi~vi (7.21)
(FT − µiIn)~vi = CTLT~vi (7.22)
on pose :
~wi = LT~vi (7.23)
il vient :
(
FT − µiIn −CT)(
~vi
~wi
)
= ~0 (7.24)
(
FT − µiIn −CT)
est une matrice de dimension n×(n+q) et definit une application lineaire
de Rn+q → R
n. Le noyau engendre un sous-espace de dimension q. Le vecteur(
~vi ~wi
)Tpeut
a priori etre choisi quelconque dans le sous-espace engendre par le noyau.
Ce calcul est mene pour les n valeurs propres µj et n afin d’obtenir n vecteurs(
~vi ~wi
)T.
On construit les matrices de passage dans la base modale P et la matrice W :
P =(
~v1 ... ~vn
)
(7.25)
122
7.3. OBSERVATEUR DE LUENBERGER
W =(
~w1 ... ~wn
)
(7.26)
D’apres (7.23) :
L = (WP−1)T (7.27)
7.3.1 Exemple : suite et fin
On suppose que la mesure de l’acceleration am est entachee d’une erreur systematique
constante et inconnue b. Comme l’estimation de la vitesse procede de l’integration de l’acce-
leration mesuree, toute erreur sur cette derniere est propagee sur l’estimation. On met en œuvre
un observateur en vue d’estimer cette erreur qui ne peut etre mesuree.
am = a+ b (7.28)
Les equations cinematiques sont inchangees :
z = v (7.29)
v = a (7.30)
v = −b+ am (7.31)
comme b = cte, on exprime ce parametre inconnu comme une variable d’etat que l’observateur
aura a estimer.
b = 0 (7.32)
Le modele augmente 2 de ce systeme continu :
h
v
b
=
0 1 0
0 0 −1
0 0 0
h
v
b
+
0
1
0
(
am
)
(7.33)
(
h
v
)
=
(
1 0 0
0 1 0
)
h
v
b
+
(
0
0
)(
am
)
(7.34)
Le systeme augmente a temps discret (T=50ms) a pour expression approchee :
hk+1
vk+1
bk+1
=
1 T 0
0 1 −T0 0 1
hkvkbk
+
0
T
0
(
amk
)
(7.35)
(
hkvk
)
=(
1 0 0)
hkvkbk
+
(
0
0
)(
amk
)
(7.36)
2. Augmente au sens ou l’on a augmente la dimension du vecteur d’etat.
123
Chapitre 7. OBSERVATEURS
0 0.5 1 1.5 2 2.5 3−6
−5
−4
−3
−2
−1
0
1
2
Temps (s)
b\hat{b}
0 0.5 1 1.5 2 2.5 3−0.5
0
0.5
1
1.5
2
2.5
Temps (s)
hv\hat{h}\hat{v}
Figure 7.6 – Estimation du biais, de la hauteur et de la vitesse
L’estimation des trois variables d’etat procede de deux mesures. Par consequent la matrice
recherchee L ∈ R3×2.
Le code source permettant de calculer la matrice L sous MATLAB est presente dans l’annexe
G. Dans cet exemple, comme il y a deux capteurs, pour chaque valeur propre µ1, µ2, µ3, les sous-
espaces nuls engendres sont de dimension deux. A priori, toute combinaison lineaire des deux
vecteurs engendres pour obtenir les vecteur ~v1, ~v2, ~v3, ~w1, ~w2, ~w3 convient. Dans un souci de
simplicite, on s’est contente de choisir pour chacun des µi le premier des deux vecteurs resultant
du calcul des noyaux. On aurait pu rechercher les vecteurs ~vi, ~wi qui minimisent la norme L2
de la matrice de l’observateur. En effet, comme en pratique les mesures sont bruitees, plus les
coefficients (en fait des gains) de cette matrice sont petits, moins les bruits sont amplifies.
Tous calculs faits, il vient :
L =
3.3125 −0.0077
65.5426 −0.5625
−58.1979 −5.2043
(7.37)
La structure de l’observateur reste la meme que celle illustree sur la figure 7.3, une constante
egale a 0.1 et simulant l’erreur systematique a ete ajoutee a la mesure de l’acceleration. Les
chronogrammes de la figure 7.6 montrent que l’observateur estime correctement cette erreur
systematique pendant les phases de regime permanent. Un autre choix des valeurs propres de F−LC pourrait permettre une convergence plus rapide des erreurs d’estimation. Le chronogramme
du bas montre les estimations de la hauteur h et de la vitesse verticale v, ces dernieres sont
comparees a h et v. On peut evidemment s’interroger sur l’interet d’un observateur qui estime
des grandeurs par ailleurs mesurees. Comme on le verra dans le chapitre consacre au filtre de
Kalman, dans la pratique les mesures sont bruitees et un observateur permet de reconstruire
une estimation des grandeurs mesurees plus fiables que les mesures elles-memes.
124
CHAPITRE 8
FILTRE DE KALMAN
8.1 EXEMPLE INTRODUCTIF
Soit un avion s’appretant a voler dans des conditions aerologiques perturbees dans une direc-
tion portee par χ. A l’instant t0 = 0, l’avion survole le point o et sa position au sol est reperee
par x. Le pilote dispose avant d’entrer dans la zone de turbulences des donnees suivantes :
— il dispose d’une carte aeronautique,
— il connaıt sa vitesse vb/a par rapport a la masse d’air, celle-ci est supposee constante et
egale a v0,
— il sait que sa vitesse par rapport au sol est vb/g = vb/a + va/g,
— il sait par ailleurs que x(t) = vb/g(t),
— les turbulences sont de nature aleatoire mais il connaıt leur amplitude minimale ∆v et
maximale ∆V .
A ce stade, une premiere difficulte se pose, l’atmosphere est supposee figee 1 et la vitesse des
rafales de vents va/g est uniquement fonction de la position x. La figure 8.1 montre une distri-
bution spatiale sinusoıdale de la vitesse du vent va/g(x). Cependant, vu de l’avion evoluant a
vitesse v0 constante dans la masse d’air, cette vitesse apparaıt comme une fonction sinusoıdale
du temps de pulsation ω =2πv0L
, soit :
va/g(t) = ∆V sin2πv0L
t (8.1)
La distribution spatiale de la vitesse du vent va/g(x) est aleatoire comme l’illustre la figure
8.2. Elle peut donc s’ecrire comme une somme continue de distributions spatiales sinusoıdales de
differentes longueurs L. Cependant, vu de l’avion evoluant a vitesse v0 constante dans la masse
1. C’est l’hypothese de Taylor, elle n’est toutefois valable que si l’amplitude des perturbations aerologiques est
petite devant la vitesse vb/a de l’avion.
125
Chapitre 8. FILTRE DE KALMAN
d’air, cette vitesse apparaıt comme une fonction aleatoire du temps notee wa/g(t).
vb/g(t) = v0 + wa/g(t) (8.2)
x(t) = vb/g(t) (8.3)
Lχ
va/g
Figure 8.1 – Distribution spatiale sinusoıdale va/g(x)
χ
va/g
Figure 8.2 – Distribution spatiale aleatoire va/g(x)
A l’instant t = t0, le pilote predit qu’apres un temps ∆T sa position sera x− = v0∆T , c’est
une estimation a priori, obtenue sur la seule base du modele. En realite, son avion est dans la
position x. Toutefois, la presence des turbulences l’amene a penser que cette estimation a priori
126
8.1. EXEMPLE INTRODUCTIF
o x−=vo∆T
xχ
(v0+∆V )∆T(v0−∆v)∆T
p1
Figure 8.3 – Modele pour l’estimation a priori
o
xχ
p1
y la mesure et son intervalle de confiancey− l’estimation de la mesure a prioriop1−x la distance reelle au waypoint
x−
Figure 8.4 – Modele pour la mesure
est entachee d’une erreur. C’est l’erreur d’estimation a priori, elle est notee x− = x − x− est
evidemment inconnue. Il peut aussi, connaissant les amplitudes minimale ∆v et maximale ∆V
borner l’intervalle au sein duquel il a estime sa position. C’est ce qu’illustre la figure 8.3.
Il peut enfin facilement, avec la carte, calculer la distance qui le separe du waypoint p1, soit
y− = op1− x− une estimation a priori de cette mesure. L’incertitude qui existe sur cette derniere
estimation est dans ce cas egale a celle qui existe sur l’estimation a priori de sa position.
A l’instant t = ∆T le pilote mesure la distance qui le separe du waypoint p1, soit op1 − x
cette distance et y la mesure qu’il en fait (cf. figure 8.4). Il commet alors une double erreur :
1. une erreur lors de la mesure de distance y qui differe 2 de la distance vraie op1 − x. Plus
formellement on ecrit :
y = op1 − x+ v (8.4)
ou v designe un bruit de mesure confondu ici avec l’erreur de mesure.
2. il propage cette erreur dans le calcul de y − y− qui represente l’ecart entre la mesure de
distance et l’estimation a priori de cette mesure operee a t0. Cet ecart est l’erreur de
mesure a posteri (ce calcul d’erreur est posterieur a l’acquisition de la mesure).
Cependant, le pilote a une certaine confiance dans sa mesure qu’il estime tres probablement
juste dans un intervalle. Ce que montre la figure 8.4.
Le pilote peut desormais estimer a posteriori sa position x+. Une strategie raisonnable
consiste a corriger x− en fonction de l’erreur de mesure a posteriori y−y− et en tenant compte de
la confiance qu’il a dans l’estimation a priori et dans la mesure. Sur la figure 8.4, les intervalles
de confiance sont a peu pres identiques. Le pilote pourrait simplement calculer la moyenne de
x− et de op1 − y et adopter comme intervalle de confiance la borne inferieure de l’intervalle des
mesures et la borne superieure de l’intervalle des estimations a priori, ce qu’illustre la figure 8.5.
x+ =1
2x− +
1
2(op1 − y) (8.5)
2. c’est un pilote de planeur et la mesure est visuelle donc imprecise, mais il en irait de meme avec n’importe
quel capteur.
127
Chapitre 8. FILTRE DE KALMAN
o
xχ
p1
y
op1−x
x−
y−
x+
intervalle de confiance de l’estimation a posteriori
Figure 8.5 – Modele pour l’estimation a posteriori
Cet intervalle de confiance a posteriori determine le credit que le pilote porte a l’estimation
a posteriori x+ de x. L’erreur resultante x+ = x+−x est l’erreur d’estimation a posteriori. Si la
mesure permet d’ameliorer la connaissance de la position, l’intervalle de confiance de l’estimation
a posteriori est inferieur ou egal a celui de l’erreur d’estimation a priori.
Le pilote aborde le waypoint p2 suivant en considerant sa position a l’instant T egale a x+dans l’intervalle de confiance defini supra. Il existe de facto une erreur avant meme qu’il estime
a priori la position suivante. Cette erreur va se propager et se cumuler a l’erreur d’estimation
a priori. La mesure de distance au waypoint p2 realisee a l’instant 2∆T doit theoriquement
contenir 3 cette erreur.
Plus tard, a l’instant (k + 1)∆T le pilote n’a besoin que de l’estimation a posteriori et de
l’intervalle de confiance calcules a k∆T pour estimer sa position, le processus est iteratif.
Dans le cas general, le coefficient qui sert a prendre en compte l’erreur de mesure a posteriori
y−y− tient compte, grace a la connaissance des intervalles de confiance, de la fiabilite de chacune
des informations.
x+ = (1− ℓ)x− + ℓ(op1 − y) (8.6)
— S’il fait davantage confiance a la mesure qu’a l’estimation a priori ℓ→ 1
— S’il fait davantage confiance a l’estimation a priori qu’a la mesure ℓ→ 0
De ce qui precede, il apparaıt que des perturbations de nature aleatoire affectent la trajectoire
de l’avion, pour les decrire, il nous faudra faire des rappels de probabilites. Comme ces aleas
sont des fonctions du temps, nous les modeliserons par des bruits, a cet effet nous rappellerons
les resultats de traitement de signal relatifs aux signaux aleatoires. D’autre part, les systemes
que nous etudions sont des systemes dynamiques dont l’etat et les mesures evoluent au cours
du temps et qui sont bruites. Il nous faudra pouvoir decrire comment un bruit se propage et
evolue dans un tel systeme, ce dont rend compte la notion de processus stochastique. Nous
aurons alors a estimer un etat de nature aleatoire a partir d’un modele du systeme entache
d’incertitudes et de mesures bruitees, ce que que traite la theorie de l’estimation. Enfin, nous
presenterons un algorithme de filtrage qui, de maniere iterative et sous certaines conditions,
fournit une estimation optimale de l’etat, c’est le filtre de Kalman.
3. Au sens ou elle empeche la derive de l’intervalle de confiance de l’erreur d’estimation.
128
8.2. PROBABILITES
8.2 PROBABILITES
8.2.1 Vecteur aleatoire
On considere un vecteur X =(
X1 . . . Xn
)Tou chaque composante Xi est une variable
aleatoire pouvant prendre un ensemble continu de valeurs. On note xi la realisation de la variable
aleatoire Xi et x celle de X.
Soit p(x1, x2, . . . , xn) la densite de probabilite conjointe du vecteur X, par definition :
Prob{x′ ≤ X < x′ + dx} = p(x′)dx1dx2 . . . dxn (8.7)
∫ +∞
−∞. . .
∫ +∞
−∞p(x)dx1dx2 . . . dxn = 1 (8.8)
qui traduit l’evenement certain.
Si la densite de probabilite est factorisable
p(x) = p(x1)p(x2) . . . p(xn) (8.9)
Les composantes xi sont independantes.
−1
0
1
2
3
4−1
0
1
2
3
40
0.2
0.4
p(x1)p(x2)
x1 x2
p
0
5 · 10−2
0.1
0.15
p(x1, x2)
Figure 8.6 – Densite de probabilite d’un vecteur aleatoire de R2
La valeur moyenne ou l’esperance mathematique de X est :
x = E[X]
∫ +∞
−∞xp(x)dx1dx2 . . . dxn (8.10)
129
Chapitre 8. FILTRE DE KALMAN
Lorsque la valeur moyenne est nulle, le vecteur est dit centre.
La matrice de covariance de X est :
Σxx = E[(X− x)(X− x)T ] =
∫ +∞
−∞. . .
∫ +∞
−∞(x− x)(x− x)T p(x)dx1dx2 . . . dxn (8.11)
C’est une matrice symetrique dont les valeurs propres sont positives ou nulles.
Σxx =
E[(X1 − x1)2] E[(X1 − x1)(X2 − x2)] . . . E[(X1 − x1)(Xn − xn)]
E[(X2 − x2)(X1 − x1)] E[(X2 − x2)(X2 − x2)] . . . E[(X2 − x2)(Xn − xn)]
. . . . . . . . . . . .
E[(Xn − xn)(X1 − x1)] E[(Xn − xn)(X2 − x2)] . . . E[(Xn − xn)(Xn − xn)]
(8.12)
Les termes diagonaux σ2ii = E[(xi − xi)(xi − xi)] de Σxx sont les variances des variables
aleatoires Xi. La trace de cette matrice represente la somme des variances :
Tr(Σxx) = E[(X− x)T (X− x)] (8.13)
Lorsque cette matrice est diagonale les composantes du vecteur aleatoire X sont dites non
correlees.
Si Σxx n’est pas diagonale, on peut, a partir des termes non diagonaux, calculer les coeffi-
cients de correlation dont la valeur est comprise entre -1 (Xi = −Yj) et 1 (Xi = −Yj). Il sontnuls pour deux variables non correlees.
ρij =E[(Xi − xi)(Xj − xj)]
√
E[(Xi − xi)2]E[(Xj − xj)2](8.14)
On peut evidemment calculer la matrice de covariance de deux vecteurs aleatoires X et Y
de Rn :
Σxy = E[(X− x)(Y − y)T ] (8.15)
8.2.2 Probabilites marginales et conditionnelles
Soit deux vecteurs aleatoires, correles ou non entre eux. Soit p(x,y) leur densite de probabilite
conjointe. Les densites marginales a priori sont :
f(x) =∫ +∞−∞ p(x,y)dy1 . . . dyn g(y) =
∫ +∞−∞ p(x,y)dx1 . . . dxn (8.16)
f(x) et g(y) representent la connaissance a priori que l’on a des phenomenes etudies decrits
par X et Y.
L’information Y = y etant disponible, on entend par probabilite conditionnelle de x|y la
probabilite de realisation x de X sachant la valeur y prise par Y. On la note p(x|y) :p(x,y) = p(x|y)f(x) = p(y|x)g(y) (8.17)
Relations a partir desquelles on etablit la loi de Bayes :
p(x|y) = p(y|x)g(y)
(8.18)
130
8.2. PROBABILITES
8.2.3 Vecteur aleatoire gaussien
C’est un vecteur aleatoire X ∈ Rn qui est completement determine par sa moyenne x et sa
matrice de covariance Σxx et que l’on note X ∼ N (x,Σxx). Il est decrit par la loi de probabilite :
p(x) =1
(2π)n/2|Σxx|1/2exp
{
−1
2(x−x)TΣ
−1xx (x−x)
}
(8.19)
La figure 8.7 represente une loi normale en dimension deux. Sur cette figure les variables
aleatoires sont correlees, de fait les termes non diagonaux de Σxx sont non nuls. Quant aux
termes diagonaux σ211 et σ222, ils refletent la dispersion des valeurs prises par x1 et x2 autour
de leurs moyennes respectives x1 et x2. Pour une loi normale Prob(xi − xi < 3σi) ≈ 0.997. Cet
intervalle a 3σ est parfois utilise par les fabricants de capteurs pour qualifier la precision de leurs
instruments.
−1
0
1
2
3
4−1
0
1
2
3
40
0.2
0.4
p(x1)p(x2)
x1 x2
p
0
0.1
0.2
0.3
p(x1, x2)
Figure 8.7 – Loi de probabilite normale x1 = 1, x2 = 2, σx1= 0.5, σx2
= 1, ρ = 0.4
Propriete 1 Dans le cas gaussien, les notions de non correlation et d’independance sont equi-
valentes. En effet, si la matrice de covariance est diagonale (non correlation), p(x) peut etre
decompose en un produit de n lois normales scalaires (independance).
Propriete 2 Toute combinaison lineaire de vecteurs aleatoires gaussiens est un vecteur aleatoire
gaussien. Soit Y = AX avec X, Y deux vecteurs aleatoires de Rn et A ∈ R
n×n.
La moyenne :
E[Y] = E[AX] = AE[X] = Ax (8.20)
131
Chapitre 8. FILTRE DE KALMAN
La covariance :
E[(Y− y)(Y− y)T ] = E[(A(X− x))(A(X− x)T
)]= AE[(X− x)(X− x)T ]AT = AΣxxA
T
(8.21)
Ainsi la moyenne y = Ax et la covariance Σyy = AΣxxAT suffisent a decrire la loi normale
definie par p(y).
8.3 ESTIMATION
La theorie de l’estimation a pour but de developper des methodes permettant de determiner
au mieux c.-a-d. au sens d’un critere, une estimation du vecteurx du vecteur X a partir des
valeurs y prises par les observations de Y, les deux vecteurs etant correles. Deux points de vue
peuvent etre adoptes :
1. L’experience a ete effectuee et on dispose de y la valeur prise par Y, X est alors un
vecteur aleatoire conditionnel obeissant a la loi de probabilite a posteriori p(x|Y = y).
Le critere d’estimation est le minimum de variance de l’erreur d’estimation a posteriori
X = X− x.
2. L’experience n’a pas encore ete realisee X et Y obeissent a leurs lois de probabilite mar-
ginales ou a priori respectivement definies par f(x) et g(y). On cherche une estimation
x = λ(y) comme estimation de X si la valeur prise par Y est y. Dans le cas d’une estima-
tion x lineaire en la mesure y, on cherche les parametres de la fonction λ qui minimisent
la variance de l’erreur a priori X− λ(Y)
8.3.1 Minimum de variance a posteriori de l’erreur d’estimation
Dans un souci de simplification, on n’envisage qu’un seul critere d’optimisation : le minimum
de variance de l’erreur d’estimation a posteriori .
La matrice de covariance de l’erreur d’estimation a posteriori :
E[XXT|Y] = E[(X− x)(X− x)T|Y] (8.22)
La trace de cette matrice represente la somme des variances conditionnelles π2ii des compo-
santes Xi de X, c’est cette quantite qu’on cherche a minimiser :
E[XTX|Y] = E[(X− x)T(X− x)|Y] = E[XTX|Y]+ xT x−E[XT|Y]x− xTE[X|Y] (8.23)
On note que E[x] = x puisque x est une valeur estimee, elle est donc certaine. L’equation
(8.24) peut encore s’ecrire :
E[XTX|Y] = (x− E[X|Y])T (x− E[X|Y]) + E[XTX|Y]− E[XT|Y]E[X|Y] (8.24)
Seul le premier terme du membre de gauche depend de x, il ne peut etre negatif toutefois, il
s’annule pour :
x = E[X|Y = y] (8.25)
132
8.3. ESTIMATION
La meilleur estimation du vecteur aleatoire X au sens du critere du minimum de l’erreur de
variance a posteriori est l’esperance de X conditionnelle a la valeur y de Y.
8.3.2 Application a une variable aleatoire scalaire
Soit une variable aleatoire scalaire gaussienne : X ∼ N (x, σ2). La mesure Y de cette variable
est entachee d’une erreur de mesure elle-meme gaussienne V ∼ N (0, r2) de sorte que Y = X+V .
Y est une variable aleatoire conditionnelle a la realisation x de X. Elle est elle-meme gaus-
sienne. Ainsi la probabilite y de Y conditionnelle a X = x est decrite par p(y|X = x) qui est
une loi normale ∼ N (x, r2). En effet :
La loi de probabilite marginale :
f(x) =1√2πσ
exp−(x− x)2
2σ2 (8.26)
La loi de probabilite conditionnelle :
E[Y |X = x] = E[X + V |X = x] = E[X|X = x] = x (8.27)
E[Y Y T |X = x] = E[Y 2|X = x] = E[(X+V )2|X = x] = E[X2|X = x]︸ ︷︷ ︸
0
+2xE[V ]︸ ︷︷ ︸
0
+E[V 2] = r2
(8.28)
p(y|X = x) =1√2πr
exp−(y − x)2
2r2 (8.29)
La loi de probabilite marginale :
E[Y ] = E[X] = x (8.30)
E[Y Y T ] = E[Y 2] = E[(X + V )2] = E[X2] + 2xE[v] + E[V 2] = σ2 + r2 (8.31)
g(y) =1√
2π√r2 + σ2
exp−
(y − x)2
2(r2 + σ2) (8.32)
133
Chapitre 8. FILTRE DE KALMAN
La loi de probabilite conditionnelle aux mesures, d’apres (8.26), (8.29), (8.32), en appliquant
la loi de Bayes (8.18), il vient :
p(x|y) = p(y|x)f(x)g(y)
=
1√2πσ
exp−(x− x)2
2σ21√2πr
exp−(y − x)2
2r2
1√2π
√r2 + σ2
exp−
(y − x)2
2(r2 + σ2)
(8.33)
p(x|y) = 1√2π
rσ√r2 + σ2
− exp
(x− x)2
2σ2−(y − x)2
2r2+
(y − x)2
2(r2 + σ2) (8.34)
Apres calculs :
p(x|y) = 1√2π
(rσ√r2 + σ2
)exp−r2 + σ2
2σ2r2
x−x−σ2
r2 + σ2(y−x)
2
(8.35)
Cette expression est une loi normale conditionnelle a la mesure y, de la forme :
p(x|y) = 1√2π√
E[X2|Y ]exp
−(x− E[X|Y ])2
2(E[X2|Y ])2 (8.36)
La meilleure estimation x de x, au sens du minimum de variance a posteriori est :
x = E[X|Y ] = x+σ2
r2 + σ2(y − x) (8.37)
qui admet pour variance a posteriori :
E[X2|Y ] =r2σ2
r2 + σ2(8.38)
Cette derniere est plus petite que r et que σ. Ceci traduit le fait que l’estimation x de X
conditionnelle a la realisation Y = y est meilleure que la connaissance a priori de X et que celle
fournie par Y .
8.3.3 Exemple
Soit une variable aleatoire X de moyenne x = 1 et de variance σ2 = 1. On opere a une
mesure y = 1.7147 de Y = X +V ou V est un bruit centre de variance r2 = 12 . D’apres (8.37) et
(8.38), la moyenne et la variance de X conditionnelles a Y sont respectivement egales a 1.4765
et 13 .
134
8.3. ESTIMATION
— x = 1.4765 est la meilleure estimation a posteriori de x.
— La variance a posteriori est plus petite que les variances a priori de X et de Y , ce qui
signifie qu’on a une meilleure connaissance de X apres avoir mesure Y .
C’est ce qu’illustre la figure 8.8.
−2 −1 0 1 2 30
0.2
0.4
0.6
0.8
1
1.2
f(x)
g(y)p(x|y)
Figure 8.8 – Loi de probabilite normales a priori et a posteriori
La figure 8.9 montre dans le plan (Y,X) les valeurs prises conjointement par X et Y pour
plusieurs realisations x de X et y de Y . Elle montre le sous-espace d’equation (8.37), sous-espace
des estimations optimales conditionnelles aux mesures, et dans le cas particulier ou y = 1.7147,
l’estimation optimale x = 1.4765 et la valeur de x = −0.1135 produite pour la simulation. Cette
derniere reste evidemment inconnue.
135
Chapitre 8. FILTRE DE KALMAN
−4 −2 0 2 4
−2
0
2
4
x
x
Y
X
x = x+ σ2
σ2+r2 (y − x)
Figure 8.9 – Estimation au sens du minimum de variance a posteriori
8.3.4 Orthogonalite
L’erreur d’estimation X = X − x est en moyenne orthogonale a l’estimation x de X. C’est
ce qu’illustre la figure 8.10. Pour cela on calcule l’esperance du produit scalaire de ces deux
vecteurs :
E[(X− x)Tx] (8.39)
E[(X− E[X|Y])TE[X|Y]] (8.40)
E[(XTE[X|Y])− E[X|Y]TE[X|Y]] (8.41)
E[XT ]E[E[X|Y]]− E[E[X|Y]T ]E[E[X|Y]] (8.42)
Comme l’esperance de l’esperance a posteriori est egale a l’esperance a priori (voir annexe) :
E[XT]E[X]− E[XT]E[X] = 0 (8.43)
On verifie bien l’orthogonalite en moyenne de X = X − x a x. L’orthogonalite traduit la
non correlation entre l’erreur d’estimation et l’estimation. Si ces deux variables etaient correlees,
l’erreur porterait une information susceptible d’enrichir la connaissance de X.
136
8.4. NOTIONS DE SIGNAL
x = E[X|Y]
XXH(y)
Y
V
Figure 8.10 – Orthogonalite de X et de x = E[X|Y]
8.4 NOTIONS DE SIGNAL
8.4.1 Signal aleatoire
Un signal aleatoire X(ω, t) est un ensemble de fonctions de la variable t indexes par une
variable ω, laquelle est associee au resultat d’une experience dans laquelle le hasard intervient.
La figure 8.11 represente trois realisations d’un meme processus aleatoire. Dans ce qui suit, on
note le signal aleatoire X(t). Ce signal est connu, au sens des probabilite si la loi de probabilite
conjointe p(x1, . . . , xk, t1, . . . , tk) est connue. Ici, X1 = X(t1), . . . , Xk = X(tk) sont des variables
aleatoires associees aux instants t1, . . . , tk. Cette connaissance constitue une statistique d’ordre
k. Ainsi, connaıtre X(ω, t) equivaut a connaıtre les lois de toutes les variables aleatoires X1,
. . . , Xk, ainsi que toutes leurs interactions. La description complete d’un tel signal requiert une
quantite enorme d’informations ; aussi en pratique on se contentera d’une description partielle.
0 1 2 3 4 5 6 7 8 9 10−2
−1
0
1
2
x(ω
1,t)
0 1 2 3 4 5 6 7 8 9 10−2
−1
0
1
2
x(ω
2,t)
0 1 2 3 4 5 6 7 8 9 10−1
−0.5
0
0.5
1
temps (s)
x(ω
3,t)
tk
t3t
2t1
Figure 8.11 – Resultats de trois experiences aleatoires realisees en fonction du temps
137
Chapitre 8. FILTRE DE KALMAN
8.4.2 Statistique d’ordre 1
Au premier ordre, toutes les realisations sont prises au meme instant ti, et la variable aleatoire
Xi a pour fonction de densite de probabilite :
F (x, ti) = Prob(xi ≤ x) (8.44)
p(x, ti) =dF (x, ti)
dx(8.45)
On a dans ce cours fait l’hypothese que les phenomenes aleatoires etudies etaient decrits par
des lois normales. Comme ces dernieres sont completement definies par leur moyenne et leur
variance, on en donne ici les expressions.
La moyenne statistique :
x(ti) = E[Xi] =
∫ +∞
−∞xip(x, ti)dxi (8.46)
La variance :
σ2x(ti) = E[(Xi − x(ti))2] =
∫ +∞
−∞(xi − x(ti))
2p(x, ti)dxi (8.47)
8.4.3 Statistique d’ordre 2
Au second ordre, les realisations sont considerees a deux instants ti, tj et l’on considere le
couple de variables aleatoires X(ti) = Xi, X(tj) = Xj . La connaissance a deux instants necessite
de connaıtre le lien statistique entre Xi et Xj . On definit une fonction de repartition conjointe :
F (xi, xj , ti, tj) = Prob(Xi ≤ xi, Xj ≤ xj) (8.48)
La densite de probabilite :
p(xi, xj , ti, tj) =∂2F (xi, xj , ti, tj)
∂xi∂xj(8.49)
La fonction d’autocorrelation statistique :
γx(ti, tj) = E[XiXj ] =
∫ +∞
−∞
∫ +∞
−∞xixjp(xi, xj , ti, tj)dxidxj (8.50)
La fonction d’autocovariance statistique :
Cx(ti, tj) = E[(Xi − x(ti))(Xj − x(tj))] = γx(ti, tj)− x(ti) x(tj) (8.51)
8.4.4 Stationnarite
Un processus aleatoire est stationnaire au sens strict si toutes ses proprietes statistiques sont
invariantes dans le temps.
Il est stationnaire au sens large si :
x(ti) = x = cte et var(Xi) = σ2x = cte (8.52)
et si ses caracteristiques du second ordre ne dependent que de l’ecart temporel τ = tj − ti.
γx(ti, tj) = γx(τ) et Cx(ti, tj) = Cx(τ) (8.53)
138
8.4. NOTIONS DE SIGNAL
8.4.5 Ergodicite
Un aleatoire est qualifie d’ergodique s’il y a equivalence entre les valeurs moyennes statistiques
et les valeurs moyennes temporelles.
Moyenne statistique Moyenne temporelle
x = E[X] =∫ +∞−∞ xp(x)dx x(t) = lim
T→+∞1
T
∫ +T2
−T2
x(t)dt
Variance Puissance des fluctuations
var(X) = E[(X − x)2] =∫ +∞−∞ (x− x)2p(x)dx σ2x(t) = lim
T→+∞1
T
∫ +T2
−T2
(x(t)− x(t))2dt
Autocorrelation statistique Autocorrelation temporelle
γx(τ) = E[X(t)X(t+ τ)] Rx(τ) = limT→+∞
1
T
∫ +T2
−T2
(x(t)x(t+ τ))dt
Cette notion est d’un grand interet en pratique car elle permet d’identifier les caracteristiques
statistiques qui seraient celles obtenues d’apres l’etude de N ≫ 1 processus aleatoires a celle
d’un seul processus aleatoire considere a N instants.
8.4.6 Densite spectrale de puissance
La densite spectrale de puissance est la transformee de Fourier de la fonction d’autocorrela-
tion. Dans le cas d’un processus stationnaire au sens large :
Φ(f) =
∫ +∞
−∞γx(τ)e
−j2πfτdτ (8.54)
Reciproquement, la transformee de Fourier inverse de la densite spectrale de puissance est
la fonction d’autocorrelation
γx(τ) =
∫ +∞
−∞Φ(f)ej2πfτdf (8.55)
8.4.7 Bruit blanc
Un bruit blanc a une densite spectrale de puissance constante sur une tres large bande de
frequence. Un signal se rapprochant d’un bruit blanc et son spectre sont representes sur la figure
8.12.
γx(τ) =
∫ +f0
−f0
b2ej2πfτdf =b2sin(2πf0τ)
πτ= 2f0b
2sincπ(2f0τ) (8.56)
La fonction d’autocorrelation γx(τ) tend vers une impulsion de Dirac de poids 2f0b2 lorsque
f0 → +∞. Dans le cas ergodique, autocorrelation temporelle et statistique sont confondues.
Ainsi, la realisation du signal aleatoire b(ti) n’a aucune influence sur celle de b(tj) lorsque ti 6= tj .
139
Chapitre 8. FILTRE DE KALMAN
−0.5
0
0.5
1
1.5
fréquence
Densité Spectrale de Puissance
−2
−1
0
1
2
3
4
5Fonction d’Autocorrélation
τ
b2
f0
−f0
Figure 8.12 – DSP d’un bruit blanc et fonction d’autocorrelation afferente
8.4.8 Bruit blanc discret
On considere une suite discrete d’instants −nT, . . . ,−T, 0, T, . . . , nT avec T ≫ 1
f0et une
sequence aleatoire blanche centree B(kT ) = Bk . On a alors, en faisant l’hypothese d’ergodicite :
Rb(iT, jT ) = γb(iT, jT ) = E[BiBj ] =
{
var(b(i)) si i = j
0 si i 6= j(8.57)
Dans le cas d’un vecteur de bruits blancs gaussiens centres :
{
E[Bi] = 0
E[BiBTj ] = Rbiδij ou δij = 1 si i = j, δij = 0 si i 6= j
(8.58)
Cela signifie que les valeurs prises par b a deux instants distincts ti et tj ne sont pas correlees
et qu’elles sont independantes si le bruit est gaussien. En d’autres termes la realisation de b(ti)
n’influence pas celle de b(tj) lorsque ti 6= tj . Notons egalement que Rb(0) est la puissance du
bruit.
Dans la pratique, les bruits ont un spectre limite en frequence. Ces bruits peuvent etre
obtenus en simulation par filtrage lineaire d’un bruit blanc. Les caracteristiques d’un tel bruit
sont decrites dans la section suivante.
8.5 PROCESSUS STOCHASTIQUES
Soit le systeme decrit par :
Xk+1 = FXk +GUk +Wk
Yk = CXk +DUk +Vk(8.59)
L’equation d’etat :
140
8.5. PROCESSUS STOCHASTIQUES
— X ∈ Rn,
— U ∈ Rm,
— W ∈ Rn est le vecteur de bruit d’etat.
Ce bruit permet d’exprimer le caractere aleatoire du vecteur d’etat 4. Par hypothese, ce bruit
est centre et blanc :
E[Wk] = 0 (8.60)
E[WkWTj ] = Qkδjk Qk ∈ R
n×n (8.61)
L’equation d’observation :
— Y ∈ Rq,
— V ∈ Rq est le bruit de mesure.
Ce bruit exprime le fait que les mesures sont bruitees 5. Par hypothese, ce bruit est centre,
blanc :
E[Vk] = 0 (8.62)
E[VkVTj ] = Rkδjk Rk ∈ R
q×q (8.63)
Les termes diagonaux des matrices Q et R sont respectivement les variances des bruits d’etat
Wi et i ∈ (1, ..., n) et de mesure Vj et j ∈ (1, ..., q). Celles-ci rendent compte de la dispersion des
valeurs prises par les variables d’etat autour de leur moyenne xi. Concernant les capteurs elles
informent quant a la precision des mesures realisees par ces capteurs.
En outre, les sequences des bruits d’etat et de mesure ne sont ni correlees entre elles, ni avec
l’etat initial 6
E[WkVTj ] = 0 (8.64)
E[VkXT0 ] = 0 (8.65)
E[WkXT0 ] = 0 (8.66)
8.5.1 Processus stochastique markoviens
On s’interesse a l’evolution du vecteur d’etat, a celles de sa moyenne et de sa covariance,
tandis que l’equation d’etat est soumise au bruit d’etat. D’apres (5.25) :
Xk+1 = Fk+1X0 +k∑
i=0
Fk−iGUi +k∑
i=0
Fk−iWi (8.67)
4. Dans l’exemple introductif, la position de l’appareil au cours du temps est, du fait de la nature aleatoire
des rafales de vent, elle-meme aleatoire.
5. Dans l’exemple introductif, ce bruit caracterise l’imprecision de la mesure de distance de l’avion a l’amer.
6. Concretement, pour l’exemple introductif, en supposant les bruits gaussiens, la vitesse des rafales de vent
qui affecte la trajectoire de l’aeronef est independante des erreurs de mesure de position realisees par exemple
avec un GPS. Ce qui est plus contestable, les erreurs de mesures de position sont supposees independantes de
la position initiale. Enfin et c’est probablement l’hypothese la moins realiste, la vitesse des rafales de vent est
supposee independante de la position initiale de l’aeronef.
141
Chapitre 8. FILTRE DE KALMAN
Comme le bruit d’etat est centre, la moyenne xk+1 :
E[Xk+1] = xk+1 = Fk+1x0 +k∑
i=0
Fk−iGUi (8.68)
Comme la commande est deterministe, elle ne contribue pas a faire evoluer la covariance de
l’etat, aussi dans un souci de simplification on la choisit nulle. Avec les hypotheses precedentes
(8.64), la matrice de covariance a pour expression :
E[(Xk+1 − xk+1)(Xk+1 − xk+1)T ] = Σxxk+1
= Fk+1Σxx0Fk+1 +
k∑
i=0
Fk−iQiFk−iT (8.69)
Par consequent, la moyenne et la covariance de l’etat a l’instant k + 1 sont predictibles,
elles dependent de la moyenne et de la covariance initiales du vecteur d’etat. Ces dernieres
representent le minimum d’informations necessaire sur le passe pour prevoir son evolution fu-
ture. Un processus stochastique qui verifie cette propriete est qualifie de processus stochastique
markovien.
Si l’etat initial est suppose etre Xk, on peut etablir de maniere iterative les expressions de
la moyenne de la covariance du vecteur d’etat a l’instant k + 1.
La moyenne :
E[Xk+1] = xk+1 = Fkxk +GUk (8.70)
La covariance :
E[(Xk+1 − xk+1)(Xk+1 − xk+1)T ] = Σxxk+1
= FΣxxkFT +Qk (8.71)
8.5.2 Processus stochastique de mesure
On s’interesse a la moyenne et a la covariance du vecteur de mesure tandis que l’equation
d’observation est soumise au bruit de mesure.
La moyenne :
E[Yk] = yk = Cx (8.72)
La covariance :
E[(Yk − yk)(Yk − yk)T ] = CΣxxk
CT +Rk (8.73)
8.5.3 Exemple
Soit le systeme a temps discret stable, decrit par les equations d’etat et d’observation :(
x1k+1
x2k+1
)
=
(
0.8187 0.0861
0 0.9048
)(
x1kx2k
)
+
(
w1k
w2k
)
(8.74)
(
y1ky2k
)
=
(
1 0
0 1
)(
x1kx2k
)
+
(
v1kv2k
)
(8.75)
142
8.5. PROCESSUS STOCHASTIQUES
Les bruits d’etat et de mesure sont supposes centres, blancs, decorreles entre eux ainsi qu’avec
l’etat initial. Les resultats des simulations du processus markovien seul sont rapportes sur les
figures 8.13 a 8.15. A partir de la matrice de covariance de l’etat Σxxk, on a represente sur les
illustrations du haut les ellipses au sein desquelles se trouvent probablement le vecteur d’etat
(probabilite a 1σ soit ≈ 68%) aux instants k. Les ecart-types σ11, σ22 des variables d’etat x1 et
x2 sont en effet les demi-axes de cette ellipse. Le niveau de correlation entre les variables d’etat
est mesure par l’angle forme par le repere constitue de ces demi-axes et celui forme par les axes
des abscisses et des ordonnees.
Sur ces memes figures, l’illustration du bas montre une simulation temporelle du processus. Elle
met en evidence les ecarts des etats a leur moyennes. Ces signaux sont aleatoires et sont presque
toujours contenus dans les intervalles definis a ±3σ. Comme ces intervalles evoluent au fil du
temps, c’est l’incertitude que l’on a quant aux valeurs prises par le vecteur d’etat qui evolue.
— Sur la figure 8.13, les conditions initiales sont parfaitement connues Σxx0 = diag(0, 0)
et E[X0] = x0, en outre il n’y a pas de bruit d’etat. dans ces conditions, l’evolution
du vecteur d’etat est completement deterministe et la covariance de l’etat est nulle ∀k.L’illustration du haut montre, dans le plan de phase, la trajectoire de la moyenne E[Xk] =
xk ∀k ≥ 0.
— Sur la figure 8.14, les conditions initiales sont parfaitement connues Σxx0 = diag(0, 0) et
E[X0] = x0, cependant, il y a du bruit d’etat. La figure du haut montre que les ecart-
types σ11, σ22 des variables d’etat x1 et x2 qui sont les demi-axes de l’ellipse tendent a
augmenter au fil du temps. Cela signifie que l’incertitude que l’on a quant a la connaissance
de ces variables augmente au fil du temps. On observe egalement que les deux demi-axes
de l’ellipse paralleles aux axes des abscisses et des ordonnees pour k = 0 tendent a
s’incliner lorsque k → +∞. Ainsi, les variables d’etat initialement decorrelees tendent a
etre correlees entre elles. Ceci est logique du fait des couplages existant dans la matrice
d’etat.
Comme le systeme est stable, en moyenne, le vecteur d’etat converge vers l’origine lorsque
k → +∞.
— Meme remarque sur la figure 8.15 que pour la figure 8.14 a l’exception du fait que les
conditions initiales ne sont pas connues. La longueur des demi-axes tend a diminuer
lorsque k augmente , cela traduit une meilleure connaissance de l’etat au fil du temps.
La figure 8.16 montre les covariances du bruit d’etat et de mesure. A l’instant initial, on observe
que la connaissance de l’etat est beaucoup plus certaine que celle obtenue par la mesure (l’ellipse
verte est contenue dans l’ellipse rouge). Lorsque k → +∞ l’incertitude sur x1 est moindre que
celle sur la mesure y1 que l’on fait de x1. en revanche, la connaissance de x2 et tout aussi
incertaine que celle de y2.
143
Chapitre 8. FILTRE DE KALMAN
−0.05 0 0.05 0.1 0.15 0.2 0.25 0.3
0
0.5
1
x1
x 2
Σxx
k
E[Xk]
0 5 10 15 20−2
−1
0
1
2x 10
−7
temps (s)
x1−E[x
1]
x2−E[x2]
σ11
σ22
Figure 8.13 – Processus markovien bidimensionnel E[X0] = (0, 1)T , Σxx0= diag(0, 0), Q = diag(0, 0)
−0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8−1
−0.5
0
0.5
1
1.5
x1
x 2
E[Xk]=E[Y
k]
Σxx
k
My
0 1 2 3 4 5 6−2
−1
0
1
2
temps (s)
x1−E[x1]
x2−E[x2]
3σ11
3σ22
−3σ11
−3σ22
k=0
k→ +∞
Figure 8.14 – Processus markovien bidimensionnel E[X0] = (0, 1)T , Σxx0= diag(0, 0), Q =
diag(0.1, 0.2)
144
8.6. FILTRE DE KALMAN
−0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4−1
−0.5
0
0.5
1
1.5
x1, y
1
x 2, y2 E[X
k]=E[Y
k]
Σxx
k
My
0 1 2 3 4 5 6−3
−2
−1
0
1
2
3
temps (s)
x1−E[x1
x2−E[x2
3σ11
3σ22
−3σ11
−3σ22
y1−E[y1
y2−E[y2
3m11
3m22
−3m11
−3m22
k=0
k → +∞
Figure 8.16 – Processus markovien et de mesure bidimensionnels E[X0] = (1, 1)T , Σxx0=
diag(0.001, 0.001), Q = diag(0.005, 0.1), R = diag(0.1, 0.005)
8.6 FILTRE DE KALMAN
Un filtre de Kalman est un filtre recursif qui, a l’instant k+1, estime le vecteur d’etat Xk+1.
Pour cela, il procede en deux temps :
1. a l’instant k, a partir de l’estimation optimale xk|k = E[Xk|Y = yk] du vecteur d’etat
Xk, il utilise le modele pour estimer a priori 7 xk+1|k = E[Xk+1|Y = yk].
7. Avant de disposer de la (k + 1)emesure.
−1 −0.5 0 0.5 1−1
0
1
2
x1
x 2
Σxx
k
E[Xk]
0 5 10 15 20−4
−2
0
2
4
temps (s)
x1−E[x1]
x2−E[x2]
σ11
σ22
k=0
k → +∞
Figure 8.15 – Processus markovien bidimensionnel E[X0] = (0, 1)T , Σxx0= diag(0.5, 0.5), Q =
diag(0.05, 0.05)
145
Chapitre 8. FILTRE DE KALMAN
Ce faisant, il commet une erreur xk+1|k = Xk+1 − xk+1|k dont l’amplitude est, au sens
des probabilites, quantifiee par la covariance de l’erreur d’estimation a priori Pk+1|k =
E[xk+1|kxTk+1|k].
2. a l’instant k + 1 il utilise la mesure yk+1 pour corriger l’estimation a priori xk+1|k et
elabore une estimation a posteriori 8 xk+1|k+1 = E[Xk + 1|Yk+1 = yk+1].
Ce faisant, il commet une erreur xk+1|k+1 = Xk+1 − xk+1|k+1 dont l’amplitude est, au
sens des probabilites, quantifiee par la covariance de l’erreur d’estimation a posteriori
Pk+1|k+1.
Cette estimation a posteriori est alors utilisee pour estimer l’etat Xk+2.
Comme cela a ete montre dans la partie 8.3, une estimation optimale de l’etat est la moyenne
conditionnelle a la mesure, et dans le cas gaussien, l’erreur d’estimation est en moyenne ortho-
gonale a l’estimation. On va utiliser ces deux resultats pour etablir les equations du filtre de
Kalman.
8.6.1 Equations du filtre de Kalman
8.6.1.1 Estimation a priori ou prediction
Soit le systeme decrit par :
Xk+1 = FXk +GUk +Wk (8.76)
Yk = CXk +DUk +Vk (8.77)
Les hypotheses sur les bruits sont celles faites dans la section 8.5. La commande GUk est
deterministe.
E[Xk+1|yk] = E[FXk +GUk +Wk|yk] (8.78)
E[Xk+1|yk]︸ ︷︷ ︸
xk+1|k
= FE[Xk|yk]︸ ︷︷ ︸
xk|k
+GUk + E[Wk|yk]︸ ︷︷ ︸
0
(8.79)
La meilleure estimation a priori ou prediction du vecteur d’etat sachant la ke mesure realisee
est :
xk+1|k = Fxk|k +GUk (8.80)
La figure 8.17 illustre cette operation. L’erreur d’estimation a priori est orthogonale a l’es-
timation a priori. L’estimation optimale est la projection orthogonale de Xk+1 sur Hnq (yk), le
sous-espace 9 de dimension n engendre par les q mesures disponibles a l’instant k.
Ce faisant, une erreur de d’estimation a priori ou erreur de prediction est commise :
xk+1|k = Xk+1 − xk+1|k (8.81)
8. Posterieure a la mesure.
9. Il s’agit de L2 espace des fonctions de carre integrables et muni du produit scalaire.
146
8.6. FILTRE DE KALMAN
xk+1|k
Xk+1
Hnq (yk)
Xk+1|k+1
xk+1|k
Figure 8.17 – Orthogonalite de l’erreur d’estimation xk+1|k et de l’etat estime a priori
Cette erreur est evidemment inconnue, cependant elle peut-etre, d’un point de vue probabi-
liste, quantifiee par la covariance de l’erreur d’estimation a priori
Pk+1|k = E[xk+1|kxTk+1|k] (8.82)
En reportant (8.76) dans (8.81) et dans (8.82) :
Pk+1|k = E[(F(Xk − xk|k) +Wk
) ((Xk − xk|k)
TFT +WTk
)] (8.83)
Comme Xk est fonction de Wk−1 et puisque le bruit d’etat est blanc E[WkWTk−1] = 0, par
suite E[WkXTk ] = 0.
Pk+1|k = FE[(Xk − xk|k)(Xk − xk|k)T ]FT + E[WkW
Tk ] (8.84)
Pk+1|k = FPk|kFT +Qk (8.85)
Avant que la mesure Yk+1 ne soit realisee a l’instant k+1. La meilleure estimation a priori
qu’on puisse en donner yk+1|k est l’esperance conditionnelle de Yk+1 sachant la mesure Yk = yk
effectuee.
La mesure :
Yk+1 = C(FXk +GUk +Wk) +Vk (8.86)
dont la prediction optimale est :
yk+1|k = E[Yk+1|yk] (8.87)
yk+1|k = E [C(FXk +GUk +Wk) +Vk|yk] (8.88)
yk+1|k = Cxk+1|k (8.89)
A ce stade, la mesure Yk+1 n’ayant pas encore ete realisee, il existera une erreur entre la
mesure et sa prediction.
Yk+1|k = Yk+1 − yk+1|k (8.90)
147
Chapitre 8. FILTRE DE KALMAN
La prediction de la mesure est optimale au sens de la moyenne conditionnelle a la mesure.
Par consequent l’erreur de prediction de la mesure Yk+1|k est orthogonale a la prediction yk+1|k.Par suite, toute combinaison lineaire ZYk+1|k avec ∈ R
n×q est orthogononale a Hnq (yk). C’est
ce qu’illustre la figure 8.18.
xk+1|k
Xk+1
Hnq (yk)
Z(Y k+
1|k)
Xk+1|k+1
Hnq (yk+1)
Figure 8.18 – Sous-espace pour les estimations a priori et a posteriori
Toutefois, a ce stade, cette erreur reste inconnue. Elle peut neanmoins etre quantifiee par la
covariance de l’erreur d’estimation a priori :
Mk+1|k = E[Yk+1|kYTk+1|k] = CPk+1|kC
T +Rk (8.91)
8.6.1.2 Estimation a posteriori
A l’instant k + 1, on procede a la mesure Yk+1. L’erreur de prediction de la mesure a pour
expression :
Yk+1|k = Yk+1 − yk+1|k (8.92)
L’erreur de prediction de la mesure Yk+1|k enrichit l’espace Hnq de sorte que l’espace dans
lequel on va proceder a l’estimation a posteriori de l’etat s’ecrit :
Hnq (Yk+1) = Hn
q (Yk)⊕ ZYk+1|k (8.93)
ou ⊕ designe la somme directe de deux sous-espaces vectoriels.
Une estimation optimale de Xk+1 ∈ Hnq (Yk+1). Dans le cas gaussien, elle est lineaire en
l’erreur de mesure (8.37 ) :
xk+1|k+1 = xk+1|k + Lk+1Yk+1|k (8.94)
Lk+1 ∈ Rn×q est une matrice de gains choisie de sorte que l’erreur Xk+1 − LYk+1|k soit
orthogonale a Hnq (Yk+1).
xk+1|k
Xk+1
Hnq (yk)
L k+1.Y
k+1|k
Xk+1|k+1
xk+1|k+1
Figure 8.19 – Orthogonalite de l’erreur d’estimation Xk+1|k+1 et de l’etat estime xk+1|k+1
148
8.6. FILTRE DE KALMAN
xk+1|k
Xk+1
Hnq (yk+1)
L k+1.Y
k+1|k X
k+1|k+1
xk+1|k+1
Xk+1− Lk+
1.Yk+
1|k
Figure 8.20 – Orthogonalite de Lyk+1|k+1 et de Xk+1 − Lyk+1|k
On a, ∀ Z ∈ Rn×q ZYk+1|k ⊥ Xk+1 − Lk+1Yk+1|k, soit :
⇔ E[(Xk+1 − Lk+1Yk+1|k)T (ZYk+1|k)] = 0 (8.95)
⇔ Tr(
E[(Xk+1 − Lk+1Yk+1|k)(ZYk+1|k)T ])
= 0 (8.96)
⇔ Tr(
E[(Xk+1 − Lk+1Yk+1|k)YTk+1|kZ
T ])
= 0 (8.97)
On utilise ce resultat : toute matrice dont la trace est nulle admet une matrice semblable
dont la diagonale est nulle. S’agissant d’une matrice de covariance, cela signifie que toutes
les variances (ou les ecart-types) sont nulles. Par consequent, les variables sont egales a leur
moyenne et les termes non diagonaux de la matrice de covariance sont egalement nuls.
E[(Xk+1 − Lk+1Yk+1|k)YTk+1|kZ
T ] = 0 (8.98)
⇔ E[Xk+1YTk+1|kZ
T ] = E[Lk+1Yk+1|kYTk+1|kZ
T ] (8.99)
⇔ E[(xk+1|k + Xk+1|k)XTk+1|kC
T ]ZT = E[Lk+1Yk+1|kYTk+1|k]Z
T (8.100)
⇔ E[(xk+1|k + Xk+1|k)XTk+1|kC
T ] = Lk+1E[yk+1|kYTk+1|k] (8.101)
⇔ E[(xk+1|kXTk+1|k]
︸ ︷︷ ︸
0
+E[Xk+1|k)XTk+1|k]
︸ ︷︷ ︸
Pk+1|k
CT = Lk+1E[Yk+1|kYTk+1|k]
︸ ︷︷ ︸
Rk+CTPk+1|kC)−1
(8.102)
(8.103)
Le gain de Kalman a donc pour expression :
Lk+1 = Pk+1|kCT (Rk +CPk+1|kC
T )−1 (8.104)
Il ne depend pas de la valeur prise par les mesures. On porte cette expression dans celle de
l’estimation a posteriori :
xk+1|k+1 = xk+1|k + Lk+1yk+1|k (8.105)
Qu’on peut egalement formuler comme suit :
xk+1|k+1 = (I− Lk+1C)xk+1|k︸ ︷︷ ︸
credit accorde a l’estimation a priori
+ Lk+1yk+1︸ ︷︷ ︸
credit accorde a la mesure
(8.106)
149
Chapitre 8. FILTRE DE KALMAN
Ce qui montre que l’estimation a posteriori de l’etat procede pour une part de l’estimation
a priori, laquelle reflete la confiance que l’on a dans le modele. D’autre part, de la mesure et de
la confiance que l’on a en celle-ci.
Il reste enfin a actualiser la matrice de covariance de l’erreur d’estimation Pk+1|k+1 dans le
but de pouvoir evaluer le credit accorde a l’estimation a posteriori.
L’erreur d’estimation a posteriori :
Xk+1|k+1 = Xk+1 − xk+1|k+1 (8.107)
⇔ Xk+1|k+1 = Xk+1 − xk+1|k − Lk+1Yk+1|k (8.108)
⇔ Xk+1|k+1 = Xk+1|k − Lk+1Yk+1|k (8.109)
⇔ Xk+1|k+1 = (I− Lk+1C)Xk+1|k − Lk+1Vk+1 (8.110)
La covariance de l’erreur d’estimation a posteriori :
Pk+1|k+1 = E[Xk+1|k+1XTk+1|k+1]
Pk+1|k+1 = E[((I− Lk+1C)Xk+1|k − Lk+1Vk+1)((I− Lk+1C)Xk+1|k − Lk+1Vk+1)T ]
Pk+1|k+1 = (I− Lk+1C)Pk+1|k(I− Lk+1C)T + Lk+1RkLTk+1 (8.111)
8.6.2 Test de divergence
Une fois la mesure Yk+1 realisee, on peut calculer l’erreur d’estimation de la mesure :
Yk+1|k = Yk+1 − yk+1|k avec yk+1|k = Cxk+1|k (8.112)
Le vecteur Yk+1|k a pour expression :
Yk+1|k = CXk+1 +Vk+1 −Cxk+1|k = CXk+1|k +Vk+1 (8.113)
On peut egalement calculer la covariance de l’erreur de mesure, dont on montre, par une
methode analogue a celle utilisee pour le calcul de (8.91) qu’elle vaut :
Mk+1|k = E[Yk+1|kYTk+1|k] = CPk+1|kC
T +Rk (8.114)
Cette matrice symetrique definie positive porte sur sa diagonale les variances σ2yi des erreurs
de mesure Yk+1|k avec i ∈ [1, ..., q]. Puisque les signaux sont supposes gaussiens, on peut tester
la pertinence de la prediction a l’aune de la mesure. Une fois ces dernieres realisees , on calcule
les erreurs de mesures yk+1|k = yk+1|k − yk+1|k :
|yk+1|k| ≤ 3σyi (8.115)
150
8.6. FILTRE DE KALMAN
8.6.3 Algorithme du filtre de Kalman
Il reprend les equations : (8.80), (8.85), (8.89), (8.91), (8.104), (8.105), (8.111). Le filtre est
dans un premier temps initialise en affectant a l’etat initial X0 la valeur que l’on juge la plus
probable. Ce faisant, on peut commettre une erreur dont on rend compte avec la matrice de
covariance de l’erreur d’estimation de l’etat initial P0. Ici le test de divergence est realise, il
n’est toutefois pas indispensable.
Algorithm 1 Algorithme du Filtre de Kalman sur un horizon k = kf
Estimation de l’etat initial X0
Covariance de l’erreur d’estimation de l’etat initial P0
repeat
Estimation a priori du vecteur d’etat xk+1|k = Fxk|k +GUk
Estimation a priori du vecteur de mesure yk+1|k = Cxk+1|kCalcul de la covariance de l’erreur d’estimation a priori Pk+1|k = FPk|kF
T +Qk
Calcul de la covariance de l’erreur de mesure Mk+1|k = CPk+1|kCT +Rk
Mesure yk+1 de Yk+1
if diag(Mk+1|k) > 3diag(yi+1 − yi+1|i) thenReinitialiser Xk|k, Pk|kRevenir a l’estimation du vecteur d’etat a priori
end if
Calcul du gain de Kalman Lk+1 = Pk+1|kCT (Rk +CPk+1|kC
T )−1
Estimation du vecteur d’etat a posteriori xk+1|k+1 = xk+1|k + Lk+1(yk+1 − yk+1|k)Calcul de la covariance de l’erreur d’estimation a priori Pk+1|k+1 = (I−Lk+1C)Pk+1|k(I−Lk+1C)T + Lk+1RkL
Tk+1
until k = kf
8.6.4 Exemple
On met en œuvre un filtre de Kalman pour l’exemple presente dans l’introduction. La vitesse
vx de l’avion dans la masse d’air est egale 100m/s, elle est supposee constante. Les etudes sont
menees en fonction des conditions meteorologiques et de la connaissance des conditions initiales.
On ne mesure que la position x de l’avion par rapport au sol, pour cela on dispose d’un GPS
dont la precision est definie par le constructeur a 1σ = 1m. Soit y cette mesure. La position
initiale x0 est a priori egale a zero mais n’est pas necessairement connue. Le systeme est decrit
par le modele suivant :
(
xk+1
vk+1
)
=
(
1 1
0 1
)(
xkvk
)
+
(
0
wk
)
(8.116)
yk =(
1 0)(
xkvk+1
)
(8.117)
La matrice de covariance du bruit de mesure est donc telle que : R = σ2 = 1 On se reportera
a l’annexe G pour le detail du code implemente sous MATLAB.
151
Chapitre 8. FILTRE DE KALMAN
8.6.4.1 Les condition initiales sont parfaitement connues, il n’y a pas de bruit
d’etat
— Comme il n’y a pas de rafales de vent, la matrice Q =
(
0 0
0 0
)
,
— l’etat initial est connu, aussi x0 = 0m, v0 = 100m/s
— par consequent La matrice P0 =
(
0 0
0 0
)
.
0 20 40 60 80 100−6
−4
−2
0
2
4
6Position
erreur de position estiméeerreur de mesure de position
0 20 40 60 80 100100
100
100
100
100
100Vitesse
vitessevitesse estimée
0 20 40 60 80 1000
0.5
1
1.5
2
Trace de Pk|k
0 20 40 60 80 1000
0.1
0.2
0.3
0.4Gain de Kalman
correction positioncorrection vitesse
Figure 8.21 –
La figure 8.21 montre que l’amplitude des erreurs d’estimation de la position est inferieure
a celle des erreurs de mesures 10, on peut conclure que la position estimee par le filtre est plus
credible que celle proposee par la mesure. La trace de la matrice de covariance de l’erreur
d’estimation et les gains de Kalman sont toujours nuls, le filtre fait donc completement confiance
au modele et pas du tout aux mesures.
8.6.4.2 Les condition initiales sont mal connues, il n’y a pas de bruit d’etat
— La matrice Q =
(
0 0
0 0
)
,
— La position initiale est connue avec incertitude aussi utilise-t-on la mesure de position
pour le determiner x0 = y(0), la vitesse initiale est supposee connue v0 = 100m/s,
— par consequent La matrice P0 =
(
R 0
0 0
)
=
(
1 0
0 0
)
10. En pratique, ces grandeurs sont inaccessibles.
152
8.6. FILTRE DE KALMAN
0 5 10 15 20−2
−1
0
1
2Position
erreur de position estiméeerreur de mesure de position
0 5 10 15 2099
99.5
100
100.5
101Vitesse
vitessevitesse estimée
0 5 10 15 200
0.2
0.4
0.6
0.8
1
Trace de Pk|k
0 5 10 15 200
0.1
0.2
0.3
0.4
0.5Gain de Kalman
correction positioncorrection vitesse
Figure 8.22 –
Les resultats des simulations sont rapportes sur la figure 8.22. Comme on ne connaıt pas
precisement la position initiale p11(0) = 1, on exploite la mesure R = 1, le gain de Kalman vaut
initialement 0.5 ce qui signifie que l’estimation de la position procede pour 50% des mesures
et pour 50% du modele. Par la suite, comme il n’y a pas de rafales de vent, donc pas de bruit
d’etat, on fait davantage confiance au modele. A plus long terme, le gain de Kalman tend vers
zero et l’estimation ne repose plus sur la mesure mais uniquement sur le modele.
8.6.4.3 Les condition initiales sont connues, il y a des rafales de vent
Les rafales de vent ont une amplitude maximale de 3√2m/s, leur vitesse moyenne est sup-
posee nulle.
— La matrice Q =
(
0 0
0 2
)
,
— L’etat initial est connu avec certitude, aussi on fixe x0 =(
0 100)
y(0),
— par consequent La matrice P0 =
(
0 0
0 0
)
153
Chapitre 8. FILTRE DE KALMAN
0 10 20 30 40 50−3
−2
−1
0
1
2
3Position
erreur de position estiméeerreur de mesure de position
0 10 20 30 40 5090
95
100
105
110
115Vitesse
vitessevitesse estimée
0 10 20 30 40 500
1
2
3
4
Trace de Pk|k
0 10 20 30 40 500
0.2
0.4
0.6
0.8
1Gain de Kalman
correction positioncorrection vitesse
Figure 8.23 –
A l’instant initial, l’etat initial est connu, on fait donc confiance au modele seul et on n’a pas
besoin des mesures. Ainsi le gain de Kalman et la trace de la matrice de covariance de l’erreur
d’estimation sont nuls, c’est ce que montre la figure 8.23. Plus tard, du fait de la presence des
rafales de vent, le modele est moins fiable et on a besoin des mesures. On observe que le gain de
Kalman utilise pour l’estimation de la position tend vers 0.8, ce qui signifie qu’on fait confiance
aux mesures a hauteur de 80%. Ce qui est normal car le vecteur d’etat est davantage bruite
que les mesures. On observe d’ailleurs qu’en terme d’amplitude, les erreurs d’estimation et de
mesure sont comparables, a la limite, pour acceder a la position, la mesure de position pourrait
suffire.
8.6.4.4 Les condition initiales sont mal connues, il y a des rafales de vent
Les rafales de vent ont une faible amplitude, leur vitesse moyenne est supposee nulle.
— La matrice Q =
(
0 0
0 0.1
)
,
— L’etat initial est connu avec incertitude, on fixe x0 =(
0 100)
y(0) mais x(0) est different
et inconnu,
— On utilise le capteur de position comme moyen de connaıtre x(0), par consequent La
matrice P0 =
(
0 0
0 1
)
154
8.6. FILTRE DE KALMAN
0 20 40 60 80 100−3
−2
−1
0
1
2
3Position
erreur de position estiméeerreur de mesure de position
0 20 40 60 80 10097
98
99
100
101
102
103
104Vitesse
vitessevitesse estimée
0 20 40 60 80 1000.5
0.6
0.7
0.8
0.9
1
Trace de Pk|k
0 20 40 60 80 1000
0.1
0.2
0.3
0.4
0.5
0.6
0.7Gain de Kalman
correction positioncorrection vitesse
Figure 8.24 –
A l’instant initial, l’etat initial est mal connu, on fait donc davantage confiance aux mesures.
Plus tard, du fait de la presence des rafales de vent, le modele est moins fiable et on a besoin
des mesures. On observe que le gain de Kalman utilise pour l’estimation de la position tend vers
0.55, ce qui signifie qu’on fait confiance aux mesures a hauteur de 55% et au modele a 45%. Les
resultats de ces simulations sont illustres sur la figure 8.24.
155
Chapitre 8. FILTRE DE KALMAN
156
ANNEXE A
Linearisation d’un systeme
A.1 Hypothese de linearite
On suppose le comportement du systeme continu et stationnaire decrit par n variables xi, m
entrees de commande uj et p sorties yp. Pour les variables, on admet que son modele peut etre
represente par n equation differentielles, non lineaires dans le cas general :
x1 = f1(x1, x2, . . . , xn, u1, . . . , um)
x2 = f2(x1, x2, . . . , xn, u1, . . . , um)
. . . = . . .
xn = fn(x1, x2, . . . , xn, u1, . . . , um) (A.1)
Pour les mesures, p equations algebriques, non lineaires dans le cas general :
y1 = f1(x1, x2, . . . , xn, u1, . . . , um)
y2 = f2(x1, x2, . . . , xn, u1, . . . , um)
. . . = . . .
yp = fn(x1, x2, . . . , xn, u1, . . . , um) (A.2)
qu’on ecrit plus simplement sous la forme :
X = f(X,U)
Y = h(X,U)
Pour ce systeme, un point equilibre defini par {Xe,Ue} satisfait :
f(Xe,Ue) = 0 (A.3)
Pour disposer d’un modele simple, on linearise les equations du modele non lineaire. Pour cela,
on calcule un developpement en serie de Taylor au premier ordre de (A.3) autour du point
d’equilibre :
157
Annexe A. Linearisation d’un systeme
f(Xe + δX,Ue + δU) ≈ f(Xe,Ue)︸ ︷︷ ︸
=0
+∂f(X,U)
∂XδX+
∂f(X,U)
∂UδU
h(Xe + δX,Ue + δU) ≈ h(Xe,Ue)︸ ︷︷ ︸
=0
+∂h(X,U)
∂XδX+
∂h(X,U)
∂UδU
δX, δU, δY sont respectivement des petites variations des variables et des entrees autour
du point d’equilibre {Xe,Ue}. Soit le modele linearise du systeme :
δX =∂f(X,U)
∂XδX+
∂f(X,U)
∂UδU (A.4)
δX =∂h(X,U)
∂XδX+
∂h(X,U)
∂UδU (A.5)
(A.6)
Xe,Ue Xe + δX,Ue + δU
X,U
(
df
∂X
)
Xe
δX +
(
df
∂U
)
Ue
δU
f(X,U)
δX, δU
f(Xe,Ue)
f(Xe + δX,Ue + δU)
Figure A.1 – Linearisation de f autour d’un point d’equilibre
avec
∂f(X,U)
∂X=
∂f1∂x1
.. ..∂f1∂xn
.. .. .. ..
.. .. .. ..∂fn∂x1
.. ..∂fn∂xn
(A.7)
∂f(X,U)
∂U=
∂f1∂u1
..∂f1∂um
.. .. ..
.. .. ..∂fn∂u1
..∂fn∂um
(A.8)
158
A.1. Hypothese de linearite
∂h(X,U)
∂X=
∂h1∂x1
.. ..∂h1∂xn
.. .. .. ..
.. .. .. ..∂hp∂x1
.. ..∂hn∂xn
(A.9)
∂h(X,U)
∂U=
∂h1∂u1
..∂h1∂um
.. .. ..
.. .. ..∂hp∂u1
..∂hn∂um
(A.10)
les matrices jacobiennes de f et h calculees respectivement par rapport a X et U.
159
Annexe A. Linearisation d’un systeme
160
ANNEXEB
Transformee de Laplace
B.1 Definition
La transformee de Laplace L (t) d’une fonction f(t) definie pour t > 0 est donnee par :
L [f(t)] = F (p) =
∫ +∞
0f(t)e−ptdt (B.1)
La variable complexe p ou variable de Laplace s’ecrit :
p = σ + jω (B.2)
ou σ et ω designent respectivement la partie reele et la partie imaginaire de p.
B.1.1 Condition d’existence
Une condition suffisante d’existence pour (B.1) est qu’elle puisse etre bornee par une integrale
convergente :
∫ +∞
0f(t)e−ptdt ≤
∫ +∞
0|f(t)e−pt|dt ≤
∫ +∞
0|f(t)|e−σtdt (B.3)
S’il existe M et α, deux reels positifs tels que f(t) ≤Meαt,
∫ +∞
0|f(t)|e−σtdt ≤
∫ +∞
0Meαte−σtdt (B.4)
Cette integrale converge pour σ > α et α est appelee l’abcisse de convergence.
B.2 Table de transformees
Les transformees de Laplace utilisees dans ce cours sont rapportees dans le tableau B.1.
161
Annexe B. Transformee de Laplace
f(t), t > 0 F (p)
δ(t) 1
U(t) 1
p
t1
p2
tn−1
(n− 1)!
1
pnn = 1, 2, . . .
eat1
p− a
sinωtω
p2 + ω2
cosωtp
p2 + ω2
e−at
ωsinωt
1
(p+ a)2 + ω2
e−at
ωcosωt
p+ a
(p+ a)2 + ω2
1√
1− ξ2e−ξωnt sinωn
√
1− ξ2t1
p2 + 2ξωnp+ ω2n
1
ω2n
√
1− ξ2
(
1− e−ξωnt sin(ωn
√
1− ξ2t+ φ)) 1
p(p2 + 2ξωnp+ ω2n)
ξ < 1, φ = cos−1 ξ
Tableau B.1 – Transformees de Laplace usuelles en automatique
B.3 Proprietes de la transformee de Laplace
B.3.1 Linearite
La transformee de Laplace est lineaire. Soit L [f(t)] = F (p) et L [g(t)] = G(p) alors :
L [αf(t) + βg(t)] = F (p) +G(p) (B.5)
avec α, β reels.
B.3.2 Derivation
Supposons f discontinue en 0 et derivable pour t > 0. La transformee de Laplace de la
derivee a l’ordre n prise au sens des distributions et pour des conditions initiales non nulles :
L
[dn
dtnf(t)
]
= pnF (p)−n∑
i=1
[
pn−i di−1
dti − 1f(t)
]
t=0−(B.6)
Cette transformee de Laplace fait intervenir f(0−), elle est generale. Si la fonction f(t) est
causale f(0−) = 0, si elle est continue f(0−) = f(0+), enfin, si f est discontinue a l’origine, elle
admet une derivee au sens des distributions.
162
B.4. Transformee de Laplace inverse
B.3.3 Integration
L
[∫ t
−∞f(t)dt
]
=F (p
p+
1
p
[∫ t
−∞f(σ)dσ
]
t=0−(B.7)
B.3.4 Retard
L [f(t− τ)] = F (p)e−τp (B.8)
B.3.5 Translation complexe
L [e−λtf(t)] = F (p+ λ) (B.9)
B.3.6 Theoreme de la valeur initiale
Ce theoreme permet de calculer f(t) a l’instant initial a partir de F (p), il est utilise pour
etablir les expressions des signaux d’un systeme a cet instant.
limt→0
f(t) = limp→+∞
pF (p) (B.10)
B.3.7 Theoreme de la valeur finale
Ce theoreme permet de calculer f(t) a l’infini a partir de F (p), il est utilise pour etablir les
expressions des signaux d’un systeme en regime permanent.
limt→+∞
f(t) = limp→0
pF (p) (B.11)
Ce theoreme n’est applicable que si pF (p) a tous ses poles a partie reelle strictement negative.
B.4 Transformee de Laplace inverse
f(t) = L−1[F (p)] =
1
2jπ
∫ σ+jω
σ−jωF (p)eptdp (B.12)
En pratique on n’utilisera pas cette formule mais plutot la table de transformees B.1. Attention
toutefois preciser que les originaux sont des siganux causals, i.e. qui s’ecrivent f(t)U(t).
163
Annexe B. Transformee de Laplace
164
ANNEXE C
Systemes simples remarquables
C.1 Integrateur pur
L’integrateur pur a pour fonction de transfert :
I(p) =1
τip(C.1)
ou τi est la constante de temps de l’integrateur. On rencontre frequemment ce systeme lorsqu’il
s’agit de decrire une reponse en position pour une entree en vitesse. En regime harmonique :
I(jω) =1
jωτi(C.2)
dont le gain a pour expression :
|I(jω)|dB = −20logω − 20logτi (C.3)
et dont l’argument vaut −π2∀ω ≥ 0. Le diagramme de Bode de ce systeme :
165
Annexe C. Systemes simples remarquables
−20
−10
0
10
20
Gai
n (d
B)
10−1
100
101
−91
−90.5
−90
−89.5
−89
Pha
se (
deg)
Pulsation (rad/sec)
Figure C.1 – Diagrammes de Bode de l’integrateur
C.2 Approximation de Pade d’un retard pur
Les retards purs τ peuvent etre a l’origine d’un comportement instable des systemes. Sur un
avion, ils peuvent avoir pour origine le temps requis pour la transmission des mesures issues des
capteurs, leur traitement dans les calculateurs embarques et l’execution des commandes.
R(p) = e−τp =e−
τp2
eτp2
(C.4)
En regime harmonique :
R(jω) =e−
jωτ2
e−jωτ2
(C.5)
Si les retards sont petits i.e. ωτ << 1, au premier ordre :
R(jω) ≈ 1− jωτ2
1 + jωτ2
(C.6)
Cette approximation du retard, dite de Pade a l’ordre un, a un module egal a 1 ∀ω ≥ 0 et
un argument
< R(jω) >=< 1− jωτ
2> − < 1 + j
ωτ
2> (C.7)
< R(jω) >= −2 tan−1 ωτ
2(C.8)
166
C.3. Double integrateur
Le diagramme de Bode de R(jω) est represente ci-dessous :
−1
−0.5
0
0.5
1G
ain
(dB
)
10−2
10−1
100
101
102
−180
−135
−90
−45
0
Pha
se (
deg)
Pulsation (rad/sec)
ωτ=1domaine de validité del’approximation
Figure C.2 – Diagramme de Bode : approximation de Pade a l’ordre un d’un retard pur
C.3 Double integrateur
L’integrateur pur a pour fonction de transfert :
J(p) =1
p2(C.9)
Cette fonction de transfert caracterise un systeme purement inertiel :
J(jω) = − 1
ω2(C.10)
dont le gain a pour expression :
|J(jω)|dB = −20logω2 = −40logω (C.11)
et l’argument vaut −π ∀ω ≥ 0. Le diagramme de Bode de ce systeme :
167
Annexe C. Systemes simples remarquables
−40
−20
0
20
40G
ain
(dB
)
10−1
100
101
−180
−135
−90
−45
0
Pha
se (
deg)
FrequencyPulsation (rad/sec)
−40dB/dec
Figure C.3 – Diagrammes de Bode du systeme complet d’ordre trois
Pour un k-integrateurs, on parle alors de systeme de classe k, le gain decroıt avec une pente
egale a −k × 20dB/dec et le dephasage vaut −kπ2.
C.4 Second ordre avec zeros
De tels systemes presentent une fonction de transfert de la forme :
H(p) =S(p)
E(p)= kω2
n
τp+ 1
p2 + 2ξωnp+ ω2n
(C.12)
H(p) possede un zero reel z = − 1τ , le denominateur est celui d’un systeme d’ordre deux. Soumis
a un echelon d’amplitude e1, la reponse a pour expression :
S(p) =kω2
nτp
p2 + 2ξωnp+ ω2n
e1p
+kω2
n
p2 + 2ξωnp+ ω2n
e1p
(C.13)
La transformee de Laplace inverse du second terme du membre de droite notee s2(t) s’ecrit
d’apres (2.35) :
s2(t) = ke1
(
1− e−ξωnt
√
1− ξ2sin(ωpt− φ)
)
U(t) (C.14)
La transformee de Laplace inverse du premier terme du membre de droite est au facteur τ pres
la derivee de la precedente.
s1(t) = ωnτke1e
−ξωnt
√
1− ξ2
(
ξ sin(ωpt− φ)−√
1− ξ2 cos(ωpt− φ))
U(t) (C.15)
168
C.4. Second ordre avec zeros
Or d’apres (2.33),
s1(t) = ωnτke1e
−ξωnt
√
1− ξ2(cosφ sin(ωpt− φ) + sinφ cos(ωpt− φ))U(t) (C.16)
s1(t) =
(
ωnτke1e
−ξωnt
√
1− ξ2cosωpt
)
U(t) (C.17)
La reponse est la somme de s1(t) et de s2(t). Le terme s1(t) est un pur transitoire qui presente
une amplitude a l’origine d’autant plus importantes que |ωnτ | >> 1. Autrement dit,
— lorsque le zero est plus proche de l’axe imaginaire que les poles, s1(t) domine le transitoire
de s2(t), on parle de zero sous-compense. Pratiquement, l’effet derivateur du systeme est
preponderant. Comme l’entree est un echelon, sa derivee est une impulsion filtree par les
termes du second ordre. D’ou la presence du depassement important qui apparaıt sur la
reponse.
— lorsque les poles sont plus proches de l’axe imaginaire que le zero, le transitoire de s2(t)
est preponderant sur s1(t) et l’on retrouve approximativement les caracteristiques d’un
mode d’ordre deux classique. Le zero est sur-compense.
— lorsque le zero est positif alors ωnτ < 0 et le transitoire s2(t) est de signe oppose a s1(t).
0n dit que le systeme est a dephasage non minimal.
−0.8 −0.6 −0.4 −0.2 0−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
Carte des poles−zéros
Axe réel
Axe
imag
inai
re
0 5 100
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
Réponse indicielle
Temps (sec)
Am
plitu
de
Figure C.4 – Systeme sous-compense
169
Annexe C. Systemes simples remarquables
−10 −5 0−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
Carte des poles−zéros
Real Axe
Axe
imag
inai
re
0 2 4 6 80
0.2
0.4
0.6
0.8
1
1.2
1.4
Réponse indicielle
Temps (sec)
Am
plitu
de
Figure C.5 – Systeme sur-compense
−1 −0.5 0 0.5 1−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
Carte des poles−zéros
Axe réel
Axe
imag
inai
re
0 2 4 6 8−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
1.2
Réponse indicielle
Temps (sec)
Am
plitu
de
Figure C.6 – Systeme a dephasage non minimal
170
ANNEXED
Critere de Nyquist
D.1 Critere de Nyquist
Le critere de Nyquist est tres interessant car il utilise une representation graphique de la
reponse frequentielle. De plus, il s’applique a tout type de transmittance.
La demonstration du critere de Nyquist fait appel a un theoreme, que nous ne demontrerons
pas, decoulant lui-meme du theoreme de Cauchy sur les fonctions holomorphes (c’est-a-dire
analytiques, uniformes et continues). Ce theoreme s’enonce de la facon suivante :
Theoreme 1 Soit F (p) une fonction de la variable complexe p, holomorphe a l’interieur d’un
contour (C).
Soient P et Z les nombres respectifs de poles et de zeros, comptes avec leur ordre de multi-
plicite, situes a l’interieur de ce contour.
Lorsque le point d’affixe p decrit le contour (C) dans le sens des aiguilles d’une montre, le
point d’affixe F (p) decrit un contour (G) qui effectue, dans le sens trigonometrique, un nombre
de tours T = P − Z autour de l’origine.
En d’autres termes, la variation d’argument de F (p) est 2π(P − Z)
D.2 Application au contour de Nyquist
Considerons le systeme ayant pour fonction de transfert :
F (p) =N(p)
D(p)=
(p− z1)(p− z2) . . .
(p− p1)(p− p2) . . .(D.1)
Faisons decrire a la variable complexe p le contour (C), denomme contour de Nyquist, ou
contour d’exclusion, ou encore contour de Bromwich represente sur la figure 3.4.
Ce contour est constitue de l’axe des imaginaires, parcouru dans le sens croissant (p = jω
avec ω ∈] −∞,+∞[ ), et d’un demi-cercle de centre l’origine et de rayon infini, parcouru dans
le sens trigonometrique inverse.
171
Annexe D. Critere de Nyquist
Les eventuels poles imaginaires purs de F (p) sont contournes par des demi-cercles de rayon
ε infiniment petit.
Ce contour enferme donc la totalite du demi-plan complexe situe a droite de l’axe des ima-
ginaires.
Lorsque p parcourt le contour (C), F (p) parcourt un autre contour, (G), qui n’est autre que
le lieu de Nyquist du systeme (pour ω ∈]0+,+∞[), complete par son symetrique par rapport a
l’axe reel (pour ω ∈] −∞, 0−[) et, eventuellement, par un demi cercle de centre l’origine et de
rayon infini, parcouru dans le sens trigonometrique inverse (jonction entre ω = 0− et ω = 0+).
Le systeme est stable si et seulement si tous les poles de F (p) sont a partie reelle strictement
negative.
Autrement dit, ce systeme est stable si et seulement si le contour (C) n’englobe aucun pole de
F (p). L’application du theoreme enonce precedemment conduit donc a la formulation suivante :
Corolaire 1 Un systeme de transmittance F (p) est stable si et seulement si le contour parcouru
par F (p) lorsque p parcourt le contour de Nyquist effectue, dans le sens trigonometrique inverse,
un nombre de tours autour de l’origine egal au nombre de zeros a partie reelle positive de F (p)
(comptes avec leur ordre de multiplicite).
D.2.1 Critere de Nyquist
Considerons l’asservissement lineaire suivant :
La transmittance de ce systeme boucle vaut :
FTBF (p) =S(p)
E(p)=
H(p)
1 + F (p)H(p)=
H(p)
1 + FTBO(p)(D.2)
Soit Z le nombre de zeros, comptes avec leur ordre de multiplicite, de 1 + FTBO(p) situes
a l’interieur du contour de Nyquist.
Z est donc le nombre de poles a partie reelle positive, comptes avec leur ordre de multiplicite,
de la FTBF.
Soit P le nombre de poles, comptes avec leur ordre de multiplicite, de 1 + FTBO(p) situes
a l’interieur du contour de Nyquist.
P est donc aussi le nombre de poles a partie reelle positive, comptes avec leur ordre de
multiplicite, de la FTBO.
Appliquons le theoreme precedent a la fonction 1 + FTBO(p) :
Lorsque le point d’affixe p decrit, dans le sens des aiguilles d’une montre, le contour de
Nyquist, le contour parcouru par la fonction 1+FTBO effectue, dans le sens trigonometrique,
un nombre de tours T = P − Z autour de l’origine.
Cela revient a dire que le contour parcouru par la FTBO effectue, dans le sens trigonome-
trique, un nombre de tours T = P − Z autour du point (−1, 0).
Ce point, de coordonnees (−1, 0) dans le plan de Nyquist et, par consequent, de coordonnees
(−180 , 0dB) dans le plan de Black, est appele point critique ou point de Nyquist.
Le systeme boucle est stable si et seulement si tous les poles de sa FTBF, c’est a dire tous
les zeros de 1 + FTBO(p), sont a partie reelle strictement negative.
Autrement dit, le systeme boucle est stable si et seulement si Z = 0.
172
D.2. Application au contour de Nyquist
D’ou l’enonce suivant du critere de Nyquist :
Un systeme boucle est stable si et seulement si le contour parcouru par sa FTBO effectue, dans le
sens trigonometrique, un nombre de tours autour du point critique egal au nombre de poles a partie reelle
positive de sa FTBO (comptes avec leur ordre de multiplicite).
173
Annexe D. Critere de Nyquist
174
ANNEXE E
Equivalence a un systeme a retour unitaire
Le systeme donc la chaıne directe a pour fonction de transfert H(p) et la chaıne de retour
pour fonction de transfert F (p) a pour FTBO :
FTBO(p) = H(p)F (p) (E.1)
et pour FTBF :
FTBF (p) =H(p)
1 +H(p)F (p)=
1
F (p)
H(p)F (p)
1 +H(p)F (p)=
1
F (p)
FTBO(p)
1 + FTBO(p)(E.2)
qui est equivalent a un systeme dont la chaıne directe a pour fonction de transfert FTBO(p) et
la chaıne de retour pour fonction de transfert 1.
FTBO(p)1
F (p)
E(p) S(p)+
−H(p)
F (p)
E(p) S(p)+
− ⇔
Figure E.1 – Equivalence avec un systeme a retour unitaire
175
Annexe E. Equivalence a un systeme a retour unitaire
176
ANNEXE F
A propos de la representation d’etat
F.1 INVARIANCE DE FONCTION DE TRANSFERT
On rappelle que le changement de base est defini par x = Pz. On montre que la matrice de
fonctions de transfert est invariante par changement de base :
H(p) = C(
pIn − A)−1
B+ D
H(p) = C(pIn −P−1AP
)−1B+ D
H(p) = C(P−1(pIn −A)P
)−1B+ D
or (AB)−1 = A−1B−1
Il vient :
H(p) = CP−1 (pIn −A)−1PB+ D
D’apres les expressions des matrices dans la nouvelle base (), il vient :
H(p) = C (pIn −A)−1B+D
H(p) = H(p) (F.1)
177
Annexe F. A propos de la representation d’etat
178
ANNEXEG
Codes MATLAB
G.1 CALCUL D’UNE COMMANDE
G.2 CALCUL D’UN OBSERVATEUR
1 % Observateur pour l’estimation de l’erreur de mesure d’un accelerometre2 % La mesure d’acceleration est entachee d’une erreur systematique b3 % Francois Bateman - 21/08/20144 % Le modele continu5 A=[0 1 0 ;0 0 −1; 0 0 0 ] ;6 B = [ 0 ; 1 ; 0 ] ;7 C=[1 0 0 ;0 1 0 ] ;8 D=0;9 sys = s s (A, B , C ,D) ;
10 % Le modele a temps discret11 T= 50e−3;12 sysd =c2d ( sys , T ) ;13 F= sysd . a ;G= sysd . b ;14 % Observabilite15 rank ( [ C ;C∗F ;C∗F ^ 2 ] )16 % poles regissant la dynamique de l’erreur17 mu1=−0.5 ; mu2 = 0 . 5 ; mu3 = 0 . 2 5 ;18 % Calcul des noyaux19 v1w1=nu l l ( [ F’−eye ( 3 )∗mu1 , −C ’ ] )20 v2w2=nu l l ( [ F’−eye ( 3 )∗mu2 , −C ’ ] )21 v3w3=nu l l ( [ F’−eye ( 3 )∗mu3 , −C ’ ] )22 % La matrice de passage P23 P=[v1w1 ( 1 : 3 , 1 ) , v2w2 ( 1 : 3 , 1 ) , v3w3 ( 1 : 3 , 1 ) ] ;24 % La matrice W25 W=[v1w1 ( 4 : 5 , 1 ) , v2w2 ( 4 : 5 , 1 ) , v3w3 ( 4 : 5 , 1 ) ] ;26 %Calcul de L27 L= r e a l ( (W∗ inv ( P ) ) ’ )
G.3 FILTRE DE KALMAN
1 % Estimation de la position d’un avion2 % F. Bateman 21/10/2014
179
Annexe G. Codes MATLAB
3
4 c l e a r a l l ; c l c ;5 % La periode d’echatillonnage6 T=1;7 % La duree de la simulation8 N=100;9 Tf=N∗T ;
10
11 % L’equation d’etat continue12 % Xdot=A X + B W13 A=[0 1 ; 0 0 ] ;14 B = [ 0 ; 1 ] ;15 % L’equation d’etat16 % X k+1 = F X k + G W k17 F=expm (A∗T ) ;18 G=B∗T ; % commande des gaz constante vb/a=cte19 C= [ 1 , 0 ] ; % on mesure la position20
21 % Caracteristique des bruits d’etat et de mesure22 Q=diag ( [ 0 , 0 . 0 1 ] ) ;23 R=1;24
25 % On preinitialisie les vecteurs et les matrices26
27
28
29 % L’algorithme du filtre30 % Initialisation31 Y(1 )= sqr t (R)∗ randn ;32 P=[1 0 ; 0 0 ] ;33 X_est = [ 0 ; 1 0 0 ] ;34 t r P (1 )=t race ( P ) ;35 % Generation d’un vecteur d’etat X(0) d’apres la covariance de l’erreur P(0)36 % d’estimation37 X=[0+ sqr t ( P ( 1 , 1 ) )∗ randn ;100+sqr t ( P ( 2 , 2 ) )∗ randn ] ;38
39 f o r k =1:N,40 X( : , k +1) =F∗X( : , k ) + T∗ sqr t (Q)∗G∗randn ;41 X_est ( : , k+1)=F∗X_est ( : , k ) ;42 P=F∗P∗F ’+Q;43 L ( : , k+1)=P∗C’ ∗ inv (R+C∗P∗C ’ ) ;44 Y( : , k+1)=C∗X( : , k+1)+ sqr t (R)∗ randn ;45 X_est ( : , k+1)= X_est ( : , k+1)+L ( : , k +1)∗ (Y ( : , k+1)−C∗X_est ( : , k + 1 ) ) ;46 P=P−L ( : , k +1)∗C∗P ;47 t r P ( : , k+1)=t race ( P ) ;48 end49 % Affichage vecteur d’etat, trace de la matrice de covariance, gain de50 % Kalman51
52 t ime =0:T : Tf ;53
54 subplot ( 221 )55 hold on56 plot ( t ime ,X(1 , : )− X_est ( 1 , : ) , ’ r−− ’ , ’ L ineWidth ’ , 2 )57 plot ( t ime ,Y−X( 1 , : ) , ’ b ’ , ’ L ineWidth ’ , 2 )58 t i t l e ( ’ P o s i t i o n ’ , ’ Fon tS i ze ’ , 14 )59 legend ( ’ e r r e u r de p o s i t i o n e s t i m é e ’ , ’ e r r e u r de mesure de p o s i t i on ’ , ’ Loca t i on ’ , ’ Sou thEas t ’ )60
61 subplot ( 223 )62 plot ( t ime ,X( 2 , : ) , ’ r ’ , ’ L ineWidth ’ , 2 )63 hold on
180
G.3. FILTRE DE KALMAN
64 plot ( t ime , X_est ( 2 , : ) , ’ g ’ , ’ L ineWidth ’ , 2 )65 t i t l e ( ’ V i t e s s e ’ , ’ Fon tS i ze ’ , 14 )66 legend ( ’ v i t e s s e ’ , ’ v i t e s s e e s t i m é e ’ , ’ Loca t i on ’ , ’ Sou thEas t ’ )67
68 subplot ( 222 )69 plot ( t ime , t rP , ’ L ineWidth ’ , 2 )70 t i t l e ( ’ T race de P_{k | k} ’ , ’ Fon tS i ze ’ , 14 )71
72 subplot ( 224 )73 plot ( t ime , L ( 1 , : ) , ’ k−− ’ , ’ L ineWidth ’ , 2 )74 hold on75 plot ( t ime , L ( 2 , : ) , ’ r ’ )76 t i t l e ( ’ Gain de Kalman ’ , ’ Fon tS i ze ’ , 14 )77 legend ( ’ c o r r e c t i o n p o s i t i o n ’ , ’ c o r r e c t i o n v i t e s s e ’ , ’ Loca t i on’ , ’ Sou thEas t ’ )
181