livre de cours d’automatique - francois-bateman.e...

ECOLE D’OFFICIERS DE L’ARMEE DE L’AIR

DEPARTEMENT DES VEHICULES AEROSPATIAUX

LIVRE DE COURS

D’AUTOMATIQUE

Monsieur BATEMAN

Table des matieres

Table des matieres i

1 ANALYSE DES SYSTEMES 1

2 SYSTEMES SIMPLES 25

3 SYSTEMES ASSERVIS 49

4 CORRECTION DES SYSTEMES 71

5 REPRESENTATION D’ETAT DES SYSTEMES 87

6 COMMANDE PAR RETOUR D’ETAT 101

7 OBSERVATEURS 115

8 FILTRE DE KALMAN 125

A Linearisation d’un systeme 157

B Transformee de Laplace 161

C Systemes simples remarquables 165

D Critere de Nyquist 171

E Equivalence a un systeme a retour unitaire 175

F A propos de la representation d’etat 177

G Codes MATLAB 179

i

CHAPITRE 1

ANALYSE DES SYSTEMES

1.1 NOTION DE SYSTEME

1.1.1 Definition et exemples

Un systeme dynamique S est une entite constituee d’elements logiquement inteconnectes.

On peut agir sur ce systeme en modifiant les valeurs de ses entrees. Pratiquement on distingue

les commandes qui sont des entrees controlees des perturbations qui sont des entrees non contro-

lees. On visualise les effets obtenus en observant les sorties ou reponses. Ces observations sont

realisees par des capteurs qui mesurent les valeurs prises par ces sorties. Un systeme S est dit

deterministe si son comportement futur peut etre determine de facon unique a partir d’une

complete connaissance du passe de S et de ses entrees futures. Un systeme est dit causal si le

comportement present du systeme ne depend pas des entrees futures.

1.1.2 Exemples de systeme

Les systemes suivants feront l’objet d’etudes lors des seances de bureaux d’etudes et de

travaux pratiques. Compte-tenu de leur complexite, des hypotheses restrictives seront faites et

leur nombre de degre de liberte sera volontairement limite.

Quadrirotor : On s’interesse au comportement d’un quadrirotor autour de son axe de tangage

(l’etude est analogue pour l’axe de roulis). Les entrees de commande sont des moments qui

procedent du differentiel de poussee produit par les helices. Des rafales de vent peuvent agir

comme des entrees de perturbation. Les sorties sont les angles d’assiette et de gıte mesures par

une centrale d’attitude.

1

Chapitre 1. ANALYSE DES SYSTEMES

Figure 1.1 – Le quadrirotor U130 de Novadem

Amortisseur de lacet ou yaw damper : On s’attache a decrire le mouvement d’un avion

autour de l’axe de lacet consecutif a une action sur la commande de direction. Le lacet est mesure

par un gyrometre. Des rafales de vent peuvent agir comme des entrees de perturbation.

x

x ab > 0

d < 0n

y

x

x ax ab > 0

d < 0n

y

r > 0

Figure 1.2 – Effets de la commande de direction sur le lacet et le derapage

Regulateur de distance pour vehicule automobile : On etudie un systeme constitue de

deux vehicules evoluant en ligne droite et l’on cherche a controler la distance entre ces deux

vehicules. L’accelerateur et le frein sont les entrees de commande du vehicule suiveur tandis que

la vitesse du vehicule suivi est une entree de perturbation.

1.2 ANALYSE DES SYSTEME

1.2.1 Signaux pour l’analyse des systemes

En vue d’etudier le comportement d’un systeme, ses entrees sont soumises a des signaux

types. L’analyse des reponses permet de caracteriser le comportement du systemes et d’evaluer

ses performances. Ces entrees types ne sont pas celles auxquelles est soumis le systeme dans

les conditions reelles de fonctionnement mais elles ont un spectre frequentiel 1 suffisament riche

pour rendre compte des proprietes et des performances du systeme etudie.

1. Voir le cours de traitement du signal.

2

1.2. ANALYSE DES SYSTEME

De meme que les realisations physiques de ces signaux 2 sont utilisees sur les systemes reels

pour evaluer leurs performances, les modeles mathematiques de ces signaux sont appliques aux

modeles mathematiques des systemes etudies pour predire leur comportement.

1.2.1.1 Signaux pour l’analyse temporelle

L’echelon : L’echelon d’Heaviside represente sur la figure 1.3 a pour expression :

e(t) = e0U(t) ={

0 si t < 0

e0 si t > 0(1.1)

Figure 1.3 – Echelon d’Heaviside

La reponse a un echelon est appelee reponse indicielle.

L’impulsion : L’impulsion de Dirac representee sur la figure 1.4 a pour expression :

e(t) = Aδ(t) = A limk→∞

k

(

U(t)− U(t− 1

k)

)

(1.2)

Figure 1.4 – Impulsion

A est appele poids de l’impulsion, celle-ci a les proprietes suivantes :

{

δ(t) = 0 si t 6= 0∫ +∞−∞ δ(t)dt = 1

(1.3)

Au sens des distributions, l’impulsion est la derivee de l’echelon. La reponse a une impulsion

est appelee reponse impulsionnelle.

2. Obtenues par exemple au moyen d’un generateur basse frequence (GBF)

3


La rampe : La rampe ou echelon de vitesse represente sur la figure 1.5 a pour expression :

e(t) = αtU(t) (1.4)

Figure 1.5 – Rampe ou echelon de vitesse

La reponse a une rampe est appelee reponse en vitesse.

1.2.1.2 Signaux pour l’analyse frequentielle

Entree harmonique : L’entree harmonique representee sur la figure 1.6 a pour expression :

e(t) = e0 sin(ωt+ φ)U(t) (1.5)

Figure 1.6 – Entree harmonique

1.2.2 Performances d’un systeme

1.2.2.1 Regimes permanent et transitoire

La sortie du systeme est initialement dans un etat d’equilibre. Soumis a une entree type et

apres un certain temps, le systeme finit en general par presenter une sortie constante, lineaire,

parabolique, harmonique, etc. On dit alors que le systeme a atteint son regime permanent. Le

regime permanent peut etre un regime :

— d’equilibre si l’entree et la sortie sont constantes,

— d’oscillations entretenues si l’entree et la sortie sont harmoniques,

— d’oscillations libres si l’entree est constante.

4


Pendant la duree mise par le systeme pour atteindre son regime permanent, le systeme est

en regime transitoire. Ce regime est caracterise par sa duree et son amortissement. Enfin, il faut

noter que de nombreux systemes travaillent pratiquement toujours en regime transitoire a cause

du caractere aleatoire de leurs entrees.

1.2.2.2 Stabilite

— Un systeme est qualifie d’asymptotiquement stable si, sous l’effet d’une entree (commande

ou perturbation) ou pour une valeur initiale de la sortie differente de sa valeur d’equilibre,

la sortie est ecartee de sa position d’equilibre et y revient.

— La sortie d’un systeme stable ecarte de sa valeur d’equilibre reste bornee autour de cet

equilibre.

— La sortie d’un systeme instable diverge.La figure 1.7 illustre ces notions.

0 5 10 15 20 25−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

Asymptotiquement stable

Temps (sec)

Am

plitu

de

0 5 10−4

−2

0

2

4

6

8

10

Instable

Temps (sec)

Am

plitu

de

0 5 10 15 20 250

0.5

1

1.5

Stable

Temps (sec)

Am

plitu

de

Figure 1.7 – Reponses impulsionnelles de systemes asymptotiquement stable, juste stable et instable

— En theorie, on peut remarquer qu’un systeme instable n’atteint jamais son regime per-

manent. En pratique, la duree du transitoire est limitee du fait des saturations des sorties

ou de la destruction du systeme.

— Les MIRAGE 2000 et le RAFALE, avec des centres de gravite recules en arriere du foyer

aerodynamique, sont des avions instables.

1.2.2.3 Amortissement

L’amortissement d’un regime transitoire est caracterise par les depassements successifs D1,

D2, etc. de la reponse indicielle du systeme et est illustre sur la figure 1.8. On calcule en

particulier l’amplitude relative du premier depassement :

D1% = 100xmax − x(∞)

x(∞)(1.6)

5


Step Response

Time (sec)

Am

plitu

de

0 2 4 6 8 10 12 14 160

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4 xmax

x(∞)réponse mal amortie

réponse très amortie

Figure 1.8 – Reponse amortie Vs. mal amortie

Un systeme correctement amorti aura un depassement n’excedant pas un pourcentage fixe

de la valeur finale du signal de sortie. Les depassements toleres dependent du systeme et de ce

que l’on veut en faire.

1.2.3 Rapidite

La rapidite d’un systeme vise a quantifier la duree du transitoire et est mise en evidence lors

d’un essai indiciel illustre sur la figure 1.9. Elle est definie par le temps de reponse a N% qui est

le temps mis par la reponse pour atteindre l’intervalle compris entre ±N% de la valeur finale et

ne plus s’en ecarter. Generalement on adopte N = 5.

Tr5% = mint0

{

∀t > t0x(t)− x(∞)

x(∞)< 5%

}

(1.7)

Réponse indicielle

Temps (sec)

Am

plitu

de

0 5 10 15 20 250

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

TR5%x(0)

x(∞)

1,05(x(∞)−x(0))

0,95(x(∞)−x(0))

Figure 1.9 – Illustration du temps de reponse a 5%

6


1.2.4 HYPOTHESES SUR LE SYSTEME

Ces hypotheses fournissent un cadre dans lequel la description des relations entrees-sortie se

prete a une representation mathematique simple.

1.2.5 Continu

Un systeme continu traite et delivre a ses sorties des signaux a temps continu. Par opposition,

les systemes a temps discrets voient les valeurs prises par leurs signaux changer a des intervalles

de temps donnes.

La notion de continuite porte sur la variable temps. Si sur un intervalle donne ces signaux

peuvent prendre toutes les valeurs possibles, ils sont dits analogiques. Si au contraire ils ne

peuvent prendre qu’un nombre fini de valeurs, ils sont qualifies de numeriques.

— Un aeronef dont les entrees sont les commandes de vol et la sortie est la position est un

systeme continu.

— Le recepteur GPS qui procede a la mesure, toutes les secondes, de la position de cet

aeronef est un systeme a temps discret et l’information de position est numerique.

— La mesure par le calculateur bord de la position de la gouverne, realisee par un potentio-

metre a des intervalles de temps reguliers, est un signal analogique a temps discret plus

communement appele signal echantillonne.

1.2.6 Invariance

On dit qu’un systeme est invariant lorsque soumis a la meme entree a deux instants distincts,

les caracteristiques de la reponse sont inchangees. Pratiquement, cela traduit le fait que les

parametres du systeme ne varient pas au fil du temps.

— Un avion, du fait de la consommation de kerosene voit ses performances changer au cours

du vol et ne peut pas etre considere comme un systeme invariant.

— Plus generalement, du fait de l’usure et du vieillissement des composants qui le consti-

tuent, les systemes physiques ne sont pas invariants.

1.2.7 Linearite

1.2.7.1 Obtention d’un equilibre

Le systeme etudie est suppose stable et les signaux appliques aux entrees E sont constantes,

soit E = E0. Des lors que les valeurs prises par les signaux de sortie S ne varient plus, soit

S = S0, le systeme est dans un etat d’equilibre. Les valeurs prises par les entrees et les sorties

definissent le point d’equilibre de coordonnees {E0, S0}.— Cas d’un avion volant en palier a vitesse et altitude de croisiere. Le point d’equilibre est

defini par les positions des commandes des gaz et de profondeur, l’altitude et la vitesse

de l’avion.

— Cas d’un helicoptere en vol stationnaire.

7


1.2.7.2 Hypothese de linearite - Gain statique

Pour de petites et lentes variations des entrees e autour de leur position d’equilibre E0,

on fait l’hypothese que les variations des sorties s autour de leur valeur d’equilibre S0 sont

proportionnelles a celles des entrees.

s = k(E0, S0)e (1.8)

Pour le point d’equilibre considere, k est le gain statique du systeme.

Outre le caractere simple de la relation entree-sortie, la linearite permet pour un systeme

possedant plusieurs entrees d’appliquer, comme on le verra ulterieurement, le principe de super-

position.

— Autour de sa vitesse de croisiere, on corrige la vitesse de l’avion par de petites actions

sur la commande de profondeur. Sous l’hypothese de linearite, les variations de vitesse

sont supposees proportionnelles a celles de la position de la commande de profondeur.

1.3 MODELES D’UN SYSTEME

1.3.1 Notion de modele

Dans le cadre de ce cours, un modele est une structure mathematique pouvant representer

le systeme etudie. Par representer, on entend la capacite qu’a le modele a repliquer fidelement

le comportement du systeme. Toutefois, le modele doit rester simple pour pouvoir etre exploite.

Dans ce cours, on distingue :

— le modele de connaissance qui procede de la mise en equation du systeme au moyen des

lois de la physique,

— le modele de representation ou boite noire obtenu, pour des entrees donnees, par identi-

fication des reponses a une classe de modeles,

— le modele de synthese, il procede d’une simplification du modele de connaissance en vue

de la synthese d’une loi de commande pour le systeme,

— le modele de simulation, implemente sur un logiciel de simulation a l’instar de MATLAB-

SIMULINK, il permet de decrire des phenomenes difficiles a representer dans le modele

de connaissance, e.g. la prise en compte de sous-systemes a temps continus et discrets au

sein d’un meme systeme.

1.3.2 Modele d’un systeme lineaire invariant continu

Dans ce cours, le systeme est continu et le modele de connaissance, pas necessairement

stationnaire, s’ecrit avec une equation differentielle 3. Dans le cas d’un systeme monovariable

i.e. qui possede une entree E(t) et une sortie S(t) l’equation differentielle d’ordre n suivante est

supposee rendre compte du comportement du systeme :

dnS(t)

dtn= f

(dn−1S(t)

dtn−1, . . . , S(t),

dm−1E(t)

dtm−1, . . . , E(t), t

)

(1.9)

3. Il serait decrit par une equation de recurrence dans le cas d’un systeme a temps discret.

8

1.3. MODELES D’UN SYSTEME

Sous l’hypothese de stationnarite, le modele devient :

dnS(t)

dtn= f

(dn−1S(t)

dtn−1, . . . , S(t),

dm−1E(t)

dtm−1, . . . , E(t)

)

(1.10)

et un point d’equilibre {E0, S0} peut etre obtenu en posantdjS(t)

dtj= 0 ou j ∈ {1, . . . , n} et

dkE(t)

dtkou k ∈ {1, . . . ,m} en resolvant l’equation :

0 = f (S(t), E(t)) (1.11)

En considerant de petites variations de l’entree e(t) et de la sortie s(t) autour du point

d’equilibre {E0, S0}, de sorte que E(t) = E0+ e(t) et S(t) = S0+ s(t), le modele linearise s’ecrit

au moyen d’une equation differentielle lineaire a coefficients contants 4 :

andns(t)

dtn+ ...+ a1

ds

dt+ a0s(t) = bm

dme

dtm+ ...+ b1

de(t)

dt+ b0e(t) (1.12)

— Les coefficients constants traduisent le caractere invariant du modele.

— Soumis a une entree e(t) en echelon d’amplitude e1, s’il est stable, la sortie en regime

permanent :

limt→+∞

s(t) =b0a0e1 (1.13)

oub0a0

est le gain statique deja entrevu (1.8).

1.3.3 Transformee de Laplace de la reponse

La methode de resolution temporelle se revele parfois delicate et souvent laborieuse compte

tenu de l’ordre (qui peut etre eleve) des equations. L’utilisation de la transformee de Laplace

permet de ramener les problemes integro-differentiels a des problemes algebriques plus faciles a

traiter. Les proprietes de la transformee de Laplace figurent en annexe B. Cette transformation

permet une elimination rapide des variables intermediaires et l’obtention d’une relation liant

l’entree et la sortie du systeme.

X(p) = L [x(t)], fonction de la variable complexe p, designe la transformee de Laplace de

x(t) . Ainsi, la transformee de Laplace de l’equation (1.12) s’ecrit :

an

(

pnS(p)− pn−1s(0−)− · · · − s(n−1)(0−))

+ . . . + a1(pS(p)− s(0−)

)+ a0S(p)

= (1.14)

bm

(

pmE(p)− pm−1e(0−)− · · · − e(m−1)(0−))

+ . . . + b1(pE(p)− e(0−)

)+ b0E(p)

4. Le calcul est detaille en annexe A.

9


S(p) =bmp

m + bm−1pm−1 + · · ·+ b1p+ b0

anpn + an−1pn−1 + · · ·+ a1p+ a0E(p)

︸︷︷︸

regime force

+g(s(0−), . . . , s(n−1)(0−), e(0−), . . . , e(m−1)(0−)

)

anpn + an−1pn−1 + · · ·+ a1p+ a0︸︷︷︸

regime libre

(1.15)

Les deriveees successives de e(t) et de s(t) sont calculees au sens des distributions et s(0−),s(1)(0−),. . . ,s(n−1)(0−),e(0−), e(1)(0−),. . . ,e(n−1)(0−) sont les conditions initiales qui quantifientles ecarts de l’entree, de la sortie et de leurs derivees successives respectives par rapport a

l’equilibre.

Comme le montre l’equation (1.15), la reponse est la somme de deux termes. Le premier

correspond au regime force qui est la partie de la reponse forcee par l’entree (commande, per-

turbation). Le second terme correspond au regime libre, c’est la contribution des conditions

initiales a la reponse. En l’absence d’entree de commande ou de perturbation, soit e(t) = 0,

le regime libre n’est autre que la reponse du systeme abandonne a lui-meme. Par exemple, un

avion au decollage, par vent nul est en regime force pur alors que l’altitude d’un planeur apres

le largage, en l’absence de vent et de phenomenes aerologiques, est un regime libre pur.

1.3.4 Fonction de transfert

1.3.4.1 Fonction de transfert operationnelle

Les conditions initiales etant toutes nulles, autrement dit, le systeme est initialement dans

son etat d’equilibre, la fonction de transfert definit la relation entree-sortie du systeme :

H(p) =S(p)

E(p)=bmp

m + bm−1pm−1 + · · ·+ b1p+ b0

anpn + an−1pn−1 + · · ·+ a1p+ a0(1.16)

De sorte que :

S(p) = H(p)E(p) (1.17)

Ainsi, la relation entree-sortie s’exprime grace a la fonction de transfert simplement au moyen

d’un produit. A cet egard, il a ete vu en traitement du signal que cette relation s’exprimait dans

le domaine temporel au moyen d’un produit de convolution.

Une fonction de transfert est caracterisee par :

— les poles qui sont les racines du denominateur, ils permettent de decrire les performances

en regime transitoire,

— les zeros qui sont les racines du numerateur,

— le gain statique H(0) =b0a0

qui est le facteur d’amplification d’une entree echelon en re-

gime permanent et dont l’expression a deja ete presentee. On a en effet S(p) = H(p)E(p),

pour une entree en echelon e(t) = e0U(t), il vient en utilisant le theoreme de la valeur

finale :

limt→+∞

s(t) = limp→0

pS(p) = limp→0

pH(p)e0p

= H(0)

10


Remarque : le numerateur et le denominateur de la fonction de transfert sont des polynomes

a coefficients reels, par consequent les poles et les zeros peuvent etre reels et/ou complexes

conjugues.

L’expression de la reponse s(t) peut etre obtenue par le calcul de la transformee de Laplace

inverse de S(p). Toutefois l’utilisation des tables de transformee fournies en annexe suffit a traiter

l’ensemble des problemes qui seront traites.

Remarque : La fonction de transfert est la transformee de Laplace de la reponse impulsion-

nelle. En effet, la reponse impulsionnelle a pour expression

S(p) = H(p)L [δ(t)] (1.18)

Comme L [δ(t)] = 1, il vient S(p) = H(p) et par consequent s(t)U(t) = h(t)U(t). La fonction

de transfert temporel h(t) est notamment utilise lorsqu’on calcule la reponse d’un systeme au

moyen d’un produit de convolution.

1.3.4.2 Fonction de transfert harmonique

Il est possible, pourvu qu’elle existe, de calculer la transformee de Laplace d’un grand nombre

de classes de signaux. En particulier, au moyen de la fonction de transfert operationnelle, celle

de la reponse S(p). Toutefois, l’utilisation de signaux sinusoıdaux ou harmoniques non causals 5

offre un cadre mathematique simple pour exprimer les fonctions de transfert et les representer

graphiquement.

Le systeme est decrit par (1.12) et on lui applique les signaux :

e(t) = e0 cosωt et ˜e(t) = e0 sinωt (1.19)

Comme le systeme est lineaire, les sorties ont respectivement pour expression :

s(t) = s0 cos(ωt+ φ) et ˜s(t) = s0 sin(ωt+ φ)

Il convient de rappeler que e0 et s0 designent de petites variations des signaux d’entree et de

sortie autour de leurs valeurs d’equilibre respectives.

Si l’on applique a l’entree le signal 6 e(t) = e(t) + j ˜e(t), on a, d’apres le principe de superpo-

sition, s(t) = s(t) + j ˜s(t), que l’on peut encore ecrire :

e(t) = e0ejωt et s(t) = s0e

(jωt+φ) (1.20)

Si l’on injecte ces signaux dans (1.12), il vient :

andns0e

(jωt+φ)

dtn+ · · ·+ a0s0e

(jωt+φ) = bmdme0e

jωt

dtm+ · · ·+ b0e0e

jωt (1.21)

5. Le regime permanent de la reponse est deja etabli a t = 0.

6. Il s’agit d’un signal mathematique qui n’a pas de realite physique.

11


an(jω)ns0e

(jωt+φ) + · · ·+ a0s0e(jωt+φ) = bm(jω)me0e

jωt · · ·+ b0e0ejωt (1.22)

(an(jω)n + · · ·+ a0) s0e

jωtejφ = (bm(jω)m + · · ·+ b0) e0ejωt (1.23)

H(jω) =s0e0ejφ =

bm(jω)m + · · ·+ b1jω + b0an(jω)n + · · ·+ a1jω + a0

(1.24)

— Le module |H(jω)| = s0e0

de H(jω) n’est autre que le rapport de l’amplitude de s(t) sur

celle de e(t)

— L’argument < H(jω) >= φ de H(jω) est le dephasage de s(t) par rapport a e(t).

Remarque : le caractere non causal du signal harmonique ne permet pas de deduire les

decalages temporels de signaux par l’observation de leur decalage angulaire. Une avance de

phase de π/4 peut aussi etre un retard de phase de 7π/4 mod 2π.

0 2 4 6 8 10 12 14−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

φ

e(t)s(t)

Figure 1.10 – Reponse harmonique

Interet de la fonction de transfert harmonique : La transformation de Fourier montre

qu’un signal x(t) 7 peut s’ecrire comme une somme continue de fonctions harmoniques X(ω) re-

presentee par son spectre frequentiel. Ainsi, comme le systeme est lineaire, la fonction de transfert

harmonique permet d’etudier la contribution de chacun des harmoniques du spectre de l’entree

E(ω) a la reponse S(ω). Le spectre complet de la reponse etant la somme des harmoniques de

la reponse. L’exemple suivant illustre ce propos :

7. sous reserve que :

— x(t) soit borne,

—∫ +∞−∞ |x(t)|dt existe,

— x(t) admet un nombre fini de discontinuites.

12


ω H(jω) |H(jω)| < H(jω) > s(ω) < s(ω >

1 e−jπ

6 1 −π6

1× 1 0− π

6

2 3e−jπ

2 3 −π2

3× 0.25π

3− π

24 0.4e−jπ 0.4 −π 0.4× 0.05

π

2− π

Tableau 1.1 – Reponse d’un systeme lineaire a des signaux harmoniques

Exemple : soit le signal e(t) = 1 sin(t) + 0.25 sin(2t+ π/3) + 0.05 sin(4t+ π/2) et la fonction

de transfert H(jω) aux pulsations ω = {1, 2, 4} en rad/s. L’amplitude s(ω) et la phase de

chaque harmonique < s(ω > de la reponse sont donnes dans le tableau Ce tableau montre que

le fondamental de pulsation 1rad/s est propage au travers du systeme sans amplification ni

attenuation mais avec un retard de phase. L’harmonique de pulsation 2rad/s est amplifie et le

retard de phase s’accroıt ; quant a l’harmonique de de pulsation 3rad/s, il est attenue.

Ainsi, la reponse a pour expression s(t) = 1 sin(t− π/6)+ 0.75 sin(2t− π/6)+ 0.02 sin(4t− π/2)

et est representee sur la figure 1.11.

0 5 10 15−1.5

−1

−0.5

0

0.5

1Le signal d’entrée et ses harmoniques

0 5 10 15−2

−1.5

−1

−0.5

0

0.5

1

1.5Le signal de sortie et ses harmoniques

e(t)e

1(t)

e2(t)

e3(t)

s(t)s

1(t)

s2(t)

s3(t)

Figure 1.11 – Illustration du temps de reponse a 5%

1.3.4.3 Representation graphique des fonctions de transfert

L’exemple precedent montre que l’etude des valeurs du module et de l’argumentde H(jω)

pour differentes valeurs de ω permet de decrire le comportement du systeme. Dans le but d’ap-

prehender de maniere globale ce comportement, il est avantageux de donner de H(jω) une

representation graphique. Les paragraphes suivants presentent les representations graphiques

les plus usitees en automatique, a savoir le lieux de Nyquist, le lieu de Black-Nichols et les

diagrammes de Bode.

13


Lieu de Nyquist : Le lieu de Nyquist se trace dans le plan complexe, la partie reelle ℜ(H(jω))

et la partie imaginaire ℑ(H(jω)) sont portees respectivement sur l’axe des abscisses et des

ordonnees. Un tel lieu est represente sur la figure 1.12 et est parametre en ω.

−3 −2 −1 0 1 2 3 4−6

−5

−4

−3

−2

−1

0

ℜ

ℑ

φ

ω croissants

ω=0

ω=ωr

|H(jω)|

|H(0)|

Figure 1.12 – Lieu de Nyquist

Sur cette figure, on lit le gain statique pour ω = 0, soit |H(0)| qui represente le facteur

d’amplification du systeme pour une entree constante (dans ce cas, un signal sinusoıdal de

pulsation nulle). Si pour ω > 0, le module |H(jω)| > |H(0)|, cela revele un phenomene de

resonance. La pulsation de resonance ωr est celle pour laquelle |H(jω)| est maximum et on

definit le facteur de surtension Q comme le rapport de |H(jωr)| sur |H(0)|.

Q =|H(jωr)||H(0)| (1.25)

Diagramme de Bode : Les diagrammes de Bode representent les evolutions du module

|H(jω)| (ou rapport des amplitudes du signal de sortie sur celle du signal d’entree) et celle de

l’argument < H(jω) = φ(ω) > (ou dephasage du sigal de sortie par rapport au signal d’entree)

en fonction de la pulsation ω ou de la frequence f (ω = 2πf). Pratiquement on represente deux

diagrammes :

— le diagramme du gain defini par |H(jω)|dB = 20 log10 |H(jω)|,— le diagramme de phase < H(jω) >= φ(ω).

Remarque : Pour des raisons de commodite, le gain est exprime en decibels. Ainsi des varia-

tions de gains consequentes s’expriment et se representent plus aisement sur un graphique.

Remarque : La fonction de transfert est generalement etudiee sur des plages de frequences

etendues, aussi porte-t-on les pulsations sur une echelle logarithmique.

Pour construire le diagramme de Bode d’une fonction de transfert, il faut :

— factoriser la fonction de transfert pour transformer le numerateur et le denominateur en

produits de termes du premier et/ou du second degre,

14


— placer les pulsations particulieres en abcisse (celles-ci seront identifiees au chapitre dedie

a l’etude des systemes d’ordre un et d’ordre deux),

— tracer les diagrammes asymptotiques de gain et de phase qui traduisent le comportement

du gain et de la phase quand ω tend vers 0 et +∞,

— affiner le trace si les diagrammes asymptotiques ne suffisent pas, en particulier au voisi-

nage des pulsations de resonance.

La figure 1.13 illustre le trace d’un diagramme de bode sur lequel sont mis en evidence les

principales caracteristiques.En particulier :

— le gain statique en dB,

— la pente en dB/decade,

— la phase a l’origine,

— la phase minimale,

— pour ce systeme, la presence d’une resonance.

−40

−30

−20

−10

0

10

20

gain

(dB

)

10−1

100

101

−180

−135

−90

−45

0

phas

e (d

eg)

pulsation (rad/sec)

ωr

|H(ωr)|

dB le gain à la résonance

<H(j∞)>

<H(0)> phase à l’origine

une décade

variation gain

variation phase

|H(0)|dB

gain

statique

QdB

Figure 1.13 – Diagramme de Bode

En automatique, un diagramme de Bode permet de visualiser la plage de frequences au sein

de laquelle il convient de faire fonctionner le systeme etudie. Le diagramme de Bode asympto-

tique du gain, trace a partir de la fonction de transfert harmonique H(jω) montre que le systeme

a un comportement de type passe-bas. Cela signifie que les amplitudes des composantes “basses

frequences” du spectre du signal d’entree ebf (celles inferieures a ωr) sont amplifiees ; en effet

le gain |H(0)|dB > 0 et par suite, les composantes “basses frequences” du spectre de la reponse

sbf = 10|H(0)|dB

20 ebf → sbf = |H(0)|ebf . Sur le diagramme asymptotique de la phase, pour les

basses frequences, la phase est nulle, par consequent, le systeme n’introduit pas de retard de la

sortie sur l’entree.

Aux pulsations superieures a ωr, le gain decroıt lineairement 8, les composantes hautes frequences

du spectre du signal d’entree sont d’autant plus attenuees que la pulsation croıt. Pour les valeurs

8. Cela est du fait que l’axe des abcisses est gradue avec une echelle logarithmique.

15


|H(0)|dB < 0, les amplitude des composantes du spectre de la reponse sont inferieures a celles

du signal d’entree. Lorsque ω >> ωr ces composantes ont des amplitudes proches de 0 ce qui

signifie que les composantes correspondantes du signal d’entree n’agissent pas sur le systeme. Sur

le diagramme asymptotique de la phase, pour les “hautes frequences”, la phase tend a diminuer,

par consequent, le systeme introduit un retard qui tend a augmenter.

On observe une resonance localisee a la pulsation ωr, comme le gain a la resonance est supe-

rieure au gain statique, les composantes du spectre du signal d’entree eres localisees a cette

pulsation et dans son voisinage sont amplifiees d’un facteur sres = 10|H(ωr)|dB

20 eres. Comme

|H(jωr)|dB = |H(0)|dB +QdB, il vient sres = 10|H(0)|dB

20 10QdB20 eres soit sres = 10

QdB20 |H(0)|eres.

En conclusion, il conviendra d’appliquer a ce systeme des signaux de commande dont les compo-

santes du spectre sont inferieures a ωr. De tels signaux ont un effet sur la reponse. En revanche,

les signaux presentant des composantes spectrales proches de ωr sont fortement amplifiees et a

l’origine d’oscillations sur la reponse. Enfin, les signaux dont les composantes du spectre sont

superieures a ωr n’ont aucun effet.

Remarque : pratiquement, il faut etre capable de tracer le diagramme de Bode a partir

du modele H(jω) et reciproquement de determiner le modele a partir des caracteritiques du

diagramme.

Remarque : Les diagrammes de Bode et le lieu de Black-Nichols etudies aux paragraphes

suivants representent la meme fonction de transfert.

Lieu de Black-Nichols : Le lieu de Black-Nichols d’un systeme ayant pour fonction de

transfert harmonique H(jω) est une representation graphique de la fonction de transfert. Ce

lieu se construit en portant :

— en abcisse, l’argument < H(jω) >= φ(ω) encore appele phase,

— en ordonnee, le gain |H(jω)|dB.Le lieu est parametre en ω et le sens des pulsations croissantes est indique par une fleche.

Un tel lieu est represente sur la figure 1.14, ses caracteristiques sont les memes que celles lues

sur le diagramme de Bode.

−180 −135 −90 −45 0−50

−40

−30

−20

−10

0

10

20

Nichols Chart

Open−Loop Phase (deg)

Ope

n−Lo

op G

ain

(dB

)

|H(ωr)|

dB le gain à la résonance

QdB

<H(j∞)>

ωr

ω<H(0)> phase à l’origine

|H(0)|dB

gain

statique

Figure 1.14 – Lieu de Black-Nichols

16


A propos de la construction des lieux et diagrammes : L’etude des limites de la fonction

de transfert harmonique au voisinage de 0 et de +∞ est a mener lors de la construction des

differents lieux et diagrammes, elle permet de degager quelques resultats interessants :

Soit la fonction de transfert (1.24). Dans le cas ou celle-ci possede k poles nuls et m < n, elle

peut s’ecrire :

H(jω) =bm(jω)m + · · ·+ b1jω + b0

(jω)k(an(jω)n−k + · · ·+ ak+1jω + ak)(1.26)

il vient : limω→0

H(jω) → b0ak(jω)k

k 0 1 2 p

|H(jω)| b0a0

b0a1ω

→ +∞ b0a2ω2 → +∞ b0

apωp → +∞|H(jω)|dB 20 log | b0a0 | ≈ −20 logω ≈ −40 logω ≈ −p× 20 logω

< H(jω) > 0 −π2 −π −p×π

2

Tableau 1.2 – Limites d’une fonction de transfert harmonique en zero

il vient : limω→+∞

H(jω) → bman(jω)n−m

n−m 1 2 p

|H(jω)| bmanω

→ 0 bmanω2 → 0 bm

anωp → 0

|H(jω)|dB −20 logω ≈ −40 logω ≈ −p× 20 logω

< H(jω) > −π2 −π −p×π

2

Tableau 1.3 – Limites d’une fonction de transfert harmonique a l’infini

1.3.5 Schemas fonctionnels

La figure 1.15 traduit la representation souvent adoptee en automatique pour representer les

systemes. Ces derniers sont decomposes en sous-systemes elementaires et chaque bloc contient

la fonction de transfert afferente. Cette representation met egalement en evidence les differents

signaux : entrees de commande, de perturbation, reponses, etc.

+

-

e1(p)

e2(p)

e1(p)− e2(p) e(p) H(p) s(p) = H(p)e(p)

Figure 1.15 – Elements pour la construction de schemas fonctionnels

17


~V~F

~x

Figure 1.16 – Le systeme etudie

1.4 EXEMPLE

Dans cet exemple simple, on se propose de mettre en application les notions etudiees prece-

demment. Le systeme etudie et represente sur la figure 1.16 est un vehicule automobile

Pour simplifier cette etude, on pose les hypotheses suivantes :

— la voiture se deplace vers l’avant a la vitesse V ,

— une seule commande : la force motrice/freinage U ,

— le modele adopte pour les frottements aerodynamiques : −fV 2,

— la reponse est la position X du vehicule,

— a l’instant initial, X(0) est quelconque et V (0) = Ve est la vitesse d’equilibre.

Le modele est etabli en appliquant le principe fondamental de la dynamique :

mdV

dt= U − fV 2 (1.27)

On a par ailleurs, la relation cinematique :

dX

dt= V (1.28)

L’etude de l’equilibre pour ce systeme n’est pas interessante, cela supposerait d’etudier le

vehicule a l’arret, en effet a l’equilibre, la conditiondX

dt= 0 doit etre satisfaite. On s’attache

donc a l’etude d’un pseudo-equilibre pour lequel la vitesse V est constante. D’apres (1.27) :

0 = U − fV 2 (1.29)

et par suite :

Ve =

√

Ue

f(1.30)

Comme le montre la figure 1.17, il existe pour ce systeme une infinite de points d’equilibre.

18

1.4. EXEMPLE

0 500 1000 1500 2000 2500 30000

10

20

30

40

50

60

Ue (N)

Ve

(m/s

)

Figure 1.17 – Carte des equilibres du vehicule automobile

Dans la suite de l’etude, un point d’equilibre est choisi arbitrairement, soit {Ue, Ve} et on

considere de petites variations de la commande u << Ue engendrant de petites variations de la

vitesse v << Ve autour de cet equilibre, de sorte que :

U = Ue + u (1.31)

V = Ve + v (1.32)

Ainsi, l’equation (1.27) s’ecrit :

md(Ve + v)

dt= (Ue + u)− f(Ve + v)2 (1.33)

apres developpement et en eliminant les termes de degre 2 (comme v << Ve ⇒ v2 << vVe), on

obtient les equations du systeme linearise :

mdVedt

︸︷︷︸

=0

+mdv

dt= Ue − fV 2

e︸︷︷︸

=0

+u− 2fVev (1.34)

d’ou

mdv

dt= u− 2fVev (1.35)

Comme Ve = cte, (1.28) s’ecrit :

dX

dt= V = Ve + v = Ve +

dx

dt(1.36)

il vient :

dx

dt= v (1.37)

19


On calcule ensuite les transformees de Laplace de ces equations :

mpV (p)−mv(0) = U(p)− 2fVeV (p) (1.38)

pX(p)− x(0) = V (p) (1.39)

Signalons que x(t) et v(t) sont des fonctions continues et que par consequent x(0−) = x(0)

et v(0−) = v(0) = 0 9. En couplant ces equations, il vient :

X(p) =U(p)

p(mp+ 2fVe)+x0p

(1.40)

Expression dans laquelle on reconnaıt dans le premier terme du membre de gauche le regime

force et le regime libre dans le dernier termes. La fonction de transfert est etablie pour des

conditions initiales nulles :

X(p)

U(p)=

1

p(mp+ 2fVe)(1.41)

En reponse a un echelon de commande d’amplitude u0 :

X(p) =1

p(mp+ 2fVe)

(u0p

)

+x0p

(1.42)

X(p) est decomposee en elements simples pour faire apparaıtre des transformees de Laplace

elementaires :

X(p) =A

p2+B

p+

C

p+ 2fVe

m

+x0p

(1.43)

avec A =u0

2fVeet B = −C = − u0m

4f2V 2e

La position x(t) est etablie au moyen des tables de transformees fournies en annexe B. Elle

est representee sur la figure 1.18

x(t) = x0︸︷︷︸

ci

+

At−B

︸︷︷︸

permanent

+Ce−2fVet

m︸︷︷︸

transitoire

U(t) (1.44)

9. Et surtout pas V (0) = Ve, en effet la transformee de Laplace des equations differentielles est ecrite pour de

petites variations v de V autour de l’equilibre. A l’instant initial, le vehicule roule a la vitesse Ve et l’ecart v(0) a

l’equilibre est nul.

20

1.4. EXEMPLE

0 5 10 15 20 25 300

50

100

150

200

250

300

350

400

450

Temps (s)

Pos

ition

x(t

) (m

)x

0+(At−B)U(t)

Figure 1.18 – Reponse de la voiture a un echelon d’amplitude u0 = 1000N et x0 = 100m

La fonction de transfert harmonique est obtenue immediatement en substituant jω a p dans

(1.41), il convient toutefois d’avoir a l’esprit qu’elle n’est operante que pour les signaux harmo-

niques en regime permanent.

X(jω)

U(jω)=

(1

2fVe

)

jω

(

jωm

2fVe+ 1

) (1.45)

Pour construire une representation graphique de cette fonction de transfert, on utilise les

resultats etablis precedemment et portant sur les limites de la fonction de transfert pour ω ten-

dant vers 0 et vers +∞. Dans cet exemple, le numerateur est un polynome de degre 0 et le

numerateur un polynome de degre 2.

La pulsation ωc =2fVem

est remarquable 10 et a ce titre, on calcule le module, le gain et l’argu-

ment de H(jωc) (cf. Tableau 1.4).

Pour les valeurs suivantes des parametres : Ve = 20ms−1, f = 1kgm−1 et m = 1000kg, on

trace le diagramme de Bode (figure 1.19) et le lieu de Black-Nichols (figure 1.20) de la fonction

de transfert :

X(jω)

U(jω)=

0.025

jω(jω

0.04+ 1)

(1.46)

10. La raison en est la suivante, a la pulsation ωc la fonction de transfert elementaire1

jω m2fVe

+ 1a sa partie

reelle egale a sa partie imaginaire. Par consequent,

— pour ω << ωc, elle tend vers 1, nombre reel, et n’a aucun effet sur l’amplitude et la phase,

— pour ω >> ωc, elle tend vers2fVe

jmω, imaginaire pur, elle fait donc tendre l’amplitude vers 0 mais surtout,

elle produit un retard de phase qui tend vers −π2,

— ainsi ω = ωc traduit la pulsation a laquelle le comportement de cette fonction de transfert change.

21


ω 0 2fVe

m +∞|H(jω)| 1

2fVeωm

4f2V 2e

√2

1

mω2

|H(jω)|dB −20 logω 20 log(

m4f2V 2

e

)

− 3dB −40 logω

< H(jω) > −π2 −3π

4 −π

Tableau 1.4 – Module, gain et argument de la fonction de transfert du vehicule en fonction de ω

−60

−40

−20

0

20

40

Gai

n (d

B)

10−3

10−2

10−1

100

−180

−135

−90

Pha

se (

deg)

Pulsation (rad/sec)

−40dB/dec

−20dB/dec

ωc

Figure 1.19 – Diagramme de Bode de la voiture

−180 −150 −120 −90−70

−60

−50

−40

−30

−20

−10

0

10

20

30

Nichols Chart

Phase (deg)

Gai

n (d

B) ω

c

Figure 1.20 – Lieu de Black-Nichols de la voiture

Ces diagammes revelent un gain statique qui tend vers +∞, cela traduit le fait qu’une

force motrice constante (de pulsation nulle) fait augmenter continument la position du vehicule,

autrement dit la voiture se deplace et x(t) augmente. Si la force motrice varie sinusoıdalement

autour de sa valeur d’equilibre Ue, a des pulsations telles que |H(jω)|dB ≤ 0dB, la position de

la voiture ne serait pas affectee par l’effet de cette commande, la voiture roulerait donc a V =

22

1.4. EXEMPLE

Ve et la position continuerait a augmenter proportionnellement au temps. Cette etude montre

qu’il ne sert a rien d’appliquer une force motrice dont l’analyse du signal revelerait la presence

d’harmoniques de pulsation trop elevee. Plus simplement, ecraser la pedale d’accelerateur ne fait

pas reagir le vehicule plus rapidement.

23


24

CHAPITRE 2

SYSTEMES SIMPLES

2.1 INTRODUCTION

L’experience montre que les reponses aux entrees-types de nombreux systemes presentent

des similitudes. Ainsi les reponses indicielles representees sur la figure 2.1 sont frequemment

observees.

0 2 4 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Réponse indicielle

Temps (sec)

Am

plitu

de

0 5 10 150

0.2

0.4

0.6

0.8

1

1.2

1.4

Réponse indicielle

Temps (sec)

Am

plitu

de

Figure 2.1 – Reponses indicielles frequemment observees

D’autre part, l’etablissement d’un modele de connaissance, sous les hypotheses de continuite,

d’invariance et de linearite, conduit tres souvent a representer les systemes etudies par des

equations differentielles lineaires a coefficients constants d’ordre un et deux.

Dans ce chapitre, on etablit les modeles et les proprietes de ces systemes, qualifies d’ordre un

et d’ordre deux, et dont les reponses indicielles peuvent avoir les allures illustrees sur la figure

2.1.

25

Chapitre 2. SYSTEMES SIMPLES

2.2 SYSTEME DU PREMIER ORDRE

2.2.1 Modele

On appelle systeme du premier ordre un systeme dont l’entree e(t) et la sortie s(t) sont liees

par une equation differentielle lineaire du premier ordre de la forme :

τds(t)

dt+ s(t) = ke(t) (2.1)

— τ est la constante de temps,

— k est le gain statique.

Un tel modele rend compte d’un systeme possedant un reservoir d’energie. C’est par exemple

le cas du vehicule automobile etudie au chapitre un pour lequel l’entree de commande est la

force motrice/freinage et la reponse la vitesse (1.35). Ce systeme possede un reservoir d’energie

cinetique : la masse de la voiture.

Certains aspects du comportement d’un avion peuvent etre decrits par des modeles du premier

ordre, c’est le cas du mode de roulis pur et du mode spiral.

2.2.2 Fonctions de transfert

La transformation de Laplace de (2.1) avec la condition initiale s(0−) :

pτS(p)− τs(0−) + S(p) = kE(p) (2.2)

S(p) =k(p)

τp+ 1E(p)

︸︷︷︸

regime force

+τs(0−)τp+ 1︸︷︷︸

regime libre

(2.3)


Avec la condition initiale s(0−) = 0, la fonction de transfert d’un systeme du premier ordre :

H(p) =S(p)

E(p)=

k

τp+ 1(2.4)

Les parametres de cette fonction de transfert sont :

— le pole reel : p1 = −1

τ— le gain statique H(0) = k


La fonction de transfert harmonique a pour expression :

H(jω) =S(jω)

E(jω)=

k

jωτ + 1(2.5)

26

2.2. SYSTEME DU PREMIER ORDRE

Caracterisee par le module et l’argument de H(jω) :

|H(jω)| =|k|√

ω2τ2 + 1(2.6)

< H(jω) > = < k > − tan−1(ωτ)

2.2.3 Reponses aux entrees types

2.2.3.1 Reponse impulsionnelle

On applique a l’entree de ce systeme l’impulsion de dirac de poids e0, soit e(t) = e0δ(t) et

L [e(t)] = e0, il vient :

S(p) =kτ

p+ 1τ

e0 (2.7)

dont l’original figure dans les tables de transformees de l’annexe B,

s(t) =ke0τe−

tτ U(t) (2.8)

Un tel systeme est asymptotiquement stable pour τ > 0. Dans le cas ou τ < 0, la reponse

diverge.

Remarque : la reponse de ce systeme en regime libre a la condition initiale s(0−) = ke0τ est

identique a celle de la reponse a une impulsion de poids e0 avec une condition initiale nulle.

Remarque : un regime transitoire tel que (2.8) et illustre sur la figure 2.2 caracterise un

mode 1 du premier ordre.

2.2.3.2 Reponse indicielle

On applique a l’entree de ce systeme l’echelon d’amplitude e1, soit e(t) = e1U(t) et L [e(t)] =e1p, il vient :

S(p) = k1τ

p+ 1τ

e1p

(2.9)

Apres decomposition en elements simples :

S(p) = ke1

(

1

p− 1

p+ 1τ

)

(2.10)

dont les transformees de Laplace inverse figurent dans les tables de l’annexe B,

s(t) = ke1

(

1− e−tτ

)

U(t) (2.11)

— le regime permanent ke1U(t) correspond bien au produit du gain statique par l’amplitude

de l’echelon,

— le regime transitoire −ke1e−tτ U(t) tend a s’eteindre pour τ > 0,

— aux instants t = τ , t = 3τ , la reponse est egale a :

— s(τ) = 0, 63ke1,

— s(3τ) = 0, 95ke1 et t = 3τ correspond approximativement a la duree du transitoire.

La reponse indicielle est illustree sur la figure 2.2.

1. Un mode est en fait un comportement.

27


2.2.3.3 Reponse en vitesse

On applique a l’entree de ce systeme l’echelon de vitesse d’amplitude e2 ou la rampe de pente

e2, soit e(t) = e2tU(t) et L [e(t)] =e2p2

, il vient :

S(p) = k1τ

p+ 1τ

e2p2

(2.12)

apres decomposition en elements simples :

S(p) = ke2

(

1

p2− τ

p+

τ

p+ 1τ

)

(2.13)

s(t) = ke2

(

t− τ + τe−tτ

)

U(t) (2.14)

— le regime permanent ke2(t − τ)U(t) correspond bien au produit du gain statique par

l’amplitude de l’echelon de vitesse d’amplitude e2, il presente un retard τ ,

— le regime transitoire ke2τe− t

τ U(t) tend a s’eteindre pour τ > 0 en environ 3τ .

La reponse en vitesse est illustree sur la figure 2.2.

0 2 4 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Temps (sec)

Am

plitu

de

0 2 4 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Temps (sec)

Am

plitu

de

0 2 4 60

1

2

3

4

5

6

Temps (sec)

Am

plitu

de

3τ3ττ

τ

0,63ke1

0,05ke0/τ

ke0/τ

ke2(t−τ)U(t)

ke1

0,95ke1

Figure 2.2 – Reponses impulsionnelle, indicielle et en vitesse d’un systeme du premier ordre

2.2.3.4 Reponse harmonique

La fonction de transfert harmonique (2.5) permet d’etudier le comportement du systeme en

regime permanent pour une entree harmonique. Le numerateur est de degre zero et le denomi-

nateur de degre un, on utilise les tableaux 1.2 et 1.3 pour etudier le comportement du systeme

28

2.2. SYSTEME DU PREMIER ORDRE

lorsque ω tend vers zero et +∞.

Pour la pulsation ω = ωc =1

τ, la partie reelle du denominateur de H(jω) est egale a la partie

imaginaire et marque un changement de comportement du systeme. Cette pulsation est appelee

pulsation de coupure 2.

Tous ces resultats sont rapportes dans le tableau 2.1 pour τ > 0 3, les valeurs particulieres sont

calculees d’apres les relations 2.6.

ω 0 ωc =1τ +∞

|H(jω)| |k| |k|√2

|k|ωτ

|H(jω)|dB 20 log |k| 20 log |k| − 3dB ≈ −20 logω

< H(jω) > < k > < k > −π4

< k > −π2

Tableau 2.1 – Analyse de la fonction de transfert harmonique d’un premier ordre

2.2.4 Diagrammes frequentiels

Le lieu de Nyquist, les diagrammes de Bode et le lieu de Black-Nichols d’un systeme du

premier ordre sont representes sur les figures 2.3, 2.4 et 2.5, ils ont ete traces pour k > 0. La

pulsation ωc = 1τ est appelee pulsation de coupure et l’intervalle [0, ωc] est la bande passante

du systeme. Pratiquement, il convient d’appliquer a un systeme du premier ordre un signal de

commande dont le spectre frequentiel soit contenu dans la bande passante, les composantes du

spectre dont la pulsation est superieure a ωc n’ayant peu ou pas d’effet sur la reponse.

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

−0.6

−0.5

−0.4

−0.3

−0.2

−0.1

0

0.1

partie réelle

part

ie im

gina

ire

ωc

|k|

ω

Figure 2.3 – Lieu de Nyquist d’un systeme du premier ordre

2. Pour un systeme a gain statique unitaire, la pulsation de coupure verifie la propriete suivante : le signal

d’entree etant un signal sinusoıdal de pulsation ωc etabli depuis un temps infini. Alors, la puissance du signal de

sortie est egale a la moitie de celle du signal d’entree. En effet, |S(ωc)| = |E(ωc)|√2

, d’apres le theoreme de Parseval

la puissance de ces signaux |S(ωc)|2 =(

|E(ωc)|√2

)2

= |E(ωc)|22

.

3. dans le cas ou τ est negatif, comme on l’a vu plus haut, la reponse diverge.

29


−40

−30

−20

−10

0

Gai

n (d

B)

10−2

10−1

100

101

102

−90

−60

−30

0

Pha

se (

deg)

Pulsation (rad/sec)

ωc

−20dB/decade

20log|k|

Figure 2.4 – Diagrames de Bode d’un systeme du premier ordre

−90 −60 −30 0−45

−40

−35

−30

−25

−20

−15

−10

−5

0

Phase (deg)

Gai

n (d

B)

20log|k|

ωc

ω

Figure 2.5 – Lieu de Black-Nichols d’un systeme du premier ordre

2.2.5 Relation temps-frequence

Pour un systeme du premier ordre, le temps de reponse a 5% est egal a 3τ et la bande passante

est definie par l’intervalle [0, 1τ ]. Ainsi il apparaıt que le systeme est d’autant plus rapide que sa

bande passante est grande, c’est ce que montre la figure 2.6. En effet, un signal dont la bande

passante est large transmet les harmoniques de rang eleve, lesquels sont les composantes rapides

de ce signal.

30

2.3. SYSTEMES DU SECOND ORDRE

0 1 2 3 4 5 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Réponse indicielle

Temps (sec)

Am

plitu

de

2ττ

10−2

10−1

100

101

102

−40

−35

−30

−25

−20

−15

−10

−5

0

Mag

nitu

de (

dB)

Diagramme de Bode

Pulsation (rad/sec)

1/2τ1/τ

Figure 2.6 – Correspondance temps-frequence pour un systeme d’ordre un

2.2.6 Relation temps-poles

Pour un systeme du premier ordre stable, i.e. dont le transitoire tend a s’eteindre, le pole

p = − 1τ est a gauche de l’axe imaginaire. Il en est d’autant plus eloigne que le temps de reponse

est court.

0 1 2 3 4 5 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Réponse indicielle

Temps (sec)

Am

plitu

de

2ττ

−3 −2.5 −2 −1.5 −1 −0.5 0−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

Carte des poles

axe réel

axe

imag

inai

re

−1/2τ−1/τ

Figure 2.7 – Correspondance temps-poles pour un systeme d’ordre un

2.3 SYSTEMES DU SECOND ORDRE

On appelle systeme du second ordre un systeme dont l’entree e(t) et la sortie s(t) sont liees

par une equation differentielle lineaire du second ordre de la forme :

a2ds2(t)

dt2+ a1

ds(t)

dt+ a0s(t) = b0e(t) (2.15)

31


Un tel modele rend compte d’un systeme possedant deux reservoirs d’energie et d’un element

susceptible de la dissiper, par exemple le circuit RLC en electricite ou le systeme masse-ressort

avec frottements en mecanique.

Certains aspects du comportement d’un avion peuvent etre decrits par des modeles du second

ordre, c’est le cas des modes de roulis hollandais, d’incidence et de la phugoıde.

On ecrira systematiquement (2.15) sous la forme :

1

ω2n

ds2(t)

dt2+

2ξ

ωn

ds(t)

dt+ s(t) = ke(t) (2.16)

ou les parametres du systeme du second ordre sont :

— ξ le facteur d’amortissement,

— ωn la pulsation propre non-amortie,

— k le gain statique.

2.3.1 Fonctions de transfert

La transformation de Laplace de (2.16) avec les conditions initiales s(0−), s′(0−) qui pour unsysteme mecanique pourraient representer la position et la vitesse initiale 4 du systeme etudie a

pour expression :

1

ω2n

(p2S(p)− ps(0−)− s′(0−)) +2ξ

ωn(pS(p)− s(0−)) + S(p) = kE(p) (2.17)

S(p) =k(p)

p2

ω2n

+2ξ

ωnp+ 1

E(p)

︸︷︷︸

regime force

+

s(0−)

(p

ω2n

+2ξ

ωn

)

+s′(0−)ω2n

p2

ω2n

+2ξ

ωnp+ 1

︸︷︷︸

regime libre

(2.18)


Avec les conditions initiales s(0−) = s′(0−) = 0, la fonction de transfert d’un systeme du

second ordre :

S(p)

E(p)=

kω2n

p2 + 2ξωnp+ ω2n

(2.19)

Cette fonction de transfert est caracterisee par :

— ses poles, ces derniers sont :

— reels distincts lorsque ξ > 1 :

p1 = −ξωn + ωn

√

ξ2 − 1 (2.20)

p2 = −ξωn − ωn

√

ξ2 − 1

4. En prenant toutefois garde au fait qu’il s’agit de variations de position et de vitesse par rapport a la position

et a la vitesse d’equilibre.

32


— reels doubles lorsque ξ = 1 :

p1 = p2 = −ωn (2.21)

— complexes conjugues lorsque 0 ≤ ξ < 1 :

p1 = −ξωn + jωn

√

1− ξ2 (2.22)

p2 = −ξωn − jωn

√

1− ξ2

Ce dernier cas est represente sur la figure 2.8.

— son gain statique H(0) = k

Comme on le verra ulterieurement, la nature et la valeur des poles conditionnent les allures des

reponses temporelles et frequentielles.

ℜ

ℑ

p1

p2

ψ

jωn

√

1− ξ2

−jωn

√

1− ξ2

−ξωn

jωn

−jωn

−ωn

Figure 2.8 – Images des poles dans le plan complexe pour 1 > ξ ≥ 0


La fonction de transfert harmonique a pour expression :

H(jω) =S(jω)

E(jω)=

kω2n

ω2n − ω2 + j2ξωnω

(2.23)

2.3.2 Reponses aux entrees types

2.3.2.1 Reponse indicielle

On applique a l’entree de ce systeme l’echelon d’amplitude e1, soit e(t) = e1U(t) et L [e(t)] =e1p, il vient :

S(p) =ke1ω

2n

p(p2 + 2ξωnp+ ω2n)

(2.24)

que l’on ecrit :

S(p) =ke1ω

2n

p(p− p1)(p− p2)(2.25)

33


Poles reels distincts : On decompose (2.25) en elements simples :

S(p) = ke1

(

1

p+

p2p1−p2

p− p1−

p1p1−p2

p− p2

)

(2.26)

On pose p1 = − 1

τ1> p2 = − 1

τ2. Comme pour les systemes du premier ordre, les τi, i = 1, 2

sont homogenes a des constantes de temps. Apres calcul, il vient :

S(p) = ke1

(

1

p−

τ1τ1−τ2

p+ 1τ1

+τ2

τ1−τ2

p+ 1τ2

)

(2.27)

D’apres les tables de transformee,

s(t) = ke1

1︸︷︷︸

permanent

− τ1τ1 − τ2

e− t

τ1 +τ2

τ1 − τ2e− t

τ2

︸︷︷︸

transitoire

U(t) (2.28)

L’expression de s(t) montre que le regime transitoire est la somme de deux regimes transitoires

du premier ordre de constantes de temps τ1 et τ2 avec τ1 > τ2. Le premier regime transitoire a

une duree approximative de 3τ1 et dure plus longtemps que le second regime transitoire dont la

duree vaut 3τ2. On dit que la reponse du systeme comporte deux modes aperiodiques.

En outre, les amplitudes maximales (en valeur absolue) de ces transitoires calculees a t = 0 sont

telles queτ1

τ1 − τ2>

τ2τ1 − τ2

.

Pour ces raisons, le transitoire associe a la constante de temps τ1 (au pole p1) est qualifie de

mode dominant et p1 de pole dominant.

Poles reels doubles : On decompose (2.25) en elements simples :

S(p) = ke1ω21

( 1p21

p−

1p21

p− p1+

1p1

(p− p1)2

)

(2.29)

On pose p1 = −ωn = − 1

τ1et (2.29) s’ecrit :

S(p) = ke1

(

1

p− 1

p+ 1τ1

−1τ1

(p+ 1τ1)2

)

(2.30)

qui admet la transformee de Laplace inverse :

s(t) =

1︸︷︷︸

permanent

− e− t

τ1 − t

τ1e− t

τ1

︸︷︷︸

transitoire

U(t) (2.31)

Ce systeme comporte un seul mode aperiodique et on qualifie son comportement de regime

critique.

34


Poles complexes conjugues : La decomposition en elements simples de (2.25) est identique

a celle de (2.26). On l’exprime avantageusement en utilisant pour p1 et p2 la forme exponentielle.

p1 = −ξωn + jωn

√

1− ξ2 = ωnejφ

p2 = −ξωn − jωn

√

1− ξ2 = ωne−jφ

φ = − tan−1

(√1−ξ2

ξ

) (2.32)

S(p) = ke1

(

1

p+

e−jφ

2j√

1− ξ21

p+ ξωn − jωn

√

1− ξ2− ejφ

2j√

1− ξ21

p+ ξωn + jωn

√

1− ξ2

)

(2.33)

On pose ωp = ωn

√

1− ξ2 et la transformee de Laplace inverse de (2.33) s’ecrit :

s(t) = ke1

(

1− e−ξωnt

√

1− ξ2

(ej(ωpt−φ) − e−j(ωpt−φ)

)

2j

)

U(t) (2.34)

s(t) = ke1U(t)︸︷︷︸

permanent

− ke1e−ξωnt

√

1− ξ2sin(ωpt− φ)U(t)

︸︷︷︸

transitoire

(2.35)

La reponse montre que la partie reelle du pole est responsable de l’extinction du transitoire

alors que la partie imaginaire l’est du regime oscillant de pulsation ωp. On dit que le systeme

comporte un mode pseudo-periodique ou oscillatoire amorti.

La figure 2.9 montre les reponses de systemes du second ordre pour differentes valeurs du

facteur d’amortissement ξ. Ces reponses sont d’autant plus mal amorties que ξ est petit.

0 5 10 150

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

Temps (sec)

Am

plitu

de

ξ=00,1

0,3

0,7

1

2,5

5

Figure 2.9 – Reponses indicielles d’un systeme du second ordre fonction de ξ

35


2.3.2.2 Analyse des performances

Les resultats suivants ont ete etablis pour une entree en echelon. Ils permettent a partir :

— d’un modele d’un systeme d’ordre deux, de predire l’allure de la reponse indicielle,

— d’un releve de la reponse indicielle d’identifier, les parametres du modele d’un systeme.

Lorsque 0 ≤ ξ < 1, l’analyse deds(t)

dtmontre que l’amplitude du premier depassement a

pour expression :

D1 = ke1e− ξπ√

1−ξ2 (2.36)

Ce maximum est atteint a a l’instant

tpic =π

ωn

√

1− ξ2(2.37)

La courbe 2.10 montre l’evolution du depassement, exprime en % en fonction du facteur

d’amortissement ξ.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

10

20

30

40

50

60

70

80

90Second ordre − Abaque de dépassement

ξ

D%

Figure 2.10 – Depassement relatif d’un systeme du second ordre en fonction de ξ

De meme, la reponse indicielle presente une oscillation dont la pulsation ωp est appelee

pseudo-pulsation et la periode est qualifiee de pseudo-periode Tp =2π

ωp.

Enfin, le temps de reponse a 5% est donne par la formule (2.38), quel que soit ξ > 0.

1√

1− ξ2e−ξωntr5% sin(ωptr5% + φ) = ±0.05 (2.38)

Pratiquement, on utilise l’abaque 2.11.

36


Figure 2.11 – Temps de reponse a 5% d’un systeme du second ordre en fonction de ξ

2.3.2.3 Reponse harmonique

La fonction de transfert harmonique (2.23) a

— pour module : |H(jω)| = |k|ω2n

√

(ω2n − ω2)2 + (2ξωn)2

— pour argument :

< H(jω) >=< k > − tan−1

(2ξωωn

ω2n − ω2

)

pour ω < ωn

< H(jω) >=< k > − tan−1

(2ξωωn

ω2n − ω2

)

− π pour ω > ωn5

On utilise la aussi les resultats resumes dans les tableaux 1.2 et 1.3 pour etudier le comportement

du systeme lorsque ω tend vers zero, vers plus l’infini et en ωn. L’etude de |H(jω)| montre que

ω 0 ωn +∞|H(jω)| |k| |k|

2ξ|k|ω2

nω2

|H(jω)|dB 20 log |k| 20 log |k| − 20 log ξ − 6dB ≈ −40 logω

< H(jω) > < k > < k > −π2

< k > −π

Tableau 2.2 – Analyse de la fonction de transfert harmonique d’un second ordre

cette fonction presente un maximum pour ω 6= 0 si et seulement si ξ <√22 . Ce maximum est

atteint pour la pulsation ωr dite pulsation de resonance :

ωr = ωn

√

1− 2ξ2 (2.39)

il vaut :

|k| 1

2ξ√

1− ξ2(2.40)

5. Ceci afin de garantir la continuite de l’argument au voisinage de ωn.

37


Relativement au gain statique k, a la pulsation de resonance, le gain est amplifie d’un facteur

Q =1

2ξ√

1− ξ2appele facteur de sutension et d’autant plus grand que ξ est petit.

Le gain a la pulsation ωr exprime en dB :

20 log |k|︸︷︷︸

gain statique

+20 log1

2ξ√

1− ξ2︸︷︷︸

QdB

(2.41)

2.3.2.4 Diagrammes frequentiels

Les figures 2.12 et 2.13 illustrent les traces des diagrammes de Bode et lieux de Black de

systeme du second ordre pour differentes valeurs de ξ. Ces graphiques montrent que l’on peut

appliquer a ces systemes des signaux de commande dont le spectre est contenu dans la bande

[0, ωn] lorsque ξ ≥√22 , mais qu’il convient de reduire la bande passante de ces signaux pour

ξ <√22 . Il reste cependant qu’on ne maıtrise pas le spectre des entrees de perturbation, lesquelles

peuvent, lorsque ξ <√22 , etre a l’origine de phenomenes de resonance.

On observe qu’a la pulsation ωn la phase est egale a −π2, et ce quelque soit la valeur de ξ.

Pratiquement, on identifie ωn en reglant la pulsation du signal d’entree de sorte que la sortie

presente un retard de phase deπ

2sur l’entree.

On observe egalement que QdB augmente tandis que ξ diminue. Il en va de meme de la variation

de phase.

−80

−70

−60

−50

−40

−30

−20

−10

0

10

20

Gai

n (d

B)

10−2

10−1

100

101

102

−180

−135

−90

−45

0

Pha

se (

deg)

pulsation (rad/sec)

ξ=0,1ξ=0,3ξ=0,7ξ=1ξ=2,5ξ=5

ωr

QdB

20log|k|

−40dB/dec

ωn

Figure 2.12 – Diagrammes de Bode d’un systeme du systeme du second ordre traces en fonction de ξ

38

2.4. STABILITE DES SYSTEMES LINEAIRES INVARIANTS CONTINUS

−180 −135 −90 −45 0−100

−80

−60

−40

−20

0

20

Phase (deg)

Gai

n (d

B)

ξ=0,1ξ=0,3ξ=0,7ξ=1ξ=2,5ξ=5sys6sys6

20log|k|

QdB

ωrω

n

Figure 2.13 – Lieux de Black d’un systeme du systeme du second ordre traces en fonction de ξ

2.4 STABILITE DES SYSTEMES LINEAIRES INVARIANTS

CONTINUS

On se propose dans ce paragraphe d’etablir les conditions sous lesquelles un systemes LIC

est asymptotiquement stable. Dans le cas general, on a vu (1.16) qu’un tel systeme pouvait etre

decrit par une fonction de transfert de la forme :

H(p) =S(p)

E(p)=bmp

m + bm−1pm−1 + · · ·+ b1p+ b0

anpn + an−1pn−1 + · · ·+ a1p+ a0(2.42)

qu’on met sous la forme :

H(p) =S(p)

E(p)=

1

an

bmpm + bm−1p

m−1 + · · ·+ b1p+ b0pn + an−1

anpn−1 + · · ·+ a1

anp+ a0

an

(2.43)

Ses poles sont reels pri et/ou poles complexes conjugues ℜpj ± ℑpj . Sans perte de generalites

et pour alleger les ecritures, on ne considere que des poles distincts. On peut donc ecrire le

denominateur comme un produit de facteurs :

H(p) =S(p)

E(p)=

bmpm + bm−1p

m−1 + · · ·+ b1p+ b0(p− pr1) · · ·+ (p−ℜpc1 + jℑpc1)(p−ℜpc1 − jℑpc1) . . .

(2.44)

pour n > m, apres decomposition en elements simples :

H(p) =S(p)

E(p)=

A1

p− pr1· · ·+ B1

p−ℜpc1 − jℑpc1− B1

p−ℜpc1 + jℑpc1. . . (2.45)

Pour une entree impulsionnelle de poids unitaire, la fonction de transfert H(p) est egale a la

reponse impulsionnelle S(p), de sorte que la transforme de Laplace inverse de (2.45) s’ecrive :

s(t) = A1epr1 t + · · ·+B1e

ℜpc1 t(

eℑpc1 t − e−ℑpc1 t)

+ . . . (2.46)

39


Conformement a la definition de la stabilite asymptotique qui precise qu’ecarte de son

etat d’equilibre la reponse tend a y revenir, un systeme LIC est asymptotiquement stable si et

seulement si tous les poles de H(p) ont leur partie reelle strictement negative.

Si un ou plusieurs poles reels ou complexes conjugues sont nuls ou ont leur partie reelle nulle, le

systeme est juste stable et la reponse impulsionnelle est bornee.

Si un ou plusieurs poles reels ou complexes conjugues sont positifs ou ont leur partie reelle

positive, le systeme est instable et la reponse diverge.

2.5 SYSTEMES D’ORDRE SUPERIEURS A DEUX

Dans cette partie, on va montrer que le comportement d’un systeme d’ordre superieur a deux

peut, sous certaines reserves, s’etudier comme la superposition de sous-systemes d’ordre un et

deux.

Le systeme decrit par l’equation (2.42) peut en lieu et place d’etre ecrit comme (2.44) etre

mis sous la forme :

H(p) =S(p)

E(p)=

b′mpm + b′m−1p

m−1 + · · ·+ b′1p+ b′0(p− pr1) . . . (p− prℓ)(p2 + 2ξ1ωn1 + ω2

n1) . . . (p2 + 2ξmωnm + ω2

nm)

(2.47)

ou b′j =bjan

et qui admet la decomposition en elements simples suivante :

H(p) =S(p)

E(p)=∑

i

kip− pri

︸︷︷︸

poles reels

+∑

j

kjω2nj

p2 + 2ξjωnj + ω2nj

︸︷︷︸

poles complexes conjugues

(2.48)

Le systeme complet apparaıt donc comme la somme de plusieurs sous-systemes simples et la

reponse d’un tel systeme est la somme des reponses de chacun des sous-systemes soumis a la

meme entree 6 :

6. La decomposition en elements simples du sous-systeme du second ordre

G(p) =kω2

n

p2 + 2ξωn + ω2n

=kω2

n

2j√

1− ξ2

(

1

p+ ξωn − jωn

√

1− ξ2− 1

p+ ξωn + jωn

√

1− ξ2

)

(2.49)

qui admet pour reponse impulsionelle :

g(t) =kωn

√

1− ξ2

(

e(−ξωn+jωn

√1−ξ2)t − e(−ξωn−jωn

√1−ξ2)t

2j

)

U(t) = kωne−ξωnt

√

1− ξ2sin(ωn

√

1− ξ2t)U(t) (2.50)

40

2.5. SYSTEMES D’ORDRE SUPERIEURS A DEUX

++

++

S(p)E(p)

k1τ1p+ 1

kiτip+ 1

kjω2j

p2 + 2ξjωjp+ ω2j

Figure 2.14 – Decomposition d’un systeme d’ordre superieur a deux en sous-systemes d’ordre un et deux

En particulier, la reponse impulsionnelle a pour expression :

s(t) =

∑

i

kie−prit +

∑

j

kjωnj√

1− ξ2j

e−ξjωnj t sinωnj

√

1− ξ2j t

U(t) (2.51)

L’extinction des modes du premier ordre est fonction de pri = − 1

τiet la duree de ces transi-

toires est environ egale a 3τi7. Ces transitoires du premier ordre sont d’autant plus courts que

τi ou pri sont petits. L’extinction des modes du second ordre est fonction de −ξjωnj , la partie

reelle des poles complexes conjugues. La duree de ces transitoires est d’autant plus courte que

−ξjωnj est petit.

Comme la reponse du systeme est la somme des reponses de chacun des sous-systemes, le transi-

toire qui dure le plus longtemps est celui qui est associe au(x) pole(s) dont la partie reelle est la

plus grande, autrement dit, le(s) pole(s) le(s) plus proche(s) de l’axe imaginaire. Si le pole le plus

proche de l’axe imaginaire est reel, le systeme presente un mode dominant du premier ordre. Si

les poles les plus proches sont complexes conjugues, le systeme presente un mode dominant du

second ordre.

La carte des poles d’un systeme d’ordre trois est representee sur la figure 2.15 ou il apparaıt

que les poles les plus proches de l’axe imaginaire sont les poles complexes conjugues, ces poles

sont qualifies de dominants et la reponse impulsionnelle de ce systeme, illustree par la figure 2.16

montre que la reponse ressemble a celle d’un systeme d’ordre deux. Les figures intermediaires

montrent les reponses impulsionnelles des sous-systemes d’ordre un et deux qui composent ce

systeme, il apparaıt que le transitoire du systeme du premier ordre est beaucoup plus court que

celui du systeme du second ordre. Ceci est vrai a la condition que les poles soient suffisament

decouples.

7. En realite, cette duree est infinie.

41


✲

✻

ℜ

ℑ

p1

p2

ψ

jωn

√

1− ξ2

−jωn

√

1− ξ2

−ξωnp3 = − 1

τ3

Figure 2.15 – Images des poles dans le plan complexe pour 1 > ξ ≥ 0

0 5 10 15−1

−0.5

0

0.5

1

Impulse Response

Time (sec)

Am

plitu

de

0 5 10 15−1

−0.5

0

0.5

1

Impulse Response

Time (sec)

Am

plitu

de

0 0.1 0.2 0.3 0.4 0.5 0.60

0.5

1

Impulse Response

Time (sec)

Am

plitu

de mode du premier ordre

mode du second ordre

reponse du systeme complet

Figure 2.16 – Reponse impulsionnelle d’un systeme d’ordre trois presentant un mode dominant d’ordre

deux

2.6 AUTRES SYSTEMES SIMPLES REMARQUABLES

Les proprietes des systemes d’ordre un et deux remarquables, a l’instar de l’integrateur, du

double integrateur, de l’approximation au premier ordre d’un retard pur et du systeme du second

ordre avec zero sont decrits dans l’annexe C.

42

2.7. Exemple

2.7 Exemple

Dans cet exemple, on etudie le comportement d’un avion volant en palier autour de son axe

de tangage. Cet avion est controle par la gouverne de profondeur, laquelle est pilotee par un

systeme compose d’un distributeur et d’un verin.

On note d la demande de position de la gouverne et δ la position effective de la gouverne,

ces variables sont regies par la relation :

τδ(t)

dt= −δ(t) + d(t) (2.52)

dont la fonction de transfert a pour expression :

δ(p)

d(p)=

1

τp+ 1(2.53)

Cette fonction de transfert du premier ordre montre qu’en reponse a un echelon de demande,

la gouverne reproduit fidelement la position demandee (le gain statique vaut un) avec un temps

de reponse de l’ordre de 3τ .

On note α l’angle d’incidence et q la vitesse de tangage. JT , kα, kq, kδ designent respective-

ment le moment principal d’inertie en tangage et les coefficients de moment de tangage de sorte

que le theoreme du moment cinetique s’ecrive :

JTdq(t)

dt= −kαα(t)− kqq(t) + kδδ(t) (2.54)

on suppose d’autre part (ce qui n’est pas tout a fait exact ) :

q(t) =dα(t)

dt(2.55)

En couplant (2.54) et (2.55), le modele de l’avion est decrit par une equation differentielle

du second ordre :

JTd2α(t)

dt2= −kαα(t)− kq

dα(t)

dt+ kδδ(t) (2.56)

dont la transformee de Laplace, pour des conditions initiales nulles est :

JT p2α(p) = −kαα(p)− kqpα(p) + kδδ(p) (2.57)

la fonction de transfert :

α(p)

δ(p)=

kdJT p2 + kqp+ kα

(2.58)

que l’on met sous la forme standard d’un systeme du second ordre (2.19) ou :

43


— k =kdkα

— ωn =

√kαJT

— ξ =kq√JT

2√kα

La fonction de transfert complete de ce systeme d’ordre trois :

α(p)

d(p)=

kω2n

(τp+ 1)(p2 + 2ξωnp+ ω2n)

(2.59)

Pour cette etude, on suppose τ = 0.1s, k = 2, ωn = 0, 5rad/s et ξ = 0, 5. Ainsi les poles de ce

systeme ont pour expression :

p1,2 = −0, 25± j0, 433

p3 = −10

Il s’agit d’un systeme presentant un mode dominant d’ordre deux comme le montre la carte des

poles sur la figure 2.17.

−11 −10 −9 −8 −7 −6 −5 −4 −3 −2 −1 0−0.5

−0.4

−0.3

−0.2

−0.1

0

0.1

0.2

0.3

0.4

0.50.5

0.5

0.5

Axe réel

Axe

imag

inai

re

Figure 2.17 – Carte des poles et mise en evidence des poles dominants

Ainsi, la reponse indicielle a un echelon d’amplitude d0 de ce systeme devrait avoir des carac-

teristiques voisines de celles du systeme du second ordre qui decrit le comportement de l’angle

d’incidence en reponse au braquage de la profondeur. Ce systeme ayant un facteur d’amortisse-

ment egal a 0, 5 et une pulsation propre non amortie egale a 0, 5rad/s. Les abaques des figures

2.11 et 2.10 permettent de predire :

— l’amplitude relative du premier depassement : D1% = 16%

— le temps de reponse a 5% tel que ωntr5% ≈ 5, 5 et par suite tr5% ≈ 11s

Ces predictions sont confirmees par la simulation realisee sur le systeme d’ordre trois et

illustree sur la figure 2.18.

44

2.7. Exemple

Temps (sec)

α(t)

0 5 10 15 20 250

0.5

1

1.5

2

2.5

System: sysFinal Value: 2

System: sysSettling Time (sec): 10.7

System: sysPeak amplitude: 2.33Overshoot (%): 16.3At time (sec): 7.34

Figure 2.18 – Reponse indicielle du systeme etudie

On peut toutefois mener le calcul exact de la reponse :

α(p) =kω2

nτ

(p+ 1τ )(p

2 + 2ξωnp+ ω2n)

d0p

(2.60)

qui admet la decomposition en elements simples :

α(p) = k

(

A

p+ 1τ

+Bp+ C

p2 + 2ξωnp+ ω2n

+D

p

)

(2.61)

Apres calculs, on obtient : A = −0, 0026, B = −0, 9974, C = −0, 5212 et D = 1.

La transformee de Laplace inverse de (2.61)

α(t) = k

(

Ae−tτ +Be−ξωnt cosωpt+

C − ξωnB

ωpe−ξωnt sin(ωpt) +D

)

U(t) (2.62)

La reponse de l’angle d’incidence a un echelon unitaire de demande est representee sur la

figure 2.18, les releves du temps de reponse et du depassement montrent que l’approximation de

ce systeme par le sous systeme d’ordre deux dominant et possedant un gain statique equivalent

produit des resultats tout a fait satisfaisants tout en s’affranchissant de calculs laborieux.

La fonction de transfert harmonique est obtenue pratiquement en posant p = jω dans (2.59)

H(jω) =α(jω)

d(jω)=

kω2n

(jωτ + 1)(ω2n − ω2 + 2jξωnω)

(2.63)

Le module

|H(jω)| = kω2n

√

(ω2n − ω2)2 + (2ξωnω)2

1√

(ωτ)2 + 1(2.64)

45


Le calcul du gain :

|H(jω)|dB = 20log

(

kω2n

√

(ω2n − ω2)2 + (2ξωnω)2

)(

1√

(ωτ)2 + 1

)

(2.65)

Le diagramme du gain est la somme des diagrammes de gain du sous-systeme du premier ordre

et du sous-systeme du second ordre. Pour le trace, on reprend les traces des figures 2.4 et 2.12.

Le calcul de l’argument :

< H(jω) >=

⟨kω2

n

(ω2n − ω2 + 2jξωnω)

⟩

+

⟨1

(jωτ + 1)

⟩

(2.66)

Le diagramme de la phase est la somme des diagrammes de phase du sous-systeme du premier

ordre et du sous-systeme du second ordre.

−100

−80

−60

−40

−20

0

Gai

n (d

B)

10−2

10−1

100

101

102

103

−180

−135

−90

−45

0

Pha

se (

deg)

Pulsation (rad/sec)

sous−système d’ordre 2sous−système d’ordre 1

1/τ

ωn

Figure 2.19 – Diagrammes de Bode des sous-systemes d’ordre un et deux

46

2.7. Exemple

10−2

10−1

100

101

102

103

−270

−225

−180

−135

−90

−45

0

Pha

se (

deg)

Pulsation (rad/sec)

−200

−150

−100

−50

0

Gai

n (d

B)

ωn

1/τ

−40dB/dec

−60dB/dec

20log2

Figure 2.20 – Diagrammes de Bode du systeme complet d’ordre trois

Le diagramme de Bode du systeme complet represente sur la figure 2.20 montre que le sous-

systeme du premier ordre compose du tiroir et du verin n’affecte pas le comportement de l’avion

tant que le spectre du signal de demande d est dans l’intervalle [0, ωn]. S’il s’averait que la

constante de temps de ce sous systeme etait plus grande, autrement dit, si l’on utilisait une

servocommande plus lente, on ne pourrait plus decoupler les dynamiques de la servocommande

et de l’avion ce qui pourrait degrader le comportement de l’ensemble.

47


48

CHAPITRE 3

SYSTEMES ASSERVIS

3.1 BOUCLE OUVERTE VS. BOUCLE FERMEE

Soit un systeme dont on cherche a controler la sortie s(t) en agissant sur l’entree de commande

u(t). Il est possible, connaissant le modele ou le comportement du systeme de predeterminer une

loi de commande permettant d’amener la reponse dans l’etat desire sdes(t). L’elaboration d’une

telle commande ne requiert pas d’utiliser la sortie mesuree et le systeme est dit en boucle ouverte.

Plus formellement, pour un systeme LIC decrit par sa fonction de transfert H(p), l’expression

de cette commande s’obtient de la maniere suivante :

S(p) = H(p)U(p) (3.1)

et par consequent :

U(p) = H(p)−1Sdes(p) (3.2)

Pour que le signal u(t) puisse exister, il faut que le numerateur de U(p) soit de degre inferieur ou

egal a son denominateur. Une fois cette loi de commande realisee, elle est appliquee au systeme

et la sortie doit theoriquement tendre vers la valeur desiree.

En pratique, le modele du systeme procede d’une identification qui comporte des approxima-

tions, de meme le systeme est soumis a des entrees de perturbation qui ne sont pas toujours

correctement identifiees, de sorte que la commande calculee ne permet pas a la sortie d’atteindre

la valeur desiree. En supposant la fonction de transfert exacte du systeme egale a H(p)+ δH(p)

et Hγ(p) la fonction de transfert qui rend compte de l’effet de la perturbation γ sur la reponse

du systeme, il vient :

S(p) = (H(p) + δH(p))U(p) +Hγ(p)γ(p) (3.3)

S(p) =

(

1 +δH(p)

H(p)

)

Sdes(p) +Hγ(p)γ(p) (3.4)

49

Chapitre 3. SYSTEMES ASSERVIS

de sorte que s(t) ne peut pas etre egale a sdes(p), en particulier en regime permanent. Ainsi, la

commande en boucle ouverte est peu performante est n’est generalement pas utilisee. Toutefois,

certains systemes sont controles en boucle ouverte a l’instar des moteurs pas a pas utilises dans

les imprimantes ; on peut egalement citer le tir de bombes sur coordonnees.

Pour amener la sortie a sa valeur desiree, il semble plus judicieux d’exploiter la mesure de

la sortie pour elaborer la commande. Pratiquement, on elabore le signal d’erreur ε(t) qui est la

difference entre la consigne (image de la sortie desiree) et la mesure (image de la sortie reelle). Le

signal d’erreur est traite (au sens du traitement du signal) par un correcteur en vue de produire

le signal de commande u(t) applique au systeme. Un tel systeme est qualifie d’asservi, il a la

propriete de se corriger lui-meme. La figure 3.1 represente un tel systeme.

La tenue de vitesse air d’un planeur procede d’une telle approche, apres avoir regle sa vitesse

d’equilibre au moyen du trim, le pilote qui souhaite tenir cette vitesse (ici vitesse d’equilibre et

consigne sont confondues) observe l’anemometre, compare la vitesse desiree a celle mesuree et

agit sur le manche en consequence. Il tend a tirer le manche si l’erreur est negative, a le pousser

si elle est positive. Dans ce systeme, on dit que le pilote est dans la boucle puisqu’il elabore le

signal d’ereur et delivre la commande.

La tenue de vitesse d’un avion d’arme peut etre realisee par une automanette. Le pilote affiche une

vitesse de consigne, c’est le calculteur qui elabore l’erreur de vitesse et qui definit les commandes

a appliquer aux gaz. Dans ce cas le pilote est a l’exterieur de la boucle.

3.2 SYSTEMES ASSERVIS

3.2.1 Structure d’un systeme asservi

Un systeme asservi est represente sur la figure 3.1, il est generalement constitue des elements

suivants :

— le transducteur : il elabore un signal image de la consigne, il est parfois associe a un pre-

filtre qui traite le signal de consigne pour que celui-ci ne soit pas directement applique a

la boucle, cela peut par exemple permettre d’adoucir des consignes ayant des variations

trop brutales.

— le comparateur : il elabore le signal d’ecart entre l’image de la consigne et l’image de la

mesure

— la chaıne directe, elle est constituee par :

— le systeme a commander : generalement mal identifie et soumis a des perturbations,

— un organe de puissance : amplificateur, distributeur, etc. qui realise l’adaptation de

puissance entre le correcteur et le systeme a commander. Cet element est generalement

mal identifie et a un gain eleve,

— le correcteur : il traite le signal d’erreur en vue de generer un signal de commande

qui confere au systeme a commander de bonnes performances en termes de stabilite,

de rapidite, d’amortissement et de precision 1. Sur les systemes modernes, c’est un

algorithme implemente sur un calculateur.

1. Cette notion sera precisee ulterieurement

50

3.2. SYSTEMES ASSERVIS

— la chaıne de retour : elle est constituee par le capteur et la chaıne de traitement du signal

de mesure (amplificateur, filtre). C’est un organe fidele et precis qui delivre un signal

image de la reponse mesuree.

+

−

correcteurreponse+

+

capteur

amplificateur

commandeerreurconsigne

perturbation

systeme

retour

prefiltre

Figure 3.1 – Structure d’un systeme asservi

3.2.1.1 Exemples de systemes asservis

Un avion comporte des systemes asservis imbriques sur plusieurs niveaux.

— Les modes superieurs du pilote automatique (PA) qui permettent de controler la trajec-

toire de l’avion. Par exemple une tenue de cap. Dans ce cas, la variable a asservir est le

cap de l’avion, l’entree de commande est l’angle de gıte et la sortie le cap mesure par la

centrale inertielle. Le vent est une entree de perturbation pour ce systeme. La consigne

de cap est affichee par le pilote.

— Le mode de base du PA qui permet de controler l’angle de gıte. La consigne d’angle

de gıte est calculee par le mode superieur du PA. Le systeme a pour entree de com-

mande le braquage des ailerons et pour sortie l’angle de gıte mesure par le gyroscope

de verticale. L’organe de puissance est realise par le systeme {distributeur a commande

electrique+verin} qui actionne les commandes de vol. Un prefiltre peut interdire a l’avion

des inclinaisons de consigne excessives pour le maintenir dans un domaine de vol donne.

— les positions des ailerons sont asservies a des consignes de position calculees par le mode

de base du PA. L’entree est le courant de commande du distributeur, la position des

ailerons est mesuree par des potentiometres de recopie de gouverne, l’organe de puissance

est realise par un amplificateur qui delivre le courant necessaire au bon fonctionnement

du tiroir electrique. Les entrees de perturbation sont les efforts aerodynamiques exerces

sur les gouvernes.

3.2.2 Fonctions de transfert en boucle ouverte et en boucle fermee

Le schema fonctionnel du systeme asservi de la figure 3.1 est represente sur la figure 3.2. La

perturbation peut entrer en n’importe quel point de la boucle et le choix retenu ici est arbitraire.

51


+

−

C(p)+

+

M(p)

H1(p)

U(p)ε(p)

Γ(p)

H2(p)F (p)

E(p) S(p)

R(p)

Figure 3.2 – Schema fonctionnel d’un systeme asservi

On definit la fonction de transfert en boucle ouverte (FTBO) comme etant le rapport deR(p)

ε(p), la boucle etant ouverte au niveau de R(p) et la perturbation Γ(p) portee egale a zero

comme cela est indique sur la figure 3.3.

+

−

C(p)+

+

M(p)

H1(p)

U(p)ε(p)

H2(p)F (p)

E(p) S(p)

R(p)

0

Figure 3.3 – Boucle ouverte

FTBO(p) =R(p)

ε(p)= C(p)H1(p)H2(p)M(p) = C(p)H(p)M(p) (3.5)

en posant H(p) = H1(p)H2(p). On observe que F (p) n’appartient pas a la boucle et n’apparaıt

donc pas dans (3.5). Dans la suite, on pose F (p) = 1.

La FTBO joue un role essentiel dans l’analyse des systemes asservis. En particulier, l’analyse

de la stabilite, de l’amortissement, de la rapidite et de la precision du systeme boucle seront

conduites a partir de l’etude de la FTBO.

La boucle etant desormais fermee, la fonction de transfert en boucle fermee (FTBF) definit

la relation entre E(p) et S(p), les perturbations etant nulles :

FTBF (p) =S(p)

E(p)Γ(p)=0

=C(p)H1(p)H2(p)

1 + C(p)H1(p)H2(p)M(p)=

C(p)H(p)

1 + FTBO(p)(3.6)

On peut egalement calculer la relation entre S(p) et Γ(p) :

S(p)

Γ(p)E(p)=0

=H2(p)

1 + C(p)H1(p)H2(p)M(p)=

H2(p)

1 + FTBO(p)(3.7)

52

3.3. STABILITE DES SYSTEMES ASSERVIS

3.2.3 Performances attendues d’un systeme asservi

Le but d’un asservissement est double, d’une part, la sortie doit suivre les variations de la

consigne, d’autre part, la sortie ne doit pas etre sensible aux perturbations.

Lorsque le gain de la chaıne directe est grand, soit C(p)H1(p)H2(p) >> 1, (3.6) montre que

FTBF (p) → 1

M(p). Pratiquement, cela signifie que c’est le capteur et la chaıne de traitement

qui definissent le gain de la boucle. Par consequent, meme si la chaıne directe est mal identifiee,

cela affectera peu le comportement du systeme boucle. Il y a donc interet, pour maıtriser le

transfert entre la consigne et la sortie, a utiliser des capteurs performants. Par exemple, la

qualite de la tenue d’altitude pour un avion depend moins du type d’avion considere, tous sont

capables de le faire, que de la precision de l’altimetre utilise.

Concernant le rejet des perturbations, la fonction de transfert (3.7) doit tendre vers zero. Pour

y parvenir, il faut C(p)H1(p)M(p) >> 1. Pratiquement, on inserera un gain eleve en amont de

la perturbation, soit C(p)H1(p) >> 1 pour garantir son rejet. En planeur, pour tenir une route

au sol en presence d’un vent lateral constant, le pilote braque la gouverne de direction pour

corriger la derive de trajectoire. Il se doit de poursuivre cette correction tant qu’il ne suit pas

la route desiree. Lorsque l’erreur de trajectoire s’annule, il maintient la gouverne de direction

en position. La relation qui existe entre l’erreur de route et l’action au pied du pilote est de

type integral 2, elle possede par consequent un gain statique infini qui permet le rejet complet

de la perturbation. Autrement dit, le pilote est capable, en presence d’une perturbation (le vent

lateral) de suivre une consigne (la route de reference).

3.3 STABILITE DES SYSTEMES ASSERVIS

Un systeme LIC, asservi ou non, peut etre decrit par une fonction de transfert. Un tel systeme

est asymptotiquement stable si tous ses poles sont a partie reelle negative. Le critere de Nyquist

est un critere graphique qui permet de conclure quant a la stabilite d’un systeme en boucle

fermee, lequel peut etre stable ou instable en boucle ouverte, et ce, sans avoir a calculer les poles

de la FTBF.

3.3.1 Critere de Nyquist

Considerons le systeme ayant pour fonction de transfert en boucle ouverte FTBO(p) et

faisons decrire a la variable complexe p le contour (C), denomme contour de Bromwich represente

sur la figure 3.4.

2. La sortie d’un integrateur varie tant que le signal applique a son entree est different de zero.

53


ℜ

ℑ

0

Figure 3.4 – Contour de Bromwich

Ce systeme est stable en boucle fermee si et seulement si le contour parcouru par FTBO(p),

effectue, dans le sens trigonometrique, autour du point critique {−1, 0} un nombre de tours egal

au nombre de poles a partie reelle positive de FTBO(p) (comptes avec leur ordre de multiplicite).

La demonstration de ce resultat est presentee dans l’annexe D.2.

3.3.2 Critere du revers

3.3.2.1 Dans le plan de Nyquist

Dans le cas de systemes stables en boucle ouverte (aucun pole a partie reelle positive) et du

fait de la symetrie du lieu de Nyquist par rapport a l’axe reel, le critere du revers qui est un cas

particulier du critere de Nyquist permet de conclure quant a la stabilite de la boucle fermee a

partir du trace du lieu de Nyquist de la FTBO.

Un systeme stable en boucle ouverte est stable en boucle fermee si et seulement si le lieu de

Nyquist de sa FTBO, parcouru dans le sens des pulsations croissantes, laisse a gauche le point

critique {−1, 0}.Ce resultat est illustre sur la figure 3.5

3.3.2.2 Dans le plan de Black

Un systeme stable en boucle ouverte est stable en boucle fermee si et seulement si le lieu de

Black de sa FTBO, parcouru dans le sens des pulsations croissantes, laisse sur sa droite le point

critique {−180 , 0dB}.Ce resultat est illustre sur la figure 3.6

3.3.2.3 Sur un diagramme de Bode

Un systeme stable en boucle ouverte est stable en boucle fermee si et seulement pour la

pulsation ωπ telle que < FTBO(jωπ) >= −180 , le gain correspondant a cette pulsation est

negatif.

Ce resultat est illustre sur la figure 3.7

54


Figure 3.5 – systeme stable Vs. instable dans le plan de Nyquist

−270 −225 −180 −135 −90−60

−50

−40

−30

−20

−10

0

10

20

Phase en boucle ouverte (deg)

Gai

n en

bou

cle

ouve

rte

(dB

)

système stable en boucle ferméesystème instable en boucle fermée

point critique

ω croissants

Figure 3.6 – systeme stable Vs. instable dans le plan de Black

55


−120

−100

−80

−60

−40

−20

0

20

40G

ain

(dB

)

10−2

10−1

100

101

102

−270

−225

−180

−135

−90

Pha

se (

deg)

Diagramme de Bode

Pulsation (rad/sec)

système stable en boucle ferméesystème instable en boucle fermée

ωπ

G(ωπ)>0

G(ωπ)<0

Figure 3.7 – systeme stable Vs. instable sur un diagramme de Bode

3.3.3 Marges de stabilite

Les erreurs de modelisation de la FTBO peuvent conduire a sous-estimer son gain ou a

negliger des retards. Ces erreurs peuvent conduire a supposer qu’un systeme boucle est stable

alors qu’il ne l’est pas.

Les regles qui suivent s’appliquent a des systemes a dephasage minimal i.e. dont tous les

poles et tous les zeros sont a partie reelle negative.

Marge de phase : La marge de phase MΦ est la reserve de dephasage qui conduirait le

systeme a devenir instable. Sa connaissance permet calculer le retard maximal admissible dans

une boucle d’asservissement de sorte que celle-ci reste stable. En effet, on deduit de la figure 3.8

que le retard maximal admissible vaut MΦω0dB

. Pratiquement, une marge de phase satisfaisante est

comprise entre 45 et 60 .

Marge de gain : La marge de gain MG est le gain (en dB) qui ajoute a celui de la FTBO

conduirait le systeme a devenir instable, ce qu’illustre egalement la figure 3.8. Pratiquement,

une bonne marge de gain doit etre superieure a 10dB.

56


−270 −225 −180 −135 −90−60

−50

−40

−30

−20

−10

0

10

20


Gai

n en

bou

cle

ouve

rte

(dB

)

MG

Mφ

ωπ

ω0dB

Figure 3.8 – Marges de stabilite dans le plan de Black

−80

−60

−40

−20

0

20

Gai

n (d

B)

10−2

10−1

100

101

102

−270

−225

−180

−135

−90

Pha

se (

deg)

Diagramme de Bode

Pulsation (rad/sec)

MG

ω0dB ω

π

MΦ

Figure 3.9 – Marges de stabilite sur un diagramme de Bode

57


3.4 ANALYSE DE LA DYNAMIQUE DES SYSTEMES AS-

SERVIS

3.4.1 Abaque de Black-Nichols

Cette construction graphique permet de caracteriser les performances dynamiques et sta-

tiques de la FTBF a partir du trace du lieu de black de la FTBO.

On considere un systeme boucle a retour unitaire, sachant, comme cela est montre a l’annexe

E, qu’il est toujours possible de se ramener a ce cas. On peut ecrire :

FTBF (jω) =FTBO(jω)

1 + FTBO(jω)(3.8)

soit

FTBO(jω) =FTBF (jω)

1− FTBF (jω)(3.9)

Ainsi, pour chaque valeur de ω, la connaissance de FTBO(jω) en module et argument permet

de determiner FTBF (jω) en module et argument. En utilisant ce resultat, Nichols a construit

un abaque dans le plan de Black, constituee de deux reseaux orthogonaux de courbes qui sont

les lieux des points pour lesquels |FTBF (jω)|dB et < FTBF (jω) > sont constants.

L’abaque de Nichols permet donc de lire simultanement, en un point donne d’un lieu de

transfert, |FTBO(jω)|dB , < FTBO(jω) >, |FTBF (jω)|dB et < FTBF (jω) >.

Le lieu de Black represente sur la figure 3.10 est caracteristique d’un systeme du troisieme

ordre (voir tableau 1.3) qui possede un pole nul (voir tableau 1.2), on lit le gain et l’argument

de la FTBO en coordonnees cartesiennes, soit a la pusation ω = 0, 7rad/s, (−144 ,−1.68dB),

ce systeme boucle sur un retour unitaire presente a cette meme pulsation un gain de +3dB et

un argument de −90 .

On lit pour ω → 0 que l’argument et le gain en boucle ouverte tendend vers (−90 ,+∞), tan-

dis qu’en boucle fermee, le systeme presente un gain statique qui tend vers 0dB et un argument

qui tend vers 0 .

Grace a cet abaque, on peut aussi mettre en evidence les resonances du systeme en boucle

fermee. En effet, il y a resonance en boucle fermee lorsque FTBF (jω) presente un maximum

local, c’est a dire lorsque le lieu de Black de la FTBO tangente une courbe de gain constante,

dans cet exemple, c’est l’isogain +3dB qui est tangentee. Comme ce gain est superieur au gain

statique, il y a au voisinage de ω = 0, 7rad/s une resonance. Ce phenomene est caracteristique

des systemes d’ordre deux, dans le cas present, en boucle fermee, le facteur de surtension vaut

3dB−0dB = 3dB et ne depend que du facteur d’amortissement (2.41) qui vaut environ 0, 38. On

peut donc considerer que ce systeme d’ordre trois est la superposition d’un systeme du premier

ordre et d’un systeme du second ordre. Pour ce dernier, le dephasage a la pulsation propre vaut

−90 . On lit cette pulsation a l’intersection du lieu de Black de la FTBO et de l’isophase −90 .

Dans cet exemple ωn vaut environ 0, 7rad/s. On note que la pulsation propre est sensiblement

egale a la pulsation de resonance, ce qui est logique compte tenu de la faible valeur du facteur

d’amortissement ξ.

58

3.4. ANALYSE DE LA DYNAMIQUE DES SYSTEMES ASSERVIS

−270 −225 −180 −135 −90 −45−80

−60

−40

−20

0

20

40

6 dB

3 dB

1 dB

0.5 dB

0.25 dB

0 dB

X: −144Y: −1.683


Gai

n en

bou

cle

ouve

rte

(dB

)

ω

isogain 3dB

isogain 0dB

Figure 3.10 – Lecture d’une FTBF a partir d’une FTBO avec l’abaque de Black-Nichols

3.4.2 Methode du lieu des racines

La methode du lieu des racines permet d’evaluer et de regler graphiquement les performances

d’un systeme en boucle fermee par la seule connaissance de sa FTBO. Cette methode developpee

chez North American Aviation par W.R. Evans au debut des annees cinquante s’est revelee un

outil remarquable pour la conception de pilotes automatiques d’avions a reaction et la synthese

de lois de commande pour missiles.

On raisonne sur un systeme boucle a retour unitaire sachant qu’il est toujours possible de se

ramener a ce cas ; k est un gain reglable et la FTBO est mise sous la forme :

H(p) =S(p)

E(p)= k

bmpm + bm−1p

m−1 + · · ·+ b1p+ b0anpn + an−1pn−1 + · · ·+ a1p+ a0

(3.10)

qu’on met sous la forme :

FTBO(p) =S(p)

E(p)= k

(bman

)pm + bm−1

bmpm−1 + · · ·+ b1

bmp+ b0

bm

pn + an−1

anpn−1 + · · ·+ a1

anp+ a0

an

(3.11)

on appelle gain d’Evans :

ke = k

(bman

)

(3.12)

dont le signe joue un role important lors de la construction du lieu des racines.

59


on met (3.11) sous la forme poles-zeros :

FTBO(p) = ke(p− z1)(p− z2) . . . (p− zm)

(p− p1)(p− p2) . . . (p− pm)= ke

m∏

i=1(p− zi)

n∏

j=1(p− pj)

= keN(p)

D(p)(3.13)

La FTBF a pour expression :

FTBF (p) =keN(p)

D(p) + keN(p)(3.14)

Les poles de 3.14 sont les racines de :

D(p) + keN(p) = 0 (3.15)

Ce calcul de la FTBF met en evidence le role de ke dans le comportement dynamique

du systeme boucle puisque la nature et la valeur des poles 3 dependent de ce gain qui peut

theoriquement varier sur ]−∞,+∞[.

Definition 1 Le lieu des racines ou lieu d’Evans represente, dans le plan complexe, les images

des poles reels et/ou complexes conjugues de la FTBF tandis que l’on fait varier le gain ke sur

]−∞,+∞[.

D’apres 3.15 :

N(p)

D(p)=

n∏

i=1(p− zi)

n∏

j=1(p− pj)

= − 1

ke(3.16)

Ainsi, pour appartenir au lieu, le point M d’affixe p (3.16) doit verifier les conditions sur

l’argument et le module suivantes

m∑

i=1< p− zi > −

n∑

j=1< p− pj > = (2λ+ 1)π+ < ke >

n∏

i=1|p− zi|

n∏

j=1|p− pj |

=1

|ke|(3.17)

Ces conditions sont illustrees sur la figure 3.11.

3. dont on rappelle qu’ils conditionnent la stabilite, la rapidite et l’amortissement.

60


ℜe

ℑm

p1

p2

z1

< p− p2 >

< p− p1 >

< p− z1 >

M

|p− z1||p− p2|

|p− p1|

Figure 3.11 – Representation vectorielle des conditions sur le module et l’argument

Des regles pratiques permettent d’ebaucher la construction du lieu et sont generalement

suffisantes pour discuter du comportement du systeme en boucle fermee.

3.4.2.1 Construction pratique du lieu d’Evans

Un exemple detaille de construction d’un lieu d’Evans est presente a la fin de ce chapitre.

1. Mettre la FTBO sous la forme (3.13) et identifier le signe du gain d’Evans ke.

2. Les points de depart du lieu sont les solutions de l’equation D(p) + keN(p) = 0 obtenues

lorsque ke → 0. Autrement dit, les points de depart du lieu sont les n racines de D(p) ou

encore les poles de la FTBO.

3. Les points d’arrivee du lieu sont les solutions de D(p) + keN(p) = 0 obtenues lorsque

ke → ±∞. Ce sont donc les racines de D(p)ke

+N(p) = 0 pour ke → ±∞. Autrement dit,

les points d’arrivee du lieu sont les m zeros de la FTBO.

4. Comme generalement m < n, il y a davantage de points de depart que de points d’arrivee

et lorsque ke → ±∞, n − m branches n’ont pas d’arrivees et correspondent a n − m

asymptotes definies par :

— Les angles formes par ces branches et l’axe reel :

θa =(2λ+ 1)π

n−mpour ke > 0

θa =2λπ

n−mpour ke < 0

(3.18)

— Ces asymptotes se coupent sur l’axe reel au point d’abcisse :

σ =

n∑

i=1pi −

m∑

j=1zj

n−m(3.19)

5. On determine quels sont les points de l’axe reel qui appartiennent au lieu d’Evans en

appliquant les regles enoncees ci-apres :

61


— Si ke > 0, un point de l’axe reel appartient au lieu s’il laisse a sa droite un nombre

impair de poles et de zeros, comptes avec leur ordre de multiplicite. Zero est considere

comme un nombre pair.

— Si ke < 0, un point de l’axe reel appartient au lieu s’il laisse a sa droite un nombre

pair de poles et de zeros, comptes avec leur ordre de multiplicite.

Nota important : le nombre 0 est considere comme pair dans l’application de cette regle.

6. Lorsque l’on fait varier le gain d’Evans ke de 0 a ±∞, des poles reels peuvent devenir

complexes conjugues et inversement. Ceci revele dans l’equation D(p) + keN(p) = 0 la

presence de racines reelles doubles se traduisant sur le lieu par des points de jonction

et/ou de separation. Ces points verifient donc :

D(p) + keN(p) = 0 (3.20)

dD(p)

dp+ ke

dN(p)

dp= 0 (3.21)

avec p reel.

7. Les points du lieu situes sur l’axe imaginaire determinent la limite de stabilite, ils veri-

fient :

D(jω) + keN(jω) = 0 (3.22)

3.4.2.2 Exploitation du lieu d’Evans

La figure 3.12 represente le lieu des poles de la fonction de transfertq(p)

δm(p)d’un avion de type

Mirage 2000 trace pour une variation de centrage ∆C autour du centrage normal de l’avion. Les

variables q(t) et δm(t) representent respectivement le tangage et la position de la commande de

profondeur. Le modele retenu correspond a celui d’un avion volant a Mach 0.65 et a une altitude

de 1000 pieds.

Pour cet exemple la variation de centrage ∆C ∈ [−100%, 100%] et joue un role analogue au

gain k ∈ [−1, 1].

— centrage nul : les poles sont a partie reelle negative et l’avion est stable. Il est cependant

mal amorti (ξ = 0, 14) et sa pulsation propre non-amortie est egale a 1, 15rad/s. Les

resultats etablis au chapitre 2 permettent de predire les caracteristiques de la reponse a

un echelon de profondeur.

— centrage avant : le lieu montre que pour ∆C = −100%, l’avion reste stable mais le

facteur d’amortissement tend a diminuer alors que la pulsation propre non-amortie tend

a augmenter.

— centrage arriere egal a 40%, l’avion est stable et les poles sont reels doubles, ce qui

correspond au regime critique (ξ = 1).

— centrage arriere egal a 41%, l’avion est instable car l’un des poles est a partie reel nulle.

Si l’on recule encore le centre de gravite, la partie reelle de ce pole est positive, l’avion

est instable.

Les reponses indicielles en tangage de cet avion pour ∆C ∈ [−100%, 40%] sont representees sur

la figure 3.13 4.

4. Pour tracer ces chronogrammes les gains statiques ont ete normalises a moins un. A ce propos le gain

62


−2 −1.5 −1 −0.5 0 0.5 1 1.5−2.5

−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

2.5

Root Locus

Real Axis

Imag

inar

y A

xis ∆C=100%

∆C=−100%

∆C=−100%

∆C=100%

ωn=1,15

ξ=0,14

∆C=0%

∆C=40%

∆C=0%

∆C=41%∆C=41%

Figure 3.12 – Lieu des poles caracteristiques du mode d’incidence en fonction du centrage pour un

Mirage 2000

Réponse indicielle

Temps (sec)

Tan

gage

0 5 10 15 20 25 30 35−1.8

−1.6

−1.4

−1.2

−1

−0.8

−0.6

−0.4

−0.2

0

∆C=−100%

∆C=0%

∆C=40%

Figure 3.13 – Effet du centrage sur la reponse en tangage d’un Mirage 2000

63


3.5 PRECISION DES SYSTEMES ASSERVIS

3.5.1 Notion d’erreur

Soit un systeme asservi dont un schema fonctionnel est represente sur la figure 3.2. Un tel

systeme est qualifie de precis si l’erreur permanente limt→∞

ε(t) = 0. Pour ce systeme et pour

F (p) = 1, le calcul de l’erreur montre que celle-ci a pour expression :

ε(p) =1

1 + C(p)H1(p)H2(p)M(p)E(p)− M(p)H2(p)

1 + C(p)M(p)H1(p)H2(p)Γ(p) (3.23)

Compte tenu de la definition de la FTBO (3.5), il vient :

ε(p) =1

1 + FTBO(p)E(p)− M(p)H2(p)

1 + FTBO(p)Γ(p) (3.24)

L’erreur procede de la consigne E(p), de la perturbation Γ(p) et du systeme, notamment au

travers de FTBO(p). L’erreur, en regime permanent, est calculee en appliquant le theoreme de

la valeur finale.

3.5.2 Expression de l’erreur en regime permanent

Comme le systeme est lineaire, on peut appliquer le principe de superposition et calculer :

1. l’erreur en regime permanent due a la consigne seule (Γ(p) = 0)

limt→∞

ε(t) = limp→0

p1

1 + FTBO(p)E(p) (3.25)

2. l’erreur due a la perturbation seule (E(p) = 0)

limt→∞

ε(t) = limp→0

p−M(p)H2(p)

1 + FTBO(p)Γ(p) (3.26)

Les fonctions de transfert qui apparaissent dans (3.25) et (3.26) doivent etre evaluees en p = 0.

Dans le cas general, elles ont une expression de la forme :

G(p) =bmp

m + · · ·+ b1p+ b0pk(anpn−k + · · ·+ ak+1p+ ak)

(3.27)

G(p) possede k poles nuls et est qualifiee de classe k.

limp→0

G(p) → b0akpk

(3.28)

statique est negatif, cela traduit le fait qu’un braquage negatif de la gouverne genere une variation positive de

l’angle d’incidence.

64

3.5. PRECISION DES SYSTEMES ASSERVIS

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.2

0.4

0.6

0.8

1

Temps (sec)

Rép

onse

ε0(∞)

0 0.5 1 1.5 2 2.5 3 3.5 40

0.5

1

1.5

2

2.5

3

3.5

4

Temps (sec)

Rép

onse

ε1(∞)

Figure 3.14 – Erreur de position et de trainage

3.5.2.1 Erreur due a la consigne

Dans le cas d’un systeme dont la FTBO a la meme structure que celle de G(p), (3.25) a pour

expression :

limt→∞

ε(t) = limp→0

p1

1 +b0akpk

E(p) = limp→0

akpk+1

akpk + b0E(p) (3.29)

On discute alors de la valeur de l’erreur en fonction du type de l’entree de consigne et de

la classe du systeme. Les resultats sont rapportes dans le tableau 3.1 ou K = b0a0, Kv = b0

a1et

Ka = b0a2

designent respectivement le gain statique, le gain en vitesse et le gain en acceleration.

Les erreurs de position et de trainage sont representees pour un systeme a retour unitaire sur la

figure 3.14 .

Classe 0 Classe 1 Classe 2

Entree E(p) FTBO(p) ∼p→0K FTBO(p) ∼

p→0Kv

pFTBO(p) ∼

p→0Ka

p2e0p

ε0 =e0

1 +Kε0 = 0 ε0 = 0

erreur de positionV0p2

ε1 = ∞ ε1 =V0Kv

ε1 = 0

erreur de vitesseγ

p3ε2 = ∞ ε2 = ∞ ε2 =

γ

Ka

erreur d’acceleration

Tableau 3.1 – Erreur en fonction de la consigne et de la classe de la FTBO

65


3.5.2.2 Erreur due a la perturbation

Dans le cas d’un systeme dont la FTBO et H2(p) ont une structure analogue a celle de G(p) 5,

(3.26) a pour expression :

limt→∞

ε(t) = limp→0

p

−M(p)β0αjpj

1 +b0akpk

Γ(p) (3.30)

On rappelle que M(p) est la fonction de transfert de la chaıne de retour qui inclue le capteur

et le traitement du signal mesure. Cette fonction de transfert est celle d’un gain pur, d’un

systeme d’ordre un, voire d’ordre deux et par consequent de classe zero. Dans ces conditions

(3.30) s’ecrit :

limt→∞

ε(t) = limp→0

−M(0)β0akp

k−j+1

αj

akpk + b0Γ(p) (3.31)

k est le nombre de poles nuls de la FTBO, j est le nombre de poles nuls de H2(p) et M(p)

est supposee de classe zero. Par consequent, k− j est le nombre de poles nuls de C(p)H1(p), on

dit aussi que c’est le nombre d’integration en amont de la perturbation. On discute alors de la

precision vis-a-vis de la perturbation en fonction de k − j et de la nature de l’entree.

On retiendra en particulier que pour une perturbation en echelon, il faut une integration

k − j = 1 en amont de l’entree de perturbation pour annuler l’erreur due a cette perturbation.

3.5.2.3 En quoi la presence d’un integration permet-elle d’annuler l’erreur sta-

tique ?

On sait que l’integrale d’une fonction du temps positive croıt au fil du temps, qu’elle decroıt

pour une fonction negative et qu’elle est constante pour une fonction nulle. Si la fonction du

temps consideree est l’erreur et son integrale la commande, alors tant que l’erreur est positive,

la commande ne cesse d’augmenter entrainant une augmentation de la sortie et par suite, une

diminution de l’erreur. Lorsque cette derniere s’annule, la commande se stabilise, la sortie ne

varie plus et est egale a la consigne.

3.6 Exemple

Dans cet exemple, on etudie le comportement en derapage β(t) d’un Mirage 2000 consecutif

au braquage δn de la gouverne de direction. Pour cette etude l’avion vole a Mach 0,6 et a une

altitude de 20000 pieds. L’etude de la reponse impulsionnelle met en evidence la presence d’un

mode du second ordre appele mode de roulis hollandais ou dutch roll mode qu’il convient, pour

5. Comme FTBO(p) = H1(p)H2(p)M(p), la classe de H2(p) est necessairement inferieure ou egale a celle de

FTBO(p)

66

3.6. Exemple

le confort du pilote, de corriger. On realise ainsi un amortisseur de lacet ou yaw damper 6 La

fonction de transfert :

β(p)

δn(p)=

0.026p+ 3.727

p2 + 0.6479p+ 11.14(3.32)

Comme le montre la figure, un braquage positif du drapeau produit du lacet negatif et un angle

de derapage positif. D’autre part, le facteur d’amortissement de ce systeme du second ordre est

egal a 0,097, de ce fait l’avion est mal amorti et difficile a piloter. On insere ce systeme dans une

boucle d’asservissement en vue d’asservir le derapage β(t) a une consigne βc(t), pratiquement,

la gouverne de direction n’est plus controlee par le pilote mais son braquage procede d’un signal

de commande issu du traitement de l’erreur de derapage β(t). Le derapage est mesure par une

palette d’incidence de gain unitaire, soit βm(t) cette mesure. Pour cette etude le correcteur est

de type proportionnel, de sorte que δn(t) = kε(t) = k(βc(t)− βm(t)).

La fonction de transfert en boucle ouverte :

FTBO(p) =βm(p)

ε(p)= k

0.026p+ 3.727

p2 + 0.6479p+ 11.14(3.33)

Le lieu de Black de la fonction de transfert harmonique de FTBO(jω) est trace pour k = 1

et represente sur la figure 3.15. D’apres le critere du revers, le lieu parcouru dans le sens des

pulsations croissantes laisse le point critique sur sa droite. Ainsi, l’avion insere dans la boucle

d’asservissement est stable ∀ω ≥ 0. La marge de gain est infinie et la marge de phase est egale

a 57 .

On regle le comportement dynamique du yaw damper par la methode du lieu d’Evans que

l’on trace en suivant les regles definies au §3.4.2. On rappelle qu’il s’agit de tracer dans le plan

complexe le lieu des poles de la FTBF :

FTBF (p) =β(p)

βc(p)=

ke(p+ 143)

p2 + (0.6479 + ke)p+ 123ke + 11, 14(3.34)

Plutot que de calculer les racines du denominateur de le FTBF (p) et de representer leurs images

dans le plan complexe en fonction de ke, on applique la methode de construction du lieu d’Evans

qui exploite FTBO(p) mise sous forme poles-zeros :

1. Sous forme poles-zeros,

FTBO(p) = 0.026kp+ 143

(p+ 0.32 + 3.33j)(p+ 0.32− 3.33j)(3.35)

et ke = 0.026k > 0

2. deux points de depart : {−0.32± 3.33j},3. un point d’arrivee : {−143},4. asymptotes

— pour ke > 0 il y a une asymptote de direction : θa =(2λ+ 1)π

2− 1avec λ = 0 soit θa = π,

6. En pratique l’amortisseur de lacet controle la vitesse angulaire autour de l’axe de lacet. Dans un souci de

simplicite le systeme etudie vise a asservir le derapage et n’est pas a proprement parler un yaw damper.

67


Lieu de Black


Gai

n en

bou

cle

ouve

rte

(dB

)

−270 −225 −180 −135 −90 −45 0−120

−100

−80

−60

−40

−20

0

20

40

60

80

System: FTBO(j\omega)Phase Margin (deg): 57.7Delay Margin (sec): 0.276At frequency (rad/sec): 3.65Closed Loop Stable? Yes

6 dB 3 dB

1 dB 0.5 dB

0.25 dB 0 dB

−1 dB

−3 dB −6 dB

−12 dB −20 dB

−40 dB

−60 dB

−80 dB

−100 dB

−120 dB

FTBO(jω)kFTBO(jω) 0dB

Figure 3.15 – Lieu de Black-Nichols caracteristique de la dynamique laterale d’un Mirage 2000

— l’asymptote est sur l’axe reel, il n’y a donc pas lieu de calculer l’abcisse du point

d’intersection des asymptotes,

— pour ke < 0 il y a une asymptote de direction : θa =(2λ)π

2− 1avec λ = 0 soit θa = 0,

— l’asymptote est sur l’axe reel, comme pour ke > 0 il n’y a pas lieu de calculer l’abcisse

du point d’intersection des asymptotes,

5. les points de l’axe reel qui appartiennent au lieu :

— pour ke > 0 : il y a un seul zero et aucun pole sur l’axe reel. Ainsi, tous les points de

l’axe reel situes a gauche du point d’abcisse −143 sont des points du lieu. La branche

tracee tend vers l’asymptote de direction π,

— pour ke < 0 : il y a un seul zero et aucun pole sur l’axe reel. Ainsi, tous les points de

l’axe reel situes a droite du point d’abcisse −143 sont des points du lieu. La branche

tracee tend vers l’asymptote de direction 0,

6. les poins de jonction separation verifient :

ke(p+ 143) + (p2 + 0.6479p+ 11.14) = 0

(kep) + (2p+ 0.6479) = 0 (3.36)

equations qui admet pour solutions reelles :{−285,−0.0028} pour ke egal a {21953,−3}7. limite de stabilite : le trace montre que l’instabilite procede d’un pole reel qui devient

superieur ou egal a zero. Le denominateur de FTBF (p) verifie :

D(p) = p2+(0.6479+ke)p+123ke+11, 14 = p2+(0.6479+ke)p+0 = p(p+0.6479+ke)

68

3.6. Exemple

(3.37)

L’instabilite se produit pour ke = −0.6479.

−400 −350 −300 −250 −200 −150 −100 −50 0 50 100−150

−100

−50

0

50

100

150

Axe réel

Axe

imag

inai

re

point d’arrivéepoints de départ

asymptote

réglage ξ=0,4

−150 −100 −50 0 50 100 150−15

−10

−5

0

5

10

15

Lieu des racines

Axe réel

Axe

imag

inai

reFigure 3.16 – Traces du lieu d’Evans pour ke > 0 et ke < 0

Interpretation du lieu d’Evans

— ke ≥ 0

— ke ∈ [0, 21953[, les poles sont complexes conjugues et au fur et a mesure que keaugmente, le facteur d’amortissement initialement egal a 0, 097 decroıt, atteint un

minimum (point de coordonnees {−143, 143j}) puis tend vers un, la pulsation propre

non amortie quant a elle ne cesse d’augmenter.

— ke = 21953, les poles de la boucle fermee se situent au point de jonction et on a un

pole reel double. Ce qui correspond au regime critique.

— ke > 21953, les poles sont reels et le systeme presente une dynamique de premier ordre

dominant. Le pole dominant augmente et la constante de temps afferente egalement.

On peut toutefois noter que le zero ”bloque”le pole, empechant par la-meme le systeme

de devenir instable.

— ke < 0

— ke ∈]0,−0.0028[, le systeme est stable et presente une dynamique d’ordre deux. Le

facteur d’amortissement est acceptable mais le module des poles qui est egal a la

pulsation propre non-amortie de ce second ordre est petite et par consequent, le temps

de reponse est lent. D’autre part, le gain statique de la boucle est negatif, ce qu’il

faudrait corriger avec un prefiltre de gain egal a −1.

— ke = −0.0028, c’est un point de jonction, les poles sont reels double et c’est encore un

regime critique. Du fait de la proximite des poles de l’axe imaginaire (−0.0028), on

peut s’ttendre a un temps de reponse de l’ordre de tr5% ≈ 30.385 ≈ 8s

— ke ∈] − 0.0028,−0.6479[, le systeme presente un mode dominant du premier ordre

encore stable.

69


— ke < −0.6479, l’un des poles est reel positif et le systeme est instable.

On regle le gain ke, et par suite k, de sorte que la reponse en boucle fermee presente un

premier depassement relatif inferieur a 25%, ce qui d’apres l’abaque 2.10 correspond a un facteur

d’amortissement egal a 0, 4. Dans (3.34) :

p2 + (0.6479 + ke)p+ 143ke + 11.14 = p2 + 2ξωnp+ ω2n (3.38)

Soit ke = 90.29 et k = 3472. Cette valeur du gain est tres importante et il conviendrait de

s’interroger sur la pertinence de ce choix. En effet, la commande de direction δn(t) = k(βc(t)−β(t)) et on pressent qu’un gain eleve risque de mettre la gouverne en butee.

Le lieu de Black de la FTBO corrigee avec cette valeur du gain est representee sur la figure

3.15. La marge de phase de la FTBO ainsi corrigee est de l’ordre de 45 . On peut egalement

exploiter les abaques de Nichols pour decrire le comportement du systeme boucle, toutefois cette

approche n’est pas tres precise. Le gain statique en boucle fermee est compris entre 0dB et −1dB.

On observe que le lieu de kFTBOjω) passe entre les isogains 3dB et 6dB, ce qui donne une idee

du gain a la resonance qui est compris entre ces deux valeurs.

Calcul de l’erreur : le gain etant regle a k = 3472, comme la fonction en boucle ouverte de

ce systeme est de classe zero, en reponse a un echelon de consigne de derapage de 1 , il existe

une erreur de position. D’apres le tableau 3.1 et l’expression de la FTBO (3.33), cette derniere

est egale a :

limt→+∞

ε(t) =

1

1 + 34723, 727

11, 14

0.017 = 1, 46.10−5 (3.39)

La figure 3.17 montre l’angle de derapage en reponse a un echelon de consigne unitaire. L’erreur

etant tres faible, et ce du fait que k est grand, la sortie tend vers la consigne.

0 0.02 0.04 0.06 0.08 0.1 0.120

0.2

0.4

0.6

0.8

1

1.2

1.4

Réponse indicielle

Temps (sec)

Dér

apag

e

Figure 3.17 – Reponse indicielle a une consigne de derapage de 1

70

CHAPITRE 4

CORRECTION DES SYSTEMES

4.1 Objectifs de la correction et methodes

La mise en œuvre d’une boucle d’asservissement (figure 4.1) vise a a asservir la reponse

d’un systeme a une consigne et a rejeter les perturations. De plus, les regimes transitoires, tant

vis-a-vis de la consigne que des perturbations doivent etre maıtrises.

Pour atteindre ces objectifs, il convient d’appliquer au systeme une commande adaptee. Dans

le cadre de la theorie des asservissements, celle-ci est elaboree par le correcteur a partir du signal

d’erreur.

Differentes approches peuvent etre retenues pour synthetiser un correcteur :

1. la poursuite d’un modele de reference. On desire que la FTBF tende vers une fonction de

transfert particuliere FTBFm(p). D’apres (3.6) On a :

C(p) =FTBFm(p)

FTBO(p)(1− FTBFm(p))(4.1)

Il faut toutefois s’assurer que le correcteur obtenu est realisable, i.e. que le degre du

numerateur de C(p) soit inferieur ou egal a celui de son denominateur.

2. la poursuite d’une trajectoire de reference. La reponse doit satisfaire a des contraintes

exprimees dans le domaine temporel, par exemple, une erreur de position nulle, un temps

de reponse, un premier depassement relatif donnes.

Dans ce cours, on s’interesse plus particuliere a la synthese de correcteurs visant a poursuivre

une trajectoire de reference. Toutefois, quelques methodes de synthese fondees sur la poursuite

d’un modele seront abordees.

71

Chapitre 4. CORRECTION DES SYSTEMES

+

−

C(p)+

+

M(p)

H1(p)

U(p)ε(p)

Γ(p)

H2(p)E(p) S(p)

R(p)

Figure 4.1 – Schema fonctionnel d’un systeme asservi muni d’un correcteur

4.1.1 Syntheses de correcteurs dans le plan de Black

— FTBONC(p) = H1(p)H2(p)M(p) designe la fonction de transfert en boucle ouverte du

systeme corrige,

— FTBOC(p) = C(p)H1(p)H2(p)M(p) designe la fonction de transfert en boucle ouverte

du systeme muni d’un correcteur.

La synthese des correcteurs est avantageusement menee dans le plan de Black, dans lequel

les effets du correcteur sur le lieu de Black de la FTBO sont faciles a representer et a interpreter.

En regime harmonique :

FTBOC(jω) = C(jω)FTBONC(jω) (4.2)

— effet du correcteur sur le gain :

|FTBOC(jω)|dB = |C(jω)|dB + |FTBONC(jω)|dB

— effet du correcteur sur la phase :

< FTBOC(jω) >=< C(jω) > + < FTBONC(jω) >

La figure 4.2, montre le lieu de Black corrige d’un systeme du second ordre par un correcteur a

action integrale.

72

4.2. Correction : les actions a mener

−270 −225 −180 −135 −90 −45 0−40

−30

−20

−10

0

10

20

System: sys1Gain (dB): −6.67Phase (deg): −90Frequency (rad/sec): 2.15

System: untitled1Gain (dB): 2.81Phase (deg): −107Frequency (rad/sec): 0.84

Nichols Chart


Ope

n−Lo

op G

ain

(dB

)−90°−108°=−198°3,16dB+(−6,67dB)=−3,5dB

Figure 4.2 – Lieu de Black d’un systeme d’ordre deux corrige par un integrateur pur

Pour synthetiser un correcteur, on procedera de la maniere suivante :

1. Donnee : le lieu de Black de la FTBONC du systeme a corriger,

2. Profiler le lieu de la FTBOC en fonction des perfomances attendues en boucle fermee,

3. identifier le correcteur qui realise ce profil et calculer ses parametres.

4.2 Correction : les actions a mener

Le correcteur permet de modifier le gain et la phase de la FTBOC :

1. Stabilite : diminution du gain |C(jω)| < 0 et ajout d’une avance de phase < C(jω) > > 0

en vue par exemple de regler une marge de gain, une marge de phase. Ce point est illustre

sur la figure 4.3.

2. Amortissement : memes actions, en vue de regler le point de tangence du lieu de FTBOC(jω)

et d’une isogain, et cela afin de regler, de maniere implicite, un coefficient d’amortisse-

ment.

3. Rapidite : a gain statique egal, un systeme est d’autant plus rapide que sa bande passante

est elevee.

4. Precision : augmentation du gain statique.

Il apparaıt que les reglages 1, 2 et 3 concernent le regime transitoire et qu’ils sont operes pour

des points du lieu proches du point critique, a des pulsations dans le voisinage de [ω0dB, ωπ]. En

revanche, le reglage 4 concerne les points du lieu situes aux pulsations proches de 0 rad/s.

73


−270 −225 −180 −135 −90 −45 0−30

−20

−10

0

10

20

30

40

6 dB

3 dB

1 dB

0.5 dB

0.25 dB

0 dB

−1 dB

−3 dB

−6 dB

−12 dB

−20 dB

Gain en boucle ouverte (deg)

Pha

se e

n bo

ucle

ouv

erte

(dB

)

|C(jω)|<0

<C(jω)> > 0

ω0dBω

π

Figure 4.3 – Actions du correcteur pour accroıtre la stabilite

4.3 Correction proportionnelle

Le correcteur proportionnel est un simple gain, de sorte que la commande est proportionnelle

a l’erreur :

u(t) = kε(t) (4.3)

dont la transformee de Laplace s’ecrit :

U(p) = kε(p) (4.4)

La fonction de transfert du correcteur C(p) = k montre que ce dernier agit a toutes les frequences,

sur le regime transitoire comme sur le regime permanent. La figure 4.4 montre le diagramme

de Bode d’un tel correcteur et son effet sur la FTBO d’un systeme dans le plan de Black. Ce

correcteur n’offre qu’un seul degre de liberte et ne permet pas de regler simulanement toutes les

performances du systeme asservi.

Dans l’exemple presente, le gain est choisi inferieur a un pour permettre au lieu de Black de

tangenter l’isogain 0dB. Toutefois, le gain statique en boucle fermee etant avec ce reglage egal a

−7dB en boucle fermee, le facteur de surtension est egal a +7dB et le facteur d’amortissement

correspondant est egal a 0, 22. Pour ce systeme, cette correction n’est pas satisfaisante. Le gain

statique en boucle fermee et le facteur d’amortissement sont petits ce qui affecte la precision et

l’amortissement de la reponse indicielle representee sur la figure 4.4. Ce type de correcteur peut

egalement etre regle par la methode du lieu d’Evans presentee au chapitre 3.

74

4.3. Correction proportionnelle

−3

−2.5

−2

−1.5

−1

−0.5

Gai

n (d

B)

−180 −135 −90 −45 0−40

−30

−20

−10

0

10

20

6 dB

3 dB

1 dB −1 dB

−3 dB

−6 dB

−12 dB

−20 dB

−40 dB

Lieu de Black−Nichols

Phase en BO (deg)

Gai

n en

BO

(dB

)

100

101

−1

−0.5

0

0.5

1

Pha

se (

deg)

Diagramme de Bode C(p)=k

Pulsation (rad/sec)

FTBONC

FTBOC

0dB

Figure 4.4 – Correction proportionnelle visant a tangenter l’isogain 0dB

Am

plitu

deA

mpl

itude

0 1 2 3 4 5 6 7 8 9 100.2

0.4

0.6

0.8

1

0 1 2 3 4 5 6 7 8 9 100

0.1

0.2

0.3

0.4

0.5

0.6

Figure 4.5 – Reponse indicielle et commande pour le correcteur proportionnel

75


4.4 Corriger la stabilite et l’amortissement

4.4.1 Correcteur a action proportionnelle derivee

Le correcteur a action derivee genere une commande qui est la derivee de l’erreur :

u(t) = Tddε(t)

dt(4.5)

dont la transformee de Laplace s’ecrit :

U(p) = pTdε(p) (4.6)

La fonction de transfert du correcteur est C(p) = Tdp. La figure 4.6 montre le diagramme de

Bode d’un tel correcteur et son effet sur la FTBO d’un systeme dans le plan de Black.


Phase BO (deg)

Gai

n B

O (

dB)

−10

−5

0

5

10

15

Gai

n (d

B)

100

101

89

89.5

90

90.5

91

Pha

se (

deg)

Diagramme de Bode

Pulsation (rad/sec)−180 −135 −90 −45 0 45 90

−40

−30

−20

−10

0

10

20

6 dB

3 dB

1 dB −1 dB

−3 dB

−6 dB

−12 dB

−20 dB

−40 dB

FTBO_CFTBO_NC

Figure 4.6 – Correcteur a action derivee et effets de cette correction dans le plan de Black

Ce correcteur genere sur toute la plage de frequence une avance de phase de +90◦, en parti-

culier pour les points du lieu proches du point critique. Ceci a pour effet d’augmenter la marge

de phase. Dans le domaine temporel, cela peut permettre de stabiliser un systeme initialement

instable et d’augmenter le facteur d’amortissement. En revanche, le gain en dB aux basses fre-

quences tend vers moins l’infini, autrement dit, en regime statique, le signal d’erreur n’est plus

amplifie, le signal de commande tend vers zero et le systeme cesse d’etre commande.

On peut donner du sens physique a l’action derivee en observant que le signal de commande

genere par cette correction est proportionnel (facteur Td) a la vitesse de l’erreur. Ainsi, si l’er-

reur converge vers zero par valeurs croissantes (resp.decroissantes), le signal de commande est

negatif (resp. positif), il tend a s’opposer (a freiner) l’evolution de la reponse et cela d’autant

plus fortement que l’erreur varie rapidement. C’est ce que montre la figure 4.7.

76

4.4. Corriger la stabilite et l’amortissement

u(t) = Tddε

dt

ε(t)

u(t) = Tddε

dt

ε(t)

t

s(t)

e(t)

t

s(t)

e(t)

Figure 4.7 – Profils des signaux de commande generes par un correcteur a action derivee

4.4.2 Correcteur a action proportionnelle derivee

Le correcteur a action proportionnelle derivee n’a pas, aux pulsations proches de zero (ou

en regime permanent), les inconvenients du correcteur a action derivee. Il delivre, a partir de

l’erreur, une commande qui a pour expression :

u(t) = kε(t) + kddε(t)

dt(4.7)

en posant Td =kdk, la transformee de Laplace de u(t) s’ecrit :

U(p) = k(1 + Tdp)ε(p) (4.8)

4.4.3 Reglage dans le plan de Black Nichols

La fonction de transfert du correcteur est C(p) = k(1 + Tdp). La figure 4.8 montre le dia-

gramme de Bode d’un tel correcteur. Il se comporte :

— comme un correcteur proportionnel aux pulsations inferieures a1

Td, ainsi le gain statique

de la FTBO tend vers kFTBONC(0). Contrairement a l’action derivee pure, le gain

statique n’est pas nul. Pratiquement, k peut servir a regler la valeur de l’erreur en regime

permanent (voir le tableau 3.1).

— comme un correcteur a action derivee aux pulsations superieures1

Tdpour lesquelles il

ajoute une avance de phase. Celle-ci permet d’eloigner le lieu de Black de la FTBO du

point critique, contribuant ainsi a accroıtre la stabilite du systeme boucle. Pratiquement,

on regle1

Td<< ω0dB pour beneficier d’une avance de phase suffisante. Il faut toutefois

prendre garde au fait que, pour les pulsations superieurs a1

Td, le correcteur introduit un

gain. Plus exactement :

— l’avance de phase Ap produite par le correcteur a ω0dB : Ap = tan−1 ω0dBTd.

— le gain ajoute par correcteur a cette pulsation : GdB = 20logk+20log√

1 + (Tdω0dB)2.

77


0

10

20

30

40

Gai

n (d

B)

10−1

100

101

102

0

45

90

Pha

se (

deg)

Pulsation (rad/sec) −180 −135 −90 −45 0−40

−30

−20

−10

0

10

20

6 dB

3 dB

1 dB −1 dB

−3 dB

−6 dB

−12 dB

−20 dB

−40 dB

Phase BO (deg)

Gai

n B

O (

dB)

FTBO_CFTBO_NC

1/Td

ω0dB

1/Td

Ap

GdB

GdB

Ap

Figure 4.8 – Diagramme de Bode d’un correcteur proportionnel derive trace pour kp = 1 et son effet

sur le lieu de Black

4.4.4 Poursuite d’un modele de reference

Considerons un systeme a regler ayant pour fonction de transfert en boucle ouverte non

corrigee :

FTBONC(p) =k′

p(τp+ 1)(4.9)

Pratiquement, les systemes dont on cherche a controler la position (verins, servomoteurs, etc.)

presentent une fonction de transfert de ce type. Ce systeme est instable en boucle ouverte, et

cela du fait de la presence du pole nul. On l’insere dans une boucle d’asservissement a retour

unitaire, le correcteur retenu est du type proportionnel derivee, il vient :

FTBOC(p) =k′k(1 + Tdp)

p(τp+ 1)(4.10)

La fonction de transfert en boucle fermee :

FTBF (p) =k′kτ (1 + Tdp)

p2 + (1+k′kTd)τ p+ k′k

τ

(4.11)

Pour un tel systeme, k′ permet de regler la pulsation propre non-amortie et Td le facteur

d’amortissement reduit. Le gain statique est egal a un, independamment de la valeur des para-

metres, et ce du fait que le systeme etudie est de classe une.

4.4.5 Correcteur a avance de phase

Pratiquement, le correcteur a action proportionnelle derivee n’est pas realisable, le degre

du numerateur etant superieur a celui du denominateur. D’autre part, l’avance de phase est

78

4.4. Corriger la stabilite et l’amortissement

seulement necessaire pour les points du lieu de la FTBO proches du point critique. Enfin, il

n’est ni necessaire ni souhaitable de deriver les composantes hautes frequences du signal d’erreur.

En effet, celui-ci contient la mesure qui est generalement bruitee. L’erreur est donc elle-meme

bruitee, comme le bruit peut contenir des signaux a des frequences elevees (autrement dit des

signaux qui varient rapidement), il n’est pas souhaitable de les deriver. Le correcteur a avance

de phase pallie ces differents inconvenients, sa fonction de transfert a pour expression :

C(p) = kaτp+ 1

τp+ 1a > 1 (4.12)

Le diagramme de Bode de ce correcteur represente sur la figure 4.9 montre qu’il se comporte

comme un correcteur proportionnel 1 sur les plages de pulsation [0,1

aτ] ∪ [

1

τ,+∞[ et comme

un correcteur a action derivee dans l’intervalle [1

aτ,1

τ] 2. Ce correcteur genere localement une

avance de phase mise a profit pour eloigner du point critique les points du lieu de la FTBO qui

en sont proches.

L’etude du gain |C(jω)|dB et de l’argument < C(jω) > montrent que ce dernier admet un

maximum a la pulsation :

ωmax =1

τ√a

(4.13)

A cette pulsation :

|C(jωmax|dB = 20 log k + 10 log a (4.14)

< C(jωmax) > = sin−1

(a− 1

a+ 1

)

(4.15)

Pratiquement, on dimensionne le correcteur de la maniere suivante :

1. on se fixe l’avance de phase Ap que l’on veut creer pour les points du lieu proches du

point critique, en particulier au point dont la pulsation vaut ω0dB,

2. le correcteur est regle pour que le maximum d’avance de phase soit cree a ω0dB, de sorte

que ωmax coıncinde avec ω0dB,

3. l’equation (4.15) permet de determiner la valeur de a qui permet de generer l’avance de

phase maximale desiree,

4. comme ω0dB coıncide avec ωmax =1√aτ

, on en deduit la valeur de τ .

Le diagramme de Bode de la figure 4.10 montre qu’a la pulsation ωmax le correcteur introduit

un gain egal a 10 log a. Ainsi, le point du lieu ω0dB de la FTBO non corrige est translate hori-

zontalement vers la droite d’une avance de phase egale < C(jωmax) > mais aussi verticalement

vers le haut d’un gain egal a 10 log a. Pour anticiper ce phenomene, on peut mener l’etude avec

la pulsation de resonance de la boucle fermee non corrigee ωr a la place de ω0dB.

1. Le gain est constant et la phase est nulle.

2. Le gain croıt avec une pente de +20dB/decade et la phase est positive.

79


0

5

10

15G

ain

(dB

)

100

102

0

10

20

30

40

Pha

se (

deg)

Pulsation (rad/sec) −180 −135 −90 −45 0−60

−50

−40

−30

−20

−10

0

10

20

6 dB

3 dB

1 dB −1 dB

−3 dB

−6 dB

−12 dB

−20 dB

−40 dB

−60 dB

Phase BO (deg)

Gai

n B

O (

dB)

FTBO_NC

FTBO_Cωmax

1/τ

10 log a

20 log a

<C(jωmax

)>

ωr

ω0dB

1/(aτ)

Figure 4.9 – Diagramme de Bode d’un correcteur a avance de phase trace pour k = 1 et son effet sur le

lieu de Black

−120 −90

−15

−10

−5

0

5

Nichols Chart


Ope

n−Lo

op G

ain

(dB

)

10 log a

Ap

FTBONC

FTBOC

ω0dBω

r

Figure 4.10 – Effets du correcteur a avance de phase sur le gain et la phase

80

4.5. Corriger la precision

4.5 Corriger la precision

4.5.1 Correction integrale

Du point de vue de la precision, les effets d’un integrateur dans le domaine temporel ont ete

decrits au chapitre 3. Un integrateur permet d’augmenter la classe de la FTBO, ce qui en boucle

fermee permet de reduire voire d’annuler les erreurs en regime permanent.

La commande du systeme en boucle fermee est proportionnelle a l’integrale de l’erreur :

u(t) =1

Ti

∫ t

t0

ε(θ)dθ (4.16)

La transformee de Laplace de cette expression permet d’etablir la fonction de transfert du

correcteur a action integrale :

C(p) =1

Tip(4.17)

Le diagramme de Bode et les effets de ce correcteur sur la FTBO d’un systeme sont illustres sur

la figure 4.11.

−20

−15

−10

−5

0

5

Gai

n (d

B)

100

101

−91

−90.5

−90

−89.5

−89

Pha

se (

deg)

Pulsation (rad/sec)

−180 −135 −90 −45 0−40

−30

−20

−10

0

10

20

30

40

6 dB

3 dB

1 dB

0.5 dB

0.25 dB

0 dB

−1 dB

−3 dB

−6 dB

−12 dB

−20 dB

−40 dB

Phase BO (deg)

Gai

n B

O (

dB)

FTBO_CFTBO_NC

1/Ti

Figure 4.11 – Diagramme de Bode du corrcteur integral et ses effets sur le lieu de Black de la FTBO

On observe que ce correcteur introduit dans la boucle ouverte un gain statique infini, ce qui

est benefique a la precision. En revanche, il cree un retard de phase deπ

2a toutes les frequences

qui affecte la stabilite de la boucle. On constate que le lieu de Black de la FTBO corrigee

tangente l’isogain 0dB lorsque la pulsation tend vers zero mais qu’il tangente egalement isogain

6dB. Ainsi, en boucle fermee, le systeme est resonant et la reponse indicielle presente un fort

depassement.

81


4.5.2 Correcteur proportionnel integral

4.5.2.1 Reglage dans le plan de Black-Nichols

L’action integrale n’est necessaire qu’aux basses frequences, ses effets sur les points du lieu

proches du point critique nuisent a la stabilite et a l’amortissement. Le correcteur proportionnel

integral (PI) pallie cet inconvenient en ne generant de l’effet integral qu’aux basses frequences.

Pour les frequences qui correspondent aux points du lieu proches du point critique, ce correcteur

a un effet integral. La commande du systeme en boucle fermee est proportionnelle a l’erreur et

a l’integrale de l’erreur :

u(t) = kε(t) +k

Ti

∫ t

t0

ε(θ)dθ (4.18)

La fonction de transfert du correcteur PI :

C(p) = k

(

1 +1

Tip

)

(4.19)

Le diagramme de Bode de ce correcteur et ses effets sur le lieu de Black de la FTBO sont

representes sur la figure 4.12.

−180 −135 −90 −45 0−40

−30

−20

−10

0

10

20

30

40

6 dB

3 dB

1 dB

0.5 dB

0.25 dB

0 dB

−1 dB

−3 dB

−6 dB

−12 dB

−20 dB

−40 dB

Phase BO (deg)

Gai

n B

O (

dB)

0

5

10

15

20

25

Gai

n (d

B)

10−2

10−1

100

101

−90

−45

0

Pha

se (

deg)

Pulsation (rad/sec)

FTBO_CFTBO_NC

1/Ti

ω0dB

Figure 4.12 – Diagramme de Bode du correcteur PI et ses effets sur le lieu de Black de la FTBO

Le correcteur se comporte comporte comme un correcteur a action integrale pour les pulsa-

tions inferieures a1

Ti. 3 Aux pulsations superieures a

1

Ti, il agit comme un correcteur propor-

tionnel de gain k 4.

3. Dans cette plage de frequences, le gain decroıt avec une pende de -20dB/decade et l’argument vaut −π

2.

4. Dans cette plage de frequences, le gain est constant et le dephasage est nul.

82


Pratiquement, on regle Ti de sorte que1

Ti<< ω0dB. Ainsi, on beneficie d’un gain statique

qui tend vers l’infini, ce qui est favorable a la precision. Aux pulsations superieures a1

Ti, le

correcteur n’introduit qu’un faible retard de phase, ce qui a pour effet de ne pas degrader la

stabilite de la boucle.

4.5.2.2 Poursuite d’un modele de reference

Cette technique vise a conferer au systeme en boucle fermee une fonction de transfert donnee.

A ce propos, la correction proportionnelle integrale permet de regler efficacement les systemes

en boucle ouverte decrits par des fonctions de transfert du type :

S(p)

U(p)=

A

(τp+ 1)(4.20)

En particulier, ces fonctions de transfert decrivent les systemes dont on souhaite controler la

position. La FTBO du systeme corrige :

S(p)

ε(p)= C(p)

A

(τp+ 1)=k(Tip+ 1)

Tip

A

(τp+ 1)(4.21)

La constante de temps Ti est choisie egale a la constante de temps du systeme τ prealablement

identifiee ; de sorte qu’en boucle fermee sur un retour unitaire :

FTBF (p) =S(p)

E(p)=

1TiAk

p+ 1(4.22)

Le systeme boucle se comporte alors comme un systeme du premier ordre de gain statique

unitaire et dont la constante de temps peut etre reglee avec le gain k du correcteur. La diminution

de la constante de temps et par suite du temps de reponse a 5% s’opere en augmentant k. Il

faut toutefois prendre garde au fait que l’amplitude du signal de commande est d’autant plus

elevee que k est grand. On montre en effet que u(0) = ke0 ou u(0) et e0 sont respectivement le

signal de commande applique au systeme et l’amplitude de l’echelon de consigne. Pratiquement

les actionneurs qui delivrent les signaux de commande admettent des limitations (par exemple

la course d’une gouverne de vol, l’intensite du courant electrique delivree par une source, etc.)

et lorsque le signal de commande est sature, l’hypothese d’un systeme lineaire ne tient plus.

4.5.3 Correcteur a retard de phase

La precision d’un systeme asservi est d’autant meilleure que le gain statique est grand. Dans

le cas des correcteurs a action integrale, ce gain tend vers l’infini. Toutefois, et pour certaines

applications, l’insertion d’un grand gain dans la boucle ne vas pas sans poser de problemes.

Considerons par exemple le cas du vehicule a voilure tournante decrit sur la figure 1.1 au chapitre

1, il convient d’asservir les angles de gıtes et d’assiette a une consigne. Celle-ci est generalement

nulle lors la phase de decollage. Cependant, tandis que les helices ne tournent pas encore suffisa-

ment vite pour l’arracher au sol qui n’est pas parfaitement a niveau, la boucle d’asservissement

83


va agir sur les vitesses de rotations des helices pour tenter d’amener l’appareil a plat. Comme

l’appareil est au sol et qu’il n’a pas de degre de liberte en rotation, pour corriger l’attitude au

sol, certaines helices vont accelerer et l’appareil se retourner.

Le correcteur a retard de phase permet de regler la precison d’un systeme asservi en lui

apportant un gain statique eleve mais fini, sans toutefois degrader la stabilite. Ce correcteur a

pour fonction de transfert :

C(p) = kτp+ 1

bτp+ 1b > 1 (4.23)

Le diagramme de Bode de ce correcteur represente sur la figure 4.13 montre qu’il se comporte

comme un correcteur proportionnel 5 sur les plages de pulsation [0,1

bτ] ∪ [

1

τ,+∞[ et comme un

correcteur a action integrale dans l’intervalle [1

bτ,1

τ] 6.

L’etude du gain |C(jω)|dB et de l’argument < C(jω) > montrent que ce dernier admet un

minimum a la pulsation :

ωmax =1

τ√b

(4.24)

A cette pulsation :

|C(jωmax|dB = 20 log k − 10 log b (4.25)

< C(jωmax) > = sin−1

(1− b

1 + b

)

(4.26)

Pratiquement, on dimensionne le correcteur de la maniere suivante :

1. on s’impose le gain statique K que l’on veut apporter a la FTBO ,

2. on choisit K = b de sorte que pour les pulsations superieures a 1τ , le correcteur apporte

un gain en dB nul,

3. on choisit τ de sorte que les points du lieu de la FTBO qui risquent, du fait de l’effet

correcteur, de tangenter des isogains trop elevees ou de passer a proximite du point

critique (points ≈ [ω1, ω2] sur la figure 4.13), ne soient pas affectes par l’effet correcteur,

on peut par exemple choisir 1τ = ω1

5. Le gain est constant et la phase est nulle.

6. Le gain decroıt avec une pente de +20dB/decade et la phase est negative.

84


0

2

4

6

8

10

12

14

16

18

20

Gai

n (d

B)

10−2

100

102

−60

−30

0

Pha

se (

deg)

Diagramme de Bode

Pulsation (rad/sec)

0 45 90 135 180 225 270 315 360−60

−50

−40

−30

−20

−10

0

10

20

30

40

6 dB

3 dB

1 dB

0.5 dB

0.25 dB

0 dB

−1 dB

−3 dB

−6 dB

−12 dB

−20 dB

−40 dB

−60 dB


Phase en BO (deg)

Gai

n en

BO

(dB

)

FTBO_NCFTBO

points du lieu qu’on ne souhaitepas approcher trop près desisogains élevées et du point critique

ω1

ω2

Figure 4.13 – Diagramme de Bode d’un correcteur a retard de phase trace pour k = 10 et son effet sur

le lieu de Black

85


86

CHAPITRE 5

REPRESENTATION D’ETAT DES SYSTEMES

5.1 EXEMPLE INTRODUCTIF

ω4

motor 1 + propeller 1

motor 3+ propeller 3

motor2+propeller2

ω1

ω2

ω3

xb

yb

x (dirige vers le Nord)

y dirige vers l’Est

Figure 5.1 – Vue de dessus du quadrirotor

On s’interesse au quadrirotor represente sur la figure 5.1 et controle autour de son axe de

roulis seul. Dans le repere lie au vehicule, le vecteur qui materialise cet axe est note xb. La mise

en rotation du drone autour de son axe de roulis produit deux composantes du vecteur poussee

reperees, dans un referentiel lie au pilote, par les vecteurs x et z = x ∧ y. L’appareil se deplace

alors en translation dans les directions definies par ces vecteurs.

m designe la masse du drone en kg, Ixx le moment principal d’inertie autour de l’axe de

roulis en kg.m2, k est le coefficient de poussee des helices en N.s2, ℓ la distance du centre de

gravite du quadrirotor au point d’application de la poussee d’une helice en metres, ω1, ω2 les

vitesses de rotation des helices 1 et 2 en rad.s−1,

p designe la vitesse de roulis en rad.s−1 dans le repere attache au vehicule, φ est l’angle de gıte,

vy, vz sont les vitesses de translation du drone dans le repere lie au pilote et y et z designent la

position du centre de gravite du drone dans ce meme repere.

87

Chapitre 5. REPRESENTATION D’ETAT DES SYSTEMES

D’apres le principe fondamental de la dynamique, le theoreme du moment dynamique et les

relations cinematiques afferentes, ce modele a pour expression :

p =kℓ

Ixx

(ω24 − ω2

2

)

vy = − k

m

(ω22 + ω2

4

)sinφ

vz = g − km

(ω22 + ω2

4

)cosφ

φ = p

y = vyz = vz

de la forme X = f(X,U) (5.1)

Ou X =(

p vy vz φ y z)T

et U =(

ω2 ω4

)T.

Le quadrirotor est un systeme dynamique, c’est a dire, dont l’evolution des variables qui le

caracterisent est fonction du temps. Il est decrit par un modele continu, nonlineaire et invariant.

X ∈ R6 designe le vecteur d’etat et ses coordonnees sont appelees variables d’etat, U ∈ R

2

designe le vecteur des commandes. Le choix des variables d’etat ou de commande pour un

systeme donne n’est pas exclusif. A titre d’exemple, on aurait pu definir la poussee P = ω22 +ω

24

et une commande en roulis R = ω24−ω2

2 comme variables constitutives du vecteur de commande.

Si on suppose ce drone equipe d’une centrale d’attitude pour la mesure de la vitesse de

roulis p et de l’angle de gıte, d’un recepteur GPS pour la mesure de la latitude Lat et d’un

telemetre a ultrasons pour la mesure de la hauteur h. Ces capteurs sont supposes parfaits. En

supposant la terre localement assimilable a un plan et RT le rayon terrestre, il vient l’equation

dite d’observation qui exprime les mesures notees avec l’indice m en fonction des variables d’etat

et de commande.

pm = p

φm = p

Latm = atan

(y

RT

)

+ Lat(O)

hm = −z

de la forme Y = h(X,U) (5.2)

Ou Y =(

pm φm Latm hm

)Test appele vecteur des mesures et dont les coordonnees

sont les grandeurs observees au moyen des capteurs qui equipent le quadrirotor. Les mesures ne

s’expriment pas necessairement comme des combinaisons lineaires des etats. On notera egalement

que toutes les variables d’etat ne sont pas necessairement mesurees, cela peut proceder d’une

impossibilite technologique, de contraintes de cout, de masse, d’encombrement, etc.

5.2 EQUATIONS D’ETAT ET D’OBSERVATION

Dans le cas general, le systeme est decrit par n variables d’etat et X est un vecteur de Rn, le

systeme possede m entrees, il peut s’agir d’entrees de commande ou de perturbation, et U est

un vecteur de Rm. Enfin, q variables etant observees Y est un vecteur de R

q.

88

5.2. EQUATIONS D’ETAT ET D’OBSERVATION

5.2.1 Definition d’un point d’equilibre

A l’equilibre {Xe,Ue}, le systeme verifie f(Xe,Ue) = 0. Pour le quadrirotor, un cas parti-

culier d’equilibre est celui correspondant au vol stationnaire.

5.2.2 Linearisation des equations d’etat et d’observation

On se reportera a l’annexe A pour la linearisation des equations. Dans ce qui suit, on notera

x = X − Xe, u = U − Ue et y = Y − Ye respectivement les variations des vecteurs d’etat,

de commande et de mesure autour de leurs valeurs d’equilibre. Ainsi le systeme linearise a pour

expression :

{

x = Ax+Bu

y = Cx+Du(5.3)

Des dimensions des differents vecteurs d’etat, de commande et de mesures, on peut etablir

celles des differentes matrices :

A ∈ Rn×n La matrice d’etat

B ∈ Rn×m La matrice de commande

C ∈ Rq×n La matrice de sortie

D ∈ Rq×m La matrice de transfert direct

(5.4)

5.2.3 Obtention d’une fonction de transfert a partir d’une representation

d’etat

Pour un systeme multivariables, les fonctions de transfert definissent m×q relations entre lesm entrees du vecteur u et les q sorties du vecteur y. Elles donnent du systeme une representation

externe. La transformee de Laplace est appliquee aux equations d’etat et d’observation, les

conditions initiales sont supposees toutes nulles.

pX(p) = AX(p) +BU(p)

⇔ (pIn −A)X(p) = BU(p)

⇔ X(p) = (pIn −A)−1BU(p)

⇒ Y(p) =(

C (pIn −A)−1B+D)

U(p)

(5.5)

ou In designe la matrice identite de dimension n.

C (pIn −A)−1B+D ∈ Cq×m est une matrice de fonctions de transfert qui definit les relations

entre lesm entrees et les q sorties. On observe que le denominateur commun a toutes ces fonctions

de transfert est le polynome caracteristique de la matrice d’etat A et par consequent les valeurs

propres de A sont les poles du systeme. On rappelle, cf. chapitre2, que ces poles, reels et/ou

complexes conjugues, caracterisent les dynamiques de systemes, respectivement d’ordre un et/ou

deux.

89


5.3 INTEGRATION DE L’EQUATION D’ETAT

5.3.1 Methode de variation de la constante

On demontre que (Cf. Annexe F) l’equation d’etat (5.3) admet pour solution :

x(t) = eA(t−t0)x(t0) +

∫ t

t0

eA(t−τ)Bu(τ)dτ (5.6)

eAt est une exponentielle de matrice qui peut etre calculee avec la formule de Sylvester (Cf.

Annexe F), elle est appelee matrice de transition et possede les proprietes de l’exponentielle

scalaire.

5.3.2 Integration de l’equation d’etat dans la base modale

Cette methode sera decrite dans la section suivante.

5.4 CHANGEMENT DE BASE

Pratiquement, un meme systeme, peut etre decrit par differents jeux de vecteurs d’etat. Ainsi,

un circuit RLC, classiquement decrit par l’intensite du courant electrique dans l’inductance et la

tension aux bornes du condensateur peut aussi l’etre au moyen du flux magnetique et la charge

electrique.

De meme, il est frequent dans la litterature de trouver des modeles d’aeronefs decrits dans

le repere aerodynamique par la vitesse aerodynamique, les angles d’incidence et de derapage ;

d’autres par les vitesses projetees dans le repere avion 1 .

Ainsi, le modele donne sous forme de representation d’etat pour un systeme n’est pas unique.

En effet, mathematiquement on peut toujours trouver une matrice de passage P qui permette

d’exprimer le vecteur d’etat x decrit dans la base originelle a partir du vecteur d’etat z decrit

dans la nouvelle base :

x = Pz et P admet une inverse (5.7)

Expression que l’on substitue dans (5.3), il vient :

Pz+Pz = APz+Bu

y = CPz+Du(5.8)

En multipliant a gauche par P−1 :

z = P−1APz+P−1Bu

y = CPz+Du(5.9)

1. Il convient de souligner que contrairement a l’exemple precedent les relations qui lient vitesse aerodynamique,

angles d’incidence et de derapage aux vitesses projetees dans le repere avion ne sont pas lineaires.

90

5.5. ANALYSE DU SYSTEME DANS LA BASE MODALE

Il vient :

z = Az+ Bu

y = Cz+ Du(5.10)

Ainsi les matrices d’etat, de commande, de sortie et de transfert directe verifient :

A = P−1AP

B = P−1B

C = CP

D = D

(5.11)

On montre (Cf. Annexe F) que la matrice de fonction de transfert est invariante par chan-

gement de base.

5.5 ANALYSE DU SYSTEME DANS LA BASE MODALE

Si l’on suppose les valeurs propres de A distinctes, au moyen de la matrice de passage P

constituee des vecteurs propres associees aux valeurs propres de A, on peut exprimer le vecteur

d’etat x dans la base originelle a partir du vecteur d’etat z dans la base modale et donner une

representation d’etat du systeme dans cette base. Son interet est fondamental, l’integration de

l’equation d’etat, l’analyse du comportement du systeme en regime dynamique et des proprietes

essentielles telles que la commandabilite et l’observabilite peuvent y etre mises en evidence.

5.5.1 Resolution de l’equation d’etat

Dans la base modale, les valeurs propres {λ1, . . . , λn} etant distinctes, l’equation d’etat

s’ecrit :

⇔

d

dt

z1...

zn

=

λ1. . .

λn

z1...

zn

+

β11 . . . β1m... . . .

...

βn1 . . . βnm

u1. . .

um

y1. . .

yq

=

γ11 . . . γq1

. . . . . ....

γ1n . . . γqn

z1. . .

zn

(5.12)

On a ainsi substitue a un systeme de n equations differentielles du premier ordre couplees

entre elles, n equations differentielles du premier ordre, ce qu’illustre la figure 5.2. On peut

resoudre ces equations avec la methode de variation de la constante. Ainsi, apres integration de

(5.12), il vient :

91


z1(t) = eλ1(t−t0)z1(t0) +

∫ t

t0

eλ1(τ−t) (β11u1(τ) + · · ·+ β1mum(τ)) dτ

. . . = . . .

zi(t) = eλi(t−t0)zi(t0) +

∫ t

t0

eλi(τ−t) (βi1u1(τ) + · · ·+ βimum(τ)) dτ

. . . = . . .

(5.13)

zn(t) = eλn(t−t0)zn(t0) +

∫ t

t0

eλn(τ−t) (βn1u1(τ) + · · ·+ βnmum(τ)) dτ

5.5.2 Du sens des valeurs propres

Les poles sont les valeurs propres de la matrice d’etat, ces dernieres conditionnent les per-

formances dynamiques du systeme, stabilite, rapidite, amortissement Cf.2.

5.5.3 Du sens des vecteurs propres

Dans la base originelle x = Pz avec P = pij ∈ C et i, j ∈ [1, n] la matrice des vecteurs

propres. En regime libre, et sans perte de generalites u = 0, les coordonnees du vecteur d’etat

ont pour expression :

x1(t) = p11eλ1tz1(t0) · · ·+ · · ·+ p1je

λjtzj(t0) · · ·+ · · ·+ p1neλntzn(t0)

. . . = . . .

xi(t) = pi1eλ1tz1(t0) · · ·+ · · ·+ pije

λjtzj(t0) · · ·+ · · ·+ pineλntzn(t0)

. . . = . . .

xn(t) = pn1eλ1tz1(t0) · · ·+ · · ·+ pnje

λjtzj(t0) · · ·+ · · ·+ pnneλntzn(t0)

On observe que le je vecteur propre distribue la je valeur propre (ou pole) sur les coordonnees

du vecteur d’etat. Ainsi, le pole λj contribuera d’autant plus a la dynamique de la variable d’etat

✲ ✲ ✲

✻

✲ γ1∫

λ1

+

+β1

✲ ✲ ✲

✻

✲ γn∫

λn

+

+βn

✲ ✲ ✲

✻

✲ γi∫

λi

+

+βi

u y

z1

zi

zn

Figure 5.2 – Representation d’un systeme mono-entree, mono-sortie dans la base modale

92


xi que le module du coefficient pij est grand, relativement aux autres coefficients du je vecteur

propre.

5.5.4 Exemple : analyse des modes d’un aeronefs

Le modele de la dynamique laterale d’un Boeing 747 evoluant a Mach 0.8 et 40000 pieds est

decrit par les vecteurs d’etat(

β r p φ)

, de commande(

δn δℓ

)

et les matrices suivantes

ou β est l’angle de derapage, p la vitesse de roulis, r la vitesse de lacet, φ l’angle de gıte, δnl’angle de braquage de la gouverne de direction et δℓ l’angle de braquage des ailerons.

A =

−.0558 −.9968 .0802 .0415

.598 −.115 −.0318 0

−3.05 .388 −.4650 0

0 0.0805 1 0

B =

.00729 0

−0.475 0.00775

0.153 0.143

0 0

(5.14)

Spe(A) designe les valeurs propres de A : Spe(A) = {−0.0329± 0.94i,−0.5627,−0.0073} et P

la matrice de passage constituee des vecteurs propres associees.

P =

0.22e±28i 0.0172e180i 0.0067

0.15e±120i 0.0118e180i 0.0404

0.66e±91i 0.4895e180i 0.0105

0.69 0.8717 0.999

(5.15)

Les arguments sont en degres. On exploite ces donnees dans le tableau 6.1.

Etat

Poles −0.0329± 0.394i −0.5627 −0.0073

β 0.22e±28i 0.0172e180i 0.0067

r 0.15e±120i 0.0118e180i 0.0404

p 0.66e±91i 0.4895e180i 0.0105

φ 0.69 0.8717 0.999

ordre 2 1 1

Tableau 5.1 – Poles (valeurs propres) et vecteurs propres de la matrice d’etat

L’analyse des valeurs propres de la matrice d’etat montre que les dynamiques des variables

d’etat procedent de la superposition de deux modes d’ordre un et d’un mode d’ordre deux

tous stables, ce que confirment les chronogrammes de la figure 5.3. L’analyse de la matrice de

passage dans la base modale revele que le mode le plus lent est associe a la quatrieme valeur

propre −0.0073, la structure du quatrieme vecteur propre montre que cette valeur propre affecte

principalement l’angle de gıte φ (module du coefficient egal a 0.999). Le quatrieme chronogramme

de la figure 5.3 montre que l’angle de gıte est principalement affecte par une dynamique du

premier ordre lente.

93


0 50 100 150 200 250 300 350 400 450 5000

0.5

1

To:

φ

−0.2

0

0.2

To:

p

0

0.02

0.04

0.06

To:

r

−0.05

0

0.05

To:

β

Figure 5.3 – Reponses a un angle de gıte initial de 1

L’utilisation des arguments se fait comme suit, par exemple, pour le mode d’ordre deux,

la phase de reference etant celle correspondant a l’angle de gıte φ, il apparaıt que l’oscillation

associee a ce mode est pour le roulis p dephasee de 91 , pour le lacet r de 120 pour le derapage β

de 28 . Ce que confirme les chronogrammes obtenus en regime libre pour un angle de gıte initial

φ(0) = 1 .

0 5 10 15 20 25 300.4

0.6

0.8

1

To:

φ

−0.2

0

0.2

To:

p

0

0.02

0.04

0.06

To:

r

−0.05

0

0.05

To:

β

−0.2

0

0.2

To:

p

120°

28°

91°

Figure 5.4 – Mise en evidence du mode d’orde deux

5.5.5 Commandabilite

Definition 2 Un systeme est commandable sur un horizon [t0, tf ] si sur cet intervalle il existe

une commande u(t) qui permette d’amener le vecteur d’etat depuis un etat initial x(t0) choisi

quelconque vers un etat final x(tf ) choisi quelconque. C’est ce qu’illustre la figure 5.5

94


x(t0)

x(tf )

x1

x2

x3

Figure 5.5 – Illustration de la notion de commandabilite

Pratiquement, pour un systeme, le domaine de commandabilite est ferme et borne sur Rn,

ce sera par exemple le domaine de vol d’un aeronef.

Lorsque le systeme est decrit dans la base modale, s’il apparaıt que la je ligne de la matrice

B est nulle, alors la commande ne permet pas d’agir sur le mode associe au pole λj . Comme

x = Pz, ce que l’equation (5.14) detaille en regime libre, a priori puisque le pole λj contribue

a tous les etats et que son evolution ne peut etre maıtrisee au moyen de la commande, ce sont

donc toutes les coordonnees du vecteur d’etat qui ne peuvent etre controlees. Le systeme est

alors qualifie de non commandable. La figure 5.6 illustre la notion de non commandabilite dans

la base modale pour un systeme mono-entree, mono-sortie.

✲ ✲ ✲

✻

✲ γ1∫

λ1

+

+β1

✲ ✲ ✲

✻

✲ γn∫

λn

+

+βn

✲ ✲ ✲

✻

✲ γj∫

λj

+

+βj = 0

u y

z1

zj

z3

+

++

Figure 5.6 – Notion de commandabilite illustree dans la base modale

Si dans la base modale la matrice B presente plusieurs lignes nulles, le systeme est evidem-

ment non commandable. Pratiquement, on peut s’assurer de la commandabilite du systeme en

verifiant que B n’a pas de lignes nulles 2.

En pratique, un systeme est non commandable s’il est mal concu du fait que le nombre d’ac-

tionneurs qu’il comporte est insuffisant ou parce que des actionneurs sont defaillants.

Les modules des coefficients de la matrice de commande du Boeing 747 deja etudie, exprimee

dans la base modale au moyen des formules de changement de base (5.11) ont pour expression

numerique :

2. Il existe d’autre criteres pour etablir la commandabilite d’un systeme, en particulier, le critere de Kalman.

95


Poles

Commandeδn δℓ

−0.0329± 0.394i 1.0994 0.0188

−0.0329± 0.394i 1.0994 0.0188

−0.5627 2.1477 0.2469

−0.0073 2.7555 0.2218

Tableau 5.2 – Sensibilite des modes du Boeing 747 aux commandes de direction et aux ailerons

Ce tableau montre que le controle du mode d’ordre deux dont on a precedemment vu qu’il

etait a l’origine d’une oscillation mal amortie sur toutes les coordonnees du vecteur d’etat (Cf.

figure 5.3 ) est principalement controle par la commande de direction δn (coefficient egal a

1.0994). Au niveau du modele, la perte la commande de direction se traduit par la suppression de

la colonne associee a δn, dans ces conditions, la commande des ailerons δℓ serait particulierement

inefficace pour effacer cette oscillation (coefficient egal a 0.0188).

Pour un systeme presentant k poles non commandables, on montre que les q ×m fonctions

de transfert ne contiennent pas les poles non commandables. Ainsi, le degre du denominateur du

polynome des fonctions de transfert est egal a n− k et est inferieur a la dimension n du vecteur

d’etat.

Un pole λj non commandable mais stable revient naturellement a sa valeur d’equilibre, il

n’y a donc pas de danger pour le systeme. En revanche un pole λj instable non commandable

verra, dans la base modale, la variable d’etat zj diverger sans pouvoir etre controlee. Par suite,

c’est tout le vecteur d’etat x qui diverge sans qu’aucun controle puisse etre opere.

5.5.6 Observabilite

Definition 3 Un systeme est dit completement observable sur l’intervalle de temps [t0, tf ] si

l’observation de la commande u(t) et de la sortie y(t) permet de determiner l’etat initial x(t0).

Cette notion est fondamentale en sciences de l’ingenieur. En effet, si le systeme est observable,

la connaissance de la sequence de commandes qui lui est appliquee et le releve des mesure

permettent d’acceder aux coordonnees du vecteur d’etat qui ne sont pas mesurees. Pratiquement,

cela peut permettre d’estimer des variables qui, pour des raisons liees a des contraintes de cout,

de masse et d’encombrement ne peuvent etre mesurees. Ou encore, d’estimer les valeurs de

parametres inconnus d’un systeme.

Lorsque le systeme est decrit dans la base modale, s’il apparaıt que la je colonne de la matrice

C est nulle, alors la sortie y ne porte aucune information sur le mode associe au pole λj . Comme

x = Pz, alors le mode decrit par λj contribue a tous les etats. Il n’est donc pas possible d’acceder

aux coordonnees du vecteur d’etat. Le systeme est alors qualifie de non observable. La figure

5.7 illustre la notion de non observabilite dans la base modale pour un systeme mono-entree,

mono-sortie.

Si dans la base modale la matrice C presente plusieurs colonnes nulles, le systeme est evi-

demment non observable. Pratiquement, le systeme peut etre mal concu et ne pas etre equipe

des capteurs necessaires. La perte d’observabilite a plus souvent comme origine la perte due a

une panne d’un ou plusieurs capteurs.

96

5.6. Representation d’etat des systemes a temps discret

Pour un systeme presentant k poles non observables, on montre que les q × m fonctions

de transfert ne contiennent pas les poles non observables. Ainsi, le degre du denominateur du

polynome des fonctions de transfert est egal a n− k et est inferieur a la dimension n du vecteur

d’etat.

Un pole λj non observable mais stable revient naturellement a sa sa valeur d’equilibre sans

qu’il y ait a le mesurer pour s’en assurer, il n’y a donc pas de danger pour le systeme. En

revanche un pole λj instable et non observable verra, dans la base modale, la variable d’etat zjdiverger sans que cela puisse etre constate. Par suite, c’est tout le vecteur d’etat x qui diverge

sans que le mode responsable puisse etre observe. Dans ces conditions le systeme ne peut etre

controle. On a en effet vu au chapitre 3 que la commande est elaboree a partir des mesures.

5.6 Representation d’etat des systemes a temps discret

La plupart des systemes, meme s’ils sont continus, sont controles par calculateur. De fait, les

mesures relevees et les commandes qui leurs sont appliquees le sont a des intervalles de temps

discrets. Cet intervalle de temps est appele periode d’echantillonnage. D’autre part, le calculateur

traite et elabore des signaux numeriques discrets dont la resolution est definie par le quantum.

La figure 5.8 illustre un systeme asservi (a), un systeme asservi controle par calculateur dans le

cas ou le capteur est analogique (b), un systeme asservi controle par calculateur dans le cas ou

le capteur est numerique(c).

Generalement, le systeme a commander a un comportement de type passe-bas. Pour respecter

le theoreme de Shanon, la frequence d’echantillonnage doit etre superieure a la frequence de

coupure du systeme a commander.

Dans ce qui suit on note T la periode d’echantillonnage, les notations suivantes sont equiva-

lentes : x(kT ) = xk.

γ1∫

λ1

+

+β1

γn∫

λn

+

+βn

γj = 0∫

λj

+

+βj

u y

z1

zj

z3

+

++

Figure 5.7 – Notion d’observabilite illustree dans la base modale

97


5.6.1 Discretisation du modele lineaire invariant continu

Le systeme est decrit par les equations (5.3), dont la solution a pour expression (5.6). Comme

le systeme n’est ”vu” par le calculateur qu’aux instants d’echantillonnage et que la commande

qui lui est appliquee entre deux instants d’echantillonnage est, du fait du bloqueur d’ordre zero,

constante, en choisissant kT = t0 et t = (k + 1)T , (5.6) s’ecrit :

x ((k + 1)T ) = eATx(kT ) +

∫ (k+1)T

kTeA((k+1)T−τ)Bdτ u(kT ) (5.16)

On pose v = τ − kT , il vient :

x ((k + 1)T ) = eATx(kT ) +

∫ T

0eA(T−v)Bdv u(kT ) (5.17)

que l’on identifie a :

xk+1 = Fxk +Guk (5.18)

L’equation d’observation (5.3) devient :

y(kT ) = Cx(kT ) +Du(kT ) (5.19)

que l’on ecrit :

yk = Cxk +Duk (5.20)

IHM

CNA

CAN

Ampli Systeme

Filtreanti-aliasing

data

data

bus

bus

calculateurBOZ+

Capteur

consigne

retour

correcteur Ampli Systeme

Capteur

+

-consigne er

reur

commande

reponsemesure

IHM

CNAAmpli Systeme

data

data

bus

bus

calculateurBOZ+

Capteur

consigne

retour

(a)

(b)

(c)Figure 5.8 – Systeme asservi : (a) temps continu, (b)

98

5.7. RESOLUTION DE L’EQUATION D’ETAT

Le calcul de matrices F et G necessite celui de la matrice de transion eAt. On peut toutefois,

a condition que la periode d’echantillonnage soit tres inferieure a la plus petite constante de

temps du systeme, considerer que eAt ≈ I+At, ainsi :

F ≈ I+AT (5.21)

G ≈ BT (5.22)

Le systeme a temps discret, decrit par sa representation d’etat a pour expression :

xk+1 = Fxk +Guk

yk = Cxk +Duk(5.23)

5.7 RESOLUTION DE L’EQUATION D’ETAT

Le calcul de l’etat xn+1 a partir de la condition initiale x0 est obtenu par iteration de

l’equation d’etat (5.18) :

x(1) = Fx0 +Gu0

x(2) = F2x0 + FGu0 +Gu1

x(3) = . . .

(5.24)

le terme general de la suite a pour expression :

xn+1 = Fn+1x0 +n∑

i=0

Fn−iGui (5.25)

5.7.1 A propos de la stabilite

Les formules de changement de base etablies au §5.4 restent valables.

Dans la base modale, les valeurs propres de F etant supposees toutes distinctes, F est une matrice

diagonale. En regime libre (uk = 0) et soumis a des conditions initiales non nulles z0 6= 0, le

systeme revient a l’equilibre z∞ = 0 si et seulement si |λj | < 1 avec j ∈ {1, . . . , n}.Par suite x = Pz revient a l’equilibre puisque les coordonnees du vecteur d’etat s’ecrivent comme

une combinaison lineaire des modes qui sont tous stables.

On retrouve la condition de stabilite des systemes lineaires a temps discret selon laquelle un tel

systeme est stable si et seulement si le module de ses poles sont tous inferieurs a l’unite.

99


−3 −2 −1 0−3

−2

−1

0

1

2

3

0.280.380.50.64

0.8

0.94

0.5

1

1.5

2

2.5

3

0.5

1

1.5

2

2.5

3

0.080.170.280.380.50.64

0.8

0.94

0.080.17

Carte des pôles (continu)

Axe Réel (seconds−1)

Axe

Imag

inai

re (

seco

nds−

1 )

Carte des pôles (discret)

Axe Réel

Axe

Imag

inai

re

−1 −0.5 0 0.5 1−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

0.1π/T

0.2π/T

0.3π/T

0.4π/T0.5π/T

0.6π/T

0.7π/T

0.8π/T

0.9π/T

1π/T

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

0.1π/T

0.2π/T

0.3π/T

0.4π/T0.5π/T

0.6π/T

0.7π/T

0.8π/T

0.9π/T

1π/T

p1*

p1

p2

z2=epT

z1=epT

z1* =epT

Figure 5.9 – Poles : cas continu et discret

100

CHAPITRE 6

COMMANDE PAR RETOUR D’ETAT


On etudie la commande d’un avion qui vole a vitesse constante v0 et doit suivre une trajectoire

de reference. On controle l’angle de gıte φ pour amener l’appareil selon un cap ψ donne avec un

ecart de position y nul a la route de reference. Une vue de dessus de ce systeme est representee

sur la figure 6.1. L’angle de gıte φ est positif lorsque l’aile droite est plus basse que l’aile gauche.

Pour etudier ce systeme, on suppose de petites variations de φ, ψ et y autour de leur position

d’equilibre posees egale a zero. Ainsi, les equations linearisees qui decrivent le mouvement de

l’avion s’ecrivent :

ψ =gφ

v0(6.1)

y = v0ψ(t)

ψ < 0

y > 0

couloir aerien

Figure 6.1 – Suivi d’une trajectoire de reference par controle de l’angle de gıte

101

Chapitre 6. COMMANDE PAR RETOUR D’ETAT

Le cap ψ et la distance a la route de reference y sont les variables d’etat, g designe l’acce-

leration de pesanteur. Ces dernieres sont supposees toutes mesurees. Pratiquement ces mesures

peuvent etre obtenues par des releves radiogoniometriques operes sur des balises VOR 1 et l’angle

de gıte φ est la commande de ce systeme.

Pratiquement, l’angle de gıte φ controle par le pilote est regle en fonction de la distance y a

la route de reference et le pilote inclinera d’autant plus les ailes de l’appareil que l’avion en sera

eloigne. Sur la figure 6.1 φ doit etre regle negatif. Cette commande agit a la maniere d’une force

rappel qui vise a ramener l’appareil vers sa position d’equilibre.

Le controle de l’angle de gıte doit egalement tenir compte de la vitesse a laquelle l’appareil

approche de la route de reference ; s’il arrive trop vite, il risque de la depasser. L’equation d’etat

(6.1) montre qu’a vitesse constante, la vitesse d’approche est proportionnelle au cap ψ. Plus

l’avion arrive vite a la route de reference, plus il faut incliner les ailes. Sur la figure φ doit etre

regle positif. Cette commande vise a freiner l’appareil dans son mouvement vers la route de

reference.

Finalement, l’angle de gıte procede de ces deux effets antagonistes. Une loi de commande simple

pourrait s’ecrire :

φ = k1y + k2ψ (6.2)

Avec k1, k2 < 0 pour tenir compte des remarques precedentes. Une telle commande procede

d’une combinaison lineaire des variables d’etat. Elle realise une commande par retour d’etat.

Differentes methodes permettent de determiner les coeffcients k1 et k2 (en fait des gains). Celle

etudiee dans ce cours vise a regler les dynamiques des variables d’etat, il s’agit d’un technique

de commande par placement de poles (valeurs propres) et de vecteurs propres.

6.2 STRUCTURED’UNE COMMANDE PARRETOURD’ETAT

6.2.1 Conditions a la mise en œuvre d’une commande par retour d’etat

Le systeme est decrit par l’equation d’etat (6.3) :

{

x = Ax+Bu

y = Cx+Du(6.3)

Le systeme est suppose commandable et tout le vecteur d’etat est mesure, de fait C = In.

Le systeme dispose de m entrees de commande et u ∈ Rm. On souhaite par ailleurs controler p

variables, soit ζ le vecteurs des variables controlees. Comme on peut controler plus de variables

qu’on ne dispose d’entrees de commande, on a p ≤ m.

Le comportement dynamique du systeme non corrige (en boucle ouverte) est defini par

l’ensemble des valeurs propres de A note spe(A).

La structure retenue pour la commande par retour d’etat :

u = He−Kx (6.4)

avec

1. VHF Omnidirectionnal Range

102

6.3. CALCUL DES MATRICES DE CONTRE-REACTION ET DEPRE-COMMANDE : LE CAS DE LA COMMANDE MODALE

— e : les consignes avec dim(e) = dim(ζ)=p,

— H : la matrice de precommande H ∈ Rm×p,

— K : la matrice de contre-reaction K ∈ Rn×m.

Elle est illustree sur la figure 6.2. En substituant l’equation de la commande (6.4) dans

l’equation d’etat (6.3), on obtient la representation d’etat du systeme corrige :

x = (A−BK)x+BHe

y = Cx+Du

ζ = Mx

(6.5)

Systeme

-

y = x

K

e +

+B C

A

∫+

x

xu

M ζ

H y

Figure 6.2 – Structure de la commande par retour d’etat (D = 0)

6.3 CALCUL DES MATRICES DE CONTRE-REACTION ET

DE PRE-COMMANDE : LE CAS DE LA COMMANDE

MODALE

Le modele est donne, les matrices A, B, C = In, D et M ∈ Rp×n sont supposees connues.

On veut pour le systeme corrige pouvoir regler :

— un comportement dynamique donne, soit des reponses des variables d’etat stables, bien

amorties et rapides,

— le suivi des consignes e en regime permanent.

Or, la dynamique du systeme corrige est definie par les valeurs propres de la matrice d’etat

A−BK (les poles du systeme corrige). Pratiquement :

— on choisit les poles du systeme corrige νi avec i ∈ [1..n] en vue d’atteindre certaines

performances dynamiques (Cf. Chapitre 2),

— on calcule K de sorte que spe(A−BK) = {νi} avec i ∈ [1, ..., n],

— determination de H de sorte qu’en regime permanent (x = 0) on ait par exemple z = e.

103


Re

Imξmin

− 1

τ1− 1

τ2

Figure 6.3 – Region du plan complexe ou sont places les poles du systeme corrige

6.3.1 Cas mono-commande

Il s’agit, pour un systeme muni d’une seule entree de commande (u ∈ R) de reguler les n

variables d’etat du vecteur x et de controler une variable de sortie ζ ∈ R . La commandabilite

du systeme doit etre etablie.

Comme le systeme est muni d’une seule entree de commande, la matrice d’entree :

BT =(

b1 . . . bn

)

(6.6)

Puisqu’il s’agit de generer une commande a partir des n variables d’etat, la matrice K recherchee

a la structure suivante :

K =(

k1 . . . kn

)

(6.7)

Les poles regissant la dynamique des variables d’etat x sont les valeurs propres de la matrice

d’etat spe(A−BK) = νj sont fixes, ils garantissent la stabilite, l’amortissement et la rapidite

des regimes transitoires des variables d’etat. Pratiquement, ils sont choisis dans la zone du plan

complexe representee sur la figure 6.3.1.

Le polynome caracteristique de cette matrice a pour expression :

PA−BK(ν) = (ν − ν1) . . . (ν − νn) = νn + an−1νn−1 + . . . a1ν + a0 (6.8)

Ce polynome caracteristique est le determinant de la matrice :

PA−BK(ν) = |νIn − (A−BK)| (6.9)

Dans cette derniere expression, les coefficients de PA−BK(ν) dependent des coefficients ki de

K. Par identification des deux expressions de PA−BK(ν) on en deduit K.

104


Exemple : Apres s’etre assure que le systeme etait commandable et que tout le vecteur d’etat

est mesure, on recherche une matrice de contre-reaction K ayant la structure suivante K =(

k1 k2

)

.

Le calcul et l’analyse des poles du systeme decrit au §6.1 montrent que les deux valeurs

propres de la matrice d’etat sont nulles. Par consequent un tel systeme est instable, on ne peut

donc esperer attendre de l’avion qu’il longe la trajectoire de reference. On envisage donc un

controle de l’angle de gıte opere a partir des mesures du cap ψ et de la distance de l’avion a

la route de reference y. C’est un probleme de regulation puisqu’il s’agit de ramener le vecteur

d’etat a sa valeur d’equilibre, soit ψ = y = 0.

On souhaite que l’appareil revienne a l’equilibre en temps minimum, un depassement de la

trajectoire de reference est tolere. En s’appuyant sur les resultats etablis au chapitre 2 pour

les systemes d’ordre deux, on choisit un facteur d’amortissement ξ = 0.7. Le choix de ωn est

plus delicat, en effet l’abaque 2.11 du tr5% montre que pour ξ = 0.7, le produit ωntr5% ≈ 3.

Or on concoit qu’a vitesse v0 donnee, le temps de retour de l’appareil a l’equilibre depend de

y(0). On observe la une des limites de l’approche lineaire pour laquelle le temps de reponse est

completement independant des conditions initiales ou de la consigne a tenir. Pratiquement, on

choisit y(0) ≤ 100m, compte-tenu du fait que v0 a ete choisie constante et egale a 20m s−1, le

temps minimal mis par l’appareil pour revenir a l’equilibre avec un cap 2 ψ ≤ 30 est de l’ordre

de 10s. On se fixe donc tr5% =, il vient ωn = 0.3rad s−1.

On peut soit :

— calculer les valeurs propres complexes conjuguees de la matrice d’etat corrige spe(A −BK) = {ν1, ν1} = −ξωn ± iωn

√

1− ξ2 (2.22) puis calculer le polynome caracteristique

PA−BK(ν) = ν2 − 2ℜ(ν1) + |ν1|2— ou ce qui revient au meme, calculer directement le polynome caracteristique de cette

matrice en se rappelant que PA−BK(ν) = ν2 + 2ξωnν + ω2n (2.19).

Numeriquement :

PA−BK(ν) = ν2 + 0.42ν + 0.09 (6.10)

a identifier a :

PA−BK(ν) =

∣∣∣∣∣

(

ν 0

0 ν

)

−(

0 0

v0 0

)

+

(gv0

0

)(

k1 k2

)∣∣∣∣∣

(6.11)

PA−BK(ν) = ν2 +gk1v0

ν + gk2 (6.12)

il vient :

K =(

0.84 0.009)

(6.13)

2. On se place dans le cas de petites variations des variables d’etat et de commande autour de leur valeur

d’equilibre.

105


La trajectoire de l’avion realisee avec ce reglage est, pour les conditions initiales ψ(0) = 0 et

y(0) = 50m, representee sur la figure 6.4.

0 100 200 300 400 500 600 700−10

0

10

20

30

40

50

x (m)

y (m

)

Trajectoire réelleTrajectoire de consigne

Figure 6.4 – Trajectoire obtenue pour une commande par placement de poles : cas mono-entree

6.3.2 Cas multi-commandes

Si νi est la ie valeur propre de (A −BK) avec i ∈ [1, ..., n] et vi le vecteur propre non nul

associe, on a par definition :

(A−BK)vi = νivi (6.14)

(A− νiIn)vi = BKvi (6.15)

on pose :

wi = Kvi (6.16)

il vient :

(

A− νiIn −B)(

vi

wi

)

= 0 (6.17)

(

A− νiIn −B)

est une matrice de dimension n×(n+m) et definit une application lineaire

de Rn+m → Rn. Le noyau engendre un sous-espace de dimension m. Le vecteur

(

vi wi

)Tpeut

a priori etre choisi quelconque dans le sous-espace engendre par le noyau. Toutefois, la structure

de ce vecteur peut etre reglee pour accentuer ou effacer la dependance de certaines variables

d’etat et de commande a certains modes.

106


Ce calcul est mene pour les n valeurs propres νj et n afin d’obtenir n vecteurs(

vi wi

)T.

On construit les matrices de passage dans la base modale P et la matrice W :

P =(

v1 ... vn

)

(6.18)

W =(

w1 ... wn

)

(6.19)

D’apres (6.16) :

K = WP−1 (6.20)

Si les vi traduisent la sensibilite des commandes aux poles νi, les wi quant a eux traduisent

celles des commandes a ces memes poles, en effet :

u = e−Kx (6.21)

u = e−WP−1x (6.22)

u = e−WP−1Pz d’apres les formules de changement de base (5.11) (6.23)

u = e−Wz (6.24)

(6.25)

Comme dans la base modale les coordonnees zi du vecteur d’etat s’expriment en fonction des

modes (5.13), ces derniers sont distribues sur les commandes de u au travers des vecteurs wi de

W.

Exemple : Cette methode est appliquee au modele du Boeing 747 etudie au chapitre 5 dont

l’analyse des modes decrite dans le tableau 6.1 a revele la presence d’un mode d’ordre deux mal

amorti affectant principalement l’axe de roulis (il s’agit du mode de roulis hollandais ou dutch

roll mode).

On propose dans un premier temps un placement de poles simple, sans se preoccuper de

la structure des vecteurs propres. Les poles corriges sont : spe(A − BK) = {−1 − i,−1 +

i,−1,−0.0075}. Dans ce probleme A ∈ R4×4 et B ∈ R

4×2. Les matrices(

A− νiIn −B)

sont

de dimension 4 × 6 et le calcul du sous-espace nul ou noyau de ces matrices renvoie, pour

chaque valeur propre νi, deux vecteurs(

v1i w1

i

)Tet(

v2i w2

i

)T∈ C

6. Les quatre premieres

composantes de ces vecteurs definissent la sensibilite des variables d’etat aux modes, les deux

dernieres la sensibilite des commandes aux modes.

107


poles ν −1± i −1 −0.0075

vecteur propre ~v v11 v2

1 v12 v2

2 v13 v2

3

β 0.1884e±i124 0.0156e±i161 0.1538ei180 0.0303ei180 0.0109ei180 0.0497ei180

p 0.2564e±i166 0.0191e±i136 0.1715ei180 0.0241ei180 0.0401ei180 0.0052

r 0.4362e±i42 0.0982e±i47 0.5889ei180 0.1363 0.0107 0.0010ei180

φ 0.3006e±i179 0.0695ei180 0.6027ei180 0.1343ei180 0.9956ei180 0.0838

vecteur ~w w11 w2

1 w12 w2

2 w13 w2

3

δn 0.7843e±i17 0.0564e±i48 0.4754 0.1081 0.0068 0.0799

δℓ 0.0548e±i140 0.9908 0.1037 0.9748 0.0832 0.9920

Tableau 6.1 – Poles (valeurs propres) et vecteurs propres de la matrice d’etat

A priori toute combinaison lineaire des vecteur convient pour generer les vecteurs ~vi et ~wi

avec i ∈ [1, ..., 4] :

(

vi

wi

)

= γ1

(

v1i

w1i

)

+ γ2

(

v2i

w2i

)

(6.26)

avec γ1, γ2 ∈ R.

Pour cet exemple, on a dans un premier temps retenu γ1 = 1, γ2 = 0. On calcule ensuite les

matrices de passage P (6.18) et W (6.19) dont procede le calcul de la matrice de contre-reaction

K.

K =

β p r φ( )3.8563 −5.0818 −0.1777 0.1536 δn0.4296 −0.2895 −0.2855 −0.0797 δℓ

(6.27)

Les figures 6.5 et 6.6 montrent les vecteurs d’etat et de commande en reponse a un angle de

gıte initial de 20 . La reponse des variables d’etat est a comparer a celle de l’avion non corrige

et illustree sur la figure 5.3. Le mode de roulis hollandais est significativement amorti et le mode

spiral evolue avec une dynamique du premier ordre lente. Ce meme mode spiral affecte tout

autant l’angle de gıte et de roulis que l’angle de derapage et le lacet, mettant ainsi en evidence

un couplage entre les axes de roulis et de lacet. Il faut enfin s’assurer que les debattements des

gouvernes obtenus en calculant u = −Kx sont compatibles avec les amplitudes minimales et

maximales des gouvernes de direction et les ailerons du Boeing 747.

6.3.3 Les techniques de placement de structures propres

Dans le cas d’un systeme possedant m > 1 entrees, la matrice de contre-reaction K contient

m×n coefficients (en fait des gains) alors qu’il y a n poles a regler. On dispose donc de davantage

de parametres de reglage que de reglages a effectuer. On peut mettre a profit cet excedent de

gains pour regler la structure des vecteurs propres. Pratiquement, cela peut permettre de jouer

108


0

0.005

0.01

To:

β

0

0.02

0.04

To:

r

−0.02

−0.01

0

To:

p

0 50 100 150 200 250 300 350 4000

0.5

1

To:

φ

Réponse à un angle de gîte initial de 0.5 rad

Temps (seconds)

Am

plitu

de

Figure 6.5 – Reponses du vecteur d’etat et commandes du Boeing 747

0 1 2 3 4 5 6 7 8

−0.1

−0.08

−0.06

−0.04

−0.02

0

Temps (s)

δ n (rad)

0 50 100 150 200 250 300 350 4000

0.01

0.02

0.03

0.04

0.05

Temps (s)

δ l (rad)

Figure 6.6 – Reponses du vecteur d’etat et commandes du Boeing 747

109


sur la sensibilite d’une variable d’etat ou d’une commande a un mode. Par exemple, dans le

cas de la commande de la dynamique laterale du Boeing 747, on pourra rendre l’axe de lacet

independant du mode spiral, ce qui aura pour effet de decoupler les effets des commandes sur

les axes.

L’equation (6.28) montre une structure pour les vecteurs vi etwi choisie telle que les variables

d’etat xj et de commande uk ne contiennent pas le mode caracterise par la valeur propre νi. Pour

un systeme possedant m commandes, on peut annuler m−1 lignes ; × designe un coefficient non

nul.

νi

vi

×0

×

x1xjxn

wi

×0

×

u1ukum

(6.28)

Si on definit les m− 1 vecteurs de contraintes suivants :

cji =1 . . . j . . . n+m( )0 0 1 0 0 (6.29)

cn+ki =

1 . . . . . . n+ k n+m( )0 0 0 1 0 (6.30)

(6.31)

Alors, les m− 1 produits scalaires (6.32) sont nuls :

cji .

(

vi

wi

)

= 0 (6.32)

cn+ki .

(

vi

wi

)

= 0 (6.33)

On a vu precedemment que la resolution des systemes (6.17) renvoyait, pour chaque valeur

propre νi avec i ∈ [1, ..., n], m vecteurs de dimension n+m. Pour que la solution soit un vecteur

unique et ayant la structure definie dans (6.28), on ajoute les m− 1 equations de contraintes de

sorte que l’on ait a resoudre un systeme de n+m− 1 equations a n+m inconnues :

A− νiIn −B

cjicn+ki

(

vi

wi

)

= 0 (6.34)

110


On reitere l’operation pour les n valeurs propres (poles du systeme corrige) et pour chacune

d’elle on s’impose la structure du vecteur propre. Comme precedemment, on construit ensuite

les matrices P et W a partir desquelles on calcule la matrice de contre-reaction K = WP−1.

Le choix des structures des vecteurs propres est souvent delicat. En particulier, on ne peut

contraindre le systeme muni de sa commande par retour d’etat a adopter un comportement

radicalement different de celui qu’il a en boucle ouverte. Par exemple, si l’on se refere au tableau

5.2, il semble fortement deconseille de chercher a decoupler le mode d’ordre deux de la commande

de direction. Sur un modele lineaire de l’appareil, cette commande necessiterait pour la matrice

K des gains tres grands, lesquels conduiraient probablement a une instabilite du systeme si on

testait cette commande sur un modele non lineaire.

6.3.4 Calcul de la pre-commande

La matrice de precommande H est calculee de sorte qu’en regime permanent et pour des

echelons de consigne e ∈ Rp, les p sorties controlees ζ soient a proportionnelles aux consignes :

ζ = diag(

γ1 . . . γp

)

e (6.35)

Pratiquement on choisira diag(

γ1 . . . γp

)

= Ip. En regime permanent, le systeme corrige

etant suppose stable, il vient :

{

0 = (A−BK)x∞ +BHe

ζ∞ = Mx∞(6.36)

ζ∞ = −M(A−BK)−1BHe (6.37)

Comme on cherche a obtenir z∞ = e, on choisit :

— dans le cas ou le nombre d’entrees a controler p est egal au nombre de commande :

H = −(M(A−BK)−1B

)−1(6.38)

— dans le cas ou le nombre d’entrees a controler p est inferieur au nombre de commande :

H = −(M(A−BK)−1B

)†(6.39)

ou A† designe la matrice pseudo-inverse 3 de A.

6.3.5 LA COMMANDE PAR RETOUR DE SORTIE

Pratiquement, il n’est pas toujours possible de mesurer tout le vecteur d’etat. Dans le cas

ou le nombre de capteurs q < n, on envisage dans cette partie une commande de la forme :

u = He−Ky (6.40)

3. Cette matrice verifie A ∈ Re×f et e < f alors AA

†A = A.

111


ou K ∈ Rq×n. Dans le cas d’une equation d’observation de la forme 4 :

y = Cx (6.41)

u = He−KCx (6.42)

On reporte (6.38) dans l’equation d’etat (6.3), il vient l’equation d’etat du systeme commande

par retour de sortie :

x = (A−BKC)x+BHe (6.43)

Si νi est la ie valeur propre de (A−BKC) avec i ∈ [1, ..., q] et vi le vecteur propre non nul

associe, on a par definition :

(A−BKC)vi = νivi (6.44)

on pose :

wi = KCvi (6.45)

(

A− νiIn −B)(

vi

wi

)

= 0 (6.46)

Ce calcul est mene pour q valeurs propres νj afin d’obtenir q vecteurs(

vi wi

)T. Comme

pour la commande par retour d’etat, on construit la matrice de passage dans la base modale P

et la matrice W :

P =(

v1 ... vq

)

(6.47)

W =(

w1 ... wq

)

(6.48)

D’apres (6.45) :

K = W(CP)−1 (6.49)

Comme on ne peut fixer que q < n valeurs propres, les n−q valeurs propres restantes prennentdes valeurs quelconques dans R et/ou C avec le risque de faire apparaıtre des dynamiques mal

amorties ou instables. Ces aspect sera etudie pendant les seances de travaux diriges.

4. Dans la plupart des cas la matrice D = 0

112

6.4. LE CAS DISCRET

6.4 LE CAS DISCRET

Le principe et le calcul de la commande des systemes a temps discret sont identiques au cas

continu. Il convient de placer les poles de la matrice d’etat corrige F−BK a l’interieur du cercle

unite. La figure 5.9 rappelle la correspondance entre les poles dans le plan complexe pour des

systemes continus et leur image dans le plan complexe pour des systemes a temps discret.

113


114

CHAPITRE 7

OBSERVATEURS


On souhaite acceder a la vitesse ascencionnelle v d’un mobile qui se deplace verticalement, par

exemple un drone a voilure tournante. Pratiquement, deux types de capteurs sont disponibles :

— un accelerometre qui mesure l’acceleration verticale a,

— un capteur a ultrason qui renvoie la hauteur h.

Ces mesures ne sont disponibles qu’a des intervalles de temps discrets T , cependant les

cinematiques qui decrivent le systeme sont elles continues. On choisit pour vecteur d’etat x =(

h v)T

et d’entree u =(

a)

, il vient :

(

h

v

)

=

(

0 1

0 0

)(

h

v

)

+

(

0

1

)(

a)

(7.1)

(

h)

=(

1 0)(

h

v

)

+(

0)(

a)

(7.2)

Le systeme a temps discret (T=50ms) a pour expression approchee :

(

hk+1

vk+1

)

=

(

1 T

0 1

)(

hkvk

)

+

(

0

T

)(

ak

)

(7.3)

(

hk

)

=(

1 0)(

hkvk

)

+(

0)(

ak

)

(7.4)

On peut evidemment tenter d’estimer la vitesse en integrant une fois la mesure de l’accelera-

tion comme le montre la figure 7.1 (gauche) ou en derivant celle de la position (droite). La figure

de gauche montre la vitesse obtenue tandis qu’il existe une erreur d’estimation de la position

initiale. Celle de droite, la vitesse obtenue a partir de la position tandis que la mesure de celle-ci

115

Chapitre 7. OBSERVATEURS

0 0.5 1 1.5 2 2.5 3−1

−0.5

0

0.5

1

1.5

Temps(s)

v\hat{v}a

0 0.5 1 1.5 2 2.5 3−3

−2

−1

0

1

2

3

4

5

Temps (s)

\hat{v}v

Figure 7.1 – Estimation de la vitesse par integration de l’acceleration et derivation de la position

est bruitee par un bruit blanc gaussien de variance egale a 1.10−4m2. Dans les deux cas, par

comparaison a la vitesse reelle, on constate que l’estimation de la vitesse presente des erreurs

qui rendent son exploitation difficilement exploitable.

Dans ce qui suit, des observateurs, systemes dynamiques charges d’estimer les variables d’etat

qu’on ne sait ou ne peut mesurer sont etudies. Dans un premier temps, tous les signaux seront

supposes deterministes.

Les systemes etudies sont pour la plupart a temps continu. Cependant les observateurs sont

implementes sur des calculateurs et exploitent des mesures echantillonnees 1. Ils realisent donc

des systemes dynamiques a temps discret. Les observateurs sont parfois appeles capteurs logiciels.

Le observateurs presentent de nombreux interets :

— Dans le cas de la commande par retour d’etat, celle-ci requiert que l’on ait acces a tout le

vecteur d’etat u = He−Kx. Pratiquement, pour des raisons de cout, d’encombrement, de

masse, on ne peut disposer de tous les capteurs necessaires pour mesurer tous le vecteur

d’etat. Un observateur permet d’estimer les etats que l’on ne mesure pas, la commande

est alors realisee a partir des etats estimes. On parle alors de commande par retour d’etat

estime.

— Certains parametres d’un systeme peuvent etre inconnus, neanmoins la loi qui regit leur

evolution au cours du temps en fonction des variables d’etat est quant a elle connue,

c’est par exemple le cas d’un parametre p inconnu mais dont la valeur est constante dans

le temps. Dans ce cas, on augmente le vecteur d’etat en ajoutant a l’equation d’etat

l’equation d’evolution p = 0. Sous reserve que le systeme augmente soit observable, un

observateur permet d’estimer le vecteur d’etat et en particulier le parametre inconuu p.

— Les methodes de diagnostic de defaut utilisent des observateurs en vue d’estimer le vecteur

d’etat des systemes surveilles. Par comparaison de ces estimations aux mesures operees

sur le systeme, un traitement ad’hoc des signaux permet de detecter et de localiser les

elements defaillants.

1. Il est evidemment possible d’etudier et de realiser des observateurs a temps continu.

116

7.2. EQUATIONS DE L’OBSERVATEUR

7.2 EQUATIONS DE L’OBSERVATEUR

Le systeme dont on desire estimer le vecteur d’etat a pour modele (7.5), en outre il est

observable.

xk+1 = Fxk +Guk (7.5)

yk = Cxk +Duk

L’observateur est un systeme dynamique, lui-meme decrit par une representation d’etat.

L’estimation du vecteur d’etat notee x procede des entrees u et des mesures y respectivement

appliquees et prelevees sur le systeme. Les equations de l’observateur :

xk+1 = Sxk +Muk + Lyk (7.6)

yk = Cxk +Duk

On definit l’erreur d’estimation εk = xk − xk dont on desire qu’elle tende vers zero lorsque k

tend vers l’infini. Ainsi les etats estimes tendent vers les etats reels. Il convient de souligner que

le vecteur εk n’est pas accessible en ce sens ou les variables d’etat ne sont pas toutes mesurees.

εk+1 = xk+1 − xk+1

εk+1 = Fxk +Guk − Sxk −Muk − Lykεk+1 = Fxk +Guk − Sxk −Muk − L(Cxk +Duk)

εk+1 = (F− LC)xk + (G−M− LD)uk − Sxk − Sxk + Sxk

εk+1 = (F− LC− S)xk + (G−M− LD)uk + Sεk

(7.7)

Les matrices S, M, L sont choisies de sorte que εk+1 ne depende ni du vecteur d’etat xk ni du

vecteur d’entrees uk. Si les conditions :

F− LC− S = 0

G−M− LD = 0 (7.8)

sont verifiees. Il vient :

εk+1 = (F− LC)εk (7.9)

Les matrices F et C etant donnees, les erreurs d’estimations tendent vers zero lorsque k tend

vers l’infini si le choix de la matrice L garantit que toutes les valeurs propres de F − LC ont

leur module inferieur a l’unite.

En outre, l’observateur doit etre plus rapide que le systeme observe, la matrice L doit etre

choisie de telle sorte que les dynamiques des erreurs soit plus rapides que celles des etats. Au-

trement dit, dans le plan complexe, pour un systeme a temps discret, le plus grand module des

117


valeurs propres de la matrice d’etat de l’observateur F−LC doit etre plus petit que le plus petit

module des valeurs propres de F.

spe(F) = λi avec i ∈ [1, . . . , n], spe(F− LC) = µj avec j ∈ [1, ..., n] alors min |λi| > max |µj |Toutefois, on observe que, plus les valeurs propres de F− LC sont choisies petites, plus les

coefficients de la matrice L (qui en fait sont des gains) sont grands. Or ces gains traitent les

mesures y, si ces dernieres sont bruitees, le vecteur d’etat estime sera alors entache de bruits.

Finalement, l’equation d’etat de l’observateur s’ecrit :

xk+1 = Fxk +Guk︸︷︷︸

prediction

+L(yk − yk)︸︷︷︸

innovation

(7.10)

yk = Cxk +Duk︸︷︷︸

prediction

Ces equations montrent que l’estimation du vecteur d’etat procede d’une part du modele du

systeme, c’est la prediction. La prediction du vecteur d’etat peut etre realisee alors meme que le

systeme ne fonctionne pas, en s’appuyant sur le seul modele. On parle egalement d’estimation a

priori.

L’ecart entre les mesures reelles et les mesures predites est exploite et realise l’innovation en

ce sens ou les mesures apportent de la nouveaute et contribuent a une meilleure estimation du

vecteur d’etat. L’estimation obtenue apres traitement des mesures est qualifiee d’estimation a

posteriori.

Systeme

retardT

+

+ +

+

-

yk

yk

xk

L

G C

F

uk

xk+1

Figure 7.2 – Structure de l’observateur a temps discret

7.2.1 OBSERVATEUR IDENTITE

Il s’agit, pour un systeme muni d’un seul capteur (y ∈ R) d’estimer les n variables d’etat du

vecteur x ∈ Rn. L’observabilite du systeme doit etre etablie.

Comme le systeme est muni d’un seul capteur, le vecteur de mesure est reduit a un scalaire.

C =(

c1 . . . cn

)

(7.11)

118

7.2. EQUATIONS DE L’OBSERVATEUR

Puisqu’il s’agit d’estimer les n variables d’etat a partir d’une seule mesure, la matrice L

recherchee a la structure suivante :

LT =(

ℓ1 . . . ℓn

)

(7.12)

On suppose en outre la matrice de transfert direct D = 0.

Les poles regissant la dynamique des erreurs d’estimation ε qui sont les valeurs propres de

la matrice d’etat spe(F− LC) = µj sont fixes, ils verifient les conditions enoncees supra. Le

polynome caracteristique de cette matrice a pour expression :

PF−LC(µ) = (µ− µ1) . . . (µ− µn) = µn + an−1µn−1 + . . . a1µ+ a0 (7.13)

Ce polynome caracteristique est le determinant de la matrice :

PF−LC(µ) = |µIn − (F− LC)| (7.14)

Dans cette derniere expression, les coefficients de PF−LC(µ) dependent des coefficients ℓi de

L. Par identification des deux expressions de PF−LC(µ) on en deduit L.

7.2.1.1 Exemple : estimation de vitesse (suite)

Le systeme etudie dans l’exemple indroductif est observable. Il possede une entree, l’acce-

leration mesuree et une sortie, la position mesuree par le capteur a ultrasons. On peut donc

estimer la vitesse verticale en mettant en œuvre un observateur identite.

Les poles de ce systeme sont les valeurs propres de la matrice d’etat spe(F) = {1, 1}. On

choisit pour regler la dynamique des erreurs les valeurs propres de F−LC a l’interieur du cercle

unite, soit spe(F− LC) = {−0.5, 0.5}.Le polynome caracteristique de F− LC :

PF−LC(µ) = (µ+ 0.5)(µ− 0.5) = µ2 + 0.25 (7.15)

a identifier a :

PF−LC(µ) =

∣∣∣∣∣

(

µ 0

0 µ

)

−(

1 T

0 1

)

+

(

ℓ1ℓ2

)(

1 0)∣∣∣∣∣

(7.16)

PF−LC(µ) =

∣∣∣∣∣

(

µ 0

0 µ

)

−(

1 T

0 1

)

+

(

ℓ1ℓ2

)(

1 0)∣∣∣∣∣

(7.17)

PF−LC(µ) =

∣∣∣∣∣

(

µ− 1 + ℓ1 −Tℓ2 µ− 1

)∣∣∣∣∣= µ2 + (ℓ1 − 2)µ+ Tℓ2 + 1− ℓ1 (7.18)

119


Figure 7.3 – Le systeme continu et l’observateur a temps discret representes sous SIMULINK

120

7.3. OBSERVATEUR DE LUENBERGER

0 0.5 1 1.5 2 2.5 3−1

0

1

2

3

4

5

hv\hat{h}\hat{v}

Figure 7.4 – Les etats reels (h, v)T et estimes (h, v)T simules

Il vient ℓ1 = 2, ℓ2 = 15. Cet observateur est simule sous SIMULINK (cf. 7.3).

Les resultats des simulations sur la figure 7.4 montrent que les conditions initiales des etats

estimes, toutes deux choisies a zeros, different ce celles des etats reels h(0) = 0.3m et v(0) =

−0.2m/s. Toutefois, apres 0.5s et quelques oscillations, le vecteur d’etat estime tend vers le

vecteur d’etat reel. La dynamique des erreurs d’estimation illustree sur la figure 7.5 depend du

choix des poles de l’observateur, dans le cas present, le fait d’avoir choisi un pole reel negatif

conduit a des suites alternees pour les erreurs.

7.3 OBSERVATEUR DE LUENBERGER

Dans le cas ou q > 1 capteurs equipent le systeme, la methode precedente pour determiner

le gain L ne peut plus etre utilisee. On procede comme dans le cas de la commande par retour

d’etat d’un systeme MIMO en utilisant une technique de placement de poles (valeurs propres)

et de vecteurs propres. La matrice C ∈ Rq×n est de rang colonne m. La methode presentee infra

peut aussi etre utilisee pour un systeme equipe de q = 1 capteur.

On utilise la propriete

spe(F− LC) = spe(F− LC)T (7.19)

Si µi est la ie valeur propre de (F − LC)T (µi est egalement valeur propre de F− LC avec

i ∈ [1, ..., n]) et −→v i le vecteur propre non nul associe, on a par definition :

121


0 0.5 1 1.5 2 2.5 3−5

−4

−3

−2

−1

0

1

εv

εv

Figure 7.5 – Les erreurs d’estimation

(F− LC)T~vi = µi~vi (7.20)

(FT −CTLT )~vi = µi~vi (7.21)

(FT − µiIn)~vi = CTLT~vi (7.22)

on pose :

~wi = LT~vi (7.23)

il vient :

(

FT − µiIn −CT)(

~vi

~wi

)

= ~0 (7.24)

(

FT − µiIn −CT)

est une matrice de dimension n×(n+q) et definit une application lineaire

de Rn+q → R

n. Le noyau engendre un sous-espace de dimension q. Le vecteur(

~vi ~wi

)Tpeut

a priori etre choisi quelconque dans le sous-espace engendre par le noyau.

Ce calcul est mene pour les n valeurs propres µj et n afin d’obtenir n vecteurs(

~vi ~wi

)T.

On construit les matrices de passage dans la base modale P et la matrice W :

P =(

~v1 ... ~vn

)

(7.25)

122

7.3. OBSERVATEUR DE LUENBERGER

W =(

~w1 ... ~wn

)

(7.26)

D’apres (7.23) :

L = (WP−1)T (7.27)

7.3.1 Exemple : suite et fin

On suppose que la mesure de l’acceleration am est entachee d’une erreur systematique

constante et inconnue b. Comme l’estimation de la vitesse procede de l’integration de l’acce-

leration mesuree, toute erreur sur cette derniere est propagee sur l’estimation. On met en œuvre

un observateur en vue d’estimer cette erreur qui ne peut etre mesuree.

am = a+ b (7.28)

Les equations cinematiques sont inchangees :

z = v (7.29)

v = a (7.30)

v = −b+ am (7.31)

comme b = cte, on exprime ce parametre inconnu comme une variable d’etat que l’observateur

aura a estimer.

b = 0 (7.32)

Le modele augmente 2 de ce systeme continu :

h

v

b

=

0 1 0

0 0 −1

0 0 0

h

v

b

+

0

1

0

(

am

)

(7.33)

(

h

v

)

=

(

1 0 0

0 1 0

)

h

v

b

+

(

0

0

)(

am

)

(7.34)

Le systeme augmente a temps discret (T=50ms) a pour expression approchee :

hk+1

vk+1

bk+1

=

1 T 0

0 1 −T0 0 1

hkvkbk

+

0

T

0

(

amk

)

(7.35)

(

hkvk

)

=(

1 0 0)

hkvkbk

+

(

0

0

)(

amk

)

(7.36)

2. Augmente au sens ou l’on a augmente la dimension du vecteur d’etat.

123


0 0.5 1 1.5 2 2.5 3−6

−5

−4

−3

−2

−1

0

1

2

Temps (s)

b\hat{b}

0 0.5 1 1.5 2 2.5 3−0.5

0

0.5

1

1.5

2

2.5

Temps (s)

hv\hat{h}\hat{v}

Figure 7.6 – Estimation du biais, de la hauteur et de la vitesse

L’estimation des trois variables d’etat procede de deux mesures. Par consequent la matrice

recherchee L ∈ R3×2.

Le code source permettant de calculer la matrice L sous MATLAB est presente dans l’annexe

G. Dans cet exemple, comme il y a deux capteurs, pour chaque valeur propre µ1, µ2, µ3, les sous-

espaces nuls engendres sont de dimension deux. A priori, toute combinaison lineaire des deux

vecteurs engendres pour obtenir les vecteur ~v1, ~v2, ~v3, ~w1, ~w2, ~w3 convient. Dans un souci de

simplicite, on s’est contente de choisir pour chacun des µi le premier des deux vecteurs resultant

du calcul des noyaux. On aurait pu rechercher les vecteurs ~vi, ~wi qui minimisent la norme L2

de la matrice de l’observateur. En effet, comme en pratique les mesures sont bruitees, plus les

coefficients (en fait des gains) de cette matrice sont petits, moins les bruits sont amplifies.

Tous calculs faits, il vient :

L =

3.3125 −0.0077

65.5426 −0.5625

−58.1979 −5.2043

(7.37)

La structure de l’observateur reste la meme que celle illustree sur la figure 7.3, une constante

egale a 0.1 et simulant l’erreur systematique a ete ajoutee a la mesure de l’acceleration. Les

chronogrammes de la figure 7.6 montrent que l’observateur estime correctement cette erreur

systematique pendant les phases de regime permanent. Un autre choix des valeurs propres de F−LC pourrait permettre une convergence plus rapide des erreurs d’estimation. Le chronogramme

du bas montre les estimations de la hauteur h et de la vitesse verticale v, ces dernieres sont

comparees a h et v. On peut evidemment s’interroger sur l’interet d’un observateur qui estime

des grandeurs par ailleurs mesurees. Comme on le verra dans le chapitre consacre au filtre de

Kalman, dans la pratique les mesures sont bruitees et un observateur permet de reconstruire

une estimation des grandeurs mesurees plus fiables que les mesures elles-memes.

124

CHAPITRE 8

FILTRE DE KALMAN


Soit un avion s’appretant a voler dans des conditions aerologiques perturbees dans une direc-

tion portee par χ. A l’instant t0 = 0, l’avion survole le point o et sa position au sol est reperee

par x. Le pilote dispose avant d’entrer dans la zone de turbulences des donnees suivantes :

— il dispose d’une carte aeronautique,

— il connaıt sa vitesse vb/a par rapport a la masse d’air, celle-ci est supposee constante et

egale a v0,

— il sait que sa vitesse par rapport au sol est vb/g = vb/a + va/g,

— il sait par ailleurs que x(t) = vb/g(t),

— les turbulences sont de nature aleatoire mais il connaıt leur amplitude minimale ∆v et

maximale ∆V .

A ce stade, une premiere difficulte se pose, l’atmosphere est supposee figee 1 et la vitesse des

rafales de vents va/g est uniquement fonction de la position x. La figure 8.1 montre une distri-

bution spatiale sinusoıdale de la vitesse du vent va/g(x). Cependant, vu de l’avion evoluant a

vitesse v0 constante dans la masse d’air, cette vitesse apparaıt comme une fonction sinusoıdale

du temps de pulsation ω =2πv0L

, soit :

va/g(t) = ∆V sin2πv0L

t (8.1)

La distribution spatiale de la vitesse du vent va/g(x) est aleatoire comme l’illustre la figure

8.2. Elle peut donc s’ecrire comme une somme continue de distributions spatiales sinusoıdales de

differentes longueurs L. Cependant, vu de l’avion evoluant a vitesse v0 constante dans la masse

1. C’est l’hypothese de Taylor, elle n’est toutefois valable que si l’amplitude des perturbations aerologiques est

petite devant la vitesse vb/a de l’avion.

125

Chapitre 8. FILTRE DE KALMAN

d’air, cette vitesse apparaıt comme une fonction aleatoire du temps notee wa/g(t).

vb/g(t) = v0 + wa/g(t) (8.2)

x(t) = vb/g(t) (8.3)

Lχ

va/g

Figure 8.1 – Distribution spatiale sinusoıdale va/g(x)

χ

va/g

Figure 8.2 – Distribution spatiale aleatoire va/g(x)

A l’instant t = t0, le pilote predit qu’apres un temps ∆T sa position sera x− = v0∆T , c’est

une estimation a priori, obtenue sur la seule base du modele. En realite, son avion est dans la

position x. Toutefois, la presence des turbulences l’amene a penser que cette estimation a priori

126

8.1. EXEMPLE INTRODUCTIF

o x−=vo∆T

xχ

(v0+∆V )∆T(v0−∆v)∆T

p1

Figure 8.3 – Modele pour l’estimation a priori

o

xχ

p1

y la mesure et son intervalle de confiancey− l’estimation de la mesure a prioriop1−x la distance reelle au waypoint

x−

Figure 8.4 – Modele pour la mesure

est entachee d’une erreur. C’est l’erreur d’estimation a priori, elle est notee x− = x − x− est

evidemment inconnue. Il peut aussi, connaissant les amplitudes minimale ∆v et maximale ∆V

borner l’intervalle au sein duquel il a estime sa position. C’est ce qu’illustre la figure 8.3.

Il peut enfin facilement, avec la carte, calculer la distance qui le separe du waypoint p1, soit

y− = op1− x− une estimation a priori de cette mesure. L’incertitude qui existe sur cette derniere

estimation est dans ce cas egale a celle qui existe sur l’estimation a priori de sa position.

A l’instant t = ∆T le pilote mesure la distance qui le separe du waypoint p1, soit op1 − x

cette distance et y la mesure qu’il en fait (cf. figure 8.4). Il commet alors une double erreur :

1. une erreur lors de la mesure de distance y qui differe 2 de la distance vraie op1 − x. Plus

formellement on ecrit :

y = op1 − x+ v (8.4)

ou v designe un bruit de mesure confondu ici avec l’erreur de mesure.

2. il propage cette erreur dans le calcul de y − y− qui represente l’ecart entre la mesure de

distance et l’estimation a priori de cette mesure operee a t0. Cet ecart est l’erreur de

mesure a posteri (ce calcul d’erreur est posterieur a l’acquisition de la mesure).

Cependant, le pilote a une certaine confiance dans sa mesure qu’il estime tres probablement

juste dans un intervalle. Ce que montre la figure 8.4.

Le pilote peut desormais estimer a posteriori sa position x+. Une strategie raisonnable

consiste a corriger x− en fonction de l’erreur de mesure a posteriori y−y− et en tenant compte de

la confiance qu’il a dans l’estimation a priori et dans la mesure. Sur la figure 8.4, les intervalles

de confiance sont a peu pres identiques. Le pilote pourrait simplement calculer la moyenne de

x− et de op1 − y et adopter comme intervalle de confiance la borne inferieure de l’intervalle des

mesures et la borne superieure de l’intervalle des estimations a priori, ce qu’illustre la figure 8.5.

x+ =1

2x− +

1

2(op1 − y) (8.5)

2. c’est un pilote de planeur et la mesure est visuelle donc imprecise, mais il en irait de meme avec n’importe

quel capteur.

127


o

xχ

p1

y

op1−x

x−

y−

x+

intervalle de confiance de l’estimation a posteriori

Figure 8.5 – Modele pour l’estimation a posteriori

Cet intervalle de confiance a posteriori determine le credit que le pilote porte a l’estimation

a posteriori x+ de x. L’erreur resultante x+ = x+−x est l’erreur d’estimation a posteriori. Si la

mesure permet d’ameliorer la connaissance de la position, l’intervalle de confiance de l’estimation

a posteriori est inferieur ou egal a celui de l’erreur d’estimation a priori.

Le pilote aborde le waypoint p2 suivant en considerant sa position a l’instant T egale a x+dans l’intervalle de confiance defini supra. Il existe de facto une erreur avant meme qu’il estime

a priori la position suivante. Cette erreur va se propager et se cumuler a l’erreur d’estimation

a priori. La mesure de distance au waypoint p2 realisee a l’instant 2∆T doit theoriquement

contenir 3 cette erreur.

Plus tard, a l’instant (k + 1)∆T le pilote n’a besoin que de l’estimation a posteriori et de

l’intervalle de confiance calcules a k∆T pour estimer sa position, le processus est iteratif.

Dans le cas general, le coefficient qui sert a prendre en compte l’erreur de mesure a posteriori

y−y− tient compte, grace a la connaissance des intervalles de confiance, de la fiabilite de chacune

des informations.

x+ = (1− ℓ)x− + ℓ(op1 − y) (8.6)

— S’il fait davantage confiance a la mesure qu’a l’estimation a priori ℓ→ 1

— S’il fait davantage confiance a l’estimation a priori qu’a la mesure ℓ→ 0

De ce qui precede, il apparaıt que des perturbations de nature aleatoire affectent la trajectoire

de l’avion, pour les decrire, il nous faudra faire des rappels de probabilites. Comme ces aleas

sont des fonctions du temps, nous les modeliserons par des bruits, a cet effet nous rappellerons

les resultats de traitement de signal relatifs aux signaux aleatoires. D’autre part, les systemes

que nous etudions sont des systemes dynamiques dont l’etat et les mesures evoluent au cours

du temps et qui sont bruites. Il nous faudra pouvoir decrire comment un bruit se propage et

evolue dans un tel systeme, ce dont rend compte la notion de processus stochastique. Nous

aurons alors a estimer un etat de nature aleatoire a partir d’un modele du systeme entache

d’incertitudes et de mesures bruitees, ce que que traite la theorie de l’estimation. Enfin, nous

presenterons un algorithme de filtrage qui, de maniere iterative et sous certaines conditions,

fournit une estimation optimale de l’etat, c’est le filtre de Kalman.

3. Au sens ou elle empeche la derive de l’intervalle de confiance de l’erreur d’estimation.

128

8.2. PROBABILITES

8.2 PROBABILITES

8.2.1 Vecteur aleatoire

On considere un vecteur X =(

X1 . . . Xn

)Tou chaque composante Xi est une variable

aleatoire pouvant prendre un ensemble continu de valeurs. On note xi la realisation de la variable

aleatoire Xi et x celle de X.

Soit p(x1, x2, . . . , xn) la densite de probabilite conjointe du vecteur X, par definition :

Prob{x′ ≤ X < x′ + dx} = p(x′)dx1dx2 . . . dxn (8.7)

∫ +∞

−∞. . .

∫ +∞

−∞p(x)dx1dx2 . . . dxn = 1 (8.8)

qui traduit l’evenement certain.

Si la densite de probabilite est factorisable

p(x) = p(x1)p(x2) . . . p(xn) (8.9)

Les composantes xi sont independantes.

−1

0

1

2

3

4−1

0

1

2

3

40

0.2

0.4

p(x1)p(x2)

x1 x2

p

0

5 · 10−2

0.1

0.15

p(x1, x2)

Figure 8.6 – Densite de probabilite d’un vecteur aleatoire de R2

La valeur moyenne ou l’esperance mathematique de X est :

x = E[X]

∫ +∞

−∞xp(x)dx1dx2 . . . dxn (8.10)

129


Lorsque la valeur moyenne est nulle, le vecteur est dit centre.

La matrice de covariance de X est :

Σxx = E[(X− x)(X− x)T ] =

∫ +∞

−∞. . .

∫ +∞

−∞(x− x)(x− x)T p(x)dx1dx2 . . . dxn (8.11)

C’est une matrice symetrique dont les valeurs propres sont positives ou nulles.

Σxx =

E[(X1 − x1)2] E[(X1 − x1)(X2 − x2)] . . . E[(X1 − x1)(Xn − xn)]

E[(X2 − x2)(X1 − x1)] E[(X2 − x2)(X2 − x2)] . . . E[(X2 − x2)(Xn − xn)]

. . . . . . . . . . . .

E[(Xn − xn)(X1 − x1)] E[(Xn − xn)(X2 − x2)] . . . E[(Xn − xn)(Xn − xn)]

(8.12)

Les termes diagonaux σ2ii = E[(xi − xi)(xi − xi)] de Σxx sont les variances des variables

aleatoires Xi. La trace de cette matrice represente la somme des variances :

Tr(Σxx) = E[(X− x)T (X− x)] (8.13)

Lorsque cette matrice est diagonale les composantes du vecteur aleatoire X sont dites non

correlees.

Si Σxx n’est pas diagonale, on peut, a partir des termes non diagonaux, calculer les coeffi-

cients de correlation dont la valeur est comprise entre -1 (Xi = −Yj) et 1 (Xi = −Yj). Il sontnuls pour deux variables non correlees.

ρij =E[(Xi − xi)(Xj − xj)]

√

E[(Xi − xi)2]E[(Xj − xj)2](8.14)

On peut evidemment calculer la matrice de covariance de deux vecteurs aleatoires X et Y

de Rn :

Σxy = E[(X− x)(Y − y)T ] (8.15)

8.2.2 Probabilites marginales et conditionnelles

Soit deux vecteurs aleatoires, correles ou non entre eux. Soit p(x,y) leur densite de probabilite

conjointe. Les densites marginales a priori sont :

f(x) =∫ +∞−∞ p(x,y)dy1 . . . dyn g(y) =

∫ +∞−∞ p(x,y)dx1 . . . dxn (8.16)

f(x) et g(y) representent la connaissance a priori que l’on a des phenomenes etudies decrits

par X et Y.

L’information Y = y etant disponible, on entend par probabilite conditionnelle de x|y la

probabilite de realisation x de X sachant la valeur y prise par Y. On la note p(x|y) :p(x,y) = p(x|y)f(x) = p(y|x)g(y) (8.17)

Relations a partir desquelles on etablit la loi de Bayes :

p(x|y) = p(y|x)g(y)

(8.18)

130

8.2. PROBABILITES

8.2.3 Vecteur aleatoire gaussien

C’est un vecteur aleatoire X ∈ Rn qui est completement determine par sa moyenne x et sa

matrice de covariance Σxx et que l’on note X ∼ N (x,Σxx). Il est decrit par la loi de probabilite :

p(x) =1

(2π)n/2|Σxx|1/2exp

{

−1

2(x−x)TΣ

−1xx (x−x)

}

(8.19)

La figure 8.7 represente une loi normale en dimension deux. Sur cette figure les variables

aleatoires sont correlees, de fait les termes non diagonaux de Σxx sont non nuls. Quant aux

termes diagonaux σ211 et σ222, ils refletent la dispersion des valeurs prises par x1 et x2 autour

de leurs moyennes respectives x1 et x2. Pour une loi normale Prob(xi − xi < 3σi) ≈ 0.997. Cet

intervalle a 3σ est parfois utilise par les fabricants de capteurs pour qualifier la precision de leurs

instruments.

−1

0

1

2

3

4−1

0

1

2

3

40

0.2

0.4

p(x1)p(x2)

x1 x2

p

0

0.1

0.2

0.3

p(x1, x2)

Figure 8.7 – Loi de probabilite normale x1 = 1, x2 = 2, σx1= 0.5, σx2

= 1, ρ = 0.4

Propriete 1 Dans le cas gaussien, les notions de non correlation et d’independance sont equi-

valentes. En effet, si la matrice de covariance est diagonale (non correlation), p(x) peut etre

decompose en un produit de n lois normales scalaires (independance).

Propriete 2 Toute combinaison lineaire de vecteurs aleatoires gaussiens est un vecteur aleatoire

gaussien. Soit Y = AX avec X, Y deux vecteurs aleatoires de Rn et A ∈ R

n×n.

La moyenne :

E[Y] = E[AX] = AE[X] = Ax (8.20)

131


La covariance :

E[(Y− y)(Y− y)T ] = E[(A(X− x))(A(X− x)T

)]= AE[(X− x)(X− x)T ]AT = AΣxxA

T

(8.21)

Ainsi la moyenne y = Ax et la covariance Σyy = AΣxxAT suffisent a decrire la loi normale

definie par p(y).

8.3 ESTIMATION

La theorie de l’estimation a pour but de developper des methodes permettant de determiner

au mieux c.-a-d. au sens d’un critere, une estimation du vecteurx du vecteur X a partir des

valeurs y prises par les observations de Y, les deux vecteurs etant correles. Deux points de vue

peuvent etre adoptes :

1. L’experience a ete effectuee et on dispose de y la valeur prise par Y, X est alors un

vecteur aleatoire conditionnel obeissant a la loi de probabilite a posteriori p(x|Y = y).

Le critere d’estimation est le minimum de variance de l’erreur d’estimation a posteriori

X = X− x.

2. L’experience n’a pas encore ete realisee X et Y obeissent a leurs lois de probabilite mar-

ginales ou a priori respectivement definies par f(x) et g(y). On cherche une estimation

x = λ(y) comme estimation de X si la valeur prise par Y est y. Dans le cas d’une estima-

tion x lineaire en la mesure y, on cherche les parametres de la fonction λ qui minimisent

la variance de l’erreur a priori X− λ(Y)

8.3.1 Minimum de variance a posteriori de l’erreur d’estimation

Dans un souci de simplification, on n’envisage qu’un seul critere d’optimisation : le minimum

de variance de l’erreur d’estimation a posteriori .

La matrice de covariance de l’erreur d’estimation a posteriori :

E[XXT|Y] = E[(X− x)(X− x)T|Y] (8.22)

La trace de cette matrice represente la somme des variances conditionnelles π2ii des compo-

santes Xi de X, c’est cette quantite qu’on cherche a minimiser :

E[XTX|Y] = E[(X− x)T(X− x)|Y] = E[XTX|Y]+ xT x−E[XT|Y]x− xTE[X|Y] (8.23)

On note que E[x] = x puisque x est une valeur estimee, elle est donc certaine. L’equation

(8.24) peut encore s’ecrire :

E[XTX|Y] = (x− E[X|Y])T (x− E[X|Y]) + E[XTX|Y]− E[XT|Y]E[X|Y] (8.24)

Seul le premier terme du membre de gauche depend de x, il ne peut etre negatif toutefois, il

s’annule pour :

x = E[X|Y = y] (8.25)

132

8.3. ESTIMATION

La meilleur estimation du vecteur aleatoire X au sens du critere du minimum de l’erreur de

variance a posteriori est l’esperance de X conditionnelle a la valeur y de Y.

8.3.2 Application a une variable aleatoire scalaire

Soit une variable aleatoire scalaire gaussienne : X ∼ N (x, σ2). La mesure Y de cette variable

est entachee d’une erreur de mesure elle-meme gaussienne V ∼ N (0, r2) de sorte que Y = X+V .

Y est une variable aleatoire conditionnelle a la realisation x de X. Elle est elle-meme gaus-

sienne. Ainsi la probabilite y de Y conditionnelle a X = x est decrite par p(y|X = x) qui est

une loi normale ∼ N (x, r2). En effet :

La loi de probabilite marginale :

f(x) =1√2πσ

exp−(x− x)2

2σ2 (8.26)

La loi de probabilite conditionnelle :

E[Y |X = x] = E[X + V |X = x] = E[X|X = x] = x (8.27)

E[Y Y T |X = x] = E[Y 2|X = x] = E[(X+V )2|X = x] = E[X2|X = x]︸︷︷︸

0

+2xE[V ]︸︷︷︸

0

+E[V 2] = r2

(8.28)

p(y|X = x) =1√2πr

exp−(y − x)2

2r2 (8.29)

La loi de probabilite marginale :

E[Y ] = E[X] = x (8.30)

E[Y Y T ] = E[Y 2] = E[(X + V )2] = E[X2] + 2xE[v] + E[V 2] = σ2 + r2 (8.31)

g(y) =1√

2π√r2 + σ2

exp−

(y − x)2

2(r2 + σ2) (8.32)

133


La loi de probabilite conditionnelle aux mesures, d’apres (8.26), (8.29), (8.32), en appliquant

la loi de Bayes (8.18), il vient :

p(x|y) = p(y|x)f(x)g(y)

=

1√2πσ

exp−(x− x)2

2σ21√2πr

exp−(y − x)2

2r2

1√2π

√r2 + σ2

exp−

(y − x)2

2(r2 + σ2)

(8.33)

p(x|y) = 1√2π

rσ√r2 + σ2

− exp

(x− x)2

2σ2−(y − x)2

2r2+

(y − x)2

2(r2 + σ2) (8.34)

Apres calculs :

p(x|y) = 1√2π

(rσ√r2 + σ2

)exp−r2 + σ2

2σ2r2

x−x−σ2

r2 + σ2(y−x)

2

(8.35)

Cette expression est une loi normale conditionnelle a la mesure y, de la forme :

p(x|y) = 1√2π√

E[X2|Y ]exp

−(x− E[X|Y ])2

2(E[X2|Y ])2 (8.36)

La meilleure estimation x de x, au sens du minimum de variance a posteriori est :

x = E[X|Y ] = x+σ2

r2 + σ2(y − x) (8.37)

qui admet pour variance a posteriori :

E[X2|Y ] =r2σ2

r2 + σ2(8.38)

Cette derniere est plus petite que r et que σ. Ceci traduit le fait que l’estimation x de X

conditionnelle a la realisation Y = y est meilleure que la connaissance a priori de X et que celle

fournie par Y .

8.3.3 Exemple

Soit une variable aleatoire X de moyenne x = 1 et de variance σ2 = 1. On opere a une

mesure y = 1.7147 de Y = X +V ou V est un bruit centre de variance r2 = 12 . D’apres (8.37) et

(8.38), la moyenne et la variance de X conditionnelles a Y sont respectivement egales a 1.4765

et 13 .

134

8.3. ESTIMATION

— x = 1.4765 est la meilleure estimation a posteriori de x.

— La variance a posteriori est plus petite que les variances a priori de X et de Y , ce qui

signifie qu’on a une meilleure connaissance de X apres avoir mesure Y .

C’est ce qu’illustre la figure 8.8.

−2 −1 0 1 2 30

0.2

0.4

0.6

0.8

1

1.2

f(x)

g(y)p(x|y)

Figure 8.8 – Loi de probabilite normales a priori et a posteriori

La figure 8.9 montre dans le plan (Y,X) les valeurs prises conjointement par X et Y pour

plusieurs realisations x de X et y de Y . Elle montre le sous-espace d’equation (8.37), sous-espace

des estimations optimales conditionnelles aux mesures, et dans le cas particulier ou y = 1.7147,

l’estimation optimale x = 1.4765 et la valeur de x = −0.1135 produite pour la simulation. Cette

derniere reste evidemment inconnue.

135


−4 −2 0 2 4

−2

0

2

4

x

x

Y

X

x = x+ σ2

σ2+r2 (y − x)

Figure 8.9 – Estimation au sens du minimum de variance a posteriori

8.3.4 Orthogonalite

L’erreur d’estimation X = X − x est en moyenne orthogonale a l’estimation x de X. C’est

ce qu’illustre la figure 8.10. Pour cela on calcule l’esperance du produit scalaire de ces deux

vecteurs :

E[(X− x)Tx] (8.39)

E[(X− E[X|Y])TE[X|Y]] (8.40)

E[(XTE[X|Y])− E[X|Y]TE[X|Y]] (8.41)

E[XT ]E[E[X|Y]]− E[E[X|Y]T ]E[E[X|Y]] (8.42)

Comme l’esperance de l’esperance a posteriori est egale a l’esperance a priori (voir annexe) :

E[XT]E[X]− E[XT]E[X] = 0 (8.43)

On verifie bien l’orthogonalite en moyenne de X = X − x a x. L’orthogonalite traduit la

non correlation entre l’erreur d’estimation et l’estimation. Si ces deux variables etaient correlees,

l’erreur porterait une information susceptible d’enrichir la connaissance de X.

136

8.4. NOTIONS DE SIGNAL

x = E[X|Y]

XXH(y)

Y

V

Figure 8.10 – Orthogonalite de X et de x = E[X|Y]

8.4 NOTIONS DE SIGNAL

8.4.1 Signal aleatoire

Un signal aleatoire X(ω, t) est un ensemble de fonctions de la variable t indexes par une

variable ω, laquelle est associee au resultat d’une experience dans laquelle le hasard intervient.

La figure 8.11 represente trois realisations d’un meme processus aleatoire. Dans ce qui suit, on

note le signal aleatoire X(t). Ce signal est connu, au sens des probabilite si la loi de probabilite

conjointe p(x1, . . . , xk, t1, . . . , tk) est connue. Ici, X1 = X(t1), . . . , Xk = X(tk) sont des variables

aleatoires associees aux instants t1, . . . , tk. Cette connaissance constitue une statistique d’ordre

k. Ainsi, connaıtre X(ω, t) equivaut a connaıtre les lois de toutes les variables aleatoires X1,

. . . , Xk, ainsi que toutes leurs interactions. La description complete d’un tel signal requiert une

quantite enorme d’informations ; aussi en pratique on se contentera d’une description partielle.

0 1 2 3 4 5 6 7 8 9 10−2

−1

0

1

2

x(ω

1,t)

0 1 2 3 4 5 6 7 8 9 10−2

−1

0

1

2

x(ω

2,t)

0 1 2 3 4 5 6 7 8 9 10−1

−0.5

0

0.5

1

temps (s)

x(ω

3,t)

tk

t3t

2t1

Figure 8.11 – Resultats de trois experiences aleatoires realisees en fonction du temps

137


8.4.2 Statistique d’ordre 1

Au premier ordre, toutes les realisations sont prises au meme instant ti, et la variable aleatoire

Xi a pour fonction de densite de probabilite :

F (x, ti) = Prob(xi ≤ x) (8.44)

p(x, ti) =dF (x, ti)

dx(8.45)

On a dans ce cours fait l’hypothese que les phenomenes aleatoires etudies etaient decrits par

des lois normales. Comme ces dernieres sont completement definies par leur moyenne et leur

variance, on en donne ici les expressions.

La moyenne statistique :

x(ti) = E[Xi] =

∫ +∞

−∞xip(x, ti)dxi (8.46)

La variance :

σ2x(ti) = E[(Xi − x(ti))2] =

∫ +∞

−∞(xi − x(ti))

2p(x, ti)dxi (8.47)

8.4.3 Statistique d’ordre 2

Au second ordre, les realisations sont considerees a deux instants ti, tj et l’on considere le

couple de variables aleatoires X(ti) = Xi, X(tj) = Xj . La connaissance a deux instants necessite

de connaıtre le lien statistique entre Xi et Xj . On definit une fonction de repartition conjointe :

F (xi, xj , ti, tj) = Prob(Xi ≤ xi, Xj ≤ xj) (8.48)

La densite de probabilite :

p(xi, xj , ti, tj) =∂2F (xi, xj , ti, tj)

∂xi∂xj(8.49)

La fonction d’autocorrelation statistique :

γx(ti, tj) = E[XiXj ] =

∫ +∞

−∞

∫ +∞

−∞xixjp(xi, xj , ti, tj)dxidxj (8.50)

La fonction d’autocovariance statistique :

Cx(ti, tj) = E[(Xi − x(ti))(Xj − x(tj))] = γx(ti, tj)− x(ti) x(tj) (8.51)

8.4.4 Stationnarite

Un processus aleatoire est stationnaire au sens strict si toutes ses proprietes statistiques sont

invariantes dans le temps.

Il est stationnaire au sens large si :

x(ti) = x = cte et var(Xi) = σ2x = cte (8.52)

et si ses caracteristiques du second ordre ne dependent que de l’ecart temporel τ = tj − ti.

γx(ti, tj) = γx(τ) et Cx(ti, tj) = Cx(τ) (8.53)

138

8.4. NOTIONS DE SIGNAL

8.4.5 Ergodicite

Un aleatoire est qualifie d’ergodique s’il y a equivalence entre les valeurs moyennes statistiques

et les valeurs moyennes temporelles.

Moyenne statistique Moyenne temporelle

x = E[X] =∫ +∞−∞ xp(x)dx x(t) = lim

T→+∞1

T

∫ +T2

−T2

x(t)dt

Variance Puissance des fluctuations

var(X) = E[(X − x)2] =∫ +∞−∞ (x− x)2p(x)dx σ2x(t) = lim

T→+∞1

T

∫ +T2

−T2

(x(t)− x(t))2dt

Autocorrelation statistique Autocorrelation temporelle

γx(τ) = E[X(t)X(t+ τ)] Rx(τ) = limT→+∞

1

T

∫ +T2

−T2

(x(t)x(t+ τ))dt

Cette notion est d’un grand interet en pratique car elle permet d’identifier les caracteristiques

statistiques qui seraient celles obtenues d’apres l’etude de N ≫ 1 processus aleatoires a celle

d’un seul processus aleatoire considere a N instants.

8.4.6 Densite spectrale de puissance

La densite spectrale de puissance est la transformee de Fourier de la fonction d’autocorrela-

tion. Dans le cas d’un processus stationnaire au sens large :

Φ(f) =

∫ +∞

−∞γx(τ)e

−j2πfτdτ (8.54)

Reciproquement, la transformee de Fourier inverse de la densite spectrale de puissance est

la fonction d’autocorrelation

γx(τ) =

∫ +∞

−∞Φ(f)ej2πfτdf (8.55)

8.4.7 Bruit blanc

Un bruit blanc a une densite spectrale de puissance constante sur une tres large bande de

frequence. Un signal se rapprochant d’un bruit blanc et son spectre sont representes sur la figure

8.12.

γx(τ) =

∫ +f0

−f0

b2ej2πfτdf =b2sin(2πf0τ)

πτ= 2f0b

2sincπ(2f0τ) (8.56)

La fonction d’autocorrelation γx(τ) tend vers une impulsion de Dirac de poids 2f0b2 lorsque

f0 → +∞. Dans le cas ergodique, autocorrelation temporelle et statistique sont confondues.

Ainsi, la realisation du signal aleatoire b(ti) n’a aucune influence sur celle de b(tj) lorsque ti 6= tj .

139


−0.5

0

0.5

1

1.5

fréquence

Densité Spectrale de Puissance

−2

−1

0

1

2

3

4

5Fonction d’Autocorrélation

τ

b2

f0

−f0

Figure 8.12 – DSP d’un bruit blanc et fonction d’autocorrelation afferente

8.4.8 Bruit blanc discret

On considere une suite discrete d’instants −nT, . . . ,−T, 0, T, . . . , nT avec T ≫ 1

f0et une

sequence aleatoire blanche centree B(kT ) = Bk . On a alors, en faisant l’hypothese d’ergodicite :

Rb(iT, jT ) = γb(iT, jT ) = E[BiBj ] =

{

var(b(i)) si i = j

0 si i 6= j(8.57)

Dans le cas d’un vecteur de bruits blancs gaussiens centres :

{

E[Bi] = 0

E[BiBTj ] = Rbiδij ou δij = 1 si i = j, δij = 0 si i 6= j

(8.58)

Cela signifie que les valeurs prises par b a deux instants distincts ti et tj ne sont pas correlees

et qu’elles sont independantes si le bruit est gaussien. En d’autres termes la realisation de b(ti)

n’influence pas celle de b(tj) lorsque ti 6= tj . Notons egalement que Rb(0) est la puissance du

bruit.

Dans la pratique, les bruits ont un spectre limite en frequence. Ces bruits peuvent etre

obtenus en simulation par filtrage lineaire d’un bruit blanc. Les caracteristiques d’un tel bruit

sont decrites dans la section suivante.

8.5 PROCESSUS STOCHASTIQUES

Soit le systeme decrit par :

Xk+1 = FXk +GUk +Wk

Yk = CXk +DUk +Vk(8.59)

L’equation d’etat :

140

8.5. PROCESSUS STOCHASTIQUES

— X ∈ Rn,

— U ∈ Rm,

— W ∈ Rn est le vecteur de bruit d’etat.

Ce bruit permet d’exprimer le caractere aleatoire du vecteur d’etat 4. Par hypothese, ce bruit

est centre et blanc :

E[Wk] = 0 (8.60)

E[WkWTj ] = Qkδjk Qk ∈ R

n×n (8.61)

L’equation d’observation :

— Y ∈ Rq,

— V ∈ Rq est le bruit de mesure.

Ce bruit exprime le fait que les mesures sont bruitees 5. Par hypothese, ce bruit est centre,

blanc :

E[Vk] = 0 (8.62)

E[VkVTj ] = Rkδjk Rk ∈ R

q×q (8.63)

Les termes diagonaux des matrices Q et R sont respectivement les variances des bruits d’etat

Wi et i ∈ (1, ..., n) et de mesure Vj et j ∈ (1, ..., q). Celles-ci rendent compte de la dispersion des

valeurs prises par les variables d’etat autour de leur moyenne xi. Concernant les capteurs elles

informent quant a la precision des mesures realisees par ces capteurs.

En outre, les sequences des bruits d’etat et de mesure ne sont ni correlees entre elles, ni avec

l’etat initial 6

E[WkVTj ] = 0 (8.64)

E[VkXT0 ] = 0 (8.65)

E[WkXT0 ] = 0 (8.66)

8.5.1 Processus stochastique markoviens

On s’interesse a l’evolution du vecteur d’etat, a celles de sa moyenne et de sa covariance,

tandis que l’equation d’etat est soumise au bruit d’etat. D’apres (5.25) :

Xk+1 = Fk+1X0 +k∑

i=0

Fk−iGUi +k∑

i=0

Fk−iWi (8.67)

4. Dans l’exemple introductif, la position de l’appareil au cours du temps est, du fait de la nature aleatoire

des rafales de vent, elle-meme aleatoire.

5. Dans l’exemple introductif, ce bruit caracterise l’imprecision de la mesure de distance de l’avion a l’amer.

6. Concretement, pour l’exemple introductif, en supposant les bruits gaussiens, la vitesse des rafales de vent

qui affecte la trajectoire de l’aeronef est independante des erreurs de mesure de position realisees par exemple

avec un GPS. Ce qui est plus contestable, les erreurs de mesures de position sont supposees independantes de

la position initiale. Enfin et c’est probablement l’hypothese la moins realiste, la vitesse des rafales de vent est

supposee independante de la position initiale de l’aeronef.

141


Comme le bruit d’etat est centre, la moyenne xk+1 :

E[Xk+1] = xk+1 = Fk+1x0 +k∑

i=0

Fk−iGUi (8.68)

Comme la commande est deterministe, elle ne contribue pas a faire evoluer la covariance de

l’etat, aussi dans un souci de simplification on la choisit nulle. Avec les hypotheses precedentes

(8.64), la matrice de covariance a pour expression :

E[(Xk+1 − xk+1)(Xk+1 − xk+1)T ] = Σxxk+1

= Fk+1Σxx0Fk+1 +

k∑

i=0

Fk−iQiFk−iT (8.69)

Par consequent, la moyenne et la covariance de l’etat a l’instant k + 1 sont predictibles,

elles dependent de la moyenne et de la covariance initiales du vecteur d’etat. Ces dernieres

representent le minimum d’informations necessaire sur le passe pour prevoir son evolution fu-

ture. Un processus stochastique qui verifie cette propriete est qualifie de processus stochastique

markovien.

Si l’etat initial est suppose etre Xk, on peut etablir de maniere iterative les expressions de

la moyenne de la covariance du vecteur d’etat a l’instant k + 1.

La moyenne :

E[Xk+1] = xk+1 = Fkxk +GUk (8.70)

La covariance :

E[(Xk+1 − xk+1)(Xk+1 − xk+1)T ] = Σxxk+1

= FΣxxkFT +Qk (8.71)

8.5.2 Processus stochastique de mesure

On s’interesse a la moyenne et a la covariance du vecteur de mesure tandis que l’equation

d’observation est soumise au bruit de mesure.

La moyenne :

E[Yk] = yk = Cx (8.72)

La covariance :

E[(Yk − yk)(Yk − yk)T ] = CΣxxk

CT +Rk (8.73)

8.5.3 Exemple

Soit le systeme a temps discret stable, decrit par les equations d’etat et d’observation :(

x1k+1

x2k+1

)

=

(

0.8187 0.0861

0 0.9048

)(

x1kx2k

)

+

(

w1k

w2k

)

(8.74)

(

y1ky2k

)

=

(

1 0

0 1

)(

x1kx2k

)

+

(

v1kv2k

)

(8.75)

142

8.5. PROCESSUS STOCHASTIQUES

Les bruits d’etat et de mesure sont supposes centres, blancs, decorreles entre eux ainsi qu’avec

l’etat initial. Les resultats des simulations du processus markovien seul sont rapportes sur les

figures 8.13 a 8.15. A partir de la matrice de covariance de l’etat Σxxk, on a represente sur les

illustrations du haut les ellipses au sein desquelles se trouvent probablement le vecteur d’etat

(probabilite a 1σ soit ≈ 68%) aux instants k. Les ecart-types σ11, σ22 des variables d’etat x1 et

x2 sont en effet les demi-axes de cette ellipse. Le niveau de correlation entre les variables d’etat

est mesure par l’angle forme par le repere constitue de ces demi-axes et celui forme par les axes

des abscisses et des ordonnees.

Sur ces memes figures, l’illustration du bas montre une simulation temporelle du processus. Elle

met en evidence les ecarts des etats a leur moyennes. Ces signaux sont aleatoires et sont presque

toujours contenus dans les intervalles definis a ±3σ. Comme ces intervalles evoluent au fil du

temps, c’est l’incertitude que l’on a quant aux valeurs prises par le vecteur d’etat qui evolue.

— Sur la figure 8.13, les conditions initiales sont parfaitement connues Σxx0 = diag(0, 0)

et E[X0] = x0, en outre il n’y a pas de bruit d’etat. dans ces conditions, l’evolution

du vecteur d’etat est completement deterministe et la covariance de l’etat est nulle ∀k.L’illustration du haut montre, dans le plan de phase, la trajectoire de la moyenne E[Xk] =

xk ∀k ≥ 0.

— Sur la figure 8.14, les conditions initiales sont parfaitement connues Σxx0 = diag(0, 0) et

E[X0] = x0, cependant, il y a du bruit d’etat. La figure du haut montre que les ecart-

types σ11, σ22 des variables d’etat x1 et x2 qui sont les demi-axes de l’ellipse tendent a

augmenter au fil du temps. Cela signifie que l’incertitude que l’on a quant a la connaissance

de ces variables augmente au fil du temps. On observe egalement que les deux demi-axes

de l’ellipse paralleles aux axes des abscisses et des ordonnees pour k = 0 tendent a

s’incliner lorsque k → +∞. Ainsi, les variables d’etat initialement decorrelees tendent a

etre correlees entre elles. Ceci est logique du fait des couplages existant dans la matrice

d’etat.

Comme le systeme est stable, en moyenne, le vecteur d’etat converge vers l’origine lorsque

k → +∞.

— Meme remarque sur la figure 8.15 que pour la figure 8.14 a l’exception du fait que les

conditions initiales ne sont pas connues. La longueur des demi-axes tend a diminuer

lorsque k augmente , cela traduit une meilleure connaissance de l’etat au fil du temps.

La figure 8.16 montre les covariances du bruit d’etat et de mesure. A l’instant initial, on observe

que la connaissance de l’etat est beaucoup plus certaine que celle obtenue par la mesure (l’ellipse

verte est contenue dans l’ellipse rouge). Lorsque k → +∞ l’incertitude sur x1 est moindre que

celle sur la mesure y1 que l’on fait de x1. en revanche, la connaissance de x2 et tout aussi

incertaine que celle de y2.

143


−0.05 0 0.05 0.1 0.15 0.2 0.25 0.3

0

0.5

1

x1

x 2

Σxx

k

E[Xk]

0 5 10 15 20−2

−1

0

1

2x 10

−7

temps (s)

x1−E[x

1]

x2−E[x2]

σ11

σ22

Figure 8.13 – Processus markovien bidimensionnel E[X0] = (0, 1)T , Σxx0= diag(0, 0), Q = diag(0, 0)

−0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8−1

−0.5

0

0.5

1

1.5

x1

x 2

E[Xk]=E[Y

k]

Σxx

k

My

0 1 2 3 4 5 6−2

−1

0

1

2

temps (s)

x1−E[x1]

x2−E[x2]

3σ11

3σ22

−3σ11

−3σ22

k=0

k→ +∞

Figure 8.14 – Processus markovien bidimensionnel E[X0] = (0, 1)T , Σxx0= diag(0, 0), Q =

diag(0.1, 0.2)

144

8.6. FILTRE DE KALMAN

−0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4−1

−0.5

0

0.5

1

1.5

x1, y

1

x 2, y2 E[X

k]=E[Y

k]

Σxx

k

My

0 1 2 3 4 5 6−3

−2

−1

0

1

2

3

temps (s)

x1−E[x1

x2−E[x2

3σ11

3σ22

−3σ11

−3σ22

y1−E[y1

y2−E[y2

3m11

3m22

−3m11

−3m22

k=0

k → +∞

Figure 8.16 – Processus markovien et de mesure bidimensionnels E[X0] = (1, 1)T , Σxx0=

diag(0.001, 0.001), Q = diag(0.005, 0.1), R = diag(0.1, 0.005)

8.6 FILTRE DE KALMAN

Un filtre de Kalman est un filtre recursif qui, a l’instant k+1, estime le vecteur d’etat Xk+1.

Pour cela, il procede en deux temps :

1. a l’instant k, a partir de l’estimation optimale xk|k = E[Xk|Y = yk] du vecteur d’etat

Xk, il utilise le modele pour estimer a priori 7 xk+1|k = E[Xk+1|Y = yk].

7. Avant de disposer de la (k + 1)emesure.

−1 −0.5 0 0.5 1−1

0

1

2

x1

x 2

Σxx

k

E[Xk]

0 5 10 15 20−4

−2

0

2

4

temps (s)

x1−E[x1]

x2−E[x2]

σ11

σ22

k=0

k → +∞

Figure 8.15 – Processus markovien bidimensionnel E[X0] = (0, 1)T , Σxx0= diag(0.5, 0.5), Q =

diag(0.05, 0.05)

145


Ce faisant, il commet une erreur xk+1|k = Xk+1 − xk+1|k dont l’amplitude est, au sens

des probabilites, quantifiee par la covariance de l’erreur d’estimation a priori Pk+1|k =

E[xk+1|kxTk+1|k].

2. a l’instant k + 1 il utilise la mesure yk+1 pour corriger l’estimation a priori xk+1|k et

elabore une estimation a posteriori 8 xk+1|k+1 = E[Xk + 1|Yk+1 = yk+1].

Ce faisant, il commet une erreur xk+1|k+1 = Xk+1 − xk+1|k+1 dont l’amplitude est, au

sens des probabilites, quantifiee par la covariance de l’erreur d’estimation a posteriori

Pk+1|k+1.

Cette estimation a posteriori est alors utilisee pour estimer l’etat Xk+2.

Comme cela a ete montre dans la partie 8.3, une estimation optimale de l’etat est la moyenne

conditionnelle a la mesure, et dans le cas gaussien, l’erreur d’estimation est en moyenne ortho-

gonale a l’estimation. On va utiliser ces deux resultats pour etablir les equations du filtre de

Kalman.

8.6.1 Equations du filtre de Kalman

8.6.1.1 Estimation a priori ou prediction

Soit le systeme decrit par :

Xk+1 = FXk +GUk +Wk (8.76)

Yk = CXk +DUk +Vk (8.77)

Les hypotheses sur les bruits sont celles faites dans la section 8.5. La commande GUk est

deterministe.

E[Xk+1|yk] = E[FXk +GUk +Wk|yk] (8.78)

E[Xk+1|yk]︸︷︷︸

xk+1|k

= FE[Xk|yk]︸︷︷︸

xk|k

+GUk + E[Wk|yk]︸︷︷︸

0

(8.79)

La meilleure estimation a priori ou prediction du vecteur d’etat sachant la ke mesure realisee

est :

xk+1|k = Fxk|k +GUk (8.80)

La figure 8.17 illustre cette operation. L’erreur d’estimation a priori est orthogonale a l’es-

timation a priori. L’estimation optimale est la projection orthogonale de Xk+1 sur Hnq (yk), le

sous-espace 9 de dimension n engendre par les q mesures disponibles a l’instant k.

Ce faisant, une erreur de d’estimation a priori ou erreur de prediction est commise :

xk+1|k = Xk+1 − xk+1|k (8.81)

8. Posterieure a la mesure.

9. Il s’agit de L2 espace des fonctions de carre integrables et muni du produit scalaire.

146


xk+1|k

Xk+1

Hnq (yk)

Xk+1|k+1

xk+1|k

Figure 8.17 – Orthogonalite de l’erreur d’estimation xk+1|k et de l’etat estime a priori

Cette erreur est evidemment inconnue, cependant elle peut-etre, d’un point de vue probabi-

liste, quantifiee par la covariance de l’erreur d’estimation a priori

Pk+1|k = E[xk+1|kxTk+1|k] (8.82)

En reportant (8.76) dans (8.81) et dans (8.82) :

Pk+1|k = E[(F(Xk − xk|k) +Wk

) ((Xk − xk|k)

TFT +WTk

)] (8.83)

Comme Xk est fonction de Wk−1 et puisque le bruit d’etat est blanc E[WkWTk−1] = 0, par

suite E[WkXTk ] = 0.

Pk+1|k = FE[(Xk − xk|k)(Xk − xk|k)T ]FT + E[WkW

Tk ] (8.84)

Pk+1|k = FPk|kFT +Qk (8.85)

Avant que la mesure Yk+1 ne soit realisee a l’instant k+1. La meilleure estimation a priori

qu’on puisse en donner yk+1|k est l’esperance conditionnelle de Yk+1 sachant la mesure Yk = yk

effectuee.

La mesure :

Yk+1 = C(FXk +GUk +Wk) +Vk (8.86)

dont la prediction optimale est :

yk+1|k = E[Yk+1|yk] (8.87)

yk+1|k = E [C(FXk +GUk +Wk) +Vk|yk] (8.88)

yk+1|k = Cxk+1|k (8.89)

A ce stade, la mesure Yk+1 n’ayant pas encore ete realisee, il existera une erreur entre la

mesure et sa prediction.

Yk+1|k = Yk+1 − yk+1|k (8.90)

147


La prediction de la mesure est optimale au sens de la moyenne conditionnelle a la mesure.

Par consequent l’erreur de prediction de la mesure Yk+1|k est orthogonale a la prediction yk+1|k.Par suite, toute combinaison lineaire ZYk+1|k avec ∈ R

n×q est orthogononale a Hnq (yk). C’est

ce qu’illustre la figure 8.18.

xk+1|k

Xk+1

Hnq (yk)

Z(Y k+

1|k)

Xk+1|k+1

Hnq (yk+1)

Figure 8.18 – Sous-espace pour les estimations a priori et a posteriori

Toutefois, a ce stade, cette erreur reste inconnue. Elle peut neanmoins etre quantifiee par la

covariance de l’erreur d’estimation a priori :

Mk+1|k = E[Yk+1|kYTk+1|k] = CPk+1|kC

T +Rk (8.91)

8.6.1.2 Estimation a posteriori

A l’instant k + 1, on procede a la mesure Yk+1. L’erreur de prediction de la mesure a pour

expression :

Yk+1|k = Yk+1 − yk+1|k (8.92)

L’erreur de prediction de la mesure Yk+1|k enrichit l’espace Hnq de sorte que l’espace dans

lequel on va proceder a l’estimation a posteriori de l’etat s’ecrit :

Hnq (Yk+1) = Hn

q (Yk)⊕ ZYk+1|k (8.93)

ou ⊕ designe la somme directe de deux sous-espaces vectoriels.

Une estimation optimale de Xk+1 ∈ Hnq (Yk+1). Dans le cas gaussien, elle est lineaire en

l’erreur de mesure (8.37 ) :

xk+1|k+1 = xk+1|k + Lk+1Yk+1|k (8.94)

Lk+1 ∈ Rn×q est une matrice de gains choisie de sorte que l’erreur Xk+1 − LYk+1|k soit

orthogonale a Hnq (Yk+1).

xk+1|k

Xk+1

Hnq (yk)

L k+1.Y

k+1|k

Xk+1|k+1

xk+1|k+1

Figure 8.19 – Orthogonalite de l’erreur d’estimation Xk+1|k+1 et de l’etat estime xk+1|k+1

148


Ce qui montre que l’estimation a posteriori de l’etat procede pour une part de l’estimation

a priori, laquelle reflete la confiance que l’on a dans le modele. D’autre part, de la mesure et de

la confiance que l’on a en celle-ci.

Il reste enfin a actualiser la matrice de covariance de l’erreur d’estimation Pk+1|k+1 dans le

but de pouvoir evaluer le credit accorde a l’estimation a posteriori.

L’erreur d’estimation a posteriori :

Xk+1|k+1 = Xk+1 − xk+1|k+1 (8.107)

⇔ Xk+1|k+1 = Xk+1 − xk+1|k − Lk+1Yk+1|k (8.108)

⇔ Xk+1|k+1 = Xk+1|k − Lk+1Yk+1|k (8.109)

⇔ Xk+1|k+1 = (I− Lk+1C)Xk+1|k − Lk+1Vk+1 (8.110)

La covariance de l’erreur d’estimation a posteriori :

Pk+1|k+1 = E[Xk+1|k+1XTk+1|k+1]

Pk+1|k+1 = E[((I− Lk+1C)Xk+1|k − Lk+1Vk+1)((I− Lk+1C)Xk+1|k − Lk+1Vk+1)T ]

Pk+1|k+1 = (I− Lk+1C)Pk+1|k(I− Lk+1C)T + Lk+1RkLTk+1 (8.111)

8.6.2 Test de divergence

Une fois la mesure Yk+1 realisee, on peut calculer l’erreur d’estimation de la mesure :

Yk+1|k = Yk+1 − yk+1|k avec yk+1|k = Cxk+1|k (8.112)

Le vecteur Yk+1|k a pour expression :

Yk+1|k = CXk+1 +Vk+1 −Cxk+1|k = CXk+1|k +Vk+1 (8.113)

On peut egalement calculer la covariance de l’erreur de mesure, dont on montre, par une

methode analogue a celle utilisee pour le calcul de (8.91) qu’elle vaut :

Mk+1|k = E[Yk+1|kYTk+1|k] = CPk+1|kC

T +Rk (8.114)

Cette matrice symetrique definie positive porte sur sa diagonale les variances σ2yi des erreurs

de mesure Yk+1|k avec i ∈ [1, ..., q]. Puisque les signaux sont supposes gaussiens, on peut tester

la pertinence de la prediction a l’aune de la mesure. Une fois ces dernieres realisees , on calcule

les erreurs de mesures yk+1|k = yk+1|k − yk+1|k :

|yk+1|k| ≤ 3σyi (8.115)

150


8.6.3 Algorithme du filtre de Kalman

Il reprend les equations : (8.80), (8.85), (8.89), (8.91), (8.104), (8.105), (8.111). Le filtre est

dans un premier temps initialise en affectant a l’etat initial X0 la valeur que l’on juge la plus

probable. Ce faisant, on peut commettre une erreur dont on rend compte avec la matrice de

covariance de l’erreur d’estimation de l’etat initial P0. Ici le test de divergence est realise, il

n’est toutefois pas indispensable.

Algorithm 1 Algorithme du Filtre de Kalman sur un horizon k = kf

Estimation de l’etat initial X0

Covariance de l’erreur d’estimation de l’etat initial P0

repeat

Estimation a priori du vecteur d’etat xk+1|k = Fxk|k +GUk

Estimation a priori du vecteur de mesure yk+1|k = Cxk+1|kCalcul de la covariance de l’erreur d’estimation a priori Pk+1|k = FPk|kF

T +Qk

Calcul de la covariance de l’erreur de mesure Mk+1|k = CPk+1|kCT +Rk

Mesure yk+1 de Yk+1

if diag(Mk+1|k) > 3diag(yi+1 − yi+1|i) thenReinitialiser Xk|k, Pk|kRevenir a l’estimation du vecteur d’etat a priori

end if

Calcul du gain de Kalman Lk+1 = Pk+1|kCT (Rk +CPk+1|kC

T )−1

Estimation du vecteur d’etat a posteriori xk+1|k+1 = xk+1|k + Lk+1(yk+1 − yk+1|k)Calcul de la covariance de l’erreur d’estimation a priori Pk+1|k+1 = (I−Lk+1C)Pk+1|k(I−Lk+1C)T + Lk+1RkL

Tk+1

until k = kf

8.6.4 Exemple

On met en œuvre un filtre de Kalman pour l’exemple presente dans l’introduction. La vitesse

vx de l’avion dans la masse d’air est egale 100m/s, elle est supposee constante. Les etudes sont

menees en fonction des conditions meteorologiques et de la connaissance des conditions initiales.

On ne mesure que la position x de l’avion par rapport au sol, pour cela on dispose d’un GPS

dont la precision est definie par le constructeur a 1σ = 1m. Soit y cette mesure. La position

initiale x0 est a priori egale a zero mais n’est pas necessairement connue. Le systeme est decrit

par le modele suivant :

(

xk+1

vk+1

)

=

(

1 1

0 1

)(

xkvk

)

+

(

0

wk

)

(8.116)

yk =(

1 0)(

xkvk+1

)

(8.117)

La matrice de covariance du bruit de mesure est donc telle que : R = σ2 = 1 On se reportera

a l’annexe G pour le detail du code implemente sous MATLAB.

151


8.6.4.1 Les condition initiales sont parfaitement connues, il n’y a pas de bruit

d’etat

— Comme il n’y a pas de rafales de vent, la matrice Q =

(

0 0

0 0

)

,

— l’etat initial est connu, aussi x0 = 0m, v0 = 100m/s

— par consequent La matrice P0 =

(

0 0

0 0

)

.

0 20 40 60 80 100−6

−4

−2

0

2

4

6Position

erreur de position estiméeerreur de mesure de position

0 20 40 60 80 100100

100

100

100

100

100Vitesse

vitessevitesse estimée

0 20 40 60 80 1000

0.5

1

1.5

2

Trace de Pk|k

0 20 40 60 80 1000

0.1

0.2

0.3

0.4Gain de Kalman

correction positioncorrection vitesse

Figure 8.21 –

La figure 8.21 montre que l’amplitude des erreurs d’estimation de la position est inferieure

a celle des erreurs de mesures 10, on peut conclure que la position estimee par le filtre est plus

credible que celle proposee par la mesure. La trace de la matrice de covariance de l’erreur

d’estimation et les gains de Kalman sont toujours nuls, le filtre fait donc completement confiance

au modele et pas du tout aux mesures.

8.6.4.2 Les condition initiales sont mal connues, il n’y a pas de bruit d’etat

— La matrice Q =

(

0 0

0 0

)

,

— La position initiale est connue avec incertitude aussi utilise-t-on la mesure de position

pour le determiner x0 = y(0), la vitesse initiale est supposee connue v0 = 100m/s,


(

R 0

0 0

)

=

(

1 0

0 0

)

10. En pratique, ces grandeurs sont inaccessibles.

152


0 5 10 15 20−2

−1

0

1

2Position


0 5 10 15 2099

99.5

100

100.5

101Vitesse


0 5 10 15 200

0.2

0.4

0.6

0.8

1

Trace de Pk|k

0 5 10 15 200

0.1

0.2

0.3

0.4

0.5Gain de Kalman


Figure 8.22 –

Les resultats des simulations sont rapportes sur la figure 8.22. Comme on ne connaıt pas

precisement la position initiale p11(0) = 1, on exploite la mesure R = 1, le gain de Kalman vaut

initialement 0.5 ce qui signifie que l’estimation de la position procede pour 50% des mesures

et pour 50% du modele. Par la suite, comme il n’y a pas de rafales de vent, donc pas de bruit

d’etat, on fait davantage confiance au modele. A plus long terme, le gain de Kalman tend vers

zero et l’estimation ne repose plus sur la mesure mais uniquement sur le modele.

8.6.4.3 Les condition initiales sont connues, il y a des rafales de vent

Les rafales de vent ont une amplitude maximale de 3√2m/s, leur vitesse moyenne est sup-

posee nulle.

— La matrice Q =

(

0 0

0 2

)

,

— L’etat initial est connu avec certitude, aussi on fixe x0 =(

0 100)

y(0),


(

0 0

0 0

)

153


0 10 20 30 40 50−3

−2

−1

0

1

2

3Position


0 10 20 30 40 5090

95

100

105

110

115Vitesse


0 10 20 30 40 500

1

2

3

4

Trace de Pk|k

0 10 20 30 40 500

0.2

0.4

0.6

0.8

1Gain de Kalman


Figure 8.23 –

A l’instant initial, l’etat initial est connu, on fait donc confiance au modele seul et on n’a pas

besoin des mesures. Ainsi le gain de Kalman et la trace de la matrice de covariance de l’erreur

d’estimation sont nuls, c’est ce que montre la figure 8.23. Plus tard, du fait de la presence des

rafales de vent, le modele est moins fiable et on a besoin des mesures. On observe que le gain de

Kalman utilise pour l’estimation de la position tend vers 0.8, ce qui signifie qu’on fait confiance

aux mesures a hauteur de 80%. Ce qui est normal car le vecteur d’etat est davantage bruite

que les mesures. On observe d’ailleurs qu’en terme d’amplitude, les erreurs d’estimation et de

mesure sont comparables, a la limite, pour acceder a la position, la mesure de position pourrait

suffire.

8.6.4.4 Les condition initiales sont mal connues, il y a des rafales de vent

Les rafales de vent ont une faible amplitude, leur vitesse moyenne est supposee nulle.

— La matrice Q =

(

0 0

0 0.1

)

,

— L’etat initial est connu avec incertitude, on fixe x0 =(

0 100)

y(0) mais x(0) est different

et inconnu,

— On utilise le capteur de position comme moyen de connaıtre x(0), par consequent La

matrice P0 =

(

0 0

0 1

)

154


0 20 40 60 80 100−3

−2

−1

0

1

2

3Position


0 20 40 60 80 10097

98

99

100

101

102

103

104Vitesse


0 20 40 60 80 1000.5

0.6

0.7

0.8

0.9

1

Trace de Pk|k

0 20 40 60 80 1000

0.1

0.2

0.3

0.4

0.5

0.6

0.7Gain de Kalman


Figure 8.24 –

A l’instant initial, l’etat initial est mal connu, on fait donc davantage confiance aux mesures.

Plus tard, du fait de la presence des rafales de vent, le modele est moins fiable et on a besoin

des mesures. On observe que le gain de Kalman utilise pour l’estimation de la position tend vers

0.55, ce qui signifie qu’on fait confiance aux mesures a hauteur de 55% et au modele a 45%. Les

resultats de ces simulations sont illustres sur la figure 8.24.

155


156

ANNEXE A

Linearisation d’un systeme

A.1 Hypothese de linearite

On suppose le comportement du systeme continu et stationnaire decrit par n variables xi, m

entrees de commande uj et p sorties yp. Pour les variables, on admet que son modele peut etre

represente par n equation differentielles, non lineaires dans le cas general :

x1 = f1(x1, x2, . . . , xn, u1, . . . , um)

x2 = f2(x1, x2, . . . , xn, u1, . . . , um)

. . . = . . .

xn = fn(x1, x2, . . . , xn, u1, . . . , um) (A.1)

Pour les mesures, p equations algebriques, non lineaires dans le cas general :

y1 = f1(x1, x2, . . . , xn, u1, . . . , um)

y2 = f2(x1, x2, . . . , xn, u1, . . . , um)

. . . = . . .

yp = fn(x1, x2, . . . , xn, u1, . . . , um) (A.2)

qu’on ecrit plus simplement sous la forme :

X = f(X,U)

Y = h(X,U)

Pour ce systeme, un point equilibre defini par {Xe,Ue} satisfait :

f(Xe,Ue) = 0 (A.3)

Pour disposer d’un modele simple, on linearise les equations du modele non lineaire. Pour cela,

on calcule un developpement en serie de Taylor au premier ordre de (A.3) autour du point

d’equilibre :

157

Annexe A. Linearisation d’un systeme

f(Xe + δX,Ue + δU) ≈ f(Xe,Ue)︸︷︷︸

=0

+∂f(X,U)

∂XδX+

∂f(X,U)

∂UδU

h(Xe + δX,Ue + δU) ≈ h(Xe,Ue)︸︷︷︸

=0

+∂h(X,U)

∂XδX+

∂h(X,U)

∂UδU

δX, δU, δY sont respectivement des petites variations des variables et des entrees autour

du point d’equilibre {Xe,Ue}. Soit le modele linearise du systeme :

δX =∂f(X,U)

∂XδX+

∂f(X,U)

∂UδU (A.4)

δX =∂h(X,U)

∂XδX+

∂h(X,U)

∂UδU (A.5)

(A.6)

Xe,Ue Xe + δX,Ue + δU

X,U

(

df

∂X

)

Xe

δX +

(

df

∂U

)

Ue

δU

f(X,U)

δX, δU

f(Xe,Ue)

f(Xe + δX,Ue + δU)

Figure A.1 – Linearisation de f autour d’un point d’equilibre

avec

∂f(X,U)

∂X=

∂f1∂x1

.. ..∂f1∂xn

.. .. .. ..

.. .. .. ..∂fn∂x1

.. ..∂fn∂xn

(A.7)

∂f(X,U)

∂U=

∂f1∂u1

..∂f1∂um

.. .. ..

.. .. ..∂fn∂u1

..∂fn∂um

(A.8)

158

A.1. Hypothese de linearite

∂h(X,U)

∂X=

∂h1∂x1

.. ..∂h1∂xn

.. .. .. ..

.. .. .. ..∂hp∂x1

.. ..∂hn∂xn

(A.9)

∂h(X,U)

∂U=

∂h1∂u1

..∂h1∂um

.. .. ..

.. .. ..∂hp∂u1

..∂hn∂um

(A.10)

les matrices jacobiennes de f et h calculees respectivement par rapport a X et U.

159

Annexe A. Linearisation d’un systeme

160

ANNEXEB

Transformee de Laplace

B.1 Definition

La transformee de Laplace L (t) d’une fonction f(t) definie pour t > 0 est donnee par :

L [f(t)] = F (p) =

∫ +∞

0f(t)e−ptdt (B.1)

La variable complexe p ou variable de Laplace s’ecrit :

p = σ + jω (B.2)

ou σ et ω designent respectivement la partie reele et la partie imaginaire de p.

B.1.1 Condition d’existence

Une condition suffisante d’existence pour (B.1) est qu’elle puisse etre bornee par une integrale

convergente :

∫ +∞

0f(t)e−ptdt ≤

∫ +∞

0|f(t)e−pt|dt ≤

∫ +∞

0|f(t)|e−σtdt (B.3)

S’il existe M et α, deux reels positifs tels que f(t) ≤Meαt,

∫ +∞

0|f(t)|e−σtdt ≤

∫ +∞

0Meαte−σtdt (B.4)

Cette integrale converge pour σ > α et α est appelee l’abcisse de convergence.

B.2 Table de transformees

Les transformees de Laplace utilisees dans ce cours sont rapportees dans le tableau B.1.

161

Annexe B. Transformee de Laplace

f(t), t > 0 F (p)

δ(t) 1

U(t) 1

p

t1

p2

tn−1

(n− 1)!

1

pnn = 1, 2, . . .

eat1

p− a

sinωtω

p2 + ω2

cosωtp

p2 + ω2

e−at

ωsinωt

1

(p+ a)2 + ω2

e−at

ωcosωt

p+ a

(p+ a)2 + ω2

1√

1− ξ2e−ξωnt sinωn

√

1− ξ2t1

p2 + 2ξωnp+ ω2n

1

ω2n

√

1− ξ2

(

1− e−ξωnt sin(ωn

√

1− ξ2t+ φ)) 1

p(p2 + 2ξωnp+ ω2n)

ξ < 1, φ = cos−1 ξ

Tableau B.1 – Transformees de Laplace usuelles en automatique

B.3 Proprietes de la transformee de Laplace

B.3.1 Linearite

La transformee de Laplace est lineaire. Soit L [f(t)] = F (p) et L [g(t)] = G(p) alors :

L [αf(t) + βg(t)] = F (p) +G(p) (B.5)

avec α, β reels.

B.3.2 Derivation

Supposons f discontinue en 0 et derivable pour t > 0. La transformee de Laplace de la

derivee a l’ordre n prise au sens des distributions et pour des conditions initiales non nulles :

L

[dn

dtnf(t)

]

= pnF (p)−n∑

i=1

[

pn−i di−1

dti − 1f(t)

]

t=0−(B.6)

Cette transformee de Laplace fait intervenir f(0−), elle est generale. Si la fonction f(t) est

causale f(0−) = 0, si elle est continue f(0−) = f(0+), enfin, si f est discontinue a l’origine, elle

admet une derivee au sens des distributions.

162

B.4. Transformee de Laplace inverse

B.3.3 Integration

L

[∫ t

−∞f(t)dt

]

=F (p

p+

1

p

[∫ t

−∞f(σ)dσ

]

t=0−(B.7)

B.3.4 Retard

L [f(t− τ)] = F (p)e−τp (B.8)

B.3.5 Translation complexe

L [e−λtf(t)] = F (p+ λ) (B.9)

B.3.6 Theoreme de la valeur initiale

Ce theoreme permet de calculer f(t) a l’instant initial a partir de F (p), il est utilise pour

etablir les expressions des signaux d’un systeme a cet instant.

limt→0

f(t) = limp→+∞

pF (p) (B.10)

B.3.7 Theoreme de la valeur finale

Ce theoreme permet de calculer f(t) a l’infini a partir de F (p), il est utilise pour etablir les

expressions des signaux d’un systeme en regime permanent.

limt→+∞

f(t) = limp→0

pF (p) (B.11)

Ce theoreme n’est applicable que si pF (p) a tous ses poles a partie reelle strictement negative.

B.4 Transformee de Laplace inverse

f(t) = L−1[F (p)] =

1

2jπ

∫ σ+jω

σ−jωF (p)eptdp (B.12)

En pratique on n’utilisera pas cette formule mais plutot la table de transformees B.1. Attention

toutefois preciser que les originaux sont des siganux causals, i.e. qui s’ecrivent f(t)U(t).

163

Annexe B. Transformee de Laplace

164

ANNEXE C

Systemes simples remarquables

C.1 Integrateur pur

L’integrateur pur a pour fonction de transfert :

I(p) =1

τip(C.1)

ou τi est la constante de temps de l’integrateur. On rencontre frequemment ce systeme lorsqu’il

s’agit de decrire une reponse en position pour une entree en vitesse. En regime harmonique :

I(jω) =1

jωτi(C.2)

dont le gain a pour expression :

|I(jω)|dB = −20logω − 20logτi (C.3)

et dont l’argument vaut −π2∀ω ≥ 0. Le diagramme de Bode de ce systeme :

165

Annexe C. Systemes simples remarquables

−20

−10

0

10

20

Gai

n (d

B)

10−1

100

101

−91

−90.5

−90

−89.5

−89

Pha

se (

deg)

Pulsation (rad/sec)

Figure C.1 – Diagrammes de Bode de l’integrateur

C.2 Approximation de Pade d’un retard pur

Les retards purs τ peuvent etre a l’origine d’un comportement instable des systemes. Sur un

avion, ils peuvent avoir pour origine le temps requis pour la transmission des mesures issues des

capteurs, leur traitement dans les calculateurs embarques et l’execution des commandes.

R(p) = e−τp =e−

τp2

eτp2

(C.4)

En regime harmonique :

R(jω) =e−

jωτ2

e−jωτ2

(C.5)

Si les retards sont petits i.e. ωτ << 1, au premier ordre :

R(jω) ≈ 1− jωτ2

1 + jωτ2

(C.6)

Cette approximation du retard, dite de Pade a l’ordre un, a un module egal a 1 ∀ω ≥ 0 et

un argument

< R(jω) >=< 1− jωτ

2> − < 1 + j

ωτ

2> (C.7)

< R(jω) >= −2 tan−1 ωτ

2(C.8)

166

C.3. Double integrateur

Le diagramme de Bode de R(jω) est represente ci-dessous :

−1

−0.5

0

0.5

1G

ain

(dB

)

10−2

10−1

100

101

102

−180

−135

−90

−45

0

Pha

se (

deg)

Pulsation (rad/sec)

ωτ=1domaine de validité del’approximation

Figure C.2 – Diagramme de Bode : approximation de Pade a l’ordre un d’un retard pur

C.3 Double integrateur

L’integrateur pur a pour fonction de transfert :

J(p) =1

p2(C.9)

Cette fonction de transfert caracterise un systeme purement inertiel :

J(jω) = − 1

ω2(C.10)

dont le gain a pour expression :

|J(jω)|dB = −20logω2 = −40logω (C.11)

et l’argument vaut −π ∀ω ≥ 0. Le diagramme de Bode de ce systeme :

167


−40

−20

0

20

40G

ain

(dB

)

10−1

100

101

−180

−135

−90

−45

0

Pha

se (

deg)

FrequencyPulsation (rad/sec)

−40dB/dec

Figure C.3 – Diagrammes de Bode du systeme complet d’ordre trois

Pour un k-integrateurs, on parle alors de systeme de classe k, le gain decroıt avec une pente

egale a −k × 20dB/dec et le dephasage vaut −kπ2.

C.4 Second ordre avec zeros

De tels systemes presentent une fonction de transfert de la forme :

H(p) =S(p)

E(p)= kω2

n

τp+ 1

p2 + 2ξωnp+ ω2n

(C.12)

H(p) possede un zero reel z = − 1τ , le denominateur est celui d’un systeme d’ordre deux. Soumis

a un echelon d’amplitude e1, la reponse a pour expression :

S(p) =kω2

nτp

p2 + 2ξωnp+ ω2n

e1p

+kω2

n

p2 + 2ξωnp+ ω2n

e1p

(C.13)

La transformee de Laplace inverse du second terme du membre de droite notee s2(t) s’ecrit

d’apres (2.35) :

s2(t) = ke1

(

1− e−ξωnt

√

1− ξ2sin(ωpt− φ)

)

U(t) (C.14)

La transformee de Laplace inverse du premier terme du membre de droite est au facteur τ pres

la derivee de la precedente.

s1(t) = ωnτke1e

−ξωnt

√

1− ξ2

(

ξ sin(ωpt− φ)−√

1− ξ2 cos(ωpt− φ))

U(t) (C.15)

168

C.4. Second ordre avec zeros

Or d’apres (2.33),

s1(t) = ωnτke1e

−ξωnt

√

1− ξ2(cosφ sin(ωpt− φ) + sinφ cos(ωpt− φ))U(t) (C.16)

s1(t) =

(

ωnτke1e

−ξωnt

√

1− ξ2cosωpt

)

U(t) (C.17)

La reponse est la somme de s1(t) et de s2(t). Le terme s1(t) est un pur transitoire qui presente

une amplitude a l’origine d’autant plus importantes que |ωnτ | >> 1. Autrement dit,

— lorsque le zero est plus proche de l’axe imaginaire que les poles, s1(t) domine le transitoire

de s2(t), on parle de zero sous-compense. Pratiquement, l’effet derivateur du systeme est

preponderant. Comme l’entree est un echelon, sa derivee est une impulsion filtree par les

termes du second ordre. D’ou la presence du depassement important qui apparaıt sur la

reponse.

— lorsque les poles sont plus proches de l’axe imaginaire que le zero, le transitoire de s2(t)

est preponderant sur s1(t) et l’on retrouve approximativement les caracteristiques d’un

mode d’ordre deux classique. Le zero est sur-compense.

— lorsque le zero est positif alors ωnτ < 0 et le transitoire s2(t) est de signe oppose a s1(t).

0n dit que le systeme est a dephasage non minimal.

−0.8 −0.6 −0.4 −0.2 0−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

Carte des poles−zéros

Axe réel

Axe

imag

inai

re

0 5 100

0.5

1

1.5

2

2.5

3

3.5

4

4.5

5

Réponse indicielle

Temps (sec)

Am

plitu

de

Figure C.4 – Systeme sous-compense

169


−10 −5 0−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8


Real Axe

Axe

imag

inai

re

0 2 4 6 80

0.2

0.4

0.6

0.8

1

1.2

1.4

Réponse indicielle

Temps (sec)

Am

plitu

de

Figure C.5 – Systeme sur-compense

−1 −0.5 0 0.5 1−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8


Axe réel

Axe

imag

inai

re

0 2 4 6 8−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

1.2

Réponse indicielle

Temps (sec)

Am

plitu

de

Figure C.6 – Systeme a dephasage non minimal

170

ANNEXED

Critere de Nyquist

D.1 Critere de Nyquist

Le critere de Nyquist est tres interessant car il utilise une representation graphique de la

reponse frequentielle. De plus, il s’applique a tout type de transmittance.

La demonstration du critere de Nyquist fait appel a un theoreme, que nous ne demontrerons

pas, decoulant lui-meme du theoreme de Cauchy sur les fonctions holomorphes (c’est-a-dire

analytiques, uniformes et continues). Ce theoreme s’enonce de la facon suivante :

Theoreme 1 Soit F (p) une fonction de la variable complexe p, holomorphe a l’interieur d’un

contour (C).

Soient P et Z les nombres respectifs de poles et de zeros, comptes avec leur ordre de multi-

plicite, situes a l’interieur de ce contour.

Lorsque le point d’affixe p decrit le contour (C) dans le sens des aiguilles d’une montre, le

point d’affixe F (p) decrit un contour (G) qui effectue, dans le sens trigonometrique, un nombre

de tours T = P − Z autour de l’origine.

En d’autres termes, la variation d’argument de F (p) est 2π(P − Z)

D.2 Application au contour de Nyquist

Considerons le systeme ayant pour fonction de transfert :

F (p) =N(p)

D(p)=

(p− z1)(p− z2) . . .

(p− p1)(p− p2) . . .(D.1)

Faisons decrire a la variable complexe p le contour (C), denomme contour de Nyquist, ou

contour d’exclusion, ou encore contour de Bromwich represente sur la figure 3.4.

Ce contour est constitue de l’axe des imaginaires, parcouru dans le sens croissant (p = jω

avec ω ∈] −∞,+∞[ ), et d’un demi-cercle de centre l’origine et de rayon infini, parcouru dans

le sens trigonometrique inverse.

171

Annexe D. Critere de Nyquist

Les eventuels poles imaginaires purs de F (p) sont contournes par des demi-cercles de rayon

ε infiniment petit.

Ce contour enferme donc la totalite du demi-plan complexe situe a droite de l’axe des ima-

ginaires.

Lorsque p parcourt le contour (C), F (p) parcourt un autre contour, (G), qui n’est autre que

le lieu de Nyquist du systeme (pour ω ∈]0+,+∞[), complete par son symetrique par rapport a

l’axe reel (pour ω ∈] −∞, 0−[) et, eventuellement, par un demi cercle de centre l’origine et de

rayon infini, parcouru dans le sens trigonometrique inverse (jonction entre ω = 0− et ω = 0+).

Le systeme est stable si et seulement si tous les poles de F (p) sont a partie reelle strictement

negative.

Autrement dit, ce systeme est stable si et seulement si le contour (C) n’englobe aucun pole de

F (p). L’application du theoreme enonce precedemment conduit donc a la formulation suivante :

Corolaire 1 Un systeme de transmittance F (p) est stable si et seulement si le contour parcouru

par F (p) lorsque p parcourt le contour de Nyquist effectue, dans le sens trigonometrique inverse,

un nombre de tours autour de l’origine egal au nombre de zeros a partie reelle positive de F (p)

(comptes avec leur ordre de multiplicite).

D.2.1 Critere de Nyquist

Considerons l’asservissement lineaire suivant :

La transmittance de ce systeme boucle vaut :

FTBF (p) =S(p)

E(p)=

H(p)

1 + F (p)H(p)=

H(p)

1 + FTBO(p)(D.2)

Soit Z le nombre de zeros, comptes avec leur ordre de multiplicite, de 1 + FTBO(p) situes

a l’interieur du contour de Nyquist.

Z est donc le nombre de poles a partie reelle positive, comptes avec leur ordre de multiplicite,

de la FTBF.

Soit P le nombre de poles, comptes avec leur ordre de multiplicite, de 1 + FTBO(p) situes

a l’interieur du contour de Nyquist.

P est donc aussi le nombre de poles a partie reelle positive, comptes avec leur ordre de

multiplicite, de la FTBO.

Appliquons le theoreme precedent a la fonction 1 + FTBO(p) :

Lorsque le point d’affixe p decrit, dans le sens des aiguilles d’une montre, le contour de

Nyquist, le contour parcouru par la fonction 1+FTBO effectue, dans le sens trigonometrique,

un nombre de tours T = P − Z autour de l’origine.

Cela revient a dire que le contour parcouru par la FTBO effectue, dans le sens trigonome-

trique, un nombre de tours T = P − Z autour du point (−1, 0).

Ce point, de coordonnees (−1, 0) dans le plan de Nyquist et, par consequent, de coordonnees

(−180 , 0dB) dans le plan de Black, est appele point critique ou point de Nyquist.

Le systeme boucle est stable si et seulement si tous les poles de sa FTBF, c’est a dire tous

les zeros de 1 + FTBO(p), sont a partie reelle strictement negative.

Autrement dit, le systeme boucle est stable si et seulement si Z = 0.

172

D.2. Application au contour de Nyquist

D’ou l’enonce suivant du critere de Nyquist :

Un systeme boucle est stable si et seulement si le contour parcouru par sa FTBO effectue, dans le

sens trigonometrique, un nombre de tours autour du point critique egal au nombre de poles a partie reelle

positive de sa FTBO (comptes avec leur ordre de multiplicite).

173

Annexe D. Critere de Nyquist

174

ANNEXE E

Equivalence a un systeme a retour unitaire

Le systeme donc la chaıne directe a pour fonction de transfert H(p) et la chaıne de retour

pour fonction de transfert F (p) a pour FTBO :

FTBO(p) = H(p)F (p) (E.1)

et pour FTBF :

FTBF (p) =H(p)

1 +H(p)F (p)=

1

F (p)

H(p)F (p)

1 +H(p)F (p)=

1

F (p)

FTBO(p)

1 + FTBO(p)(E.2)

qui est equivalent a un systeme dont la chaıne directe a pour fonction de transfert FTBO(p) et

la chaıne de retour pour fonction de transfert 1.

FTBO(p)1

F (p)

E(p) S(p)+

−H(p)

F (p)

E(p) S(p)+

− ⇔

Figure E.1 – Equivalence avec un systeme a retour unitaire

175

Annexe E. Equivalence a un systeme a retour unitaire

176

ANNEXE F

A propos de la representation d’etat

F.1 INVARIANCE DE FONCTION DE TRANSFERT

On rappelle que le changement de base est defini par x = Pz. On montre que la matrice de

fonctions de transfert est invariante par changement de base :

H(p) = C(

pIn − A)−1

B+ D

H(p) = C(pIn −P−1AP

)−1B+ D

H(p) = C(P−1(pIn −A)P

)−1B+ D

or (AB)−1 = A−1B−1

Il vient :

H(p) = CP−1 (pIn −A)−1PB+ D

D’apres les expressions des matrices dans la nouvelle base (), il vient :

H(p) = C (pIn −A)−1B+D

H(p) = H(p) (F.1)

177

Annexe F. A propos de la representation d’etat

178

ANNEXEG

Codes MATLAB

G.1 CALCUL D’UNE COMMANDE

G.2 CALCUL D’UN OBSERVATEUR

1 % Observateur pour l’estimation de l’erreur de mesure d’un accelerometre2 % La mesure d’acceleration est entachee d’une erreur systematique b3 % Francois Bateman - 21/08/20144 % Le modele continu5 A=[0 1 0 ;0 0 −1; 0 0 0 ] ;6 B = [ 0 ; 1 ; 0 ] ;7 C=[1 0 0 ;0 1 0 ] ;8 D=0;9 sys = s s (A, B , C ,D) ;

10 % Le modele a temps discret11 T= 50e−3;12 sysd =c2d ( sys , T ) ;13 F= sysd . a ;G= sysd . b ;14 % Observabilite15 rank ( [ C ;C∗F ;C∗F ^ 2 ] )16 % poles regissant la dynamique de l’erreur17 mu1=−0.5 ; mu2 = 0 . 5 ; mu3 = 0 . 2 5 ;18 % Calcul des noyaux19 v1w1=nu l l ( [ F’−eye ( 3 )∗mu1 , −C ’ ] )20 v2w2=nu l l ( [ F’−eye ( 3 )∗mu2 , −C ’ ] )21 v3w3=nu l l ( [ F’−eye ( 3 )∗mu3 , −C ’ ] )22 % La matrice de passage P23 P=[v1w1 ( 1 : 3 , 1 ) , v2w2 ( 1 : 3 , 1 ) , v3w3 ( 1 : 3 , 1 ) ] ;24 % La matrice W25 W=[v1w1 ( 4 : 5 , 1 ) , v2w2 ( 4 : 5 , 1 ) , v3w3 ( 4 : 5 , 1 ) ] ;26 %Calcul de L27 L= r e a l ( (W∗ inv ( P ) ) ’ )

G.3 FILTRE DE KALMAN

1 % Estimation de la position d’un avion2 % F. Bateman 21/10/2014

179

Annexe G. Codes MATLAB

3

4 c l e a r a l l ; c l c ;5 % La periode d’echatillonnage6 T=1;7 % La duree de la simulation8 N=100;9 Tf=N∗T ;

10

11 % L’equation d’etat continue12 % Xdot=A X + B W13 A=[0 1 ; 0 0 ] ;14 B = [ 0 ; 1 ] ;15 % L’equation d’etat16 % X k+1 = F X k + G W k17 F=expm (A∗T ) ;18 G=B∗T ; % commande des gaz constante vb/a=cte19 C= [ 1 , 0 ] ; % on mesure la position20

21 % Caracteristique des bruits d’etat et de mesure22 Q=diag ( [ 0 , 0 . 0 1 ] ) ;23 R=1;24

25 % On preinitialisie les vecteurs et les matrices26

27

28

29 % L’algorithme du filtre30 % Initialisation31 Y(1 )= sqr t (R)∗ randn ;32 P=[1 0 ; 0 0 ] ;33 X_est = [ 0 ; 1 0 0 ] ;34 t r P (1 )=t race ( P ) ;35 % Generation d’un vecteur d’etat X(0) d’apres la covariance de l’erreur P(0)36 % d’estimation37 X=[0+ sqr t ( P ( 1 , 1 ) )∗ randn ;100+sqr t ( P ( 2 , 2 ) )∗ randn ] ;38

39 f o r k =1:N,40 X( : , k +1) =F∗X( : , k ) + T∗ sqr t (Q)∗G∗randn ;41 X_est ( : , k+1)=F∗X_est ( : , k ) ;42 P=F∗P∗F ’+Q;43 L ( : , k+1)=P∗C’ ∗ inv (R+C∗P∗C ’ ) ;44 Y( : , k+1)=C∗X( : , k+1)+ sqr t (R)∗ randn ;45 X_est ( : , k+1)= X_est ( : , k+1)+L ( : , k +1)∗ (Y ( : , k+1)−C∗X_est ( : , k + 1 ) ) ;46 P=P−L ( : , k +1)∗C∗P ;47 t r P ( : , k+1)=t race ( P ) ;48 end49 % Affichage vecteur d’etat, trace de la matrice de covariance, gain de50 % Kalman51

52 t ime =0:T : Tf ;53

54 subplot ( 221 )55 hold on56 plot ( t ime ,X(1 , : )− X_est ( 1 , : ) , ’ r−− ’ , ’ L ineWidth ’ , 2 )57 plot ( t ime ,Y−X( 1 , : ) , ’ b ’ , ’ L ineWidth ’ , 2 )58 t i t l e ( ’ P o s i t i o n ’ , ’ Fon tS i ze ’ , 14 )59 legend ( ’ e r r e u r de p o s i t i o n e s t i m é e ’ , ’ e r r e u r de mesure de p o s i t i on ’ , ’ Loca t i on ’ , ’ Sou thEas t ’ )60

61 subplot ( 223 )62 plot ( t ime ,X( 2 , : ) , ’ r ’ , ’ L ineWidth ’ , 2 )63 hold on

180

G.3. FILTRE DE KALMAN

64 plot ( t ime , X_est ( 2 , : ) , ’ g ’ , ’ L ineWidth ’ , 2 )65 t i t l e ( ’ V i t e s s e ’ , ’ Fon tS i ze ’ , 14 )66 legend ( ’ v i t e s s e ’ , ’ v i t e s s e e s t i m é e ’ , ’ Loca t i on ’ , ’ Sou thEas t ’ )67

68 subplot ( 222 )69 plot ( t ime , t rP , ’ L ineWidth ’ , 2 )70 t i t l e ( ’ T race de P_{k | k} ’ , ’ Fon tS i ze ’ , 14 )71

72 subplot ( 224 )73 plot ( t ime , L ( 1 , : ) , ’ k−− ’ , ’ L ineWidth ’ , 2 )74 hold on75 plot ( t ime , L ( 2 , : ) , ’ r ’ )76 t i t l e ( ’ Gain de Kalman ’ , ’ Fon tS i ze ’ , 14 )77 legend ( ’ c o r r e c t i o n p o s i t i o n ’ , ’ c o r r e c t i o n v i t e s s e ’ , ’ Loca t i on’ , ’ Sou thEas t ’ )

181

livre de cours d’automatique - francois-bateman.e...

Documents