LES MATHS EN PHYSIQUELa physique à travers le filtre
des mathématiques
avec éléments d’analyse numérique
Cours et applications
Jean-Pierre ProvostProfesseur à l’université de Nice-Sophia Antipolis
Gérard valléeMaître de conférences à l’université de Nice-Sophia Antipolis
3e édition
© Dunod, Paris, 2011
© Dunod, Paris, 2006 pour la 2e éditionISBN 978-2-1005-5933-6
Table des matieres
Liste des abreviations vi
Table des sujets de physique vii
Avant-propos xi
1 Nombres reels ; grandeurs physiques ; dimensions 11.1 Grandeurs physiques ; continuite ; parametrages additifs . . . . . . . . . . 1
1.1.1 Survol « physique » des ensembles N, Z, Q, R . . . . . . . . . . . . 11.1.2 Parametrage additif des lois de composition ; logarithmes . . . . . 41.1.3 Fonction et notation exponentielles ; applications . . . . . . . . . . 61.1.4 Mesure additive du desordre microscopique ; grands nombres
et entropie ; exemples ; irreversibilite . . . . . . . . . . . . . . . . . 81.2 Caractere algebrique des grandeurs physiques . . . . . . . . . . . . . . . . 10
1.2.1 Pensee « naıve » et pensee algebrique . . . . . . . . . . . . . . . . 101.2.2 Conventions et lois de l’electricite . . . . . . . . . . . . . . . . . . . 12
1.3 Grandeurs physiques et dimensions . . . . . . . . . . . . . . . . . . . . . . 151.3.1 Changements d’unites et invariance des lois physiques . . . . . . . 151.3.2 Applications et limites de l’analyse dimensionnelle . . . . . . . . . 18
2 Nombres et notation complexes ; plan euclidien 222.1 Calculs avec les nombres complexes . . . . . . . . . . . . . . . . . . . . . . 22
2.1.1 Regles de calcul ; exponentielle imaginaire ; fonctions complexes . . 222.1.2 « Theoreme fondamental de l’algebre » et applications . . . . . . . 25
2.2 Plan complexe et transformations associees . . . . . . . . . . . . . . . . . 262.2.1 Plan complexe et plan cartesien ; produit scalaire ; aire . . . . . . . 262.2.2 Transformations dans le plan complexe . . . . . . . . . . . . . . . . 28
2.3 Etude de courbes et de mouvements plans . . . . . . . . . . . . . . . . . . 312.3.1 Mouvements et courbes en coordonnees polaires . . . . . . . . . . 312.3.2 Coniques en coordonnees polaires et cartesiennes ; foyers . . . . . . 322.3.3 Mouvement de Kepler . . . . . . . . . . . . . . . . . . . . . . . . . 362.3.4 Mouvement harmonique ; vecteurs tournants . . . . . . . . . . . . 38
2.4 Notation complexe en physique classique . . . . . . . . . . . . . . . . . . . 392.4.1 Signaux reels et complexes . . . . . . . . . . . . . . . . . . . . . . 392.4.2 Systemes entree-sortie ; fonctions de transfert et impedances . . . . 402.4.3 Signaux modules ou quasi-monochromatiques . . . . . . . . . . . . 42
2.5 Applications a l’optique ondulatoire . . . . . . . . . . . . . . . . . . . . . 422.5.1 Interferences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422.5.2 Diffraction en lumiere monochromatique . . . . . . . . . . . . . . . 452.5.3 Polarisations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
ii Table des matieres
3 Espace ; symetries ; calcul vectoriel 513.1 Symetrie, invariance et relativite . . . . . . . . . . . . . . . . . . . . . . . 52
3.1.1 Groupes de symetrie et invariance . . . . . . . . . . . . . . . . . . 523.1.2 Le groupe de symetrie de la physique . . . . . . . . . . . . . . . . 533.1.3 Symetries spatiales (presentation « experimentale ») . . . . . . . . 553.1.4 Transformation des grandeurs et des champs physiques . . . . . . . 59
3.2 Calcul vectoriel ; applications . . . . . . . . . . . . . . . . . . . . . . . . . 603.2.1 Produit scalaire, produit vectoriel et produit mixte ; pseudovecteurs 603.2.2 Equations de plans ; frequences spatiales ; reseaux . . . . . . . . . . 643.2.3 Differentielles de chemins ; effet Doppler ; lois de Descartes . . . . . 663.2.4 Vecteurs surface ; flux de grandeurs . . . . . . . . . . . . . . . . . . 693.2.5 Sphere, angle solide et applications . . . . . . . . . . . . . . . . . . 713.2.6 Geometrie spherique ; notion de transport parallele . . . . . . . . . 74
3.3 Vecteurs tournants ; mecanique du solide . . . . . . . . . . . . . . . . . . . 763.3.1 Vecteurs tournants ; changements de referentiels . . . . . . . . . . 763.3.2 Referentiel du centre de masse . . . . . . . . . . . . . . . . . . . . 783.3.3 Cinematique et dynamique d’un corps solide . . . . . . . . . . . . 80
3.4 Systemes physiques possedant des symetries . . . . . . . . . . . . . . . . . 833.4.1 Schema general ; principe de Curie . . . . . . . . . . . . . . . . . . 833.4.2 Symetries de translation ; lois de Descartes et generalisations . . . 843.4.3 Symetries de rotation et symetries discretes ; applications en
electromagnetisme et en acoustique . . . . . . . . . . . . . . . . . . 85
4 Calcul et physique lineaires ; relativite ; quantique 874.1 Espaces vectoriels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.1.1 Definitions ; changements de bases ; applications lineaires . . . . . 874.1.2 Structures metriques ; fonctions orthonormees . . . . . . . . . . . . 904.1.3 Formes quadratiques et antisymetriques ; volume . . . . . . . . . . 91
4.2 Calcul matriciel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 944.2.1 Bases du calcul matriciel ; lien avec le calcul vectoriel . . . . . . . . 944.2.2 Matrices n× n ; exponentielle ; trace ; determinant ; inverse . . . . 954.2.3 Spectre d’une matrice n× n ; vecteurs propres ; exemples . . . . . 984.2.4 Matrices de Pauli ; groupe de symetrie de la physique ; spineurs . . 1014.2.5 Groupe de rotation et classification des grandeurs physiques . . . . 103
4.3 Applications en physique classique . . . . . . . . . . . . . . . . . . . . . . 1054.3.1 Deformations et contraintes ; elasticite ; viscosite . . . . . . . . . . 1054.3.2 Optique matricielle des systemes centres . . . . . . . . . . . . . . . 1084.3.3 Relativite d’Einstein et quadrivecteurs . . . . . . . . . . . . . . . . 111
4.4 Physique quantique et espaces vectoriels . . . . . . . . . . . . . . . . . . . 1174.4.1 Cadre general ; etats quantiques ; moyennes ; evolution . . . . . . . 1184.4.2 Dynamique des systemes a deux etats ; transitions quantiques . . . 1204.4.3 Fonctions d’ondes ; E.D.P. de Schrodinger ; etats gaussiens . . . . . 1244.4.4 Oscillateur harmonique ; champ electromagnetique . . . . . . . . . 1274.4.5 E.D.P. relativistes de Klein-Gordon, Weyl, Dirac ; champs quan-
tiques ; particules et antiparticules . . . . . . . . . . . . . . . . . . 130
Table des matieres iii
5 Fonctions d’une variable ; analyse des signaux 1335.1 Savoir-faire concernant les fonctions . . . . . . . . . . . . . . . . . . . . . 134
5.1.1 Graphe et informations sur une fonction . . . . . . . . . . . . . . . 1345.1.2 Derivation, developpements limites : principaux resultats . . . . . 1375.1.3 Integration ; cas des fonctions piquees ou rapidement oscillantes . . 1395.1.4 Concavite de l’entropie ; travail maximum ; transitions de phase . . 141
5.2 Operations sur les fonctions ; analyse de Dirac . . . . . . . . . . . . . . . . 1455.2.1 Operations sur les fonctions . . . . . . . . . . . . . . . . . . . . . . 1455.2.2 Impulsion de Dirac (« fonction delta ») ; exemples mecaniques . . . 1475.2.3 Analyse de Dirac ; reponse impulsionnelle ; convolution ; filtrage . . 150
5.3 Transformation de Fourier ; analyse de Fourier . . . . . . . . . . . . . . . . 1515.3.1 Decomposition de Fourier ; spectre d’un signal ; formule de Poisson 1525.3.2 Proprietes : dualite temps frequence . . . . . . . . . . . . . . . . . 1545.3.3 Transformee de Laplace . . . . . . . . . . . . . . . . . . . . . . . . 1575.3.4 Signaux stationnaires ; signaux chaotiques ; langage probabiliste . . 158
5.4 Optique de Fourier ; filtrage optique . . . . . . . . . . . . . . . . . . . . . 1615.4.1 Decomposition en ondes planes ; filtrage . . . . . . . . . . . . . . . 1615.4.2 Illustrations optiques de la transformee de Fourier . . . . . . . . . 163
6 Equations differentielles ; systemes dynamiques 1666.1 Systemes dynamiques et espace de phase . . . . . . . . . . . . . . . . . . . 167
6.1.1 Definitions ; proprietes generales . . . . . . . . . . . . . . . . . . . 1676.1.2 Exemples de systemes dynamiques et de leurs portraits de phase . 170
6.2 Equations lineaires stationnaires ; modes propres ; stabilite . . . . . . . . . 1746.2.1 Equations du premier et du second ordre sans et avec second membre1746.2.2 Cas general ; modes propres ; oscillateurs couples . . . . . . . . . . 1776.2.3 Stabilite et instabilite d’un systeme dynamique lineaire stationnaire 180
6.3 Dix equations vectorielles classiques de la physique . . . . . . . . . . . . . 1826.4 Equations differentielles lineaires a coefficients variables . . . . . . . . . . 187
6.4.1 Quatre exemples ; matrices de transfert . . . . . . . . . . . . . . . 1876.4.2 Ondes stationnaires ; etats lies ; quantification . . . . . . . . . . . . 1906.4.3 Ondes propagatives ; reflexion, transmission, adaptation d’impedance1916.4.4 Equations avec parametres periodiques ; theoreme de Floquet-Bloch 1936.4.5 Equations d’amplitude ; approximation adiabatique . . . . . . . . . 195
6.5 Oscillateurs non lineaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1976.5.1 Oscillateurs lineairement stables faiblement non lineaires . . . . . . 1976.5.2 Oscillateurs lineairement instables ; exemple de Van der Pol ;
bifurcations de Hopf et d’un cycle limite . . . . . . . . . . . . . . . 200
7 Fonctions de plusieurs variables ; analyse vectorielle 2047.1 Calcul differentiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
7.1.1 Developpement de Taylor ; differentielles ; variation seconde ;extremum ; E.D.P. simples . . . . . . . . . . . . . . . . . . . . . . . 204
7.1.2 Derivees spatiales de champs scalaires et vectoriels . . . . . . . . . 2087.1.3 Derivees temporelles et applications hydrodynamiques . . . . . . . 2127.1.4 Changements de variables ; regles de calcul . . . . . . . . . . . . . 214
7.2 Calcul integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
iv Table des matieres
7.2.1 Integration a n dimensions ; jacobien ; cas des tres grandes dimensions2167.2.2 Formes differentielles ; formules de Stokes et Ostrogradski . . . . . 2197.2.3 Analyse vectorielle ; frontieres et champs dependant du temps ;
loi de Lenz ; hydrodynamique . . . . . . . . . . . . . . . . . . . . . 2247.2.4 Bilans de grandeurs ; applications aux milieux continus . . . . . . . 227
7.3 Applications a la mecanique et a l’optique geometrique . . . . . . . . . . . 2317.3.1 Mecanique et fonctions energie potentielle . . . . . . . . . . . . . . 2317.3.2 Optique geometrique : rayons ; surfaces d’onde ; caustiques
et problemes d’extremum . . . . . . . . . . . . . . . . . . . . . . . 2347.4 Applications a la thermodynamique . . . . . . . . . . . . . . . . . . . . . 238
7.4.1 Role cle de l’entropie ; equations d’etat ; coexistence de phases . . . 2397.4.2 Potentiels thermodynamiques et equilibres . . . . . . . . . . . . . . 242
7.5 Applications a l’electromagnetisme . . . . . . . . . . . . . . . . . . . . . . 2457.5.1 Formulation integrale ; champs statiques ; milieux . . . . . . . . . . 2457.5.2 Potentiel scalaire et potentiel vecteur ; bilans d’energie et de
quantite de mouvement ; A.R.Q.S . . . . . . . . . . . . . . . . . . . 2487.5.3 Calculs avec des densites microscopiques ; rayonnement . . . . . . 250
8 Equations aux derivees partielles ; propagation ; diffusion 2538.1 Chaines de systemes dynamiques couples ; limite continue . . . . . . . . . 253
8.1.1 Chaines d’oscillateurs ; role des conditions aux limites ; phonons . . 2548.1.2 Limite continue ; cordes vibrantes ; lignes electriques ;
hydrodynamique ; impedances . . . . . . . . . . . . . . . . . . . . . 2568.2 Solutions de quelques E.D.P. dynamiques . . . . . . . . . . . . . . . . . . 261
8.2.1 E.D.P. lineaires a coefficients constants et solutions ondes planes . 2618.2.2 Equations de diffusion et de propagation ; fonctions de Green ;
ondes stationnaires . . . . . . . . . . . . . . . . . . . . . . . . . . . 2678.2.3 Six E.D.P. liees a une loi de conservation . . . . . . . . . . . . . . 2728.2.4 Trois exemples d’E.D.P. non lineaires ; ondes solitaires . . . . . . . 273
8.3 E.D.P. « spatiales » impliquant l’operateur laplacien . . . . . . . . . . . . 2748.3.1 Exemples et analogies physiques ; conditions aux limites . . . . . . 2748.3.2 Unicite des solutions ; identite de Green ; separation des variables . 2768.3.3 Equation de Laplace Δf = 0 dans le plan et fonctions d’une
variable complexe ; applications hydrodynamiques . . . . . . . . . 279
9 Principes variationnels 2839.1 Exemples historiques ; formalismes de Lagrange et de Hamilton . . . . . . 283
9.1.1 Principes de Fermat, Maupertuis, Lagrange . . . . . . . . . . . . . 2839.1.2 Principe de Hamilton dans l’espace de phase . . . . . . . . . . . . 2869.1.3 Equations d’Euler-Lagrange ; symetries et lois de conservation ;
E.D.P. d’Hamilton-Jacobi . . . . . . . . . . . . . . . . . . . . . . . 2879.1.4 Equations de Hamilton et geometrie de l’espace de phase . . . . . 289
9.2 Principes de moindre action et generalisation des mouvements inertiels . . 2909.2.1 Collisions et introduction de la masse inertielle . . . . . . . . . . . 2909.2.2 Particules chargees et interactions electromagnetiques . . . . . . . 2919.2.3 Temps propre et gravitation ; courbure de l’espace-temps . . . . . 294
9.3 Champs et principes de moindre action . . . . . . . . . . . . . . . . . . . 297
Table des matieres v
9.3.1 Equations de Maxwell ; action de Schwarzschild . . . . . . . . . . . 2979.3.2 Equation de Schrodinger ; theoreme adiabatique . . . . . . . . . . . 2989.3.3 Equations d’Einstein de la gravitation ; action de Hilbert . . . . . 299
10 Probabilites ; processus aleatoires 30010.1 Langage des probabilites . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300
10.1.1 Grandeurs aleatoires et raisonnements logiques ; conditionnement . 30110.1.2 Probabilites ; lois de probabilite . . . . . . . . . . . . . . . . . . . . 30210.1.3 Grandeurs moyennes ; moments ; correlations . . . . . . . . . . . . 307
10.2 Origine et discussion de quelques lois importantes en physique . . . . . . . 30810.2.1 Theoreme de la limite centrale et lois gaussiennes . . . . . . . . . . 30810.2.2 Loi binomiale et loi de Poisson . . . . . . . . . . . . . . . . . . . . 31010.2.3 Loi de Boltzmann ; generalisations ; statistiques quantiques ;
reponse lineaire et fluctuations . . . . . . . . . . . . . . . . . . . . 31210.2.4 Estimation et lois de χ2 (khi-deux) . . . . . . . . . . . . . . . . . . 315
10.3 Processus aleatoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31710.3.1 Marche aleatoire ; processus de diffusion ; mouvement brownien . . 31710.3.2 Processus de Markov ; probabilites de transition ; bilan detaille . . 31910.3.3 Processus stationnaires ; theoreme de Wiener-Khintchine ;
ergodicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
11 Analyse numerique ; physique discrete 32311.1 Discretisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324
11.1.1 Representation des nombres ; erreurs ; stabilite numerique . . . . . 32411.1.2 Derivation et integration ; extrapolation de Richardson . . . . . . . 32611.1.3 Nombres aleatoires ; methode de Monte-Carlo . . . . . . . . . . . . 327
11.2 Resolution numerique d’E.D. et d’E.D.P. . . . . . . . . . . . . . . . . . . . 32811.2.1 Systemes dynamiques ; schemas d’Euler et de Runge Kutta . . . . 32811.2.2 E.D. avec conditions aux limites ; methode de tir . . . . . . . . . . 33011.2.3 E.D.P. avec conditions initiales : propagation, diffusion . . . . . . . 331
11.3 Approximation de fonctions ; interpolation ; moindres carres ; methode deBezier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33411.3.1 Approximations polynomiales (Tchebytchev, B-splines...) . . . . . 33411.3.2 Interpolation de Lagrange et par “cubic-splines” . . . . . . . . . . 33711.3.3 Methode des moindres carres . . . . . . . . . . . . . . . . . . . . . 33911.3.4 Methode de Bezier . . . . . . . . . . . . . . . . . . . . . . . . . . . 341
11.4 Resolution d’equations, d’E.D. et d’E.D.P. lineaires . . . . . . . . . . . . . 34311.4.1 Equations lineaires regulieres et singulieres . . . . . . . . . . . . . 34311.4.2 E.D. et E.D.P. lineaires ; methodes spectrales ; elements finis . . . . 347
11.5 Recherche de minima . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35011.5.1 Methodes utilisant le gradient . . . . . . . . . . . . . . . . . . . . . 35011.5.2 Methodes du simplex et du recuit simule . . . . . . . . . . . . . . . 352
Index 354
Liste des abreviations
A.R.Q.S. approximation des regimes quasi-stationnaires.
c.d.m. centre de masse.
C.I. condition initiale.
C.L. condition aux limites.
E.D. equation differentielle.
E.D.L. equation differentielle lineaire.
E.D.L.S. equation differentielle lineaire stationnaire.
E.D.P. equation aux derivees partielles.
E.V. espace vectoriel.
L.C. loi de conservation.
S.D. systeme dynamique.
S.D.L. systeme dynamique lineaire.
S.D.L.S. systeme dynamique lineaire stationnaire.
T.F. transformee de Fourier.
v.a. variable aleatoire.
Table des sujets de physique
1. Generalites
1.1 Caractere algebrique des grandeurs physiques : Chapitre 1, pages 10-15.
1.2 Dimensions ; analyse dimensionnelle : Chapitre 1, pages 15-21.
1.3 Grandeurs (pseudo)scalaires, (pseudo)vectorielles, quadrupolaires : Chapitre 3,pages 59-63 et Chapitre 4, pages 103-104.
1.4 Notation complexe : Chapitre 2, pages 39-42.
1.5 Statistiques de Gauss et de Poisson : Chapitre 10, pages 308-312.
1.6 Loi du χ2, estimation : Chapitre 10, pages 315-316.
2. Mecanique classique
2.1 Etude de mouvements- Coordonnees polaires : Chapitre 2, pages 31-33.- Mouvements de Kepler, harmonique, uniformement accelere, de precession, d’une par-ticule chargee dans un champ magnetique, pendule de Foucault : Chapitre 2, pages 36-38et Chapitre 6, pages 182-187.- Portraits de phase de mouvements a une dimension : Chapitre 6, pages 169-174.
2.2 Oscillateurs- Oscillateurs lineaires amortis : Chapitre 6, pages 174-175.- Oscillateurs parametriques, approximation adiabatique : Chapitre 6, pages 173-174 etpages 193-196.- Oscillateurs non lineaires : Chapitre 6, pages 171-174 et pages 197-203.- Oscillateurs lineaires couples : Chapitre 4, pages 92 et 100 et Chapitre 6, pages 178-180.- Chaıne d’oscillateurs, limite continue, corde vibrante : Chapitre 8, pages 253-260.
2.3 Mecanique et principes variationnels- Principes de Lagrange et de Hamilton : Chapitre 9, pages 283-287.- Equations d’Euler-Lagrange, symetries et lois de conservation : Chapitre 9,pages 287-289.- Introduction de la masse inertielle et des interactions electromagnetiques : Chapitre 9,pages 290-293.
2.4 Autres sujets- Changements de referentiels, referentiel du centre de masse, probleme des deux corps :Chapitre 3, pages 77-80.- Cinematique et dynamique du solide : Chapitre 3, pages 80-82.- Energie potentielle d’un systeme de points materiels et en electromagnetisme : Chapitre7, pages 231-234.- Resonance magnetique nucleaire : Chapitre 6, pages 177-178.
viii Table des sujets de physique
3. Hydrodynamique et milieux continus
3.1 Deformations et contraintes ; elasticite, viscosite : Chapitre 4, pages 105-108.
3.2 Derivee en suivant le mouvement ; theoremes de l’hydrodynamique : Chapitre 7,pages 212-214 et 226-227.
3.3 Flux de masse, de quantite de mouvement, d’energie ; bilans : Chapitre 3, pages 70-71et Chapitre 7, pages 227-231.
3.4 Autres sujets- Equations adimensionnees : Chapitre 1, page 20.- Ecoulements irrotationnels incompressibles : Chapitre 8, pages 274-277 et pages 279-282.
4. Thermodynamique et physique statistique
4.1 Entropie- Introduction statistique : Chapitre 1, pages 8-10.- Proprietes des fonctions S(U) et applications (thermalisation, travail maximum, tran-sitions solide-liquide et paramagnetique-ferromagnetique) : Chapitre 5, pages 141-144.- Proprietes des fonctions S(U, V ) et applications (gaz parfait, fluide de Van der Waals,corps noir) : Chapitre 7, pages 238-242.
4.2 Potentiels thermodynamiques ; equilibres, deplacements d’equilibres, parametre d’ordre :Chapitre 7, pages 242-243.
4.3 Loi de Boltzmann ; reponse lineaire, fluctuations ; statistiques quantiques : Chapitre 10,pages 312-315.
4.4 Phenomenes de diffusion et de transport- Marche au hasard, limite continue : Chapitre 10, pages 317-319.- Equations de diffusion, de Fokker-Planck, de Boltzmann : Chapitre 8, page 262, pages267-268 et pages 271-272.
5. Electricite et electromagnetisme
5.1 Circuits electriques- Conventions et lois de l’electricite : Chapitre 1, pages 12-15.- Forces exercees sur les circuits : Chapitre 7, pages 231-234.- Limite continue, lignes electriques : Chapitre 8, pages 257-259.
5.2 Equations de Maxwell. Formulation integrale, approximation des regimes quasi-station-naires, milieux dielectriques et magnetiques, equations de propagation, rayonnement :Chapitre 7, pages 245-252. Formulation variationnelle : chapitre 9, page 297.
5.3 Autres sujets- Utilisation des symetries : Chapitre 3, pages 83-86.- Conducteurs en mouvement, loi de Lenz : Chapitre 7, page 226.- Images electriques : Chapitre 8, pages 276-277.- Milieux dielectriques anisotropes : Chapitre 8, pages 262-263.- Invariance relativiste : Chapitre 4, page 117.
Table des sujets de physique ix
6. Relativite
6.1 Groupe de symetrie et invariance des lois physiques- Generalites : Chapitre 3, pages 51-53.- Transformations de Lorentz, approximation galileenne : Chapitre, 3 pages 53-55.
6.2 Relativite d’Einstein- Temps propre, quadrivecteurs : Chapitre 4, pages 111-115.- Mecanique-electromagnetisme : Chapitre 4, pages 115-117 et chapitre 9 pages 290-293et pages 295-296.
6.3 Relativite et gravitation- Geodesiques, courbure, metrique de Schwarzchild : Chapitre 9, pages 294-297.- Equations d’Einstein : Chapitre 9, page 299.
7. Optique
7.1 Optique geometrique- Principe de Fermat, lois de Descartes, theoreme de Malus : Chapitre 3, pages 67-68 etChapitre 9, pages 283-284.- Optique matricielle des systemes centres : Chapitre 4, pages 108-111 et Chapitre 6,pages 187-190.- Etendue optique et luminance : Chapitre 3, pages 73-74.- Caustiques et aberrations : Chapitre 7, pages 234-238.
7.2 Interferences- Interferences en lumiere monochromatique : Chapitre 2, pages 42-45 et Chapitre 3,pages 64 et 67.- Localisation : Chapitre 3, page 68.- Interferences en lumiere non monochromatique : Chapitre 2, pages 44-45 et Chapitre5, page 159.
7.3 Diffraction de Fresnel et de Fraunhofer- Principe d’Huygens-Fresnel : Chapitre 2, pages 45-46 et Chapitre 5, page 150.- Filtrage optique ; optique de Fourier : Chapitre 5, pages 161-165.
7.4 Lumiere polarisee ; etats de polarisation, interferences : Chapitre 2, pages 46-50.
8. Ondes
8.1 Ondes planes- Frequences spatiales ; lois de Descartes et des reseaux, formule de Bragg : Chapitre 3,pages 64-65 et pages 84-85.- Reflexion, transmission, adaptation d’impedance : Chapitre 6, pages 191-192 etChapitre 8, page 260.- Relations de dispersion ; paquets d’ondes ; ondes guidees : Chapitre 8, pages 262-267.
8.2 Approximation de l’optique geometrique ; surfaces d’onde et rayons : Chapitre 7,pages 234-236.
8.3 Equations de propagation a une et trois dimensions- Solution generale ; fonctions de Green ; ondes stationnaires : Chapitre 8, pages 267-272.- Approximation de Born de la diffusion : Chapitre 8, page 278.
x Table des sujets de physique
8.4 Ondes non lineaires ; ondes de choc ; ondes solitaires : Chapitre 7, pages 207 et 228 etChapitre 8, pages 273-274.
9. Physique quantique
9.1 Etats quantiques, amplitudes de probabilite, evolution : Chapitre 4, pages 118-120.
9.2 Dynamique des systemes a deux etats ; transitions quantiques : Chapitre 4,pages 120-124.
9.3 Equation de Schrodinger a une dimension- Fonctions d’onde ; oscillateur harmonique : Chapitre 4, pages 124-129.- Puits et barrieres de potentiel, potentiels periodiques : Chapitre 6, pages 190-194.
9.4 Physique quantique relativiste- Matrices de Pauli et espace-temps ; spineurs : Chapitre 4, pages 101-103.- Champs quantiques ; particules et antiparticules : Chapitre 4, pages 130-132.
9.5 Autres sujets- Lois de conservation : Chapitre 3, page 85.- Spineurs et moments cinetiques : Chapitre 4, pages 103-105.- Emissions spontanee et induite ; coefficients d’Einstein : Chapitre 4, pages 129-130 etChapitre 10, page 321.- Statistiques de Fermi-Dirac et de Bose-Einstein : Chapitre 10, page 314.- Theoreme adiabatique ; distinction « travail-chaleur » ; phase de Berry ; transport quan-tique : Chapitre 9, pages 298-299.- Diamagnetisme et paramagnetisme ; effet Aharonov-Bohm : Chapitre 9, page 293.
Avant-propos
Cet avant-propos est destine a expliciter l’esprit qui a prevalu a la redaction de cetouvrage et a permettre au lecteur d’en tirer le meilleur profit.
Esprit et originalite de l’ouvrage
Ce livre a son origine dans l’elaboration de documents de travail pour “agregatifs” dephysique constitues de questions-exercices de mathematiques ayant un rapport direct avecle programme du concours. Sous sa forme actuelle, qui s’adresse a un public plus large,cet ouvrage reprend les principaux concepts et techniques mathematiques intervenantdans la physique enseignee en premier et second cycles universitaires, et les illustre parde nombreux exemples issus de toutes les branches de la physique. Son objectif est demettre en avant l’interet des mathematiques pour la physique en montrant comment unmeme concept ou resultat mathematique intervient dans des domaines de physique parfoistres eloignes les uns des autres, ce qui souligne l’essence mathematique de beaucoupd’idees physiques. Il ne s’agit donc ni d’un livre de “methodes mathematiques pour laphysique”, avec definitions, lemmes et theoremes, offrant un cadre rigoureux a un nombrelimite d’applications physiques, ni d’un livre d’entraınement a la resolution de problemesreduisant les mathematiques au role d’outils de calcul.
Quelques exemples
Des savoir-faire “typiques” de physicien, comme par exemple1) l’etablissement du signe correct dans une relation en raisonnant sur un cas particulier,2) l’utilisation d’arguments dimensionnels pour retablir des parametres poses egaux a 1lors du calcul d’une expression,3) l’emploi d’arguments de symetrie pour determiner la direction d’un champ vectorielen un point,reposent tous sur la propriete des lois physiques d’etre invariantes par rapport a ungroupe de transformations. S’il veut transmettre ce savoir le physicien se doit d’explicitercette notion d’invariance, ce qui implique de preciser les transformations considerees etla maniere dont elles agissent sur les grandeurs physiques. Ces informations sont nonseulement tres fondamentales mais aussi tres pratiques.Dans le premier cas ce sont le caractere algebrique des grandeurs physiques et l’invariancedes lois par rapport aux changements de conventions de signe qui sont en jeu. L’exemple,donne au chapitre 1, d’un systeme electromecanique simple, avec 64 combinaisons de signepossibles, montre la relativite des conventions et la possibilite d’en choisir une sans pertede generalite (de meme qu’on traite un probleme dans un referentiel). Dans le secondcas c’est l’invariance des lois par rapport aux changements d’unites qui est concernee.Cette propriete permet d’adimensionner des equations (ce qui simplifie beaucoup decalculs) et de faire des predictions dimensionnelles (par exemple estimer des ordres degrandeurs). Quant aux arguments de symetrie, on montre par exemple au chapitre 3 que,conjuguee a la linearite, l’invariance par rapport aux transformations les plus simples(les translations) conduit a la fois aux lois de Descartes (translations “continues”), auxformules des reseaux optiques et de Bragg pour les cristaux (translations “discretes”) et
xii Avant-propos
aussi a la loi de conservation de la quantite de mouvement et de l’energie (translationsspatiales et temporelles) en physique quantique.
Beaucoup d’autres exemples relatifs aux liens mathematiques-physique pourraient etredonnes. Ainsi au chapitre 5 on verra que ce qui se cache derriere une analyse de Fourierdes fonctions est la notion physique de filtrage, derriere une analyse “a la Dirac” celle dereponse impulsionnelle et derriere une analyse “probabiliste” celle de correlation.
Parties originales de l’ouvrage
En plus du caractere nouveau de son approche ce livre contient certaines presentations,discussions et demonstations originales (ou partiellement originales) comme :
- les introductions des dimensions (section 1.3.1), des groupes de symetrie (section 3.1.1),des bilans de grandeurs et ondes de choc a partir de l’exemple de la circulation automobile(section 7.2.4), de la masse d’inertie (section 9.2.1)...
- les discussions de la concavite de l’entropie dans des cas simples (section 5.1.4) et pourle gaz de Van der Waals (section 7.4.1), de la distinction entre signaux stationnaireschaotiques et quasiperiodiques (section 5.3.3), du principe d’Huygens Fresnel en liaisonavec la notion de filtrage (section 5.4.1), des volumes en grande dimension (section 7.2.1),des formules de Stokes et d’Ostrogradski pour des champs et des domaines dependant dutemps (section 7.2.3), de l’identite des vitesses de groupe et de l’energie (section 8.2.1)...
- les demonstrations des lois de Descartes et de ses generalisations (section 3.4.2), del’invariance relativiste de l’electromagnetisme (section 4.3.3), de la regle d’or de Fermiet de la loi exponentielle de desexcitation en quantique (section 4.4.2), du theoremeadiabatique classique (section 6.4.5) et quantique (section 9.4.2), de la solution causalede l’E.D.P. de propagation a trois dimensions (section 7.2.2), de la formule de Biot etSavart sans les potentiels vecteurs (section 7.5.1), des lois de conservation a partir desprincipes variationnels (section 9.1.3)...
Organisation de l’ouvrage
L’ouvrage contient dix chapitres consacres chacun a un grand domaine des mathe-matiques (nombres reels, complexes, espace et symetries, calcul lineaire, fonctions d’unevariable, de plusieurs variables, equations differentielles, aux derivees partielles, principesvariationnels, probabilites) ainsi qu’aux applications physiques correspondantes.
Chaque chapitre commence par une breve introduction du sujet (souvent historique)permettant de motiver son etude ainsi que la facon de l’aborder. Les aspects les plusmathematiques (definitions, principaux resultats...) sont ensuite presentes dans les premi-eres sections. Ces resultats font en general l’objet d’une demonstration rapide, certainscalculs etant laisses au lecteur ; sinon l’idee de la demonstration est donnee. Ils ne sontdonc jamais “parachutes” et leur appropriation par le lecteur est facilitee par la presencede nombreux exemples et eventuellement contre exemples.
Bien que l’imbrication mathematiques-physique soit permanente, les dernieres sectionsd’un chapitre sont generalement consacrees a des domaines particuliers de physique uti-lisant les techniques et concepts introduits auparavant. C’est le cas par exemple de l’op-tique de Fourier (en liaison avec la transformation de Fourier), de la formulation integralede l’electromagnetisme (en liaison avec l’analyse vectorielle), de l’etude des deformations(en liaison avec le calcul matriciel)...
Avant-propos xiii
Au total le livre comporte plus d’une centaine de sous-sections traitant d’un theme precis,a dominante mathematique ou physique. Leur redaction a ete concue de sorte a rendrechacune la plus autonome possible afin qu’un lecteur disposant d’un minimum de connais-sances puisse s’y reporter directement (moyennant eventuellement des renvois, signalesdans le texte, a d’autres sous-sections).
A la table des matieres usuelle a ete ajoutee une “table des sujets de physique” des-tinee aux lecteurs qui souhaitent retrouver un sujet de physique connu dans le “decoupageclassique” par specialites : Generalites, Mecanique classique, Hydrodynamique et milieuxcontinus, Thermodynamique et physique statistique, Electricite et electromagnetisme,Relativite, Optique, Ondes, Physique quantique.
Differents niveaux de lecture
Le profit tire de la lecture d’un livre depend bien sur de la culture du lecteur. Aussi lesauteurs sont-ils conscients qu’ils ne peuvent s’adresser a chacun avec la meme efficacite.Si il est vrai que les parties mathematiques sont en general facilement abordables car ellesne font appel qu’a des connaissances qui ne depassent que rarement le niveau licence, lesparties physiques demandent par contre de la part du lecteur une “participation active”.En effet, l’esprit meme du livre l’oblige a passer rapidement d’un domaine de physiquea un autre ; cet exercice auquel les etudiants ne sont pas habitues est pourtant a la basede l’acquisition d’une veritable culture en physique.
Le lecteur doit etre averti qu’il y a cependant differents niveaux de lecture de chaquechapitre ou meme de chaque section. Si certaines parties ne seront pleinement profitablesqu’a un etudiant de master ou meme un enseignant possedant deja un certain recul parrapport a la physique, d’autres peuvent tres bien etre lues par un etudiant de licenceou de classes preparatoires. Prenons l’exemple du chapitre 5 “fonctions d’une variable ;analyse des signaux”. Tout ce qui concerne la premiere section, a savoir l’informationcontenue dans un graphe, les derivees et developpements limites, l’integration et le lienentre la concavite de l’entropie et la thermodynamique releve des premieres annees delicence ; meme l’integration par la methode du col ou celle de la phase stationnaire,rarement introduites a ce niveau, peuvent etre lues compte tenu des exemples physiqueschoisis. Le contenu des deuxieme section “operations sur les fonctions et analyse deDirac” et troisieme section “transformee et analyse de Fourier” est en general enseigneen troisieme annee ; cependant certaines parties comme la transformee de Laplace sontabordables par un etudiant de deuxieme annee tandis que d’autres comme l’applicationdu filtrage d’un bruit blanc a l’equation de Langevin et aux telecommunications sont d’unniveau master. De meme dans la derniere section “optique de Fourier ; filtrage optique”,du niveau master, certaines parties peuvent interesser un etudiant de deuxieme annee.
Enfin le livre contient de nombreux passages ecrits en petits caracteres. Dans l’espritdes auteurs ces passages sont consideres comme des complements reserves a une secondelecture. C’est le cas par exemple des passages “metrologie” et “ensembles fractaux” duchapitre 1 sur les nombres reels, ou de certaines demonstrations de theoremes.
Remerciements
Les auteurs tiennent a remercier leurs collegues Y. Gabellini, O. Legrand, F. Peters,L. Petit, J.A. Sepulchre et D. Wilkowski pour la relecture de certains chapitres et leurssuggestions pertinentes, ainsi que G. Gonczi pour son aide a la realisation de certaines
xiv Avant-propos
figures, en particulier le trace de la surface S(U, V ) pour un fluide de Van der Waals.Ils sont egalement conscients que la redaction de certaines parties de cet ouvrage abeneficie indirectement de conversations avec de nombreux autres collegues notammentP. Coullet, J.L. Femenias, J.M. Levy Leblond, J.L. Meunier, ainsi que de l’experiencetiree de nombreux enseignements effectues en licence et maıtrise de physique, licenceE.E.A et preparation a l’agregation de physique.
Nice Mars 2004
Avant propos de la deuxieme edition
L’apport principal de cette nouvelle edition concerne le chapitre 11 “Analyse Numerique ;Physique Discrete”. Un tel chapitre, inhabituel dans les ouvrages de mathematiques pourla physique, nous semble devoir faire partie de la culture mathematique du physicien enraison de l’importance prise par le calcul et la simulation numeriques en physique. Ecritdans le meme esprit, a la fois introductif et synthetique, que les chapitres precedents,il s’efforce de couvrir les methodes les plus utiles au physicien, en precisant leurs li-mites (stabilite, precision ...). Le choix des sujets retenus, indispensable compte tenu del’etendue du domaine, a beneficie des discussions que nous avons eues avec B. Cessac, T.Corbard, J.L. Femenias, O. Legrand et J. Provost ; qu’ils en soient ici remercies.
Cette deuxieme edition a ete aussi l’occasion de quelques ajouts (geometrie spherique,notions de transport parallele et de courbure au chapitre 3, equation de Hamilton-Jacobi,formulation variationnelle des equations de Maxwell et geometrie symplectique au cha-pitre 9) et d’un effort d’amelioration de la lisibilite de l’ouvrage, notamment en faisantressortir les exemples et en ajoutant quelques figures.
Nice Juillet 2006
Avant propos de la troisieme edition
Cette troisieme edition a ete l’occasion d’introduire le lecteur a deux nouveaux sujets :la physique quantique relativiste au chapitre 4 (equations de Klein-Gordon, de Weyl etde Dirac, champs quantiques, particules et antiparticules) ; la theorie relativiste de lagravitation au chapitre 9 (metrique et courbure de l’espace-temps, equations d’Einstein).Un complement d’analyse numerique (methode de Beziers utilisee en CAO) a ete ajouteau chapitre 11. Enfin l’index a ete developpe pour permettre un meilleur acces aux motscle du livre.
Nice Octobre 2010
Chapitre 1
Nombres reels ; grandeursphysiques ; dimensions
Le but de ce chapitre n’est pas de rappeler au lecteur des techniques de calcul qu’ilconnait, mais d’insister sur des notions non triviales que recouvre l’emploi des reels enphysique. Parmi elles figurent la continuite, le caractere algebrique de la plupart desgrandeurs physiques, et la notion de dimension qui traduit l’invariance des lois physiquespour certains changements d’unites.
1.1 GRANDEURS PHYSIQUES ; CONTINUITE ; PARAMETRAGESADDITIFS
Les nombres servent a comparer entre elles, notamment avec celle qui sert d’unite,des grandeurs de meme nature et a transcrire la loi de composition de ces grandeurs.L’exemple qui a servi de prototype depuis la theorie des grandeurs d’Euclide (� 400 av.J.-C.) jusqu’a la construction recente des nombres reels (Cantor, Dedekind �1870) estla description des longueurs sur une “droite”. Aujourd’hui encore, meme si la plupartdes appareils de mesure avec une aiguille se deplacant devant un cadran sont remplacespar des appareils a affichage numerique, l’identification (“isomorphisme local”) grandeurphysique-longueur sur une droite reste valable. En particulier deux notions communessont tres importantes : celle de continuite et celle de parametrage additif de la loi decomposition.
1.1.1 Survol « physique » des ensembles N, Z, Q, R
� Composition de grandeurs additives
L’introduction de l’ensemble N des nombres entiers 0,1,2... n’est evidemment pasqu’une question de numerotation. L’important est qu’ils sont generes par une operationrecurrente : le passage de n a n+ 1. C’est cette operation fondamentale “addition d’une
2 1 • Nombres reels ; grandeurs physiques ; dimensions
unite” que l’on reconnaıt dans de tres nombreuses situations experimentales : mise bouta bout de segments identiques sur une droite, repetition d’une rotation autour d’unaxe, accrochages successifs de masses pesantes identiques a un ressort, mise en serie deforces electromotrices identiques, etc. Ces operations physiques possedent les proprietesde commutativite et d’ associativite qu’on transcrit par l’addition au niveau des nombres.L’entier q = 1 + 1 + 1 + · · ·+ 1 represente alors la grandeur obtenue en composant q foisavec elle meme la grandeur unite, et le nombre 0 l’operation “neutre”, qui consiste parexemple a ne rien accrocher au ressort. Enfin si on compose la grandeur associee a q avecelle meme, on obtient les grandeurs associees a 2q, 3q . . . L’operation de multiplicationainsi introduite est, on le sait, commutative, associative et distributive par rapport al’addition.
� Changements d’unite
On peut adopter un autre point de vue qui est l’analogue du point de vue passif lors d’unchangement de referentiel (cf. section 3.1.1). Il consiste a considerer que le regroupementq par q de la grandeur unite definit une nouvelle unite q fois plus grande. Alors desgrandeurs correspondant aux nombres x′ = 0, 1, 2, 3 . . . lorsqu’elles sont obtenues parcomposition de cette nouvelle unite correspondent comme on l’a vu aux nombres x =0, q, 2q, 3q . . . pour l’ancienne unite. Inversement pour representer numeriquement avec lanouvelle unite des grandeurs correspondant a x = 0, 1, 2 . . . p . . . on est amene a introduireles nombres fractionnaires, x′ =
p
qsignifiant x = p.
� Nombres algebriques
Pour de nombreuses grandeurs physiques il existe une operation inverse de l’addition,comme par exemple lors de la mise bout a bout de segments orientes. On est alors amenea introduire l’ensemble des entiers algebriques Z = (· · · − 2,−1, 0, 1, 2 . . . ), l’ensembledes nombres rationnels Q =
{pq
; p ∈ Z, q �= 0 ∈ Z
}, et les regles du calcul algebrique
(les fameuses “regles des signes”) afin d’etendre a Z et Q les proprietes de l’addition etde la multiplication sur N. Compte tenu de son importance deux sections (1.2.1,2) sontconsacrees au caractere algebrique des grandeurs physiques.
� Commensurabilite et incommensurabilite
Une question a de longue date preoccupe les scientifiques : peut-on toujours comparerdeux grandeurs (de meme nature) a l’aide de Q ? Si oui elles sont commensurables et ilexiste une unite telle que la premiere vale p ∈ Z et la seconde q ∈ Z. Mais la reponse a
cette question est non, et etait deja connue des Grecs (relationsd2
a2= 2 entre diagonale
et cote d’un carre, l = πd entre circonference et diametre d’un cercle...). D’ou les autresquestions : les grandeurs “irrationnelles” vis-a-vis d’une unite sont-elles une exceptionou la regle quasi generale? Peut-on les comparer entre elles et par quel ensemble doit-on remplacer Q pour les mesurer ? Les Grecs avaient constate que les irrationnels sont“plus nombreux” que les rationnels mais ils n’ont pu repondre de maniere complete a ladeuxieme question. On sait aujourd’hui que les rationnels forment un ensemble dense,bien que de mesure de Lebesgue nulle, dans l’ensemble des reels R.
1.1 Grandeurs physiques ; continuite ; parametrages additifs 3
� Continuite ; nombres reels
L’approche moderne des nombres reels reprend a son compte toutes les proprietes rela-tives a Q (addition, multiplication, ordre, distance...) et donne une methode de construc-tion par “approximations successives” de l’ensemble R. Cette methode fait appel al’axiome d’Archimede, qui stipule que quels que soient x et y il existe n ∈ N telque n|x| ≥ |y|, et a l’axiome de Cauchy des intervalles emboites, selon lequelil existe un nombre x et un seul dans la famille d’intervalles {In = [an, bn]} tels queIn+1 ⊂ In et |bn−an| → 0 quand n→∞. En pratique le premier axiome permet d’enca-
drer tout reel x par des rationnelsp
qetp+ 1q
, et le second permet par des encadrements
emboites · · ·[pnqn
[pn+1
qn+1· · · pn+1 + 1
qn+1
]pn + 1qn
]· · · de definir x comme la limite des
pnqn
ou
pn + 1qn
lorsque qn tend vers l’infini ; on dit que Q est un ensemble dense dans R. Bien
evidemment on s’assure que cette definition des reels comme limite de suite de rationnelsest unique (notion de suites equivalentes), et qu’elle est compatible avec les operationsdefinies sur Q (si
pnqn
tend vers x etrnsn
vers y alorspnrnqnsn
tend vers xy = yx, etc.). En
base 10, qn = 10n (25, 37... = 2 101 + 5 100 + 3 10−1 + 7 10−2 + ...) ; en base 2, qn = 2n (lememe nombre est represente par une suite de 0 et de 1). En toute base on montre que lesrationnels correspondent a des suites de chiffres qui deviennent periodiques a partir d’un
certain rang, par exemple112
= 0, 83333... en base 10 et 0, 00 01 01 01... en base 2, tandis
que les non rationnels correspondent a des suites “chaotiques” (cf. π,√
2, le nombre d’or1 +
√5
2dont la suite des decimales peut servir a generer des nombres aleatoires...).
Le resultat le plus remarquable de cette construction est que R est un ensemble com-plet : toute suite de Cauchy de nombres reels (suite de nombres xn tels que |xn−xm| < εarbitrairement petit des que n et m > N(ε)) converge vers un nombre reel. On peut doncparler de “continuite des nombres reels” (a l’inverse de Q pour lequel les suites de Cauchy“sortent en general de l’ensemble”). Ceci permet par exemple de definir la continuited’une fonction f ou sa derivabilite : f est continue en x0 ∈ R si |f(x) − f(x0)| peutetre rendu arbitrairement petit pour x suffisamment proche de x0, et est derivable en
x0 sif(x0 + ε)− f(x0)
εadmet une limite (derivee en x0 notee f ′(x0) ou
dfdx
(x0)) pourε→ 0.
� Mesure de Lebesgue
Definie par μ([a, b]
)= b−a pour un intervalle [a, b], elle est nulle pour un point (encadre
par les intervalles In) de meme que pour un ensemble fini ou denombrable de points(par exemple Q), et elle s’etend a toutes les intersections et unions denombrables d’in-tervalles. Elle est invariante par translation et permet de definir l’integrabilite d’unefonction : au sens de Lebesgue (resp. Riemann) une fonction y = f(x) est integrablesi en partitionnant l’axe y (resp. x) en domaines Dn la quantite
∑n yn μ
(f−1(Dn)
)
4 1 • Nombres reels ; grandeurs physiques ; dimensions
(resp∑
n f(xn)μ(Dn)) a une limite, quels que soient les yn (resp. xn) appartenant aDn, lorsque les μ(Dn) tendent vers 0 (figure 1a, resp. 1b). Le premier point de vue estmathematiquement plus general (cf.
∫ 1
0f(x) dx, avec f(x) = 0 si x ∈ Q et 1 ailleurs,
qui vaut 1 pour Lebesgue et n’est pas definie pour Riemann) et pas moins physique (cf.section 5.3.3).
Dn
Dn
x� �
x x
(Dn)(a) (b)( )f −1 ( )nD
{
��������������
��������������
��������������
��������������
�������
�������
������������������������
������������������������yn
f(xn)
n
f(x) f(x){
Figure 1
1.1.2 Parametrage additif des lois de composition ; logarithmes
� Reperage des grandeurs
Reprenons l’exemple qui consiste a suspendre des masses a un ressort. En pratique,pour les comparer, on “repere” les masses en leur associant le nombre reel x corres-pondant a l’elongation du ressort. Mais comme la reponse d’un ressort n’est pas lineaire(son comportement n’est approximativement lineaire que pour des petites deformations),l’operation physique qui consiste a accrocher simultanement deux masses ne conduit pasen general a la somme x1 + x2 des elongations correspondant a chacune des masses maisa un autre nombre x1 ∗ x2. Cette loi de composition (x1, x2) → x1 ∗ x2 est cependantcommutative, associative et possede un element neutre que l’on peut toujours noter 0.(Le nombre x peut ne pas avoir d’inverse pour cette loi.)
� Parametrage additif
Pour tout reperage raisonnable (x1 ∗ x2 continu et derivable par rapport a x1 et x2), ondemontre qu’on peut trouver une fonction ϕ(x), definie a une constante multiplicative λpres, telle que :
ϕ(x1 ∗ x2) = ϕ(x1) + ϕ(x2) ; ϕ(0) = 0 .
Donc si on associe a chaque grandeur non plus xi mais ϕi = ϕ(xi), la loi de compositionx = x1 ∗ x2 devient additive ϕ = ϕ1 + ϕ2. La mesure d’une grandeur, par oppositiona son reperage, consiste precisement a trouver ce parametrage additif. La grandeurunite est par definition celle pour laquelle ϕ = 1. Quant a la liberte du changement deparametrage ϕ→ λϕ, elle correspond au choix toujours possible d’une unite λ fois pluspetite. Remarquons que ce parametrage additif est la version continue de l’etalonnage
qui consiste a associer ϕ = 1 a un certain nombre x1, puis ϕ =1q
au nombre xq tel que
q fois︷ ︸︸ ︷xq ∗ · · · ∗ xq = x1 et ϕ =
p
qau nombre
p fois︷ ︸︸ ︷xq ∗ · · · ∗ xq.
1.1 Grandeurs physiques ; continuite ; parametrages additifs 5
EXEMPLES. Une regle bien graduee traduit additivement la composition “physique”des translations. Un cercle bien gradue traduit additivement la composition des ro-tations (le parametre additif etant l’angle). La loi de composition des changementsde referentiels inertiels a une dimension, qui s’ecrit pour les vitesses relatives
v = v1 ∗ v2 = (v1 + v2)(1 +
v1v2c2
)−1
(|vi| < c) devient ϕ = ϕ1 + ϕ2 en introduisant la rapidite relative ϕ definie par :
eϕ =
√1 + v
c
1 − vc
ou ϕ =12
ln1 + v
c
1 − vc
ouv
c=eϕ − e−ϕ
eϕ + e−ϕ= tanh ϕ .
(ϕ est mesurable directement par effet Doppler ; cf. section 4.3.3). La vitesse v n’estun parametre additif que dans la limite galileenne v � c (tanh ϕ � ϕ� 1).
� Multiplication et logarithme
Le logarithme Loga x d’un nombre x positif est le parametrage qui rend additif la loi demultiplication (x1, x2) → x1x2 sur R+ :
Loga x1x2 = Loga x1 + Loga x2 (ce qui implique Loga 1 = 0) .
L’unite du parametrage, appelee base a du logarithme, est le nombre dont le logarithmevaut 1 : Loga a = 1. Comme un changement d’unite, donc ici de base, correspond al’introduction d’un facteur multiplicatif λ on doit avoir Loga x = λLogb x ; en posantx = b puis x = a dans cette relation on trouve λ = Loga b =
(Logb a
)−1. Les logarithmesles plus utilises sont les logarithmes neperien (a base e � 2, 7) note ln et decimal (abase 10) note log. Il est utile d’avoir en memoire les deux valeurs approchees ln 10 =(log e
)−1 � 2, 3 et log 2 � 0, 3. La fonction logarithme verifie :
d Loga xdx
= limε→0
Loga (x+ ε) − Loga xε
= limε→0
Loga(1 + ε
x
)ε
=1x
(d Loga x
dx
)x=1
.
Le logarithme neperien est celui pour lequeld ln x
dx=
1x
(figure 2b).
�
� �x = e
e
1
−1
(a)
1 e
(b)
= ln x
1
−11 x
e
e
Figure 2
6 1 • Nombres reels ; grandeurs physiques ; dimensions
EXEMPLES. En chimie, les logarithmes decimaux sont utilises pour parametrer desconcentrations ou des activites : pH = − log
[H3O
+]et pKa = − log
([A−][H+][AH ]−1
).
En physique on les introduit pour mesurer des rapports de puissance en decibels. Unrapport de 10 dans les puissances correspondant par definition a un ecart de 10 decibels(1 Bel) en “echelle logarithmique”, on a :
“P2
P1en decibels ” = 10 log
P2
P1.
Un rapport de 2 correspond a 3 decibels. Les decibels (dB) sont utilises en acoustiqueou les “puissances sonores” sont comparees au seuil d’audibilite P0 egal a 10−12 Wm−2.Ainsi 70 dB correspondent a 107P0 = 10−5 Wm−2.En electronique il servent a mesurer les gains ; par exemple si la tension a la sortie d’unsysteme est Vs et la tension a l’entree est Ve, sachant que le rapport des puissances est
comme(VsVe
)2
, on pose : “gain en dB” = 20 logVsVe
. Dans le domaine des frequences
temporelles une octave designe un rapport de 2 et une decade un rapport de 10 ; ona donc “
ω2
ω1en octaves (ou decades) ” = Log2 (ou 10)
ω2
ω1.
En astronomie un rapport de flux lumineux est mesure en (ecart de) magnitude par
Δm = 2, 5 logF2
F1.
Voir aussi la definition de l’entropie a la section 1.1.4.
1.1.3 Fonction et notation exponentielles ; applications
� Multiplication et fonction exponentielle
L’operation exponentielle sur R est l’operation inverse du logarithme (figure 2a) :
ϕ = ln x⇐⇒ x = eϕ ; ϕ = Loga x⇐⇒ x = aϕ (a > 0) .
Elle fait donc correspondre a la somme ϕ1+ϕ2 d’elements de R le produit x1x2 d’elementsde R+. Les proprietes suivantes de l’exponentielle sont des consequences immediates decelles du logarithme :
ab+c = ab ac , ab = eb lna ,(ab
)c = abc , a0 = 1 (a > 0) .
Ainsi par exemple ab = eb ln a car ln ab = (Loga ab) ln a = b ln a.
La fonction eϕ (notee aussi expϕ) peut etre obtenue plus explicitement comme limite ousous la forme d’un developpement en serie convergente :
eϕ = limN→∞
(1 +
ϕ
N
)N= 1 + ϕ+
ϕ2
2!+ · · ·+ ϕp
p!+ . . . (e = 1 + 1 +
12
+16
+ · · · � 2, 7) .
La premiere expression se deduit du fait que ln(1 +
ϕ
N
)N= N ln
(1 +
ϕ
N
)tend vers ϕ
lorsque N tend vers l’infini. Quant au developpement en serie il se deduit de la formule
du binome :(1 +
ϕ
N
)N=
N∑p=0
CpN
( ϕN
)p N→∞−−−−−−→∞∑p=0
ϕp
p!. eϕ possede la propriete
1.1 Grandeurs physiques ; continuite ; parametrages additifs 7
remarquable d’etre sa propre derivee (cf. son developpement en serie ou la relationdeϕ
dϕ=
dxd ln x
= x = eϕ).
� Applications physiques
En physique les fonctions exponentielles apparaissent souvent a travers leur proprietecaracteristique
f(ϕ1 + ϕ2) = f(ϕ1) f(ϕ2) equivalente a f ′(ϕ) = f ′(0) f(ϕ)
(puisquef(ϕ+ ε)− f(ϕ)
ε= f(ϕ)
f(ε)− 1ε
). Par exemple le rapport p(τ) =N(t+ τ)N(t)
des
populations de noyaux radioactifs non desintegres aux instants t+ τ et t doit verifier
p(τ1 + τ2) = p(τ1) p(τ2)
si l’on suppose qu’il ne depend que de l’intervalle de temps τ et pas de t ; en effet :
N(t+ τ1 + τ2)N(t)
=N(t+ τ1 + τ2)N(t+ τ2)
N(t+ τ2)N(t)
.
On en deduit que la loi qui decrit la desintegration radioactive est du type p(τ) =
exp (−λτ), ou exp(−τ ln 2
T
)en introduisant la demi-periode T c’est-a-dire le temps
au bout duquel la moitie des noyaux de l’echantillon se sont desintegres. On etablit parle meme raisonnement que l’attenuation de l’intensite d’une onde se propageant selonOx dans un milieu homogene est donnee par la loi d’absorption de Beer
I(x+ l) = I(x) e−αl
ou αl = lnI(x)
I(x+ l)� 2, 3 log
I(x)I(x+ l)
. Par exemple une attenuation de 0,2 dB par
kilometre correspond a logI(x)
I(x+ l)= 2 10−2 et l = 103m, soit α � 4, 6× 10−5m−1.
� Developpement de Taylor et ecriture exponentielle
L’approche de l’exponentielle eϕ par une limite ou une serie ne fait appel qu’aux pro-prietes des deux operations + et × sur les reels. L’extension de l’exponentielle a d’autresobjets mathematiques que les reels (nombres complexes, matrices carrees, operateursdifferentiels...) est tres utilisee. Ainsi, a titre d’exemple la formule de Taylor (pour les“bonnes” fonctions)
f(x+ a) = f(x) + a f ′(x) +a2
2!f ′′(x) + · · ·+ ap
p!f (p)(x) + · · · = ea
ddx f(x)
s’ecrit a l’aide de l’exponentielle deddx
. Cela se comprend en remarquant qu’on passe de
f(x) a f(x+
a
N
)par f
(x+
a
N
) � f(x)+a
Nf ′(x) =
(1+
a
N
ddx
)f(x), et par consequent
de f(x) a f(x+ a) par l’application de limN→∞
(1+
a
N
ddx
)N= ea
ddx . (On etablit de meme
pour l’operation de dilatation : f(eax) = eaxddx f(x).) On dit que l’operateur derivation
8 1 • Nombres reels ; grandeurs physiques ; dimensions
ddx
est le generateur des translations f(x) → f(x + a). En physique quantique lesgenerateurs des transformations “continues” effectuees sur les etats ou fonctions d’onde,translation d’espace, de temps, rotation, sont associes a des observables, quantite demouvement, energie, moment cinetique (cf. sections 4.4).
� Fonctions hyperboliques (figure 3)
A la fonction eϕ sont reliees les fonctions cosinus hyperbolique (paire), sinus et tangentehyperboliques (impaires)
cosh ϕ =eϕ + e−ϕ
2, sinh ϕ =
eϕ − e−ϕ
2, tanh ϕ =
sinh ϕcosh ϕ
,
dont les proprietes principales (analogues a celles des fonctions trigonometriques) sontdes consequences immediates de celles de eϕ :
�
�
�
�
�
cosh
tanh
0
2e
1
sinh −1
Figure 3
cosh ϕ =∞∑0
ϕ2n
(2n)!; sinh ϕ =
∞∑0
ϕ2n+1
(2n+ 1)!; tanh ϕ = ϕ− ϕ3
3+ · · · ;
(cosh ϕ)′ = sinh ϕ ; (sinh ϕ)′ = cosh ϕ ; (tanh ϕ)′ = (cosh ϕ)−2 ;
cosh2 ϕ− sinh2 ϕ = 1 ; cosh(ϕ1 + ϕ2) = cosh ϕ1 cosh ϕ2 + sinh ϕ1 sinh ϕ2 ;sinh(ϕ1 + ϕ2) = sinh ϕ1 cosh ϕ2 + cosh ϕ1 sinh ϕ2 ;
tanh(ϕ1 + ϕ2) =tanh ϕ1 + tanh ϕ2
1 + tanh ϕ1 tanh ϕ2.
On les rencontre essentiellement en relativite d’Einstein et en mecanique statistique.
1.1.4 Mesure additive du desordre microscopique ; grandsnombres et entropie
� Definition et exemples
L’entropie S introduite par Clausius en 1854 reste encore pour certains une grandeurmysterieuse. En fait ses proprietes decoulent de l’interpretation qu’en a donne Boltzmann(∼1877) : S est une mesure additive du “desordre microscopique” (ou plutot de la “liberte
1.1 Grandeurs physiques ; continuite ; parametrages additifs 9
microscopique”, voir ci-dessous) donnee parS = kB ln Ω
(kB = R
N = 1, 4 × 10−23 J.K−1).
Ω est le nombre d’etats microscopiques (specifies chacun par les positions, quantites demouvement et etats quantiques de toutes les particules) compatibles avec les valeurs V ,U , etc. des grandeurs volume total, energie interne totale, etc. qui caracterisent un etatd’equilibre macroscopique.
EXEMPLES. Pour un gaz parfait constitue de N particules dans un volume V , le
volume “libre” moyen par particule estV
Net le nombre de configurations de position
est donc proportionnel a(VN
)N. Pour un gaz parfait monoatomique, on etablit (cf.
section 7.2.1.) que la contribution a Ω du desordre dans l’espace des vitesses ou quan-
tites de mouvement est proportionnelle a(U/N
) 32N ; on peut dire aussi que (2mU/N)
32
est un volume “libre” typique dans l’espace (px, py, pz) pour une particule d’energiep2
2m� U
N.
D’autres exemples (justifiables aussi par des arguments qualitatifs ou dimensionnels) sont : Ω ∝(UN
) 32N
(UN
) 32N pour un solide dont chacun des N atomes est assimile a un oscillateur a trois dimen-
sions (dans Ω un facteur est lie a la vitesse et l’autre a l’amplitude de la vibration ; V n’apparaıt pas
car il n’y a pas de “liberte” de position dans un solide) ; Ω ∝ maxN(VN
)N(UN
)3Nd’ou S ∝ V
14U
34
pour le corps noir (ici UN
� cp et on prend le maxN car le nombre de photons n’est pas fixe a priori ;
cf. remarque ci-dessous et sections 1.3.2 et 7.4.1).
� Consequences
Meme si Ω n’est calculable que dans un petit nombre de cas, la definition de S permetde comprendre les bases de la thermodynamique. On en deduit que S = 0 (Ω = 1) pourun systeme mecanique macroscopique (par exemple un piston, caracterise par uneposition et une vitesse), et que S est une grandeur extensive
S = S1 + S2 (Ω = Ω1Ω2)
pour un systeme compose de deux corps isoles l’un de l’autre par des contraintes. Oncomprend aussi l’evolution irreversible vers l’equilibre : si des contraintes sontsupprimees (systeme plus “libre”) alors Ωf , qui correspond a l’etat macroscopique finalmoins contraint, est non seulement plus grand que Ωi (correspondant a l’etat initial) maisen fait “infiniment plus grand”. Par exemple si on offre a un gaz un volume supplementaireΔV initialement vide (detente de Joule a U constant) on a, meme pour des valeurs aussi
petites que N = 10−9 moles etΔVV
= 10−6 :
ΩfΩi
=(V + ΔV
V
)N� exp
(N
ΔVV
)= exp (6 × 108)!
De meme si deux gaz monoatomiques ayant les memes valeurs fixees de N et V mais desenergies U1 �= U2 sont mis en contact thermique, on a
ΩfΩi
=
((U1+U2
2
)2
U1U2
) 32N
=(
1 +(U2 − U1)2
4U1U2
) 32N
,
10 1 • Nombres reels ; grandeurs physiques ; dimensions
rapport qui dans la pratique est lui aussi quasi infini. Si on admet que tous les etatsmicroscopiques sont equiprobables, on en deduit que le systeme des deux corps va, sousl’effet des interactions desormais permises par la suppression des contraintes, evoluer defacon “certaine” vers l’etat macroscopique correspondant au maximum de Ω donc de S.
On notera queΩfΩi
= expSf − SikB
= exp (108) correspond a un ΔS = 1, 4 × 10−15 J.K−1
extremement petit a l’echelle macroscopique.
REMARQUES. 1) Ωf calcule ci-dessus pour les deux gaz correspond a Ωf = max(1,2) Ω1Ω2 (ou Sf =
max(1,2) (S1 + S2)) avec U1 + U2 = U fixe. Pour le calcul de S il revient au meme de prendre Ωf =
Σ(1,2) Ω1Ω2 (= Ω total) car dans une somme Ω = Σpi=1 λNi on voit, en mettant en facteur le terme
λNmax, que c’est lui qui donne lnΩ pour N grand (cf. aussi section 5.1.2). 2) La loi de Boltzmann est
elle aussi une consequence directe de S = kB ln Ω (cf. section 10.2.3).
1.2 CARACTERE ALGEBRIQUE DES GRANDEURS PHYSIQUES
1.2.1 Pensee « naıve » et pensee algebrique
Le langage usuel fait toujours reference a des quantites positives : distance de deplacementsur une route dans une direction ou son opposee, avance ou retard a un rendez vous, avoirou dette dans un compte, etc. Il en est de meme des variations de grandeurs echangees :gain ou perte d’argent, etc. Ce mode de pensee “naıf” revient a raisonner comme si onne connaissait que les nombres positifs.
� Discours algebrique
Reprenons les exemples ci-dessus sous l’angle algebrique. A un deplacement sur une droiteorientee (axe), on associe un nombre x positif si le deplacement se fait dans le sens del’axe et un nombre negatif dans le cas contraire. L’interet de ce point de vue est que la loide composition des translations correspond toujours a une addition x = x1 + x2 + x3 · · ·de nombres algebriques, au lieu d’une suite d’additions et de soustractions de nombrespositifs dependant du cas particulier considere ; pour le choix d’orientation opposee, lesxi deviennent −xi, mais leur loi de composition demeure inchangee. En ce qui concernele temps, celui-ci est traditionnellement oriente du passe vers le futur, par referenceaux phenomenes irreversibles de la vie courante. Il n’empeche que les notions d’avanceet de retard peuvent etre considerees comme algebriques, une avance de τ = −1 heurecorrespondant a un retard de −τ = 1 heure (et reciproquement). Enfin on sait bien quedans un compte on peut considerer une dette comme un avoir negatif et faire le bilanen ajoutant les avoirs algebriques. De meme dans un echange il est equivalent de donner100 euros a un ami (gain algebrique pour lui de +100) ou de le liberer d’une dette dememe valeur (gain algebrique pour lui de −(−100)). Cette equivalence lors d’echangede grandeurs algebriques conservees apparaıt en physique par exemple a propos descourants electriques, associes a un flux dans un sens ou son oppose de charges positivesou negatives, et de la notion de pression cinetique, associee a un flux dans un sens ouson oppose de quantites de mouvement ; sur la figure 4, dans les deux cas, la region 2gagne une charge q et une quantite de mouvement mv, et la region 1 gagne −q et −mv.
1.2 Caractere algebrique des grandeurs physiques 11
1 12 2
m
q
v−v
m
−q
Figure 4
� Caractere algebrique des grandeurs physiques
Ce caractere tient souvent au fait que la grandeur consideree est la composante d’unegrandeur vectorielle sur un axe (produit scalaire du vecteur avec le vecteur unitaire del’axe) : circulation d’un champ vectoriel le long d’une courbe orientee, flux d’un champvectoriel a travers une surface orientee, etc. Pour de telles grandeurs un changement dusens d’orientation entraıne un changement de signe. Mais il existe aussi des grandeursscalaires algebriques (charge electrique, tension d’un ressort, etc.). Pour ces dernieres,comme pour le temps, la convention sur leur signe fait partie de la definition de lagrandeur.
� Consequences sur les lois physiques
Les lois physiques v = Ri, e = −dϕdt
, etc. font intervenir des grandeurs algebriques v, i, e,ϕ . . . Leur ecriture depend donc des conventions de signe adoptees pour ces grandeurs,conventions qu’il est important de preciser et de retenir. Une fois precisees les conventionsrelatives a des grandeurs A et B, on peut se rappeler si une loi s’ecrit A = B ou A = −Ben la testant dans une situation particuliere. Si par exemple pour A > 0 la “physiquedit” (l’experience montre) que B doit etre positif (resp. negatif), la loi est A = B (resp.A = −B) ; en vertu de son caractere algebrique la formule ainsi obtenue sera toujoursvalable. On verra sur des exemples qu’il n’y a pas lieu de s’inquieter de ces multiplesecritures : les resultats physiques ne dependent pas des conventions.
EXEMPLE. Ressort (figure 5).
2
A
nn1(A)
2 21
x(B)
2
B
1
Figure 5
12 1 • Nombres reels ; grandeurs physiques ; dimensions
L’allongement δl d’un ressort est algebrique (δl < 0 dans le cas d’une compression).Sa tension T , qui caracterise l’etat mecanique du ressort, l’est aussi. On la definit enintroduisant les forces F1→2 exercees par le ressort (systeme 1) sur l’exterieur (systeme2) : F1→2 = −T n1→2, n1→2 designant le vecteur unitaire dirige vers l’exterieur. Larelation bien connue T = K δl avec K > 0 est elle aussi algebrique : T > 0 si δl > 0(ressort tendu) et T < 0 si δl < 0 (ressort comprime). Jusqu’a present on n’a paschoisi d’orientation sur la direction du ressort. Cela devient indispensable pour etudierle mouvement de masses mA et mB accrochees a ses extremites A et B. Avec uneorientation de A vers B et en notant xA et xB les ecarts algebriques par rapport ala position d’equilibre on a δl = xB − xA, mAxA = T et mBxB = −T . Un choixoppose (de B vers A) conduit a des relations differentes δl = xA− xB , mAxA = −T etmBxB = T , mais il ne modifie pas les equations du mouvement mAxA = −K(xA−xB)et mBxB = −K(xB − xA) obtenues en remplacant T par K δl.
1.2.2 Conventions et lois de l’electricite
� Charges et courants
Une convention historique, un peu malheureuse, a attribue une charge electrique positivea une barre de verre frottee avec une peau de chat. Comme on le sait aujourd’hui labarre perd alors des electrons et cela a conduit a attribuer une charge negative auxelectrons. Une intensite electrique etant un flux de charges a travers une surface, on doitpreciser l’orientation de la normale a cette surface, disons de 1 vers 2 (cf. figure 6). Untransfert de charges positives de 1 vers 2, ou de charges negatives de 2 vers 1, corresponda une intensite i de courant positive. (Plus savamment i =
∫∫j · −→dS avec j = nqv ou n
��������������
��������������
1dS 2
i
Figure 6est la densite des charges q animees d’une vitesse moyenne v). Rappelons aussi que pourla charge q d’un condensateur, il est necessaire de preciser l’armature qui porte cettecharge, l’autre portant la charge −q au meme instant.
� Tensions et forces electromotrices
La convention sur les charges etant fixee, la valeur algebrique du potentiel VA en Aest determinee par le fait que qVA est l’energie potentielle d’une charge q placee en A(l’origine des potentiels etant prise “a l’infini” ou “a la masse”). Quant a la tension v auxbornes d’un dipole AB, elle est egale a la difference des potentiels aux bornes, et vaut soitv = VA−VB soit v = VB−VA suivant la convention choisie qui doit donc etre precisee ; onrappelle que VA−VB =
∫ BA
−→E es ·−→dl est la circulation du champ electrostatique
−→E es =
−−−→gradV . Les forces electromotrices d’induction sont definies pour une portion decircuit oriente par eAB =
∫ BA
−→E em · −→dl (circulation du champ electrique induit
−→E em)
1.2 Caractere algebrique des grandeurs physiques 13
et pour un circuit ferme oriente par e =∮C
−→E em · −→dl ; leur signe depend donc du choix
d’orientation sur le circuit (sens de−→dl). De meme la loi de l’induction e = −dϕ
dt(=
∮C
−→E em · −→dl), avec ϕ =
∫∫S
−→B · −→dS, suppose qu’il existe la relation “du tire-bouchon”
(cf. section 3.1.3) entre le sens de parcours sur C et l’orientation de la normale a lasurface S qui s’appuie sur C. (Pour une inductance ϕ = Li avec L > 0.)
� Dipoles (figure 7)
Les lois des dipoles dependent de deux conventions de signe qui sont precisees sur lesschema par des fleches : de facon standard la fleche associee a i est aussi celle qui orientele circuit, tandis que celle associee a v precise que v est egale au potentiel a l’extremitede la fleche moins le potentiel a son origine. Ainsi pour les figures 7a (en presence dechamp electromoteur) 7b et 7c, on a v = VA − VB et les lois s’ecrivent :
A B
v
(a)
v
CB
−q+q
iA
v
A B(c)
(b)
R
Li
i
Figure 7
v = Ri− eAB ; v =q
C;
v = Ldidt
(= −eAB) ; i =dqdt
.
(Ri =∫ BA (
−→E es +
−→E em) · −→dl est la loi d’Ohm). Le choix du sens de la fleche de v oppose a
celui de i s’appelle convention recepteur (voir justification plus loin). La conventionopposee, fleches de v et i de meme sens, s’appelle convention generateur ; son choixaurait conduit pour le premier dipole par exemple a la loi v (= VB − VA) = eAB −Ri.
� Reseaux
En electricite la relation∮C
−→E es · −→dl = 0 est connue sous le nom de loi des mailles
tandis que la relation de conservation de la charge∫∫©S
j · −→dS = 0 l’est sous le nom de
14 1 • Nombres reels ; grandeurs physiques ; dimensions
loi des noeuds (S surface fermee entourant le noeud). Ces lois s’ecrivent aussi :
ε1v1 + ε2v2 + · · ·+ εnvn = 0 et ε′1i1 + ε′2i2 + · · ·+ ε′pip = 0 .
Les vj sont les tensions aux bornes des n dipoles qui constituent la maille (circuit fermeC) et chaque εj vaut ±1 suivant que la fleche correspondant a vj est dans le meme sensou en sens inverse du sens de parcours choisi sur C ; pour les courants ik dans les pbranches qui constituent un noeud chaque ε′k vaut ±1 suivant que la fleche associee a iksort du noeud ou se dirige vers lui. L’introduction des ε et des ε′ est indipensable carlorsqu’il y a plusieurs mailles il est impossible de choisir les conventions sur les tensionset les courants de sorte qu’il valent tous +1.
� Systeme electromecanique
q
i
v
PM
xFC
R
G
−q
QN
L
Bressort
Figure 8
EXEMPLE (figure 8). Sur la figure sont precisees les conventions de signes choisies(parmi 64 possibles !) pour le deplacement x de la barre
−−→PQ = l de masse m, pour
la force exterieure−→F a priori variable, pour le champ magnetique
−→B constant et
perpendiculaire au plan du circuit, pour le courant i, la charge q du condensateur et latension v = VM−VN aux bornes du generateur G. Par projection des forces −Kr, −fr,−→F et il∧−→B sur l’axe x on obtient l’equation du mouvement mx = −Kx−fx+F+ilB.Si l’orientation de cet axe est changee, mais pas les autres conventions, il faut changerF + ilB en −F − ilB ou multiplier x, x et x par −1. En introduisant les symbolesεx, εF , εi et εB valant 1 pour la convention de depart sur x,
−→F , i et
−→B , et −1 pour
la convention opposee, on ecrit l’equation de la mecanique sous la forme generale (quipermet de voir l’influence du choix effectue) :
εx(mx+ fx+Kx) = εFF + l (εii)(εBB) .
De meme les equations de l’electricite, qui s’ecrivent VM −VN = v = Ri−e+Ldidt
+q
C,
i =dqdt
et e = −dϕdt
= −Blx avec la convention initiale, s’ecrivent de facon generale
VM − VN = εvv = εi
(Ri − e + L
didt
)+ εq
q
C, εii = εq
dqdt
et εie = −l (εBB)(εxx).
1.3 Grandeurs physiques et dimensions 15
En eliminant i entre ces equations on obtient le bilan electrique :
VM − VN = εvv = εq
( qC
+Rdqdt
+ Ld2q
dt2)
+ l (εBB)(εxx) .
On constate que εi a disparu avec i et que les termes en q, q et q apparaissentavec le meme signe εq en facteur comme attendu physiquement (cf. decharge d’uncondensateur dans une resistance ou oscillations d’un circuit LC). On obtient les bi-lans energetiques mecanique et electrique en multipliant les equations mecanique etelectrique respectivement par εxx et εqq :
ddt
(12mx2 +
12Kx2
)= −fx2 + εF εxF x+ εiεBεxliBx
ddt
(12Li2 +
12q2
C
)= −Ri2 + εvεivi− εiεBεxliBx .
Dans le bilan global obtenu par addition “ddt
(energie mecanique + energie electrique)
= puissances (fournie + dissipee)”, on remarque que quelles que soient les conventionsle terme magnetique disparait et que la puissance dissipee −fx2 − Ri2 est negative.Au contraire l’expression (mais pas la valeur) de la puissance fournie εvεivi+ εF εxF xdepend des conventions. La puissance electrique fournie s’ecrit +vi pour la conventiongenerateur (d’ou son nom) et −vi pour la convention recepteur ; quant a la puissancemecanique elle s’ecrit F x lorsque les conventions pour l’axe x et
−→F sont les memes
(cas habituel) et −F x dans le cas contraire.
1.3 GRANDEURS PHYSIQUES ; DIMENSIONS
Le calcul aux dimensions introduit par Reynolds (1883) est extremement precieux enphysique. Il permet de verifier qu’une expression n’est pas absurde, de deviner ou deretrouver (au moins partiellement) une loi connaissant les grandeurs susceptibles d’etremises en jeu, d’obtenir des ordres de grandeur, de simplifier des equations en remplacantpar 1 les parametres dont le role est “trivial”, etc. Il est fortement charge de sens, physiquecomme mathematique, car il correspond a une invariance remarquable des lois physiques,celle relative aux changements d’unites.
1.3.1 Changements d’unites et invariance des lois physiques
� Grandeurs, nombres et dimensions
Soient des grandeurs (longueur, surface, temps, vitesse, intensite electrique, resistance...)mesurees par les nombres g1, g2 · · · lorsqu’on a choisi pour chacune d’elle une grandeurunite. Une loi de la physique mettant en jeu ces grandeurs s’exprime par une relationf(g1, g2 · · · ) = 0. Dans des changements d’unites arbitraires ces nombres deviennentg′1 = λ1g1, g
′2 = λ2g2 · · · et a priori on n’a plus f(g′1, g
′2 · · · ) = 0. Par contre on constate
experimentalement que l’equivalence
f(g1, g2 · · · ) = 0 ⇐⇒ f(λ1g1, λ2g2 · · · ) = 0
16 1 • Nombres reels ; grandeurs physiques ; dimensions
est satisfaite si les changements d’unites sont convenablement relies entre eux : inva-riance de la loi par changements d’unites. C’est cette relation entre changementsd’unites que la notion de dimension sert a preciser, et cette invariance qui fait que lesphysiciens ecrivent les lois f(G1, G2, . . . ) = 0 avec les grandeurs physiques Gi plutotqu’avec les nombres gi (de meme qu’on ecrit des relations entre vecteurs plutot qu’entreleurs composantes).Une observation importante de la physique classique galileenne est que toutes les lois sontlaissees invariantes par des changements d’unites “non correles” des quatre grandeurs “debase” (la temperature mise a part) masse, longueur, temps et charge electrique,les changements d’unites des autres grandeurs etant eux definis a partir des precedents.Autrement dit la dimension d’une grandeur quelconque s’exprime a partir des dimen-sions des quatre grandeurs de base. En particulier une grandeur est sans dimension siil est impossible de changer son unite sans modifier l’ecriture des lois dans lesquelles elleintervient, et l’invariance ci-dessus entraıne que les egalites en physique ne peuvent avoirlieu qu’entre grandeurs de meme dimension.
EXEMPLES GEOMETRIQUES. La relation S = a2 entre l’aire d’un carre et soncote est valable en geometrie euclidienne si les unites de longueur et de surface sontpar exemple le metre et le metre carre. Si on divise ces deux unites par 10, alorsS′ = 10S, a′ = 10a et la relation entre surface et cote devenue S′ = 10−1a′2 estmodifiee. Pour que la loi S = a2 reste invariante, il faut que les changements d’unitea′ = λLa et S′ = λSS soient relies par λS = λ2
L. On dit que la dimension d’une surface(d’un volume) est le carre (le cube) de celle d’une longueur et on ecrit symboliquement[S] = [L]2, [V ] = [L]3 (en oubliant parfois les crochets). Pour les lois mettant en jeu un
angle comme l = aθ ou S =12a2θ (longueur d’un arc et surface d’un secteur circulaires
de rayon a, θ en radians), on constate que leur invariance implique λθ = 1 ; l’angle estdonc une grandeur sans dimension ([θ] = 1), mais pas sans unite ! Remarquons que cecaractere “sans dimension” n’a rien a voir avec le choix de l’unite radian ; si l’unitecorrespond a un tour, on a l = 2πaθ et S = πa2θ, formules qui elles aussi ne sontinvariantes que si λθ = 1.APPLICATION : demonstration “dimensionnelle” du theoreme de Pythagore. Untriangle rectangle etant entierement determine par son hypothenuse a et un angle aiguα sa surface est necessairement de la forme a2 f(α) ; en considerant les deux “petits”triangles rectangles d’hypothenuses b et c obtenus en abaissant la hauteur issue del’angle droit du “grand” triangle, on obtient a2 f(α) = b2 f(α) + c2 f(α).REMARQUE. Il faut noter que le caractere euclidien de l’espace est essentiel pourqu’une longueur ait une dimension. Si sur la sphere on considere par exemple untriangle rectangle, forme de trois arcs de grand cercle (geodesiques) dont deux secoupent a angle droit, la relation entre hypothenuse a, cote b et angle oppose B s’ecrit,pour des unites de longueur et d’angle bien choisies, sin b = sin a sin B (au lieu deb = a sin B dans le cas euclidien). On en conclut qu’en geometrie spherique longueuret angle sont sans dimension car tout changement d’unites pour a et b entraıne unemodification de l’ecriture de la relation contrairement au cas euclidien.
EXEMPLES PHYSIQUES. L’invariance de la loi de transformation de Galilee des in-tervalles d’espace-temps x′ = x − V t, t′ = t implique λV = λL λ
−1T donc
1.3 Grandeurs physiques et dimensions 17
[V ] = [L][T ]−1, celle de−→F = m
dvdt
= q(−→E + v ∧ −→
B ) implique [F ] = [M ][L][T ]−2,
[−→E ] = [v][
−→B ] = [
−→F ][Q]−1, etc. Souvent, pour des raisons de commodite, on utilise
l’energie, de dimension [E] = [M ][L]2[T ]−2, a la place de la masse pour le calcul auxdimensions. En effet on la retrouve dans de nombreuses expressions qui touchent tous
les domaines de la physique telles que12mv2 ou mc2 en mecanique, qV et
q2
4πε0ren
electrostatique,−Gm2
ren gravitation, hν en quantique, etc. On en deduit par exemple
[V ] = [E][Q]−1, [ε0]−1 = [E][L][Q]−2 = [μ0][L]2[T ]−2 (car ε0μ0c2 = 1 sans dimension),
[G] = [E][L][M ]−2 = [E]−1[L]5[T ]−4, [h] = [E][T ] et [α] = 1 (α =q2e
4πε0�cconstante
de structure fine).Les paragraphes qui suivent montrent que la notion de dimension d’une grandeur phy-sique n’est pas absolue.
� Dimensions et metrologie
Il ne faut pas confondre calcul aux dimensions et metrologie. Le but de cette derniere est de choisir les
etalons les plus fiables et precis possibles pour certaines grandeurs, et tels que les mesures des autres
grandeurs puissent s’y ramener avec une precision superieure a celle que l’on aurait avec des etalons
propres a ces autres grandeurs. Le nombre des etalons n’a pas toujours ete le meme dans l’histoire de
la physique. C’est ainsi qu’on a rattache la calorie au Joule en fixant l’equivalent en Joules de la calorie
(W = JQ avec J = 4, 1868 J.Cal−1), les unites “electrostatiques” aux unites “magnetiques” en fixant
celle de μ0 et le metre a la seconde en fixant celle de c. Ce processus de rattachement de grandeurs entre
elles n’a chaque fois ete rendu possible que par des decouvertes physiques prealables (equivalence travail
“chaleur”, unification de l’electromagnetisme, relativite) ; il n’est donc pas termine. D’ailleurs, anticipant
sur la metrologie, de nombreux physiciens considerent l’entropie comme une grandeur sans dimension ;
ceci revient a considerer la constante de Boltzmann comme sans dimension et a attribuer a la temperature
thermodynamique non plus une dimension propre mais celle d’une energie (cf. 12m < v2 >= 3
2kBT ou
le facteur de Boltzmann exp( −EkBT
)).
� Dimensions et domaines de la physique
Le nombre de “dimensions de base”, donc de degres de liberte pour les changementsd’unites, depend du domaine de la physique considere ; ce nombre est d’autant plus pe-tit que l’etendue de la validite de la theorie consideree est grande. Ainsi, il diminued’une unite lorsque l’on passe de la physique classique galileenne (“vitesses”� c,“actions”� �) au domaine plus general de la physique classique einsteinienne (“vi-tesses” quelconques, “actions”� �). Ceci est du a l’apparition d’une nouvelle constantede la physique avec la relativite d’Einstein, a savoir la vitesse invariante c de la lumieredans le vide, qui permet d’identifier les grandeurs masse et energie au travers de la re-lation E = mc2 ; en posant [c] = 1 (de meme qu’on a pose [J ] = 1 pour identifiertravail et “chaleur” et avoir [W ] = [Q]) on a [E] = [M ], [L] = [T ], [μ0] = [ε0]−1 . . .L’apparition de la constante � avec la physique quantique permet quant a elle d’iden-tifier energie et pulsation et quantite de mouvement et vecteur d’onde au travers desrelations de Planck-Einstein E = �ω et de de Broglie p = �k ; en posant [�] = 1 on a[E] = [T ]−1 et [P ] = [L]−1. Finalement en physique quantique relativiste ou inter-viennent a la fois c et �, et considerant par ailleurs que les charges electriques sont sans
18 1 • Nombres reels ; grandeurs physiques ; dimensions
dimension car multiples d’une charge fondamentale qe, il ne reste plus qu’une dimension :on a en effet [E] = [M ] = [T ]−1 = [L]−1 si on pose [�] = [c] = 1. Les physiciens desparticules ont meme pris l’habitude d’“oublier” les constantes c et � dans les formules,ecrivant par exemple λc = Tc = m−1 pour la longueur d’onde ou temps Compton, ouEr =
qa
4πε0rsin θ pour le champ rayonne par une charge acceleree ; ils mesurent aussi
les masses en Gev et les longueurs en Gev−1. Ceci est sans consequence pour un physi-cien “ordinaire” qui peut toujours retablir les expressions completes incluant c et � parl’analyse dimensionelle. En effet λ = m−1�αcβ de dimension [EL−2T 2]−1[ET ]α[LT−1]β
n’est une longueur que pour α = 1 et β = −1 et par consequent λc = �(mc)−1 = cTc ; onretablit de meme l’expression Er =
qa
4πε0rc2sin θ par comparaison a Ees =
q
4πε0r2. Par
ailleurs si une masse m vaut 1Gev, c’est que mc2 = 1, 6× 10−19 × 109 J, d’ou on deduitm en kg sachant que c = 3 × 108 m.s−1.
REMARQUE. En theorie quantique des champs (relativiste) la connaissance des dimensions des
champs, [E] pour les bosons (cf. les potentiels electromagnetiques V et−→A ) et [E]
32 pour les fermions
([Ψ]2 [L]3 = 1), ainsi que l’exigence que les constantes de couplage des interactions fondamentales soient
sans dimension, ont joue un role predictif important pour la theorie electrofaible et la chromodynamique.
Par contre comme la constante de couplage G de la gravitation a une dimension, [G] = [E]−2 = [L]2,
cette theorie est plutot consideree comme phenomenologique, approximation d’une theorie fondamentale
necessaire a l’echelle de Planck lPlanck = G12 (= (�Gc−3)
12 = 10−35 m en retablissant � et c).
1.3.2 Applications et limites de l’analyse dimensionnelle
� Lois “devinees” ; ordres de grandeurs
EXEMPLE CLASSIQUE. Un pendule simple est caracterise par sa longueur l et samasse m et le champ de pesanteur par g. Ces trois grandeurs etant dimensionnellementindependantes, la periode T du pendule s’ecrit T ∝ lαmβgγ ; comme [g] = [L][T ]−2,on obtient par identification β = 0, γ = −α = 1/2. Par rapport a la formule exacteT = 2π
√l/g il manque le facteur sans dimension 2π, qu’un calcul dimensionnel ne
peut evidemment pas donner. Cependant un temps caracteristique pour le pendule,cense rendre compte de la variation plus ou moins rapide de son elongation θ(t), doitetre de l’ordre d’un quart de periode (temps necessaire pour passer de |θmin| = 0 a|θmax|) et la grandeur homogene a un temps qui convient le mieux est l’inverse dela pulsation ω−1 = T/2π. (Un argument equivalent consiste a dire qu’une variationcaracteristique pour un angle, ωt pour le pendule, n’est pas 2π mais un radian). Si lecalcul dimensionnel est fait avec ω le resultat pour le pendule est exact et nous verronsqu’il est meilleur en general dans la mesure ou le facteur numerique sans dimensionest toujours plus proche de 1 qu’avec T (cf. exemples 3 Rayonnements ci-dessous).
EXEMPLES MOINS CLASSIQUES. 1) Atomes et corps solides. Avec les trois
constantes e2 =q2e
4πε0, me et � qui interviennent pour decrire le comportement d’un
electron en physique atomique non relativiste, on peut construire une longueur, uneenergie et une vitesse. On “predit” ainsi le rayon typique d’un atome ou la longueur
1.3 Grandeurs physiques et dimensions 19
d’une liaison a ∝ �2
mee2� 1A, l’energie de liaison atomique |El| ∝ mee
4/�2 � qques
ev, la vitesse v des electrons dans un atome ou un metal v ∝ e2/� = αc � c/137.On peut en deduire certaines proprietes des materiaux solides (constitues d’atomes demasse m lies les uns aux autres et distants de a) : leur incompressibilite est d’ordre
χ−1 = −V δP
δV∝ Ela3
� 1011 pascal, la vitesse des ondes (sismiques, sonores...) qui s’y
propagent est d’ordre cs ∝√Elm
� 1 km.s−1, leur frequence de coupure est d’ordre
νmax ∝ csa� 1013 Hz, etc.
2) Corps noir. On peut predire que l’entropie (divisee par kB) d’un corps noir (systemequantique de particules de masse nulle relativistes) est proportionnelle a U
34 V
14 (�c)−
34
en remarquant que UV13 (�c)−1 est sans dimension et que S est une grandeur extensive
(S(kU, kV ) = kS(U, V )). L’energie du corps noir U ∝ V (kBT )4(�c)−3 en fonction dela temperature (loi de Stefan) ou le nombre de photons Nγ ∝ V (kBT/�c)3 ∝ k−1
B Ss’obtiennent par un raisonnement analogue. Les photons ont alors pour energie typiquekBT et pour longueur d’onde λ ∝ �c/kBT . En remplacant c par la vitesse du son cs,ces relations sont valables pour les ondes de vibration d’un solide (phonons) a condi-tion que λ ≥ λmin = a, ce qui revient a T ≤ �cs/kBa � 100K ou Nγ ≤ V a−3 (nombred’atomes).3) Rayonnements. La puissance electromagnetique Pem rayonnee par une chargeelectrique q se deplacant a vitesse uniforme ωR sur un cercle de rayon R depend apriori de q, R et ω qui caracterisent la particule et son mouvement et des grandeurs4πε0 et c associees au champ electromagnetique. Ces cinq grandeurs n’etant pas dimen-sionnellement independantes, il n’est pas possible d’obtenir l’expression de Pem sanshypothese ou connaissance supplementaires. Si on s’interesse a la partie dipolaire durayonnement il est raisonnable de penser que q et R n’interviennent dans l’expressionde Pem qu’au travers du moment dipolaire : le produit qR. Si de plus, faisant appel ases connaissances, le lecteur averti se souvient qu’une puissance est proportionnelle aucarre de l’amplitude des ondes et que cette amplitude est elle-meme proportionnelleau moment dipolaire alors Pem est du type Pem ∝ (qR)2 × (4πε0)αωβcγ . A l’aide de[P ] = [M ][L]−1[V ]3 ([V ] = [L][T ]−1), on obtient α = −1, β = 4, γ = −3, donc en par-ticulier la proportionnalite de Pem a ω4. Le coefficient numerique exact 2/3 est prochede 1 ; il aurait ete d’ordre (2π)4 � 103 si on avait fait le calcul dimensionnel avec laperiode ! Pour la contribution quadrupolaire (puissance proportionnelle au carre dumoment quadrupolaire qR2) on obtient α = −1, β = 6, γ = −5. Pour les ondes gravi-tationnelles, de type quadrupolaire, rayonnees par une masse m, on etablit de memePgrav ∝ Gm2R4ω6c−5 ; le coefficient numerique exact est alors 32/5.
EXEMPLES “CURIEUX”. En cosmologie le rayon de l’univers varie comme t23 si on suppose qu’il
ne depend que de t , G et M (masse de l’univers). La dependance en temps du rayon du nuage
issu d’une explosion nucleaire s’ecrit r(t) ∝ E15 ρ−
15 t
25 si, en plus de t, seules l’energie liberee E et
la masse volumique de l’air ρ interviennent ; on peut alors determiner E par simple observation de
l’evolution de la taille du nuage. De nombreuses lois dites lois d’echelle, ayant des comportements
en puissances pour les variables temps, espace, etc., se rencontrent en hydrodynamique, transitions
de phases, sismologie, physiologie animale, etc.
20 1 • Nombres reels ; grandeurs physiques ; dimensions
On remarquera que la prediction dimensionnelle des lois fait appel a une forte intui-tion physique, puisqu’elle repose essentiellement sur un “bon” inventaire de tous lesparametres susceptibles d’intervenir dans l’expression de la grandeur que l’on cherchea determiner. Cet inventaire etant rarement aussi evident que dans le cas du pendulesimple, les arguments dimensionnels ne prennent toute leur valeur (ne serait-ce quecomme moyen mnemotechnique) qu’une fois la loi verifiee experimentalement et justifiee,au moins en partie, par un modele mathematique.
� Simplification d’equations differentielles ou aux derivees partielles
EXEMPLE 1. Dans l’equation d’un oscillateur de Van der Pol
x− ax(1 − bx2) + cx = 0 ,
les dimensions des parametres positifs a, b et c sont : [a] = [T ]−1, [b] = [x]−2 et[c] = [T ]−2. Le changement x′ = xb
12 , t′ = tc
12 permet de recrire l’equation sous forme
adimensionneed2x′
dt′2− 2ε
dx′
dt′(1 − x′2) + x′ = 0
avec 2ε = ac−12 . Elle est connue pour posseder un cycle limite x′ε(t
′) (vers lequeltend toute solution). L’equation de depart possede donc aussi un cycle limite quis’ecrit x(t) = b−
12 x′ε(tc
12 ). La dependance de ce cycle vis-a-vis de b et vis-a-vis de c
ou a (a ε fixe) se deduit donc de considerations purement dimensionnelles. Seule sadependance vis-a-vis du parametre sans dimension ε est non triviale et necessite uneetude analytique ou numerique plus approfondie (cf. section 6.5.2).
EXEMPLE 2. Une equation assez generale de l’hydrodynamique des fluides in-compressibles dans un referentiel tournant est :
ρ(∂t v + (v.
−→∇)v)
= −−→∇p+ ρg + ηΔv − 2ρ−→Ω ∧ v .
Considerons un ecoulement stationnaire dans une enceinte (un tuyau par exemple) delongueur caracteristique L et correspondant a des valeurs V et P de la vitesse et dela pression du fluide en un certain point (a l’entree du tuyau par exemple) ; supposonsde plus que les conditions aux limites sont telles que la solution v
L,V,P(r), p
L,V,P(r)
est unique. Alors connaissant les dimensions de toutes les grandeurs impliquees, parexemple pour le coefficient de viscosite [η] = [ρ][L]2[T ]−1 puisque la dimension du la-placien est [Δ] = [L]−2, on peut affirmer en reprenant l’analyse de l’exemple precedent
que la solution va s’ecrire vL,V,P
(r) = V v′( rL· · ·
), p
L,V,P(r) = Pp′
( rL· · ·
)les « . . . »
representant l’ensemble des parametres sans dimensions (nombres de Reynoldsρ
ηV L, d’Euler
2PρV 2
, de FroudeV 2
gL, de Rossby
V
ΩL, etc.). Une application pratique
importante de la dependance en rL−1 de la solution est la possibilite de prevoir certainsecoulements a l’aide de maquettes deduites par homothetie de la structure reelle ; cesmaquettes comme les fluides doivent etre choisis pour preserver les valeurs des nombressans dimension.
1.3 Grandeurs physiques et dimensions 21
� Dimensions et ensembles fractaux
Mesuree a partir d’une carte au 1/50000 la longueur de la cote de Bretagne sera pluspetite que si on la mesure a partir d’une carte au 1/10000 car, plus l’echelle est grande,plus les details sont “gommes”. Autrement dit si x et x′ sont les nombres qui mesurent la
longueur d’une courbe avec des unites l et l′,on n’aura x′ = xl
l′(c.a.d. xl = x′l′), comme
on s’y attend “dimensionellement”, que pour des courbes suffisamment lisses ; pour la
cote de Bretagne la relation sera plutot de la forme x′ = x( ll′
)davec d > 1. d s’appelle
la dimension fractale de la cote.
EXEMPLE 1. La courbe de Koch, obtenue comme limite du processus iteratif de construction dont
les etapes successives sont representees sur la figure 9, est telle que x′ = 4x si l′ = l3
d’ou 4 = 3d et
d = ln 4ln 3
. De meme d = ln 2ln 3
pour l’ensemble de Cantor (de mesure nulle) obtenu en enlevant le
tiers central de [0, 1], puis les tiers centraux des deux segments restants et ainsi de suite.
Figure 9
a
a N
Figure 10
EXEMPLE 2. Trajectoire d’un mouvement brownien. (figure 10), Sa dimension fractale est
toujours d = 2 independamment du fait que ce mouvement ait lieu sur une ligne, dans un plan ou
dans l’espace. On justifie heuristiquement ce resultat en observant que, dans une marche au hasard,
on s’eloigne typiquement d’une distance L = a√N du point de depart au bout de N pas de longueur
a (cf. section 10.3.1). La longueur de la trajectoire correspondant a N pas est donc mesuree par x = 1
avec l’unite l = L, et par x′ = N =(La
)2avec l’unite l′ = a ; par consequent x′ = x
(ll′
)2et d = 2.
EXEMPLE 3. En physique cette notion de dimension fractale intervient pour caracteriser les trajec-
toires asymptotiques dans l’espace de phase de systemes dynamiques chaotiques (attracteurs etranges)
et pour interpreter certaines lois d’echelle qui interviennent dans des phenomenes tels que la perco-
lation, la gelification, la brisure d’une roche, la porosite d’un milieu etc. Par exemple, si un milieu
materiel est tel que, aux petites echelles, la densite de probabilite de trouver de la matiere en �r0 + �r
(sachant qu’il y en a en �r0) obeit a une loi de puissance g(r) ∝ r−α, on a d = 3−α ; en effet, la quan-
tite de matiere contenue dans une sphere de rayon R centree en �r0, proportionnelle a∫ R0 r−α r2 dr,
varie alors comme R3−α , au lieu de R3 comme habituellement pour un milieu homogene (α = 0). Les
experiences de diffusion donnent un acces a g(r) (cf. section 5.4.2.)
Chapitre 2
Nombres et notation complexes ;plan euclidien
Les nombres complexes z = x+ iy (x, y ∈ R ; i2 = −1) ont ete introduits des le XV I eme
siecle sous la forme de nombres “imaginaires” tels que√−1 ou 3
√−1 pour etendre lesformules de resolution des equations algebriques du 2eme et du 3eme degre. A la fin duXV III eme siecle Gauss etablit le resultat remarquable que tout polynome P (z) de degren arbitraire a coefficients complexes admet exactement n racines. Ce resultat, faux sion se limite aux nombres reels (exemple P (x) = x2 + 1), est tres important en pratiquepour la resolution des Equations Differentielles Lineaires Stationnaires (a coefficientsconstants) (E.D.L.S.). Une autre vertu de l’ensemble C des nombres complexes, utile pourla geometrie et la physique a deux dimensions, est la possibilite de coder non seulementles points du plan mais aussi des mouvements (Kepler, harmonique) et des transforma-tions geometriques dans ce plan. Parmi ces transformations les rotations, attachees auxexponentielles complexes eiθ = cos θ + i sin θ introduites par Euler, jouent un role es-sentiel dans l’usage de la “notation complexe” en physique classique pour representer lesgrandeurs oscillantes (signaux ou ondes polarisees) ainsi que leurs interferences. D’autresapplications a la physique lineaire (classique et quantique), et aux E.D.L.S. (etude destabilite), sont donnees aux chapitres 4 et 6.
2.1 CALCULS AVEC LES NOMBRES COMPLEXES
2.1.1 Regles de calcul ; exponentielle imaginaire ; fonctions complexes
� Rappel des regles de calcul
Soit z = x+ iy un nombre complexe. z = x− iy est son complexe conjugue, x = �e z =z + z
2sa partie reelle, y = �mz =
z − z
2isa partie imaginaire et r = |z| =
√x2 + y2
son module. Les operations addition et multiplication s’effectuent comme pour les reels ;
2.1 Calculs avec les nombres complexes 23
elles possedent les proprietes de commutativite, d’associativite et de distributivite, et enplus l’importante propriete de commuter avec l’operation de conjugaison complexe quiconsiste a changer i en −i. On a notamment
z1 + z2 = x1 + x2 + i(y1 + y2) d’ou z1 + z2 = z1 + z2 ,
z1z2 = (x1 + iy1)(x2 + iy2) = (x1x2 − y1y2) + i(x1y2 + x2y1) d’ou z1z2 = z1z2 ,
zz = (x+ iy)(x− iy) = x2 + y2 = |z|2 d’ou |z1z2| = |z1||z2| ,|z1 + z2|2 = |z1|2 + |z2|2 + 2�e (z1z2) d’ou |z1 + z2| ≤ |z1| + |z2| ,z−1 =
1x+ iy
=x− iy
x2 + y2=
z
|z|2 d’ou |z−1| = |z|−1 et (z)−1 = z−1 .
� Exponentielle imaginaire et fonctions sinusoıdales
L’exponentielle imaginaire
eiθ = 1 + iθ +(iθ)2
2!+
(iθ)3
3!+ · · ·
joue un role essentiel dans la theorie et la pratique des nombres complexes en vertu deses proprietes fondamentales :
ei(θ1+θ2) = eiθ1eiθ2 ; |eiθ|2 = eiθe−iθ = 1 ;(eiθ
)′ = i eiθ .
Elle permet d’introduire algebriquement (sans geometrie) les fonctions cosinus et sinuspar les relations :
eiθ = cos θ + i sin θ ⇐⇒ cos θ = �e eiθ =eiθ + e−iθ
2et sin θ = �meiθ =
eiθ − e−iθ
2i.
On retrouve a partir des expressions ci-dessus les proprietes classiques de ces fonctions :
cos θ =∞∑n=0
(−1)nθ2n
(2n)!(fonction paire) ;
sin θ =∞∑n=0
(−1)nθ2n+1
(2n+ 1)!(fonction impaire) ;
cos (θ1 + θ2) = cos θ1 cos θ2 − sin θ1 sin θ2 ; sin (θ1 + θ2) = sin θ1 cos θ2 + sin θ2 cos θ1 ;
cos2 θ + sin2 θ = 1 ;(cos θ
)′ = − sin θ ;(sin θ
)′ = cos θ ;
cos2 θ =(eiθ + e−iθ
2
)2
=1 + cos 2θ
2; cos3 θ =
(eiθ + e−iθ
2
)3
=cos 3θ + 3 cos θ
4. . . ;
cos θ = sin (θ +π
2) = − cos (θ + π) = cos (θ + 2π) ;
sin θ = cos (θ − π
2) = − sin (θ + π) = sin (θ + 2π) .
Ces dernieres proprietes (avance deπ
2de cos θ sur sin θ, periodicite 2π) decoulent des
relationsei
π2 = i , eiπ = i2 = −1 et e2iπ = 1 ,
elles memes consequence de l’etude des variations de cos θ et de sin θ a partir de leursderivees (
π
2etant la premiere valeur positive de θ pour laquelle cos θ = 0).
24 2 • Nombres et notation complexes ; plan euclidien
� Argument d’un nombre complexe
L’argument θ ∈ [0, 2π[ (ou phase) de z = x+ iy est defini par x = r cos θ et y = r sin θ.Il permet d’ecrire z sous la forme :
z = r(cos θ + i sin θ) = r eiθ (r = |z|) .
Cette forme est tres utile pour les calculs comme le produit, l’inverse, la recherche des ra-cines Neme, nombres complexes ρ eiϕ tels que ρNeiNϕ = r eiθ, ou celle des logarithmesneperiens (nombres complexes Z tels que eZ = r eiθ) :
z1z2 = r1r2ei(θ1+θ2) ; z−1 = r−1e−iθ ; “ N
√z” = r
1N ei
θN ei
2πpN p = 0, 1, 2, . . . , N−1 ,
“ ln z” = ln r + iθ modulo 2πi (ln z1z2 = ln z1 + ln z2 modulo 2πi) .
EXEMPLES :√i = ±eiπ
4 = ±1 + i√2
; ln i = iπ
2modulo 2πi.
REMARQUE. Les N racines Neme de l’unite αp = ei2πpN verifient αNp −1 = 0 et donc, en
mettant αp − 1 en facteur,N−1∑n=0
αnp = 0 si p �= 0. Elles servent a definir la transformee
de Fourier discrete (cf. section 5.3.2).
� Fonctions de z
En pratique une fonction f(z) est une expression dans laquelle x et y n’apparaissent qu’atravers la combinaison z = x+ iy, comme par exemple un polynome P (z), l’exponentielleez, la transformee en z d’un signal numerique {fn}
F (z) =∞∑
n=−∞fn z
n ,
mais pas |z|2 dans laquelle apparait aussi z = x − iy. On fera attention au fait que cer-taines de ces fonctions comme “ N
√z” ou “ln z” ne sont pas bien definies meme si on choisit
une determination. Par exemple “ N√z” = r
1N ei
θN est multiplie par ei
2πN quand θ passe
continument de 0 a 2π. Il faut donc toujours preciser le domaine de definition considere.La derivee au point z de f(z) est definie comme pour les reels par la limite, quand elle
existe, def(z + ε) − f(z)
εlorsque ε complexe tend vers zero (i.e. |ε| → 0). (Exemple :
dz2
dz= lim
(z + ε)2 − z2
ε= lim (2z + ε) = 2z). Pour toutes les fonctions classiques
(definissables localement a partir de series), les formules de derivation sont les memes que
dans le cas des reels : (ez)′ = ez, (ln z)′ =1z
(z �= 0), (cos z)′ = − sin z, etc. Des precisions
mathematiques et des applications physiques (hydrodynamique, electrostatique...) sontdonnees a la section 8.3.3.
2.1 Calculs avec les nombres complexes 25
2.1.2 « Theoreme fondamental de l’algebre » et applications
� Racines d’un polynome
Un resultat tres important est que tout polynome P (z) de degre n admet n racinesp1, p2 · · · pn et peut donc toujours etre factorise :
P (z) = a0zn + a1z
n−1 + · · ·+ an−1z + an = a0(z − p1)(z − p2) . . . (z − pn) .
JUSTIFICATION : si P (z) de degre n ≥ 1 ne s’annule jamais, |P (z)| atteint une valeur minimale non
nulle, disons en p1. Posant z = p1 + ε on peut ecrire P (z) = P (p1) + b1ε+ b2ε2 + · · · + bnεn. Soit bk le
premier coefficient non nul. Pour |ε| petit on a |P (z)|2 � |P (p1) + bkεk|2 � |P (p1)|2 + 2�e(P (p1) bkε
k),
et en faisant “tourner” l’argument de ε on peut toujours rendre negative la quantite �e(P (p1) bkεk)
ce
qui contredit l’hypothese. D’ou P (p1) = 0 et la possibilite de factoriser (z − p1) : P (z) = (z − p1)Q(z).
On repete le raisonnement avec Q(z) de degre n− 1 et ainsi de suite jusqu’a n = 1. Remarque : dans le
cas reel on ne peut pas jouer sur l’argument de ε.
� Equations differentielles lineaires stationnaires (E.D.L.S.)
Le resultat ci-dessus s’applique immediatement a la resolution des equations
a0f(n)(t) + a1f
(n−1)(t) + · · ·+ an−1f′(t) + anf(t) = 0
en permettant de les recrire (puisque f (p) =( d
dt
)pf) :
a0
( ddt
− p1
)( ddt
− p2
). . .
( ddt
− pn
)f(t) = 0 .
Comme les n operations( d
dt− pj
)(j = 1 . . . n) commutent entre elles, il est clair
sous cette forme que les exponentielles ep1t, . . . , epnt sont des solutions particulieres de l’equation differentielle. Si toutes les racines pj sont differentes, les n fonctions exponen-tielles sont independantes et la solution generale, qui depend a priori lineairement den constantes arbitraires Aj (cf. section 6.2.1), est :
f(t) = A1ep1t +A2e
p2t + · · · +Anepnt .
Si par contre une racine, par exemple p1, apparaıt k fois il manque k − 1 solutions. Ce-
pendant comme( d
dt− p1
)ep1tg(t) = ep1tg′(t) et donc
( ddt
− p1
)kep1tg(t) = ep1tg(k)(t),
on voit que a une racine p1 d’ordre k sont associees les k solutions independantesep1t, tep1t, t2ep1t, . . . , tk−1ep1t.
EXEMPLE : E.D.L.S. du second ordre af ′′ + bf ′ + cf = 0 (a, b et c reels). Soient
p1,2 =−b±√
b2 − 4ac2a
les racines du polynome “ caracteristique” ap2 + bp+ c.
1er cas : b2 − 4ac > 0. p1 et p2 sont reels et f(t) = A1ep1t +A2e
p2t.
2eme cas : b2 − 4ac < 0. p1 = p2 = −λ + iω (avec λ =b
2a, ω =
√4ac− b2
2|a| ) et
f(t) = e−λt(A1e
iωt + A2e−iωt). Cependant f(t) etant en physique souvent reelle, on
prefere ecrire la solution sous l’une des deux formes equivalentes (A, B, C reels)
f(t) = e−λt(A cos ωt+B sin ωt
)ou f(t) = e−λt C cos(ωt+ ϕ) .
3emecas : b2 − 4ac = 0. p1 = p2 = −λ est une racine double et f(t) = e−λt (At+B).
26 2 • Nombres et notation complexes ; plan euclidien
2.2 PLAN COMPLEXE ET TRANSFORMATIONS ASSOCIEES
2.2.1 Plan complexe et plan cartesien ; produit scalaire ; aire
Au nombre complexe z = x + iy = reiθ on associe dans le plan cartesien (xOy) (appeleaussi plan euclidien) un vecteur V = xx + yy de composantes x et y (x et y etant lesvecteurs unitaires des axes) et de norme |V | = |z| =
√x2 + y2. De facon equivalente
on peut associer a z un point M , dit affixe de z, de coordonnees cartesiennes x et y etdonc tel que
−−→OM = V (figure 1). L’addition des nombres complexes z1 + z2 correspond
alors a l’addition vectorielle V1 + V2 ; on a |Σizi| ≤ Σi|zi| l’egalite n’ayant lieu que si lesarguments des zi sont egaux (figure 2).
�
���
�� �O
y
xx
y
VM(z)
z
Figure 1
�
�
�
__
2
__z
O1
2__
1z
__
__z3
3
M
x
y __
Figure 2
Le produit scalaire V1 · V2 de deux vecteurs et l’aire algebrique σ(V1, V2) du pa-rallelogramme construit sur V1 et V2 (figure 3)
������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������
����������������������������
����������������������������
������������������
������������������
V
V
2
1�
�2
1
Figure 3
sont les quantites invariantes par rotation definies par
V1 · V2 = x1x2 + y1y2 = �e(z1z2) = |V1||V2| cos (θ2 − θ1) = V2 · V1 ,
σ(V1, V2) = x1y2 − x2y1 = �m(z1z2) = |V1||V2| sin (θ2 − θ1) = −σ(V2, V1) .
REMARQUES. L’invariance par rotation est celle relative au changement θi → θi + ϕ.σ est bien l’aire car c’est la seule quantite lineaire en V1 et V2 qui est nulle si V1 et V2
sont colineaires ; (elle est prise egale a 1 pour les vecteurs de base).
2.2 Plan complexe et transformations associees 27
EXEMPLES DE PRODUITS SCALAIRES. L’equation d’une droite perpendicu-laire au vecteur unitaire u de composantes α = cos θ0 et β = sin θ0 et distante de dde l’origine s’ecrit (figure 4) :
u · −−→OM = αx+ βy = d = r cos (θ − θ0) = �e (e−iθ0z
).
L’egalite |−−→BC|2 = |−−→BA+−→AC|2 conduit a la relation bien connue entre les cotes d’un
triangle a2 = b2 + c2 − 2bc cos A.
��
�
M
O
H
u
OH = d0
x
y
Figure 4
A B
bM
C
c
ah
A
Figure 5
EXEMPLES D’AIRES. L’aire d’un triangle ABC, etant egale a la moitie de celle
d’un parallelogramme construit sur deux de ses cotes (figure 5), vaut S =12bc sin A =
12ab sin C =
12ac sin B =
12hc.
Les aires algebriques des triangles orientes MBC, MCA et MAB sont proportion-nelles aux coordonnees barycentriques λA, λB et λC de M qui verifient λA
−−→MA+
λB−−→MB+λC
−−→MC = 0 ; par exemple σ
(λA
−−→MA+λB
−−→MB+λC
−−→MC ,
−−→MB
)= 0 entraıne
λA σ(−−→MA,
−−→MB
)= λC σ
(−−→MB ,
−−→MC
)soit
aire MAB
λC=
aire MBC
λA. En thermodyna-
mique le “point” triple (phases A, B et C) est represente par l’interieur d’un triangledans le diagramme Volume-Entropie (ou Enthalpie) et M correspond a un melangetriphase de composition (λA, λB, λC).En cinematique, la vitesse areolaire S(t) qui est l’aire balayee par unite de tempspar un vecteur
−−→0M(t) = r(t) s’ecrit (figure 6) :
S =12σ(r,
drdt
)=
12�m (zz) =
12r2θ .
������������������������������������������������������������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������������������������������������������������������������
�� �
M
M(t+dt)
(t)
O
r+d
Figure 6
28 2 • Nombres et notation complexes ; plan euclidien
2.2.2 Transformations dans le plan complexe
� Transformations euclidiennes (figure 7)
�
�
�
�
�
z−
z
z
z+z0
z0
z eiy
xO
Figure 7
La simple observation de la figure montre que l’addition z → z + z0 correspond a unetranslation de l’affixe M de z, la multiplication par un reel z → λz a une homothetiede centre O et de rapport λ (symetrie ponctuelle ou rotation de π si λ = −1), lamultiplication par une exponentielle imaginaire z → eiϕz a une rotation de centre O etd’angle ϕ. Leur composition z → az + b est une similitude. Enfin l’operation z → z estune symetrie par rapport a Ox.
� Inversion (figure 8)
En geometrie l’inversion de centre O et de rapport λ (reel positif) correspond a r → λ/ret θ → θ, donc a z → λ/z. Nous appellerons “ inversion” (entre guillemets) l’operationz → λ/z donc r → λ/r et θ → −θ qui en differe par une symetrie d’axe Ox.
��
O A
(C)
OB =
OA=
(C’ )
D’
B’ A’
OA’ OB’
M0 M’0
B
Figure 8
2.2 Plan complexe et transformations associees 29
Propriete principale : l’inversion de centre O transforme les cercles en “droites ou cercles”et les droites en “droites ou cercles” selon que ces courbes passent ou non par O.
DEMONSTRATION : l’equation d’un cercle de rayon R et de centre M0 est (x − x0)2 + (y − y0)2 =
|z−z0|2 = R2 qui s’ecrit zz−z0z−z0z+|z0|2−R2 = 0, ou encore plus generalement a zz+αz+αz+b = 0
(avec a et b reels). Sous cette derniere forme, qui inclut le cas limite des droites lorsque a = 0, on voit
que l’inversion z → 1z conduit a l’equation bzz + αz + αz + a = 0, qui est d’un cercle si b �= 0 ou d’une
droite si b = 0 ; les centres M0 (z0 =−αa ) et M ′
0 (z′0 = −αb ) sont alignes avec O. On remarquera sur la
figure 8 que, quand A tend vers O (B restant fixe), le cercle C’ inverse du cercle C tend vers la droite D’.
La composition des similitudes et de l’“inversion” conduit aux homographies z →az + b
cz + d. On verifie que leur loi de composition
z → z1 =a1z + b1c1z + d1
→ z2 =a2z1 + b2c2z1 + d2
=az + b
cz + d
equivalente a la multiplication des matrices 2 × 2 :(a bc d
)=
(a2 b2c2 d2
) (a1 b1c1 d1
)=
(a2a1 + b2c1 a2b1 + b2d1
c2a1 + d2c1 c2b1 + d2d1
).
Les homographies preservent aussi le caractere “droite ou cercle”.
� Transformations conformes
Ce sont les transformations z → z′ = f(z) associees aux fonctions complexes f(z) deri-vables. Elles ont la propriete remarquable de conserver les angles ; en particulier toutreseau de courbes orthogonales est transforme en un reseau de meme nature.
DEMONSTRATION (figure 9) : soient deux courbes C1 et C2 se coupant en M (affixe de z) et Mi
(i = 1, 2) deux points voisins de M , affixes de zi = z + εi, situes sur Ci. Leurs transformes M ′i sur C′
i
sont les affixes de z′i = f(zi) � f(z)+εi f′(z). L’angle (
−−−→MM1,
−−−→MM2) entre C1 et C2 est θ � arg ε2−arg ε1
et celui entre C1’ et C2’ est θ′ � arg f ′(z)ε2 − arg f ′(z)ε1 ; comme arg f ′(z)εi = arg f ′(z) + arg εi, on
a bien θ = θ′.
�
�
M(z)C
C 2
M1
,
,
,
,
C 2
C 1
M, 1
M2M
,
2
(z )1
M2(z )
1
x
y
Figure 9
30 2 • Nombres et notation complexes ; plan euclidien
Application. Les lieux geometriques de M definis par
angle (−−→MB,
−−→MA) = constante (modulo π) et
MA
MB= constante
sont deux reseaux de cercles, les premiers passant par A et B et les seconds orthogo-naux aux premiers (figure 12).
DEMONSTRATION : l’homographie z → z′ =z−zA
z−zBqui amene A en O et B a l’infini transforme les
lieux cherches en respectivement les droites passant par O (arg z′ = constante modulo π) et les cercles
centres en O (|z′| =constante).
EXEMPLE 1. Optique et points de Weierstrass. Pour un dioptre, de point cou-rant M , deux points A et A′, respectivement dans des milieux d’indice n et 1, sontrigoureusement conjugues si nAM ∓ A′M = constante (principe de Fermat). Si onveut un dioptre spherique il faut nAM −A′M = 0 ; les points A (reel) et A′ (virtuel)sont appeles points de Weierstrass du dioptre. La figure 10 represente une lentille bouled’indice n pour laquelle A et A′ sont rigoureusement conjugues.
EXEMPLE 2. Abaque de Smith. Un autre exemple d’utilisation de l’“inversion”concerne les ondes sur une ligne ou un guide d’onde. La relation entre le coefficientde reflexion complexe r et l’impedance complexe Z = X + iY placee en bout de ligne
(normalisee a l’impedance caracteristique) est r =1 − Z
1 + Zou r + 1 =
21 + Z
. Cette
“inversion” de centre A (−1, 0) transforme les droites X = 0 et X = Cste > 0 dansle cercle de diametre AB (|r| = 1) et dans les cercles interieurs et tangents en Aau precedent ; elle transforme les demi-droites Y = Cste (X > 0) dans les portionsde cercles tangents en A a AB. Ces deux reseaux de cercles orthogonaux (abaque deSmith) permettent de determiner graphiquement Z connaissant r (figure 11).
�
O
M
AA’
Figure 10
���
�� �B1
A−1
O
Figure 11
2.3 Etude de courbes et de mouvements plans 31
EXEMPLE 3. Electrostatique et magnetostatique de deux fils infinis pa-ralleles (figures 12a,b). Si ces fils qui percent le plan de la figure en A et B sontcharges (densites −λ et λ, figure 12a), ou sont parcourus par des courants (intensites−I et I, figure 12b), les potentiels dont derivent les champs electrique et magnetique
sont respectivement Ves(M) =λ
2πε0ln
MA
MBet Vms(M) =
μ0I
2π× angle(
−−→MB,
−−→MA).
Les equipotentielles et les lignes de champ sont representees respectivement en pointilleet en traits pleins sur les figures.
� ��−
M
BA
(a)
BAI
M
I−
(b)
Figure 12
EXEMPLE 4. Images electriques (cf. section 8.3.2).
2.3 ETUDE DE COURBES ET DE MOUVEMENTS PLANS
2.3.1 Mouvements et courbes en coordonnees polaires
� Vitesse et acceleration (figure 13)
Le mouvement plan d’un point M generalement decrit par les coordonnees cartesiennesx(t) et y(t) peut aussi l’etre par les coordonnees polaires r(t) et θ(t). Ceci correspondaux deux representations du nombre complexe z dont M est l’affixe : z(t) = x(t) +iy(t) = r(t) eiθ(t). La vitesse v du mouvement, de composantes cartesiennes x et y, etl’acceleration a de composantes x et y sont les vecteurs associes a z(t) et a z(t). Enderivant r(t) eiθ(t) on obtient :
z = (r + irθ) eiθ ; z =((r − rθ2) + i(rθ + 2rθ)
)eiθ .
Ces expressions peuvent etre traduites vectoriellement en introduisant les vecteurs uni-
taires radial r =r
|r| associe a eiθ, et orthoradial θ associe a i eiθ (deduit de r par une
32 2 • Nombres et notation complexes ; plan euclidien
rotation deπ
2). On retrouve les expressions classiques de v et a en coordonnees polaires :
v = r r + rθ θ ; a = (r − rθ2) r + (rθ + 2rθ) θ .
��
�
��
dr
r
d M(t)
r d
M(t+dt)y
xO
Figure 13
� Integrales premieres
Pour un mouvement a force centrale ou a est colineaire a r, on a rθ+2rθ = 0 =1r
ddtr2θ,
soit r2θ = C = constante : c’est la loi des aires qui exprime que la vitesse areolaire estconstante. Si en plus la force ne depend pas de θ (ma = f(r) r), on obtient une deuxiemeintegrale premiere energie E = 1
2mv2 + V (r) (avec f = −V ′ et V energie potentielle).
En effetddt
(12mv2 + V (r)
)= mv .a+ V ′(r) r = v . (ma+ V ′(r)r) = 0. Les equations du
mouvement se ramenent alors a deux equations couplees du premier ordre pour r(t) etθ(t) (en utilisant v2 = r2 + r2θ2) :
θ =C
r2;
12mr2 + V (r) +
mC2
2r2= E .
� Courbes en coordonnees polaires
Une courbe est definie par une relation r(θ) ; par exemple r =d
cos (θ − θ0)pour une
droite (figure 4). La tangente a la courbe s’obtient a partir de dr = dr r + r dθ θ, et
l’angle α qu’elle fait avec r verifie tgα = rdθdr
(figure 13).
2.3.2 Coniques en coordonnees polaires et cartesiennes ; foyers
Les coniques apparaissent en geometrie et en physique sous trois formes principales.
� Coniques en coordonnees polaires (figure 14)
Elles sont definies parr(θ) =
p
1 + e cos θ(p > 0 ; e ≥ 0) ,
les angles etant mesures a partir de l’axe de la conique θ = 0.
2.3 Etude de courbes et de mouvements plans 33
(H)(P)
x
y
O
(C)(E)
p
Figure 14
Les cercles (C), ellipses (E), paraboles (P) et hyperboles (H) correspondent respec-tivement aux valeurs e = 0, e ∈]0, 1[, e = 1 et e > 1 de l’excentricite e (sur la figuree = 1/2 pour (E) et e = 3/2 pour (H)). Pour p fixe et r > 0 (voir la remarque ci-dessous), toutes ces courbes passent par les points r = p, θ = ±π
2. Elles sont fermees si
e < 1 ; si e ≥ 1 elles presentent des branches infinies dans les directions ±θ∞ telles que
cos θ∞ = −1e.
� Coniques en coordonnees cartesiennes
Leur equation x2 + y2 = (p − ex)2 s’obtient a partir de r = p − e r cos θ. Pour e = 1
on obtient l’equation d’une parabole x =p
2− y2
2p. Pour e �= 1 on regroupe les termes en
x et x2 dans un carre : (1 − e2)(x +
ep
1 − e2
)2
+ y2 =p2
1 − e2. Cette expression montre
l’existence d’un centre de symetrie C de coordonnees yC
= 0 et xC
= − ep
1 − e2;
xC
= 0 pour les cercles, xC
= −c < 0 pour les ellipses (figure 15) et xC
= c′ > 0 pour leshyperboles (figure 16 avec OC = c′).
OCO’
b
c
a
2a
2b X
Y
Figure 15
CO O’
S’S
b’
a’
c’
Y
X
Figure 16
34 2 • Nombres et notation complexes ; plan euclidien
Avec C comme origine des coordonnees, on a
pour les ellipses :X2
a2+Y 2
b2= 1 ; a =
p
1 − e2; b = a
√1 − e2 ; e =
c
a< 1 ,
pour les hyperboles :X2
a′2− Y 2
b′2= 1 ; a′ =
p
e2 − 1; b′ = a′
√e2 − 1 ; e =
c′
a′> 1 .
Les interpretations geometriques des coefficients a, b, c, a′, b′, c′ et des relationsa2 = b2 + c2 et c′2 = a′2 + b′2 sont illustrees sur les figures.
L’ellipse se deduit du cercle de rayon a par une affinite de rapportb
asuivant Oy, d’ou
son aire πa2 b
a= πab. L’hyperbole a pour asymptotes Y = ± b
′
a′X .
REMARQUE. Lorsque e > 1 la courbe d’equation r = p(1 + e cos θ)−1 avec r > 0ne correspond qu’a la branche d’hyperbole “la plus proche” de O ; l’autre branche (enpointille sur la figure 14) correspond a l’extension de la formule a des valeurs negativesde r.
Parametrisation avec origine au centre. Elle s’ecrit (cf. cos2 ϕ + sin2 ϕ = 1 etcosh2 φ− sinh2 φ = 1) :
X = a cos ϕ , Y = b sin ϕ (ellipses) ; X = ±a′ coshφ , Y = b′ sinh φ (hyperboles) .
Une propriete importante de cette parametrisation pour l’ellipse est que l’aire balayee
par le vecteur−−→CM est proportionnelle a Δϕ ; en effet dS =
12σ (
−−→CM, d
−−→CM) =
12(X dY −
Y dX) =ab
2dϕ (figure 17 ; l’aire hachuree vaut
12abϕ).
�������������������������������������������������
�������������������������������������������������
�
ab
C
M
Figure 17
� Coniques rapportees a leur(s) foyer(s)
Le point O, origine des coordonnees polaires, est appele foyer de la conique. Commepour les ellipses et les hyperboles le point O′ symetrique de O par rapport a C joue unrole identique, ces coniques possedent deux foyers O et O′. Considerons alors deux points
2.3 Etude de courbes et de mouvements plans 35
M et M ′ de la conique symetriques par rapport a C et leurs projections H et H ′ sur OO′.Pour une ellipse (figure 18a) on a r+ eOH = r′ + eOH ′ = p, soit r+ r′ = 2p− 2eOC =constante. Pour une hyperbole (figure 18b) ceci reste vrai mais r′ < 0 (cf. remarqueci-dessus),
HOC
O’H’
M’
M
X
OM = r OM’ = r’ = O’M
(a)
M
M’
O O’
C H’HX
OM = r OM’ = −r ’= O’M
(b)
Figures 18
et donc r − |r′| = constante. Pour determiner les constantes on prend M sur l’axe OX .On en deduit qu’ellipses et hyperboles sont les lieux geometriques des points M tels que :
MO +MO′ = 2a (ellipses) ; |MO −MO′| = 2a′ (hyperboles) .
A partir de la relation r +OH = p, on etablit de meme qu’une parabole est le lieu despoints M dont la somme de la distance a O et de la distance mesuree algebriquement aune droite fixe est constante :
MO +MK et MO +MK ′ sont constants (parabole ; figure 19).
�
KK’M
H O
DD’
Figure 19
Une parabole est une ellipse ou une hyperbole dont un foyer est a l’infini.
36 2 • Nombres et notation complexes ; plan euclidien
Applications a l’optique. En optique geometrique le principe de Fermat dit quedeux points O et O′ sont conjugues par rapport a un miroir (point courant M) siMO ± MO′ = constante (signe moins si les caracteres reel ou virtuel de O et O′ nesont pas les memes). Consequence : les surfaces de revolution engendrees par les coniquessont des miroirs parfaits pour leurs foyers (figures 20). En optique ondulatoire les
O O’
M
O’
M
O
O
M
Figures 20
O1
S
M
M
S
M
2
Figure 21
interferences de deux sources S1 et S2 monochromatiques et coherentes presentent undephasage fixe sur les hyperboloıdes de revolution S1M − S2M = constante lorsque lalumiere arrivant en M vient de S1 et S2. Les intersections de ces hyperboloıdes avecdes plans d’observation peuvent donner des cercles (observation dans la direction S1S2),ou des branches d’hyperboles assimilables a des droites paralleles (observation a grandedistance dans une direction perpendiculaire a S1S2) (figure 21).
2.3.3 Mouvement de Kepler
Ce mouvement plan (cf. section 3.3.2) a force centrale attractive en1r2
est decrit par lesequations differentielles, pour le rayon vecteur r joignant deux corps ou pour z = x+ iy,
r = −α r
r2ou z = −α eiθ
|z|2 (α > 0) .
(α = G(m1 + m2) pour le probleme gravitationnel ; cf. section 3.3.2). Compte tenu de
la loi des aires r2 θ = C, l’equation pour z devient z = iα
C
ddteiθ (ou r =
α
C
ddtθ) et
s’integre en z = iα
Ceiθ+ constante (ou r =
α
Cθ+
−−→Cste). On peut toujours, en changeant
z en z eiθ0 (rotation), se ramener a :
z = iα
C(eiθ + e) (e reel positif) ou v =
α
C(θ + e y) .
Cette expression donne la direction de la vitesse en tout point (figure 22), et conduita l’equation de la trajectoire en ecrivant C = �m(zz) =
αr
C�e(1 + e e−iθ) (ou C =
σ(r, v)) :
2.3 Etude de courbes et de mouvements plans 37
r(θ) =p
1 + e cos θavec p =
C2
α> 0 .
�
�
�
y
x
M
C
ye
v
O
Figure 22
��
v12
2
v
1
�
�r
r
v
2
1
1
O
2v
Figure 23
On retrouve les equations en polaire des coniques. Dans le cas des ellipses on obtient la
periode T du mouvement en ecrivant que l’aire12CT balayee pendant une periode est
la surface πab de l’ellipse. Comme b = a√
1 − e2 et C2 = αp = αa(1 − e2), on a :
T =2π√αa
32 (3eme loi de Kepler) .
Dans le cas des hyperboles (figure 23), l’angle de diffusion Δ entre les vitesses initialev1 et finale v2 se deduit de l’expression des vitesses en ecrivant v2−v1 =
α
C(θ2− θ1) ; des
relations |v1| = |v2| = v (conservation de l’energie), |v2 − v1| = 2v sinΔ2
et |θ2 − θ1| =
2 cosΔ2
, et de C = ρ v (ρ parametre d’impact), on deduit :
tgΔ2
=α
ρv2.
L’energie E s’obtient a l’aide de r(θ) et de v2(θ) =α2
C2(θ+ ey)2 =
α
p(1 + e2 + 2e cos θ) :
E = μ(1
2v2 − α
r
)=μα
2p(e2 − 1) (μ =
m1m2
m1 +m2masse reduite) .
Pour les ellipses on a p = a(1 − e2) et E = −μα2a
< 0 ; pour les hyperboles E > 0.
REMARQUES. 1) Lorsque la force est repulsive α < 0 (cas de la diffusion de Ru-therford de particules alpha par un noyau), les calculs precedents sont inchanges mais
il faut se rappeler que r(θ) doit etre positif. Comme p =C2
α< 0 ceci n’est possible que
si e > 1 et la trajectoire est necessairement une branche d’hyperbole (en pointille sur lafigure 23). 2) L’integrale premiere z − i
α
Ceiθ correspond, au facteur iC pres, au vecteur
de Lenz introduit a la section 6.3.
38 2 • Nombres et notation complexes ; plan euclidien
2.3.4 Mouvement harmonique ; vecteurs tournants
L’equation d’un mouvement plan associe a une force centrale attractive proportionnellea la distance est :
r = −ω2 r ou z = −ω2 z .
Sa solution generale qui, pour z(t), s’ecrit
z(t) = z+eiωt + z−e−iωt avec z± = |z±|eiϕ± ,
peut etre decrite de multiples facons. Elle apparaıt ci-dessus comme la somme de deuxvecteurs tournants (representes a l’instant t = 0 sur la figure 24) ; l’un de longueur|z+| tourne dans le sens trigonometrique direct (polarisation circulaire “gauche” enoptique) a la vitesse angulaire ω tandis que l’autre de longueur |z−| tourne dans le sensinverse (polarisation circulaire “droite”) a la vitesse −ω.
En posant ϕ± = ϕ0 ± ϕ on a aussi :
z(t) = eiϕ0((|z+|+ |z−|) cos(ωt+ ϕ) + i(|z+| − |z−|) sin(ωt+ ϕ)
).
Sous cette deuxieme forme, z(t) apparaıt comme la somme de deux vecteurs oscillants(polarisations rectilignes) qui sont orthogonaux et qui oscillent en quadrature dephase. On en deduit que l’extremite M de
−−→OM (M affixe de z) decrit une ellipse de
demi grand axe OA = a = |z+| + |z−| incline de ϕ0, de demi petit axe OB = b =||z+| − |z−||, et qui est parcourue dans le sens direct si |z+| − |z−| > 0 (dans le sensinverse si |z+| − |z−| < 0). Il existe aussi une infinite d’autres facons de decrire
−−→OM(t)
comme somme de polarisations rectilignes en quadrature mais non orthogonales(figure 25). Il suffit pour cela d’ecrire z(t) en fonction des conditions initiales :
z(t) = z(t0) cosω(t− t0) + z(t0)sinω(t− t0)
ω.
��
�
0
z−
M
B
A
x
y
z+
O
Figure 24
�
xO
z(t )0
yz (t ) 0.
Figure 25
REMARQUES. 1) Comme celui de Kepler, le mouvement harmonique est facilement integrable et possede
des trajectoires fermees. En plus des integrales premieres 12
(|z|2 +ω2|z|2) (proportionnelle a l’energie) et
C = m(zz) = ω (|z+|2 − |z−|2) (dont le signe est bien relie au sens de parcours de l’ellipse), il possede
l’integrale (complexe) 12
(z2 + ω2z2).
2) La representation d’un vecteur oscillant (z = z0 cosωt) par deux vecteurs tournants ( 12z0 e±iωt) est
tres utilisee en physique (moteur synchrone, RMN, optique...).
2.4 Notation complexe en physique classique 39
2.4 NOTATION COMPLEXE EN PHYSIQUE CLASSIQUE
2.4.1 Signaux reels et complexes
La notation complexe est definie pour les signaux “sinusoıdaux” reels par la correspon-dance
f(t) = a cos(ωt+ φ) ⇐⇒ F (t) = Aeiωt avec A = a eiφ amplitude complexe .
Cette correspondance s’etend a tous les signaux reels combinaisons lineaires (sommes ouintegrales) de signaux sinusoıdaux c’est-a-dire, d’apres l’analyse de Fourier, a quasimenttous les signaux “utiles” en physique. Nous considerons pour simplifier l’ecriture dessommes discretes :
f(t) = a1 cos(ω1t+ φ1) + a2 cos(ω2t+ φ2) + · · · ⇐⇒ F (t) = A1 eiω1t +A2 e
iω2t + · · · .Le signal complexe F (t) s’appelle aussi signal analytique associe a f(t).
REMARQUE. Conventions et notation complexe. Le fait d’associer a eiωt sa partie reelle cos ωt
plutot que sa partie imaginaire sin ωt est tout a fait arbitraire. De meme on peut faire correspondre
a cos ωt aussi bien e−iωt, comme il est fait souvent pour les ondes, que eiωt, convention utilisee en
electronique et en theorie du signal. Une distinction “physique” entre frequences positives et negatives
n’intervient que pour les champs quantiques (cf. sections 4.4.4-5).
� Proprietes importantes
1) Linearite : λ1f1 + λ2f2 + · · · ⇐⇒ λ1F1 + λ2F2 + · · · (λi reels).On en deduit en particulier que la somme de signaux sinusoıdaux de meme pulsation ωest un signal sinusoıdal de pulsation ω :
a1 cos(ωt+φ1)+a2 cos(ωt+φ2)+· · · = a cos(ωt+φ) avec aeiφ = a1eiφ1 +a2e
iφ2 +· · · .Ceci se montre en passant aux signaux complexes et en mettant eiωt en facteur. Parexemple :
a cos ωt+ b sin ωt = �e((a− ib)eiωt
)=
√a2 + b2 cos(ωt+φ) avec φ = arg(a− ib) .
(Preciser seulement la valeur de tg φ, ou de sinφ ou de cosφ est insuffisant.) On noteraque la formule d’addition est encore valable si les amplitudes ai et les phases φi dependentdu temps (voir section 2.4.3).
2) Invariance par translation : f(t+ τ) ⇐⇒ F (t+ τ) d’ou f (n)(t) ⇐⇒ F (n)(t).Cette correspondance s’etend aux primitives si on exclut les constantes d’integration.
3) Moyenne temporelle du produit de deux fonctions :
< f1f2 >def= lim
T→∞1
2T
∫ T
−Tf1(t)f2(t) dt =
12�e(< F 1F2 >
).
DEMONSTRATION : il suffit de le verifier pour
f1(t) = a1 cos(ω1t+ ϕ1) et f2(t) = a2 cos(ω2t+ ϕ2) ,
40 2 • Nombres et notation complexes ; plan euclidien
le cas general correspondant a une “simple extension par linearite”. On a
< f1f2 >=a1a2
2⟨
cos((ω1 + ω2)t+ (ϕ1 + ϕ2)
)+ cos
((ω2 − ω1)t+ (ϕ2 − ϕ1)
) ⟩,
et donc < f1f2 >= 0 si ω1 �= ω2 et < f1f2 >=a1a2
2cos(ϕ2 − ϕ1) si ω1 = ω2 ; ce meme
resultat se retrouve sur l’expression12�e
(a1a2
⟨ei(ω2−ω1)t
⟩ei(ϕ2−ϕ1)
).
Un exemple important en physique est la fonction de correlation d’un signal f(t) :
Γf (τ) =< f(t)f(t+ τ) >=12�e < F (t)F (t+ τ) > .
On verifie facilement que la fonction de correlation d’une somme de signaux sinusoıdauxde pulsations differentes est la somme des fonctions de correlation de chaque signal :
f(t) = a1 cos(ω1t+ϕ1)+a2 cos(ω2t+ϕ2)+· · · =⇒ Γf (τ) =a1
2
2cosω1τ+
a22
2cosω2τ+· · · .
2.4.2 Systemes entree-sortie ; fonctions de transfert et impedances
La notation complexe est tres utilisee dans l’etude des circuits RC, RLC... alimentesen alternatif, et plus generalement en physique lorsqu’on s’interesse a la reponse d’unsysteme lineaire et stationnaire a une excitation sinusoıdale.
� Solutions particulieres d’E.D.L.S. avec second membre sinusoıdal
EXEMPLES : x+ λx = a cos ωt et x+ 2λx+ ω20x = a cos ωt (λ ≥ 0).
On cherche une solution particuliere des equations
X + λX = a eiωt et X + 2λX + ω20X = a eiωt
proportionnelle a eiωt. On trouve facilement “de tete” :
Xω(t) =aeiωt
iω + λet Xω(t) =
aeiωt
(ω20 − ω2) + 2iλω
.
Les solutions particulieres reelles xω(t) s’obtiennent en prenant la partie reelle desXω(t) :
xω(t) = aλ cos ωt+ ω sin ωt
ω2 + λ2et xω(t) = a
(ω20 − ω2) cos ωt+ 2λω sin ωt
(ω20 − ω2)2 + 4λ2ω2
.
Remarques. 1) Si λ = 0 et ω = ω0 (resonance sans amortissement), la solutionXω(t) n’existe plus. Il faut chercher une solution du type At eiω0t. On trouve X(t) =a
2iω0t eiω0t ; donc x(t) = a t
sin ω0t
2ω0est une solution particuliere de x+ω2
0x = a cos ω0t
(avec x(0) = x(0) = 0). 2) En pratique, pour λ > 0, ces solutions particulieres(“regime stationnaire”) sont observees lorsque l’excitation cos ωt a ete appliqueedepuis suffisamment longtemps (en toute rigueur a t = −∞) pour que les “transi-toires” (solutions de l’equation sans second membre) aient disparu.
2.4 Notation complexe en physique classique 41
� Systemes entree-sortie lineaires et stationnaires
On appelle ainsi une correspondance univoque e(t) → s(t) entre deux fonctions telle que :
λ1e1 + λ2e2 → λ1s1 + λ2s2 (linearite) et e(t+ τ) → s(t+ τ) (stationnarite) .
EXEMPLES. 1) Les equations precedentes recrites s+λs = e, s+2λs+ω20s = e (avec
λ > 0), ou plus generalement toute E.D.L.S. (relative a un systeme stable) pour s(t),avec e(t) ou ses derivees au second membre, et avec (attention !) conditions initialesnulles (pour assurer la linearite), souvent prises a t = −∞. 2) La moyennisationd’un signal e(t) ou de facon generale la convolution de e(t) avec une fonction R(t)(cf. section 5.2.1) :
e(t) −→ s(t) =1τ
∫ t+ τ2
t− τ2
e(t′) dt′ ; e(t) −→ s(t) =∫ ∞
−∞R(t− t′) e(t′) dt′ .
Le resultat principal relatif a tous ces exemples est que a toute entree e(t) sinusoıdalecorrespond une sortie s(t) sinusoıdale ne pouvant differer de e(t) que par son amplitudeet sa phase. En notation complexe et avec l’ecriture d’usage en electronique :
e(t) = ept −→ s(t) = T (p) ept (p = iω) .
JUSTIFICATION (ne faisant appel qu’aux proprietes de linearite et de stationnarite) :si eiωt → sω(t), on doit avoir eiω(t+τ) → sω(t + τ) et eiωτeiωt → eiωτsω(t), d’ousω(t + τ) = eiωτsω(t) et sω(τ) = sω(0) eiωτ . T (p) est la fonction de transfert (com-plexe) du systeme, appelee aussi impedance complexe lorsque s(t) est une tension ete(t) une intensite.
EXEMPLES. Pour les deux E.D.L.S. etudiees ci-dessus, T (p) = (p+ λ)−1 (filtre passebas du premier ordre) et T (p) = (p2 +2λp+ω2
0)−1 (filtre passe bas du deuxieme ordre
si λ� ω0). Pour la moyennisation on verifie directement :
sω(t) =1τ
∫ t+ τ2
t− τ2
eiωt′dt′ = sinc
(ωτ2
)eiωt (sincx =
sinxx
: fonction sinus cardinal) ;
la moyennisation attenue donc toute fonction sinusoıdale et introduit un dephasage de0 ou π. Plus generalement pour la convolution, en posant t′′ = t − t′ et ω = 2πν, onobtient :
sω(t) =∫ ∞
−∞R(t−t′) ei2πνt′ dt′ = R(ν) ei2πνt avec R(ν) =
∫ ∞
−∞e−i2πνt
′′R(t′′) dt′′ .
La fonction de transfert R(ν) = T (p = i2πν) est la transformee de Fourier de lafonction R(t) (reponse impulsionnelle ; cf. section 5.2.3).
REMARQUE. Pour des signaux numeriques la relation de convolution entree sortie est :
{en} → {sn} avec sn =∑m
Rn−m em .
Les transformees en z sont reliees par∑
n snzn = S(z) = R(z)E(z).
42 2 • Nombres et notation complexes ; plan euclidien
2.4.3 Signaux modules ou quasi-monochromatiques
En physique il est rare que les signaux soient rigoureusement sinusoıdaux c’est-a-diremonochromatiques. Ils se presentent souvent sous la forme d’une somme de signauxmonochromatiques ayant des pulsations differentes mais proches d’une valeur ω0 ; de telssignaux sont dits modules ou quasi-monochromatiques. Il s’ecrivent en notation complexe
F (t) = A1 eiω1t+A2 e
iω2t+· · · =(A1 e
i(ω1−ω0)t+A2 ei(ω2−ω0)t+· · ·
)eiω0t = Af (t) eiω0t ,
avec Af (t) = af (t) + ibf(t) amplitude complexe dependant du temps, et en notationreelle :
f(t) = a1 cos(ω1t+ φ1) + a2 cos(ω2t+ φ2) + · · · = af (t) cos ω0t− bf (t) sin ω0t .
Les fonctions af (t) et bf (t) sont lentement variables (comparees a cos ω0t).
EXEMPLES. Les modulation d’amplitude et modulation de frequence d’unsignal “porteur de haute frequence” a cos ω0t, par un signal adimensionne x(t) de“basse frequence” (sense transmettre l’information), conduisent respectivement auxsignaux modules :
a(1 +mx(t)) cos ω0t et a cos(ω0t+ Δω
∫ t
x(t′) dt′)
;
m � 1 est le facteur de modulation d’amplitude, et ω0
(1 +
Δωω0
x(t)), avec
Δωω0
� 1,
est la pulsation instantanee du signal module en frequence. Les amplitudes complexessont : a(1 +mx(t)) et a exp
(iΔω
∫ tx(t′) dt′
).
� Fonction de correlation
Quand on calcule la moyenne temporelle du produit de deux signaux modules f et g depulsations proches de ω0, l’utilisation de la notation complexe montre immediatementque seules les amplitudes lentement variables interviennent :
< fg >=12�e < FG >=
12�e < AfAg >=
12< afag + bfbg > .
En particulier :
Γf (τ) =< f(t) f(t+ τ) >=12�e(eiω0τ ΓA(τ)
)avec ΓA(τ) =< Af (t)Af (t+ τ) > .
La fonction de correlation d’un signal module contient une partie rapidement variable (depulsation ω0) modulee par la fonction de correlation lentement variable de l’amplitudecomplexe.
2.5 APPLICATIONS A L’OPTIQUE ONDULATOIRE
2.5.1 Interferences
Les interferences en optique resultent de l’addition de signaux qui presentent entre euxessentiellement des differences de temps de propagation. La grandeur detectee est uneintensite lumineuse I qui est proportionnelle a la moyenne temporelle du carre dusignal resultant.
2.5 Applications a l’optique ondulatoire 43
� Lumiere monochromatique
En notation complexe, avec la convention des ondes, un signal monochromatique (periode
T =2πω
, longueur d’onde λ = cT ) s’ecrit A1e−iωt. Un autre signal de meme pulsation en
avance de τ s’ecrit A2e−iω(t+τ) ; avance temporelle τ , avance de phase ϕ et difference de
chemin optique δ sont relies parτ
T=
ϕ
2π=δ
λ.
L’addition de ces deux signaux correspond a tous les systemes interferentiels a deux ondes(deux trous, deux fentes, biprisme, etc.). Dans ce cas F (t) = A1e
−iωt +A2e−i(ωt+ϕ) et
I(ϕ) =12< |F (t)|2 >=
12|A1 +A2e
−iϕ|2 = I0(1 + C cos(ϕ− ϕ0)
).
I0 =12(|A1|2 + |A2|2
)est l’intensite moyenne et C =
2|A1A2||A1|2 + |A2|2 =
Imax − IminImax + Imin
le
facteur de contraste de la figure d’interferences (figure 26) ; quant a ϕ0 = arg A2 −arg A1 il rend compte des dephasages supplementaires lies a des reflexions, au passagepar un foyer, etc.
� ��
�
2
1
− 02
1+C
1−C
O
I( )C=1
/I 0
Figure 26
� � � � ��
�
3 3
maxI ( ) / IN
O 2 40
2
1
N = 100N = 2 N = 3
Figure 27
L’addition de N signaux egalement dephases correspond aux interferences donnees pardes reseaux. Dans ce cas F (t) = A
(1+e−iϕ+ · · ·+e−i(N−1)ϕ
)e−iωt (serie geometrique)
et
IN (ϕ) =12< |F (t)|2 >=
12|A|2
∣∣∣∣1− e−iNϕ
1 − e−iϕ
∣∣∣∣2 = Imaxsin2 Nϕ
2
N2 sin2 ϕ2
,
ou Imax =12N2|A|2 est obtenue pour ϕ = 2πn (n = 0, 1, 2 . . . est l’ordre d’in-
terference) (figure 27). Pour N grand le rapportI(ϕ)Imax
est tres petit presque partout,
sauf pour ϕ proche de zero (modulo 2π) ou on peut l’approximer par sinc2 Nϕ
2. De
part et d’autre du maximum d’ordre n l’intensite s’annule pour la premiere fois pour
ϕ = 2πn ± Δϕ avec Δϕ =2πN
; le rapportϕ
Δϕ= nN qui caracterise la finesse du
maximum est le pouvoir de resolution du reseau dans l’ordre n (cf. cours d’optique).
44 2 • Nombres et notation complexes ; plan euclidien
REMARQUE. Un calcul analogue apparait pour le signal emis par un laser lorsqu’un grand nombre N
de modes de la cavite ωn = ω0 + nΔω sont accroches en phase. Alors F (t) = A∑N−1n=0 e−i(ω0+nΔω)t
et tΔω joue le role de ϕ dans le calcul precedent. Le signal se presente donc comme une succession de
pulses intenses espaces dans le temps de T = 2πΔω
et de duree τ � TN
.
Le signal a la sortie d’un interferometre a ondes multiples comme le Perot Fabry estune somme discrete infinie de signaux egalement dephases et attenues de la forme F (t) =A
(1 +Re−iϕ +R2e−2iϕ + · · · ) e−iωt ; dans cette expression, R = |R| eiϕ0 est un facteur
de reflexion de module legerement inferieur a 1, et le dephasage ϕ est relie a l’epaisseur
e de l’interferometre et a l’angle d’incidence i (proche de zero) par ϕ = 2π2e cos i
λ.
L’intensite resultante est
I(ϕ) =12< |F (t)|2 >=
12
|A|2|1 −Re−iϕ|2 =
Imax
1 +m sin2 ϕ−ϕ02
,
ou Imax =|A|2
2(1 − |R|)2 est obtenue pour ϕ − ϕ0 = 2nπ, et ou m =4|R|
(1 − |R|)2 est un
coefficient tres grand devant 1 (m � 1600 pour |R| = 0, 95) (figure 28). A partir de la
relation I =Imax
2pour ϕ− ϕ0 ∼ ± 2√
m(modulo 2π), on deduit la largeur a mi-hauteur
des maxima Δϕ =4√m
= 2(1− |R|) ; le pouvoir de resolution de l’interferometre est
ϕ
Δϕ=
2π1 − |R|
e
λ.
� �
��
�
�
O 0
I ( ) / I max
2
1
Figure 28
�
�� �O
I( )/2a²
2
2
/Figure 29
� Lumiere non monochromatique
Dans une interference a deux ondes f(t) et f(t+ τ), en supposant pour simplifier qu’ellesne different que par leur temps de propagation, le detecteur mesure l’intensite :
I(τ) =<(f(t) + f(t+ τ)
)2>= 2
(Γf (0) + Γf (τ)
).
Les interferences donnent donc acces a la fonction de correlation du signal reel et a cellede son amplitude complexe.
2.5 Applications a l’optique ondulatoire 45
EXEMPLE. f(t) = a cos(ω0+ε)t+a cos(ω0−ε)t ; Γf (τ) =a2
2cos(ω0+ε)τ+
a2
2cos(ω0−
ε)τ et I(τ) = 2a2 (1 + cos ετ cosω0τ). Cette expression ressemble au cas monochro-matique mais avec un contraste C(τ) = cos ετ dependant “lentement” de τ (figure29). On verra a la section 5.3.3 l’importance de l’etude de Γf(τ) pour caracteriser lessignaux chaotiques.
2.5.2 Diffraction en lumiere monochromatique
La diffraction correspond aux interferences d’un ensemble “continu” d’ondes et conduita des calculs d’integrales.
� Diffraction de Fresnel
Si on connait le signal lumineux A(m) e−iωt en tout point m d’un plan (z = 0), leprincipe d’Huygens-Fresnel exprime que le signal A(M) e−iωt en un point M d’unplan z > 0 est une somme de contributions provenant des “points sources” m (figure 30),
O
MXx
écranz
inci
dent
eon
de
m
Figure 30
chacune contenant un facteur qui rend compte de la propagation du signal de m(x, y, 0)a M(X,Y, z). Plus precisement :
A(M) e−iωt =∫ ∫
A(m) e−iωtei2π
mMλ
iλmMdxdy ,
et dans l’approximation de Gauss (mM =√
(X − x)2 + (Y − y)2 + z2 � z +(X − x)2 + (Y − y)2
2z)
A(M) =ei2π
zλ
iλz
∫ ∫A(x, y) eiπ
(X−x)2+(Y −y)2
zλ dxdy .
EXEMPLE. Pour une ouverture rectangulaire (x ∈ [x1, x2 = x1 + l] et y ∈ [y1, y2 =y1 + L]) eclairee sous incidence normale (A(x, y) = A constante), l’integrale factorise
et se ramene, par le changement de variables s =
√2zλ
(X − x) et t =
√2zλ
(Y − y),
a :
46 2 • Nombres et notation complexes ; plan euclidien
A(M) = Aei2π
zλ
2i(Z(s2) − Z(s1)
)(Z(t2) − Z(t1)
).
Z(s) est l’integrale de Fresnel Z(s) =∫ s
0
eiπu22 du dont la dependance en s se lit
facilement sur la spirale de Cornu, lieu des points affixes de Z(s) (figure 31). On
remarquera que ds = |dZ(s)| (element de longueur de la spirale), et quedZds
est
alternativement imaginaire et reel pour s =√n (n = 1, 2, 3...). Pour la diffraction
par un demi ecran plan occupant la region x < 0 (t1 = ∞ et t2 = s2 = −∞), on
obtient l’intensite |A(M)|2 =|A|22
|Z(−∞)− Z(
√2zλ
X)|2 (figure 32).
��
��
�
0.5
0.5
Z(s)
Z(s)
0
1,9
3s=1
Z(s)
1,27
2,3
Z(− )
s=
2s=
s=2
Figure 31
�
1
s
1/4
1/2 Z(s) − Z(− ) ²
1,27 1,9 2,3
Figure 32
� Diffraction de Fraunhofer (a “l’infini”)
Si z est grand devant les dimensions du domaine d’integration, on peut negliger les termes
enx2
zλet
y2
zλsous l’integrale et ecrire :
|A(M)|2 ∝∣∣∣∣∫ ∫
A(x, y) e−2iπ(ux+vy) dxdy∣∣∣∣2 = |A(u, v)|2 ou u =
X
zλet v =
Y
zλ.
La fonction A(u, v) est la transformee de Fourier (a deux dimensions) de A(x, y).Pour l’ouverture rectangulaire ci-dessus, et A(x, y) = A constante, on a |A(M)|2 ∝|A|2
( lLzλ
)2
(sinc πul)2 (sinc πvL)2 puisque∣∣l−1
∫ x1+l
x1e−2iπux dx
∣∣2 = (sincπul)2 (cf. sec-
tion 2.4.2). On verra d’autres exemples a la section 5.4.2.
2.5.3 Polarisations
Lorsque la grandeur physique est vectorielle, la notation complexe definie plus haut sefait composante par composante, et les calculs de moyennes temporelles obeissent auxmemes regles.
2.5 Applications a l’optique ondulatoire 47
� Description des polarisations d’une onde plane electromagnetiquemonochromatique
Considerons une onde se deplacant vers les z > 0, et notons E(0, t) le champ electriquecomplexe de composantes Ex et Ey dans le plan z = 0 :
E(0, t) =(αβ
)e−iωt (α et β constantes complexes) .
Le vecteur complexe de composantes α et β s’appelle vecteur de Jones. Par definitionles composantes Ex et Ey du champ electrique reel E(0, t) sont obtenues en prenant lesparties reelles de Ex et Ey :
Ex = �e(αe−iωt) =αe−iωt + αeiωt
2; Ey = �e(βe−iωt) =
βe−iωt + βeiωt
2.
L’extremite de E(0, t) decrit une ellipse dans le plan (xOy) (polarisation elliptique).En effet sur l’expression
Z(t) = Ex + iEy =α+ iβ
2eiωt +
α+ iβ
2e−iωt
du nombre complexe associe au vecteur reel E, on reconnait que E est la somme de deuxvecteurs tournants. Les caracteristiques a, b et θ de l’ellipse ont ete decrites a la section2.3.4. En particulier la polarisation est circulaire gauche si α = −iβ, droite si α = iβ etrectiligne si |α + iβ| = |α+ iβ|. Inversement si on se donne des polarisations elliptiquesgauche et droite (resp. une fleche et deux fleches sur la figure 33), de caracteristiques a,b et θ, les champs complexes E±(0, t) correspondant s’ecrivent :
E±(0, t) =(
cos θ − sin θsin θ cos θ
) (a±ib
)e−i(ωt+ϕ) .
�b
a
y
x
Figure 33
En effet �e E±(0, t) se deduit de la polarisation elliptique a cos(ωt+ϕ) x±b sin(ωt+ϕ) yd’axes (x, y) par la rotation d’angle θ. La polarisation est circulaire si a = b et rectilignesi b = 0.
48 2 • Nombres et notation complexes ; plan euclidien
� Effets de la propagation sur la polarisation
Ils s’obtiennent en observant que le champ en z n’est autre que le champ en z = 0 aprespropagation. Dans le cas d’un milieu isotrope on a
E(z, t) = E((0, t− z
v
)=
(αβ
)e−iω(t− z
v ) ;
la trajectoire parcourue par l’extremite du champ reel E(z, t) est donc identique a celleparcourue par l’extremite de E(0, t), avec un retard de
z
v, et la nature de la polarisation
n’est donc pas modifiee.
Dans les milieux anisotropes on rencontre des situations ou la vitesse de propagationn’est pas la meme pour Ex et Ey :
Ex(z, t) = α e−iω(t− zvx
) ; Ey(z, t) = β e−iω(t− z
vy).
Dans ce cas la nature de la polarisation change au cours de la propagation. Pour uneorigine de temps bien choisie le champ reel E(z, t) a pour composantes :
Ex(t) = |α| cos ωt ; Ey(t) = |β| cos (ωt+ϕ) ; ϕ = arg α−arg β+ωz( 1vx
− 1vy
).
Les trajectoires possibles pour son extremite sont des ellipses dependant de ϕ, inscritesdans un rectangle de cotes 2|α|, 2|β| (figure 34). Leurs “inclinaison” et sens de parcours
sont determines respectivement par la valeur de Ey(0) et le signe dedEydt
(0).
� � � �
� � � � �
� � � �
� �
� � � � �
� � � �
,
= 0 /2] 0 , [ /2=
[/2,] = /2] 3 [
/2= 3 [ 3] /2, 2 = 2]
Figure 34
Pour les milieux gyrotropes ce sont les polarisations circulaires gauche et droite quiont des vitesses de propagation bien definies et differentes :
E+(z, t) ∝(
1i
)e−iω(t− z
v+) ; E−(z, t) ∝
(1−i
)e−iω(t− z
v− ).
2.5 Applications a l’optique ondulatoire 49
Pour voir comment evolue une polarisation quelconque en fonction de z, le plus simpleest de dessiner, au meme instant, les vecteurs tournants qui la composent dans le planz = 0 (lorsque ces vecteurs sont paralleles) et dans un plan z > 0 (figure 35).
���
� ��
gran
d ax
e
de l’
ellip
sePlan z = 0 Plan z > 0x
y y
x+−
Figure 35
Leurs modules etant inchanges, la polarisation a les memes parametres a et b et le memesens de rotation. Cependant, comme dans le plan z > 0 ils sont en retard respectivementde
z
v+et de
z
v−, leurs positions sont θ± = θ ∓ ωz
v±; les axes de l’ellipse ont donc tourne
de Δθ =θ+ + θ−
2− θ =
12ωz
( 1v−
− 1v+
).
� Interferences de deux ondes polarisees monochromatiques
L’interference de deux ondes coherentes 1 et 2, de meme pulsation mais de polarisationsdifferentes, entre lesquelles on introduit un dephasage ϕ, conduit a une intensite (sommedes contributions des deux composantes du champ electrique) :
I =12|α1 + α2 e
−iϕ|2 +12|β1 + β2 e
−iϕ|2 = I0(1 + C cos (ϕ − ϕ0)
).
Dans cette expression ϕ0 = arg(α1α2+β1β2), I0 =12
(|α1|2+|β1|2+|α2|2+|β2|2) = I1+I2
et C =|α1α2 + β1β2|
I1 + I2est le contraste. On voit que le terme d’interference disparaıt si
α1α2 + β1β2 = 0 ; cela correspond a deux polarisations elliptiques gauche et droite degrands axes perpendiculaires, par exemple : (α1, β1) = (a, ib) et (α2, β2) = (b,−ia).
� Ondes polarisees non monochromatiques
Dans ce cas α(t) et β(t) sont des fonctions du temps et la polarisation elliptique fluctue.Les intensites lumineuses pouvant etre mesurees experimentalement font intervenir lamatrice de Jones :
J =(< |α|2 > < αβ >< αβ > < |β|2 >
).
50 2 • Nombres et notation complexes ; plan euclidien
EXEMPLES. Un polariseur ne laissant passer que la composante du champ parallele aune direction fixe θ0 mesure une intensite proportionnelle a <(Ex cos θ0+Ey sin θ0)2>
=12< |α cos θ0 + β sin θ0|2 >, soit :
I =12
(< |α|2 > cos2 θ0 + 2�e < αβ > cos θ0 sin θ0+ < |β|2 > sin2 θ0) .
Un systeme ne laissant passer que les polarisations circulaires directes mesure (cf.expression de Z(t) ci-dessus) :
I =< |α+ iβ
2|2 >=
14
(< |α|2 > + < |β|2 > +2�m < αβ >
).
Proprietes de J. J est une matrice hermitienne positive :
trJ =< |α|2 > + < |β|2 > > 0 ; detJ =< |α|2 >< |β|2 > −| < αβ > |2 ≥ 0 .
detJ ≥ 0 est une consequence de l’inegalite de Schwarz < |λα + β|2 >≥ 0 quel que soitλ ∈ C. En effet < |λα+ β|2 >=< |α|2 > |λ|2 + 2�e(λ < αβ >)+ < |β|2 >≥ 0 et enparticulier : < |α|2 > |λ|2 + 2|λ|| < αβ > |+ < |β|2 >≥ 0.Le cas ou J est multiple de l’identite correspond a une lumiere naturelle c’est-a-direnon polarisee ; celui ou detJ = 0 correspond a une lumiere completement polarisee(comme pour α et β constants).
Decompositions de J
1) On verifie aisement par identification qu’il est toujours possible de decomposer de maniere unique J
sous la formeJ =
(λ 00 λ
)+
(< |α|2 > −λ < αβ >
< αβ > < |β|2 > −λ)
= J1 + J2 ,
avec 0 < λ ≤ (< |α|2 > et < |β|2 >) et det J2 = 0 ; on interprete alors le champ electrique comme la
somme des champs (incoherents entre eux) des lumieres ci-dessus.
2) Une autre decomposition possible est J = λ1 P1 + λ2 P2 ou les Pi sont les projecteurs sur les
vecteurs propres orthogonaux de J (cf. section 4.2.3) ; le champ est alors la somme de deux polarisations
orthogonales incoherentes entre elles. ρ = (trJ)−1 J est la matrice densite des photons associes (cf.
section 4.4.1).
Chapitre 3
Espace ; symetries ; calculvectoriel
La geometrie, autrefois presentee comme “art de raisonner juste sur des figures fausses”,s’est tres souvent developpee au cours de l’histoire en relation directe avec l’etude etla representation de l’“espace physique” : geometrie euclidienne (Euclide 400 A.C.)verifiee “experimentalement” avec une tres grande precision ; geometrie projective intro-duite a la Renaissance en relation avec les problemes de representation de la perspective(Desargues, Pascal � 1640) ; geometries non euclidiennes (� 1830) dont les auteurs, no-tamment Gauss et Lobatchevski, ont cherche a tester les consequences observationnelles ;geometrie des espaces metriques dont Riemann (� 1880) a pense pouvoir associer lacourbure a la gravitation etc. Le concept important a la base de toutes ces geometries,et d’autres telles que la geometrie symplectique (pour l’espace de phase en mecanique)ou la geometrie des espaces fibres (pour decrire les interactions fondamentales), est celuide groupe de symetrie. Le mathematicien Klein a ete le premier dans son programmed’Erlangen (1872) a insister sur l’idee qu’un espace geometrique est defini par une dimen-sion et l’action d’un groupe de symetrie, et a avoir defini les proprietes geometriquespar leur invariance vis-a-vis de ce groupe. Par exemple le plan “plat” et la sphere “courbe”sont deux espaces de dimension 2 homogenes (pas de point privilegie) et isotropes (pasde direction privilegiee en chaque point), mais dont les groupes de symetrie, respective-ment le groupe euclidien et le groupe des rotations, different.
En physique l’espace n’est defini que par rapport a un referentiel. Depuis Galilee (1632)on sait que les referentiels d’inertie se caracterisent par l’invariance des lois physiquesvis-a-vis des translations et rotations des coordonnees spatiales dans le referentiel (ho-mogeneite et isotropie de l’espace), des translations de temps (oubliees par Galilee), etdes mises en mouvement a vitesse uniforme de ces referentiels. Einstein (1905) a simple-ment etendu ce “principe de relativite” aux lois de l’electromagnetisme. La comparaisonavec les geometries montre qu’il existe donc une correspondance entre groupe de symetried’un espace et groupe de relativite de l’espace temps d’une part, et entre proprietesgeometriques et lois physiques d’autre part. Physique galileenne et physique einsteiniennedifferent par leur groupe de symetrie.
52 3 • Espace ; symetries ; calcul vectoriel
Apres une presentation generale des notions de symetrie et d’invariance en physique,nous nous interessons principalement dans ce chapitre aux symetries spatiales (transla-tions, rotations et symetries ponctuelles). Il est en effet indispensable de connaıtre leuraction non seulement sur l’espace (objet de la geometrie euclidienne), mais aussi surles grandeurs physiques qu’elles permettent de classer en scalaires, vecteurs... La des-cription mathematique de cette action repose pour une part importante sur les outilsdu calcul vectoriel (produits scalaire, vectoriel, mixte) mis au point vers 1880 par lesmathematiciens et les physiciens (Grassman, Hamilton, Gibbs, Maxwell...). Elle permet,lorsqu’un systeme physique possede des symetries spatiales particulieres, de predire cer-taines de ses proprietes grace a des “arguments de symetrie”. Des complements surles symetries spatiales (quadrupoles, spineurs...) ou autres (Lorentz en particulier) sontdonnes au chapitre 4.
3.1 SYMETRIE, INVARIANCE ET RELATIVITE
3.1.1 Groupes de symetrie et invariance
� Groupes et representations
Un groupe G (Galois 1832) est un ensemble d’elements g muni d’un produit assocatif(g3(g2g1) = (g3g2)g1) avec un element neutre e (eg = ge = g), chaque element g ayantun inverse g−1 (gg−1 = g−1g = e). Il est commutatif si g1g2 = g2g1 quels que soientg1, g2 ∈ G ; c’est en particulier le cas de tous les groupes continus a un seul parametre,par exemple les rotations autour d’un axe fixe.
Un groupe est donc un ensemble abstrait defini par sa loi de multiplication ; mais enpratique il “agit” sur des objets geometriques (points, vecteurs...) ou sur des systemeset des grandeurs physiques (dipole, champ electrique...) caracterises par des parametresx (coordonnees de points, composantes de vecteurs...). Cette action notee un peu abu-sivement x → gx, qui verifie ex = x et g2(g1x) = (g2g1)x, decrit une representation dugroupe G dans l’espace X des parametres. En general les espaces X correspondant auxdifferentes grandeurs physiques ont une structure d’espace vectoriel ; les representationslineaires, qui verifient par definition g(λ1x1 + λ2x2) = λ1 (gx1) + λ2 (gx2), jouent alorsun role important pour la classification de ces grandeurs.
� Symetries et invariance
Un objet (ou systeme physique) x est invariant par rapport a une transformation g sigx = x (parametres inchanges). L’ensemble des transformations qui laissent x invariantconstitue son groupe de symetrie. Mais en geometrie comme en physique le conceptde symetrie est plus profond, car il ne concerne pas simplement les objets pris individuel-lement mais plus generalement leurs relations. Une relation est dite invariante si, etantvraie pour des objets, elle l’est aussi pour leurs transformes ; symboliquement :
f(x1, x2 · · · ) = 0 ⇐⇒ f(gx1, gx2 · · · ) = 0
pour tout g ∈ G. G est alors un groupe de symetrie pour cette relation. Le groupe desymetrie des proprietes geometriques ou des lois physiques est toujours plus grand quecelui de tel ou tel objet particulier. Par exemple la propriete pour l’ensemble de deuxdroites du plan d’etre orthogonales est laissee invariante par toutes les translations et
3.1 Symetrie, invariance et relativite 53
toutes les rotations, mais seules les rotations denπ
2autour de leur point d’intersection
laissent cet ensemble invariant. De meme la loi selon laquelle un point M massif sur uneplanete spherique est soumis a une force dirigee vers le centre O est laissee invariante partoutes les translations et rotations de l’ensemble “masse-planete”, alors que ce systemen’est laisse invariant que par les rotations autour de l’axe OM .
� Points de vue actif et passif
Les transformations x→ gx qui font passer d’un objet parametre par x dans un systemede coordonneesR a l’objet parametre par gx (toujours dansR) sont dites actives. On peutinversement, point de vue passif, effectuer l’operation g sur le systeme de coordonnees ;R devient alors R’ et le meme objet parametre par x dans R l’est par x′ = g−1x dansR’.DEMONSTRATION : si on applique g a la fois au systeme de coordonneesR et aux objetsles coordonnees ne changent pas (figure 1 : R est arbitraire et g est une rotation). Donc(gx)′ = x pour tout x et x′ = (gg−1x)′ = g−1x. Les deux points de vue sont equivalents.
OO
gMgMM
R R’
Figure 1
Une propriete (ou loi) qui s’exprime par la relation f(x1, x2 · · · ) = 0 dans R sera diteinvariante si elle s’exprime sous forme identique a la prececente f(x′1, x
′2 · · · ) = 0 dans
tous les systemes R’ deduits de R par les transformations g ∈ G. (Remarquons l’analogieavec les changements d’unites etudies a la section 1.3.1.)
3.1.2 Le groupe de symetrie de la physique
Dans ce paragraphe nous adoptons exceptionnellement le point de vue passif et nousdesignons par R un systeme de coordonnees (ou referentiel) muni d’une origine spatio-temporelle, ce qui permet d’affecter a tout evenement une coordonnee temporelle t ettrois coordonnees spatiales x, y, z (relatives a un triedre orthonorme). Considerons deuxevenements reperes dans R par (ti, xi, yi, zi) (i = 1, 2), et soient T = t2−t1, X = x2−x1,Y = y2 − y1 et Z = z2 − z1 (
−→R = −→r 2 −−→r 1) les composantes de l’intervalle d’espace-
temps entre ces evenements. Les changements de referentiels inertiels sont caracterisespar les deux proprietes :
(1) preservation de l’addition des intervalles (2) invariance de c2T 2 −−→R
2.
(1) traduit l’homogeneite d’un espace temps “plat” et implique que les transformations
sur T , X , Y et Z sont lineaires. (2) qui s’ecrit c2T 2 − −→R
2= c2T ′2 − −→
R′2
a ete intro-
54 3 • Espace ; symetries ; calcul vectoriel
duite historiquement pour rendre compte de l’invariance de la vitesse c de la lumiere :|−→R |T
= c ⇐⇒ |−→R ′|T ′ = c. On peut montrer que le groupe des transformations continues
compatibles avec ces deux proprietes s’obtient par composition des trois types suivantsde transformations :
- Les translations d’espace-temps qui ne changent pas les composantes d’un intervalle(T ′ = T ,
−→R
′=−→R ) mais translatent les coordonnees d’un evenement :
t′ = t− t0 , x′ = x− x0 , y′ = y − y0 , z′ = z − z0 .
Elles dependent de quatre parametres, les coordonnees t0, x0, y0 et z0 dans R del’evenement choisi comme origine dans R′.
- Les rotations qui verifient T ′ = T et |−→R ′| = |−→R | ; une rotation depend de troisparametres (l’angle et l’axe de rotation, ce dernier etant specifie par deux angles). Parexemple pour une rotation d’axe Oz (figure 2) :
�
�
O
M
x’X’
Y’
Y
xX
y’ y
Figure 2
T ′ = T ; X ′ = X cos θ + Y sin θ ; Y ′ = −X sin θ + Y cos θ ; Z ′ = Z .
- Les transformations de Lorentz pures (sans rotation) caracterisees par la vitessede translation uniforme
−→V du referentiel R′ par rapport au referentiel R ; elles dependent
donc de trois parametres. Elles concernent a la fois T et la composante de−→R parallele a
la vitesse de translation, par exemple :
cT ′ = cT coshϕ−X sinhϕ , X ′ = X coshϕ− cT sinhϕ ; Y ′ = Y , Z ′ = Z;
l’invariance de c2T 2 −X2 resulte de cosh2 ϕ − sinh2 ϕ = 1. Interpretation physique : lereferentiel R′ se deplace a la vitesse V = c tanhϕ (ϕ rapidite) dans la direction x parrapport a R ; en effet en posant X ′ = Y ′ = Z ′ = 0, c’est-a-dire en considerant tous lesevenements attaches a un point fixe de R′, les relations X = c tanhϕT et Y = Z = 0montrent que leurs positions dans R se deplacent dans la direction x a la vitesse V .Comme 1 − tanh2 ϕ = cosh−2 ϕ la transformation s’ecrit aussi :
T ′ = γ(T − VX
c2
); X ′ = γ (X − V T ) avec γ = coshϕ =
(1 − V 2
c2
)− 12.
3.1 Symetrie, invariance et relativite 55
REMARQUE (figure 3). A un instant donne dans R (T = 0), des points fixes dans R′
espaces dans R′ de X ′, Y ′, Z ′ sont representes dans R avec un espacement X = γ−1X ′,
Y = Y ′ , Z = Z ′ : contraction “apparente” dans la direction x, negligeable siV 2
c2� 1.
�
x x’1 2 3 1 2 3
1
2
3 3
2
1
O’O
y’y V=2)(
t fixé
Figure 3
� Approximation galileenne
Dans la double limiteX
cTetV
c� 1, la transformation devient T ′ = T et X ′ = X − V T .
Plus generalement on appelle physique galileenne l’ensemble des lois laissees invariantespar les translations, les rotations, et les transformations de Galilee pures
T ′ = T ,−→R
′=−→R −−→
V T .
REMARQUE 1. Aux symetries “continues” ci-dessus peuvent s’ajouter des symetriesdiscretes qui correspondent a des transformations qui ne peuvent pas etre atteintescontinument a partir de l’identite. Il en est ainsi de l’operation de renversement dutemps (T ′ = −T ,
−→R
′=
−→R ) qui est une symetrie pour les phenomenes reversibles, ou
de la parite (T ′ = T ,−→R
′= −−→R) qui est une symetrie pour toutes les interactions sauf
l’interaction faible (cf. section 3.2.1).
REMARQUE 2. Vocabulaire : on dit de facon incorrecte que les lois physiques sont “rela-tivistes”. Elles sont en fait “invariantes” (meme formulation dans tous les referentielsinertiels). Ce qui est relatif, c’est la valeur des grandeurs, a commencer par la grandeur“espace”
−→R qui, meme en physique galileenne (si T �= 0), depend du referentiel. De ce
point de vue il n’y a pas de difference avec la geometrie : une egalite entre vecteurs−→V =
−→W
se formule de la meme maniere dans deux bases differentes : Vi = Wi ⇐⇒ V ′i = W ′
i , maisV ′i �= Vi et W ′
i �= Wi.
3.1.3 Symetries spatiales (presentation « experimentale »)
Les symetries spatiales continues correspondent aux deplacements des objets dans l’es-pace. Comme on le sait, un deplacement conserve les distances entre points et, en general,“tourne” les directions (en conservant les angles). Un deplacement general s’obtient encomposant des translations et des rotations.
56 3 • Espace ; symetries ; calcul vectoriel
� Translations
Les translations conservent les directions ; elles forment un groupe commutatif dont laloi de composition correspond a l’addition vectorielle (figure 4a). La translation T−→a devecteur −→a amene tout point M en M ′ tel que
−−−→MM ′ = −→a .
(b)(a)
2a
a1
a2
a2
a11+ a
Figure 4
REMARQUE. Lorsque le vecteur −→a (t) depend du temps, on parle de mouvement detranslation (figure 4b). Par exemple le referentiel geocentrique ayant pour origine lecentre T de la Terre et ses axes paralleles a ceux du referentiel de Copernic centre sur leSoleil S effectue un mouvement de translation autour du Soleil, et non de rotation bienque le vecteur
−→ST tourne.
� Rotations de centre O
Ces rotations, definies par un axe passant par O et un angle, “tournent” les directions.Elles forment un groupe mais ne commutent pas a l’exception du cas de rotations dememe axe ou du cas de rotations d’angle π et d’axes orthogonaux. La loi de compositiongenerale est donnee a la section 4.2.3.
�
�
��
� �
O
2
n
n
2
1
1nP M
M’P’
Figure 5
�
�
�
�
O
A
P P’
M M’
a
A
n
n
Figure 6
JUSTIFICATION (figure 5). Considerons l’expression RO(n2, ϕ) = RO(n, θ)RO(n1, ϕ)R−1O (n, θ) qui
relie deux rotations de meme angle ϕ dont les axes, de vecteurs directeurs n1 et n2, se deduisent l’un
de l’autre par la rotation RO(n, θ) amenant n1 sur n2. Les rotations a priori quelconques RO(n, θ)
et RO(n1, ϕ) commutent si RO(n, θ)RO(n1, ϕ)(= RO(n2, ϕ) RO(n, θ)
)= RO(n1, ϕ)RO(n, θ), donc si
RO(n1, ϕ) = RO(n2, ϕ)). Cette relation entraıne soit n1 = n2 si ϕ est quelconque, soit n2 = −n1 et
ϕ = π, ce qui conduit aux deux cas cites (soit n = n1, soit n ⊥ n1 et θ = ϕ = π).
3.1 Symetrie, invariance et relativite 57
REMARQUE (figure 6). Des rotations d’axes paralleles et de meme angle, mais de centresA et O differents, se deduisent par la relation :
RA(n, ϕ) = T−→a RO(n, ϕ)T−−→a (−→a =−→OA) .
� Vissages
La relation ci-dessus montre qu’une translation T−→a ne commute avec une rotationRO(n, ϕ) que si −→a est parallele a l’axe de rotation n (ce qui assure RO(n, ϕ) = RA(n, ϕ)puisque O et A sont alors sur le meme axe). La composition des deux transformations,lorsqu’elles commutent, est un vissage ; sur la figure 7, l’helice γ est le lieu des pointsqui se deduisent de M par les vissages λ−→a , λϕ (0 < λ < 1).
� a
M
M’
�
Figure 7
y y’
trièdre direct trièdre inverse
z z’
x’x
miroir
tire−bouchon usuel tire−bouchon "inversé"
Figure 8
Un exemple est donne par le tire-bouchon (usuel) dont le sens de deplacement, lie au sensde rotation, sert a definir les triedes directs par la fameuse “regle du tire-bouchon”(figure 8). Tout deplacement se ramene a un vissage.
O
A y
z
x’
y’z’
A’
Ax
y
1
1
z1
1
x
Figure 9
JUSTIFICATION (figure 9) : restreinte aux vecteurs unitaires n qui caracterisent les directions (vecteurs
“libres”), l’effet d’un deplacement se resume a une rotation. Soit z la direction de son axe. Un triedre
Axyz est alors deplace en A′x′y′z′ tel que les axes Az et A′z′ sont paralleles. La figure montre que ce
deplacement s’obtient en composant un deplacement plan amenant Axyz en A1x1y1z1 (A1, x1, y1
projection de A′, x′, y′ sur le plan Axy), et une translation−−−→A1A′ parallele a z. Le deplacement plan est
58 3 • Espace ; symetries ; calcul vectoriel
une rotation dont l’axe parallele a z (axe du vissage) coupe le plan en O, centre de rotation situe sur
la mediatrice de AA1 et tel que l’angle (−→OA,
−−→OA1) est celui dont ont tourne les axes Ax et Ay. Si ces
axes n’ont pas tourne le deplacement est simplement une translation.
Mouvement d’un solide. C’est une succession de vissages elementaires reliant sespositions aux instants t et t + dt. Chaque vissage elementaire est caracterise par unaxe (dont la position et la direction n(t) dependent du temps), une rotation infinitesimaled’angle ω(t) dt autour de cet axe et une translation infinitesimale de vecteur −→v (t) dtparallele a n(t) (cf. section 3.3.3).
� Symetries discretes (figure 10)
�
�
A P
M
MSAMSP
MS
x
y
x’
x’
y’
y’ y’
z’z’
z’ zx’
Figure 10
Elles conservent aussi les distances et les angles (en valeurs absolues). On distingue lessymetries SA par rapport a un centre A (
−−→AM → −−→
AM ′ = −−−→AM) , SΔ par rapport a unedroite Δ (equivalente a une rotation de π autour de Δ), et SP par rapport a un plan P .Dans tous les cas S2 est la transformation identite. Si Δ ⊥ P coupe P en A, SP differe deSA par SΔ. Noter que SA et SP , mais pas SΔ, changent le caractere (direct ou indirect)d’un triedre.
�
�
1P P2
a
2a
M
M’1 2
M’
M
2
1
M’
M’
M’
M’
2
12
(a) (b)
P
P
A
Figure 11
Les lois de composition de deux symetries par rapport a des plans P1 et P2 qui, soitsont paralleles (ils se deduisent alors l’un de l’autre par la translation de vecteur −→a ⊥ P1
et P2), soit se coupent selon l’axe (A, n) (la rotation RA(n, ϕ) transformant P1 en P2),
3.1 Symetrie, invariance et relativite 59
verifient respectivement (figures 11a,b, ou M ′1 = SP1M et M ′ = SP2SP1M) :
SP2SP1 = T2−→a et SP2SP1 = RA(n, 2ϕ) .
Ecrites SP2 = T2−→a SP1 et SP2 = RA(n, 2ϕ) SP1 , ces relations montrent que les symetriquesM ′
1 et M ′2 d’un point M par rapport aux plans P1 et P2 se deduisent l’un de l’autre, soit
par la translation T2−→a , soit par la rotation RA(n, 2ϕ).
EXEMPLES. Soient S1 et S2 les images d’une source S donnees par des miroirs paralleles ou “en
coin”, et γ1 et γ2 les deux rayons issus d’un meme rayon incident γ (figures 12a,b). Les intersections
L de γ1 et γ2 donnent le lieu de localisation des franges d’interferences (cf. section 3.2.3). Pour la
figure 12a L est a l’infini. Pour la figure 12b (dans le plan de figure), L est sur le cercle circonscrit
au triangle S1OS2 car γ1 et γ2 font entre eux un angle 2ϕ comme OS1 et OS2 ; ce cercle devient la
droite OP lorsque S est a l’infini dans la direction i. La figure 12c illustre le principe du cataphote :
SP1SP2SP3 = SO quel que soit l’ordre des reflexions sur les trois plans perpendiculaires deux a deux.
� �
�
�
�
���
L
i
i
S1
P2
P1
(b)2S S1
2
2P
OP2
P1
S
1 2
S2
S1
O
x
y
z
(c)(a)
Figure 12
3.1.4 Transformation des grandeurs et des champs physiques
Les operations de symetrie ne portent pas uniquement sur des objets geometriques “en-sembles de points”, mais aussi sur des objets physiques auxquels sont associees des gran-deurs. Lorsque l’objet est deplace (ou subit par la pensee une symetrie ponctuelle), cesgrandeurs peuvent changer. Toutes les grandeurs classiques sont laissees inchangees parles translations. (Voir remarque section 3.4.2. pour un etat quantique.) Par contre vis-a-vis des rotations et des symetries ponctuelles, on distingue les grandeurs scalaireslaissees inchangees (la masse, la charge, la temperature, etc.), les grandeurs vecto-rielles qui se transforment comme les vecteurs de la geometrie (vitesse, moment dipo-laire, etc.), et d’autres (spineurs, quadrupoles...) etudiees au chapitre 4. On verra aussia la section 3.2.1 que, vis-a-vis des symetries discretes, il faut distinguer les grandeursscalaires et pseudoscalaires de meme que les grandeurs vectorielles et pseudovecto-rielles. Dans tous les cas, l’invariance des lois physiques entraıne que les egalites nepeuvent avoir lieu qu’entre grandeurs ayant les memes lois de transformation.
Ces operations de symetrie portent aussi sur les champs relatifs aux objets physiques(densite volumique de charges par exemple), ou crees par eux (champ electrique), quisont des grandeurs dont la valeur depend du point d’espace ou elle est mesuree.
60 3 • Espace ; symetries ; calcul vectoriel
La figure 13 illustre, sur l’exemple du potentiel V (−→r ) (champ scalaire) et du champelectrique
−→E (−→r ) (champ vectoriel) d’un dipole, le fait tres important que dans une
symetrie la valeur du champ transforme au point transforme s’obtient en appliquantla transformation a la valeur du champ initial au point initial, ce qu’on peut ecriresymboliquement :
f ′(g−→r ) = g f(−→r ) .
+
−)+(E’ r a
+ −RE’( r )
r(E )
− +rSE’ P
( )�
P
−+
Figure 13
ATTENTION : g dans le membre de gauche designe l’action de la symetrie sur le vecteurposition, tandis que dans le membre de droite il designe son action sur la valeur f(−→r ) de lagrandeur f au point −→r , action qui depend de la nature (scalaire, vectorielle ou autre) de f .Ainsi pour une translation, f ′(−→r +−→a ) = f(−→r ) quelle que soit la nature de la grandeur
f ; pour une rotation, f ′(R−→r ) = f(−→r ) pour un champ scalaire et−→f
′(R−→r ) = R
−→f (−→r )
pour un champ vectoriel. La connaissance de ces lois de transformation est essentiellepour comprendre l’application des arguments de symetrie aux champs. La poursuite decette discussion sur les symetries est faite a la section 3.4.1.
3.2 CALCUL VECTORIEL ; APPLICATIONS
3.2.1 Produit scalaire, produit vectoriel et produit mixte ;pseudovecteurs
� Definitions et proprietes
Ces produits, qui generalisent−→V 1 · −→V 2 et σ(
−→V 1,
−→V 2) vus a la section 2.2.1, sont les
quantites multilineaires (i.e. lineaires par rapport a chacun des facteurs) definies dansune base orthonormee directe de vecteurs unitaires x, y et z par :
−→V 1 · −→V 2 = X1X2 + Y1Y2 + Z1Z2 =
−→V 2 · −→V 1 ,
−→V 1 ∧−→
V 2 = (Y1Z2 − Y2Z1)x+ (Z1X2 − Z2X1)y + (X1Y2 −X2Y1)z = −−→V 2 ∧ −→V 1 ,
3.2 Calcul vectoriel ; applications 61
(−→V 1,
−→V 2,
−→V 3) = (
−→V 1 ∧−→
V 2) · −→V 3
= (Y1Z2 − Y2Z1)X3 + (Z1X2 − Z2X1)Y3 + (X1Y2 −X2Y1)Z3
= (−→V 2,
−→V 3,
−→V 1) = (
−→V 3,
−→V 1,
−→V 2) (permutations circulaires) ;
Xi, Yi et Zi sont les composantes des vecteurs−→V i = Xix + Yiy + Ziz. Ils verifient les
relations :
(−→V 1 ∧−→
V 2) · −→V 1 = (−→V 1 ∧ −→
V 2) · −→V 2 = 0 ; |−→V 1|2|−→V 2|2 = (−→V 1 · −→V 2)2 + |−→V 1 ∧ −→
V 2|2 ;
−→V 1 ∧ (
−→V 2 ∧ −→
V 3) = (−→V 1 · −→V 3)
−→V 2 − (
−→V 1 · −→V 2)
−→V 3 �= (
−→V 1 ∧ −→
V 2) ∧ −→V 3 .
La premiere montre que−→V 1 ∧ −→
V 2 est orthogonal a−→V 1 et
−→V 2 ; sa direction est donnee
par la regle du tire-bouchon (cf. par exemple x ∧ y = z = −y ∧ x). La seconde permetd’introduire l’angle θ de deux vecteurs (cf. section 2.2.1) par
−→V 1 · −→V 2 = |−→V 1| |−→V 2| cos θ , |−→V 1 ∧ −→
V 2| = |−→V 1| |−→V 2| sin θ ,
et donc de traduire leur orthogonalite et leur parallelisme respectivement par−→V 1 ·−→
V 2 = 0 et−→V 1 ∧ −→
V 2 = 0 ; on en deduit aussi que lorsque les−→V i sont des vecteurs de
l’espace ordinaire, |−→V 1∧−→V 2| est egal a l’aire du parallelogramme construit sur−→V 1 et−→
V 2, et que |(−→V 1,−→V 2,
−→V 3)| = |(−→V 1 ∧−→V 2) ·−→V 3| est egal au volume du parallelepipede
construit sur−→V 1,
−→V 2 et
−→V 3, produit de la “surface de base” |−→V 1 ∧ −→
V 2| par le mo-dule de la composante de
−→V 3 perpendiculaire a cette base (hauteur du parallelepipede)
(figure 14). La derniere montre que le produit vectoriel n’est pas associatif, d’ou l’im-portance des parentheses et de leurs places ;
−→V 1 ∧ (
−→V 2 ∧ −→
V 3), orthogonal a−→V 2 ∧ −→
V 3,appartient au “plan” (
−→V 2,
−→V 3) (figure 15).
.h ^=
S =
�S
V3
V 1
V2u
V3u
2 1 VV
O
h
Figure 14
V2 V3
V1
V1
V3V1 V2
V1
V2 V3
)^(^
^direction de
Figure 15
Il resulte de la multilinearite de ces produits que leurs regles de derivation (lorsque lesvecteurs dependent d’un parametre) ou de differentiation sont analogues a celles des
62 3 • Espace ; symetries ; calcul vectoriel
produits de fonctions ; par exemple :
d(−→V 1,
−→V 2,
−→V 3) = d
((−→V 1 ∧ −→
V 2) · −→V 3
)=
(d−→V 1 ∧ −→
V 2 +−→V 1 ∧ d
−→V 2
) · −→V 3 + (−→V 1 ∧ −→
V 2) · d−→V 3
= (d−→V 1,
−→V 2,
−→V 3) + (
−→V 1, d
−→V 2,
−→V 3) + (
−→V 1,
−→V 2, d
−→V 3).
2v a
n
t
t+dt
dvdt
�
x
y
(a) (b)
RR
v
dl
d
Figures 16
Une consequence importante est que la differentielle d’un vecteur unitaire (ou de normeconstante) est orthogonale a ce vecteur : u · u = 1 entraıne d(u . u) = du · u + u · du =2u · du = 0. Si t est le vecteur unitaire tangent a une courbe (figure 16a), la relationdtdl
=1Rn definit le vecteur normal et le rayon de courbure. L’element dl est alors
assimilable a un arc de cercle (cercle osculateur) etdlR
est l’angle dθ dont a tourne t.
On en deduit, en mecanique (classique ou relativiste), la decomposition en composantestangentielle et normale de l’acceleration et de la force (figure 16b) :
a =dvdt
=dvdtt+
v2
Rn ;
−→F =
dpdt
=dpdtt+
vp
Rn .
Si au point considere, pris comme origine 0, les vecteurs t et n sont selon Ox et Oy,l’equation de la courbe est y = x2
2R (approximation pres de O de (y −R)2 + x2 = R2).
REMARQUE. Vis-a-vis des rotations, qui conservent les longueurs et les angles, le produit scalaire de
deux vecteurs est un invariant (R−→V 1 · R
−→V 2 =
−→V 1 · −→V 2), tandis que le produit vectoriel se comporte
comme un vecteur (R−→V 1 ∧ R
−→V 2 = R(
−→V 1 ∧ −→
V 2)). On demontre que tout invariant (aussi appele
“scalaire” ), construit a partir de deux vecteurs−→V 1 et
−→V 2 est une fonction de
−→V
2
1,−→V
2
2 et−→V 1 · −→V 2.
� Pseudovecteurs et symetries discretes
Dans une symetrie SO, des vecteurs translation−→V 1 et
−→V 2 sont changes en −−→V 1 et −−→V 2 ;
cette loi de transformation caracterise les “vrais” vecteurs, appeles aussi vecteurs po-laires. Par contre
−→V =
−→V 1 ∧−→
V 2 reste inchange ; on l’appelle pseudovecteur ou vecteur
3.2 Calcul vectoriel ; applications 63
axial, et on l’ecrit parfois avec une fleche incurvee pour le distinguer des “vrais” vec-teurs. Le produit vectoriel d’un vecteur avec un pseudovecteur est un vecteur, tandisque le produit vectoriel de deux pseudovecteurs est un pseudovecteur. On fera attentiona l’action “surprenante” d’une symetrie plane SP = SΔSO sur un pseudovecteur : sacomposante perpendiculaire au plan reste inchangee tandis que sa composante paralleleau plan change de signe ; les figures 17a et 17b representent l’action de S0 et de SPrespectivement sur un vrai vecteur et sur un pseudovecteur.
planP
SPV
V SPV
S VO
S VO
V
planP
� �
OO
(a) (b)
axe axe
Figure 17
�
�
�
�
P
Figure 18
Des exemples de pseudovecteurs sont :−→L = −→r ∧ −→p (moment cinetique),
−→Γ = −→r ∧ −→
F
(moment d’une force), −→ω (vitesse de rotation, figure 18), −→μ (moment magnetique),−→B
(champ magnetique), etc.
La figure 19 illustre l’invariance de l’electromagnetisme dans une symetrie SP :−→B′(SP −→r ) = SP
−→B (−→r ). La figure 20a illustre la non invariance des interactions
faibles (desintegration β) : une source de cobalt polarisee perpendiculairement au planP , donc caracterisee par −→μ ⊥ P laisse invariant par SP , emet des nombres differentsd’electrons de part et d’autre de P ; la desintegration symetrique qui correspond a lafigure 20b n’a jamais ete observee.
B )( r B’ SP r )(
I IP
Figure 19
��
P P CoCo
(b)(a)Figure 20
REMARQUE. Le produit scalaire d’un vecteur et d’un pseudovecteur, qui change designe dans une symetrie SO, est appele pseudoscalaire.
64 3 • Espace ; symetries ; calcul vectoriel
3.2.2 Equations de plans ; frequences spatiales ; reseaux
� Equations de plans ; ondes planes
Un plan orthogonal au vecteur unitaire n(α, β, γ) et distant de d de l’origine O a pourequation (figure 21) :
d = OH = n · −→r = αx+ βy + γz .
n �
�
�
H
Md
rOFigure 21
n�
�
�
�
�
�
plan d’onde
xx
Figure 22
Par exemple (figure 22) une onde a cos(ωt−−→k · −→r +ϕ) est dite onde plane parcequ’elle
prend une meme valeur lorsque ωt − −→k · −→r + ϕ = Φ (fixe modulo 2π), c’est-a-dire sur
les plans d’onde orthogonaux a n =−→k
|−→k |et d’equations n · −→r =
ωt+ ϕ− Φ
|−→k |(modulo
λ =2π
|−→k |). A un instant donne ces plans sont equidistants de la longueur d’onde λ ; ils se
deplacent a la vitesse de phase vϕ =ω
|−→k |. Le vecteur −→σ =
n
λ=
−→k
2πest appele frequence
spatiale. Sa composante σx =α
λ=kx2π
est bien l’inverse de la periode Δx =2πkx
mesuree
sur l’axe Ox ; par contre nλ ne peut pas representer un “vecteur periode spatiale” carαλ �= Δx (sauf a une dimension).
De meme l’interference de deux ondes planes ai cos(ωt − −→k i · −→r + ϕi) conduit a
des surfaces d’egale intensite (−→k 2 −−→
k 1) · −→r = constant (modulo 2π). Ce sont des plans
fixes orthogonaux a−→k 2 − −→
k 1 et distants de2π
|−→k 2 −−→k 1|
∼ λ
θ(si l’angle θ entre
−→k 2 et
−→k 1 est petit) (figure 23).
2k
k1
k1
2k
− �� �
Figure 23
3.2 Calcul vectoriel ; applications 65
� Reseaux
Un autre exemple est celui des plans reticulaires d’un reseau. On appelle reseau unensemble de points deduits de O par les translations de vecteurs
−→t (m,n,p) = m−→a + n
−→b + p−→c (m,n, p ∈ Z)
(−→a ,−→b ,−→c vecteurs de base du reseau). Une famille de plans reticulaires permet pardefinition de regrouper les points du reseau par plans ; la figure 24a represente une coupede familles de plans reticulaires, en supposant −→c perpendiculaire a −→a et
−→b .
(0,1
,0)
(1,1,0)
(1,0,0)
(1,3,0)
(a) (b)
B
A
b
a
Figure 24
Pour decrire ces familles de plans, on introduit le reseau reciproque des frequencesspatiales
−→σ (h,k,l) = h−→A + k
−→B + l
−→C (h, k, l ∈ Z) ,
dont les vecteurs de base−→A ,
−→B et
−→C sont definis par
−→A · −→a =
−→B · −→b =
−→C · −→c = 1 et−→
A · −→b =−→A · −→c = 0,
−→B · −→c =
−→B · −→a = 0 et
−→C · −→a =
−→C · −→b = 0 (figure 24b). L’equation
d’une famille de plans reticulaires s’ecrit alors :
−→σ (h,k,l) · −→r = μ μ ∈ Z ;
elle est caracterisee par les trois nombres h, k et l premiers entre eux appeles indices deMiller (chaque valeur de μ correspondant a un plan de la famille).
DEMONSTRATION : tout point du reseau appartient bien a la famille car −→σ (h,k,l) · −→t (m,n,p) = hm+
kn+ lp ∈ Z. La condition h, k, l premiers entre eux est necessaire pour que tous les plans contiennent
des points du reseau, notamment le plan μ = 1 ; en effet le theoreme de Bezout assure alors l’existence
de nombres entiers m n et p tels hm+kn+ lp = 1 (contre exemple 2m+2n+4p = 1 n’a pas de solution).
On verifie aisement sur leurs equations que le plan μ = 1 coupe les trois axes issus de O et paralleles a−→a ,
−→b et −→c en
−→ah
,−→bk
et−→cl
et que deux plans voisins sont distants de d(h,k,l) = |−→σ (h,k,l)|−1.
66 3 • Espace ; symetries ; calcul vectoriel
3.2.3 Differentielles de chemins ; effet Doppler ; lois de Descartes
� Differentielle de la longueur AB d’un segment
Si A et B se deplacent de d−→r A et d−→r B, la variation de AB est
d(AB) = d(u · −−→AB) = u · d−−→AB = u · (d−→r B − d−→r A)(u =
−−→AB
AB
)
(car u · du = 0). On retrouve ce resultat en calculant d√−−→AB2 =
12AB
2−−→AB · d
−−→AB ou
encore en regardant simplement la figure 25 (A′B′ −AB = HK −AB = BK −AH).
A
B’
Ku
H
A’
drA
drB
B
Figure 25
D
D1
2
LS
1 u
vDTDSv
ST
2S
Figure 26
EXEMPLE 1. Effet Doppler (figure 26). Dans un referentielR une source se deplacanta la vitesse −→v
Semet des signaux (sonores, optiques...) a intervalles de temps reguliers
TS ; ces signaux sont recus a intervalles de temps reguliers TD par un detecteur quise deplace dans R a la vitesse −→v
D. Si on suppose |−→v
S|TS et |−→v
D|TD � L (distance
de propagation du signal), les vecteurs unitaires u des directions de propagation dedeux signaux successifs peuvent etre confondus. Si V est la vitesse du signal on a
TD = TS +ΔLV
ou ΔL = u · (−→vDTD − −→vSTS) est la difference des trajets parcouruspar ces signaux. D’ou :
TD = TS1 −
−→vS·uV
1 −−→v
D·u
V
.
On remarquera que ce calcul n’implique aucun changement de referentiel. CependantTD et TS ne sont les periodes mesurees dans les referentiels de la source et du detecteurque dans l’approximation galileenne. En realite ces periodes (temps propres) sont
τS,D = TS,D
(1 − v2
S,D
c2
) 12
(cf. section 4.3.3) et les frequences correspondantes sont νS,D
= τ−1S,D.
3.2 Calcul vectoriel ; applications 67
EXEMPLE 2. Interference de deux ondes spheriques ai cos(ωt− kri +ϕi) (ri =
SiM et k =2πλ
, figure 27). A grande distance dans une direction proche de celle de
S1S2, la relation S1M − S2M = S1S2 cosα ∼ S1S2
(1 − α2
2
)entraıne que les lignes
d’egale intensite k(r2 − r1) = constante (modulo 2π) sont sur des cones de sommetS1 ∼ S2 (cf. aussi section 2.3.2).
�
M
S1
S2
Figure 27
�O
S
M
M
M1u
2
Figure 28
EXEMPLE 3. Largeur de coherence. On considere une source de lumiere monochromatique eten-
due centree en O, dont les points S emettent de facon incoherente, et un point M eloigne (figure 28).
On admet que les amplitudes complexes en deux points M1 et M2 voisins de M (−−−−→M1M2 ⊥ −−→
OM)
presentent un certain degre de coherence tant que la distance SM1 − SM2 varie de moins d’une
fraction de longueur d’onde lorsque S decrit la source. Comme SM1 − SM2 = u · −−−−→M1M2 = αM1M2
avec − θ2≤ α ≤ θ
2(ou θ est l’angle suppose petit sous lequel on voit la source de M), la condition de
coherence correspond approximativement a M1M2 <λθ (largeur de coherence).
� Differentielles de chemins optiques
Le principe de Fermat pour un dioptre “nAAM + nBMB extremum” (A et B fixes, Mpoint courant sur le dioptre) se traduit par d(nAAM + nBMB) = (nA uA − nB uB) ·d−→r M = 0 (u vecteur unitaire porte par le rayon) ; d−→r M etant un vecteur tangent audioptre (figure 29), on obtient la loi de Descartes :
nA uA‖ = nB uB‖ (u‖ projection de u sur le plan tangent au dioptre) .
drM
i
r
A
B
M
n
n
A
B
M’
Figure 29
Cette loi avec nA = nB s’applique aussi a la reflexion sur un miroir. Si maintenanton considere un trajet AMB reellement suivi par la lumiere (un rayon) et le chemin
68 3 • Espace ; symetries ; calcul vectoriel
optique L(A,B) = nAAM + nBMB correspondant, sa differentielle s’ecrit dL(A,B) =nAuA · (d−→r M − d−→r A) + nBuB · (d−→r B − d−→r M ) ou, compte tenu de la loi de Descartes :
dL(A,B) = nB uB · d−→r B − nA uA · d−→r A .
L’observation de la figure 30 et l’application repetee de cette relation montrent qu’elles’etend a la traversee d’un nombre quelconque de dioptres (dL(A,C) = nC uC · d−→r C −nA uA · d−→r A), ou meme dans la limite continue a un milieu d’indice variable.
Bu
uC
Au
A
A’
B’
C’
B
C
Adr
Bdr
Cdr
M
M’
Figure 30
On en deduit que tous les points C qui sont situes a une meme distance optique d’unpoint source A sont sur une surface perpendiculaire aux rayons (Theoreme de Malus).En effet dL = 0 et d−→r A = 0 implique uC · d−→r C = 0. (cf. aussi section 7.3.2.)
u1
u2 u’2
1u’
S
sourceétendue
Pinterférentiel
Système
Figure 31
Application aux interferences (figure 31). Soient P un point ou interferent deux ondesissues d’une source ponctuelle S, u1, u2 les directions d’emission, u′1, u
′2 les directions
d’arrivee en P , et L1 et L2 les chemins optiques correspondant aux deux rayons allantde S a P . On a :
d(L2 − L1) = (u′2 − u′1) · d−→r P − (u2 − u1) · d−→r S .Si S est fixe la condition (u′2 − u′1) · d−→r P = constante (modulo λ) donne les surfacesd’egale intensite (deja obtenues a la section 3.2.2) pour deux ondes planes. On en deduitaussi le lieu de localisation des interferences lorsque la source est etendue. En effetpour que l’interference en P (fixe) ne soit pas detruite lorsqu’on etend la source, il fautque (u2 − u1) · d−→r S = 0. Donc soit d−→r S ⊥ u2 − u1 ce qui implique que la source estune fente, soit u1 = u2. Dans ce dernier cas, qui suppose un systeme interferentiel aseparation d’amplitudes, les franges se localisent sur la surface lieu des intersections desrayons issus d’un meme rayon incident (exemple figure 12).
3.2 Calcul vectoriel ; applications 69
3.2.4 Vecteurs surface ; flux de grandeurs
� Vecteurs surface
Considerons un parallelogramme oriente construit sur deux vecteurs ordonnes−→V 1 et−→
V 2 (figure 32). On appelle “vecteur surface” le vecteur−→V 1 ∧ −→
V 2. La justification decette appellation est que sa norme est egale a la surface du parallelogramme, et quesa projection (
−→V 1 ∧ −→
V 2) · u sur une direction u correspond a l’aire algebrique de laprojection du parallelogramme sur un plan perpendiculaire a u et oriente par u via laregle du tire-bouchon. En effet on verifie que (
−→V 1 ∧ −→
V 2) · u = (−→V 1‖ ∧
−→V 2‖) · u ou les
vecteurs−→V i‖ =
−→V i − (
−→V i · u)u sont les projections des vecteurs
−→V i sur le plan.
��������������������������������������������
��������������������������������������������
��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
1 2
11
2
11
2V
V
VV
V
V V
u
Figure 32
dS
dS’�
�������������������������
�������������������������u
Figure 33
Plus generalement pour une surface infinitesimale dS s’appuyant sur une courbe orienteeγ, on introduit le vecteur
−→dS = dS n ou n est le vecteur unitaire normal a l’element de
surface et dont le sens est determine par l’orientation de γ ;−→dS ·u est alors l’aire apparente
dans la direction u (“l’ombre” de dS sur un plan perpendiculaire a u). Pour une surfacefinie orientable (cf. section 7.2.2), le vecteur surface
−→S est la somme des vecteurs
−→dS ; on
fera attention a ce que son module |−→S | ne represente pas l’aire totale, qui est la sommedes |−→dS|. Lorsque la surface s’appuye sur une courbe fermee γ, la somme algebrique des−→dS · u (aire hachuree sur la figure 33), et donc aussi
−→S , ne depend que de γ. Dans le cas
d’une surface fermee, γ est reduit a un point et−→S = 0.
EXEMPLES.−→dS =
12−→r ∧ −→
dr est l’aire balayee par un rayon vecteur −→r (cf. sec-
tion 2.2.1). Le moment cinetique orbital−→L = −→r ∧ m−→v s’ecrit 2m
−→dSdt
. Le mo-ment magnetique d’un circuit ferme parcouru par un courant d’intensite I est
−→μ = I
∮ −→r ∧−→dr
2= I
−→S ; cette formule est la version continue de l’expression −→μ =
12
Σi qi−→r i ∧ −→v i valable pour une distribution discrete de charges ; −→μ =q
2m−→L pour
une seule charge en mouvement orbital.
70 3 • Espace ; symetries ; calcul vectoriel
� Flux de particules et flux associes
Considerons des particules d’un type “i” donne, en nombre ni par unite de volume etayant une meme vitesse −→v i. Le flux de ces particules a travers
−→dS est le nombre de
particules qui traversent−→dS par unite de temps ; c’est le quotient par dt du nombre de
particules presentes dans le cylindre de base−→dS et de generatrice −→v i dt, donc de volume
(−→v i dt) ·−→dS (figure 34). Si gi est une grandeur (masse, charge...) attachee aux particules,
dS
v dti
Figure 34
le flux de particules s’accompagne d’un flux de cette grandeur egal a nigi (−→v i ·−→dS). Pourun systeme macroscopique contenant plusieurs types de particules, ce flux s’obtient ensommant sur “i” et en introduisant des quantites macroscopiques moyennes.
EXEMPLE 1 : le flux de masse Σi nimi (−→v i · −→dS) s’ecrit
dϕm = ρ−→v · −→dS =−→j m · −→dS ,
ou ρ = Σinimi est la masse volumique, −→v =Σnimi
−→v iΣnimi
est la vitesse du centre de
masse (vitesse d’ensemble), et−→j m est la densite volumique de courant de masse.
EXEMPLE 2 : le flux de charges electriques Σi niq (−→v i ·−→dS) (pour une seule especede porteurs : qi = q) s’ecrit ρ−→v ·−→dS ou ρ = Σiniq est la densite volumique des porteurs
et −→v =Σni−→v iΣni
leur vitesse moyenne. Pour plusieurs especes α de porteurs allant a
des vitesses moyennes differentes, il faut ajouter les contributions de chacune :
dϕq =∑α
ρα−→v α · −→dS =
−→j q ·
−→dS (
−→j q densite volumique de courant electrique) .
EXEMPLE 3 : le flux de quantite de mouvement Σi ni (mi−→v i) (−→v i · −→dS) s’ecrit
d−→ϕ p = ρ−→v (−→v · −→dS) + P−→dS
si la distribution des vitesses relatives−→V i = vi − v est isotrope (v etant la vitesse
d’ensemble). Ce flux apparaıt comme la somme d’un flux macroscopique ρv (v · −→dS)associe au mouvement d’ensemble des particules et d’un flux “microscopique”
3.2 Calcul vectoriel ; applications 71
Σi nimi−→V i (
−→V i · −→dS) = P
−→dS associe a leur mouvement relatif. (Demonstration : on
developpe∑
i nimi(v +−→V i)
((v +
−→V i) · −→dS
)en utilisant les egalites
∑i nimi
−→V i = 0,∑
i nimi(VixViy ou VixViz ou ViyViz) = 0 et∑i
nimi(V 2ix ou V 2
iy ou V 2iz) =
13
∑i
nimi−→V
2
i
consequences de l’isotropie.) Pour des particules identiques on obtient l’expression bien
connue P =13nm <
−→V
2
i > de la pression cinetique d’un gaz parfait. Dans le cas d’un
gaz de photons isotrope, le flux s’ecrit Σini(eicui
)(cui · −→dS), d’ou la relation P =
13u
entre la pression de radiation et la densite volumique d’energie u = Σi niei.
EXEMPLE 4 : flux d’energie. Si ei = 12miv2i + migzi + εi est l’energie totale d’une particule, un
petit calcul montre que le flux d’energie Σiniei (−→v i · −→dS) associe, dans le cas ou la distribution des
vitesses relatives−→V i = −→v i −−→v est isotrope, s’ecrit
dϕE = ρ(
12v2 + e+ gz
)−→v · −→dS + −→v · P−→dS ,
ou e = ρ−1Σini(
12miV 2
i + εi)
est l’energie interne massique. Pour un ecoulement stationnaire, le flux
de masse ρ−→v · −→dS etant le meme le long d’un tube de fluide, on obtient (si le fluide est isole) le
theoreme de Bernouilli : la quantite 12v2 + e+ gz+P
ρ est constante le long d’une ligne de courant.
Remarque : dans les exemples 3 et 4 on n’a pas pris en compte les forces a distance entre particules
situees de part et d’autre de−→dS ; elles ont pour effet d’ajouter a P une pression moleculaire.
� Flux d’un champ de vecteurs
Soit−→A (−→r ) la valeur d’un champ au point −→r ou se trouve l’element de surface
−→dS.
On appelle flux de−→A a travers
−→dS la quantite
−→A (−→r ) · −→dS. On notera que les flux de
masse, charge, energie et quantite de mouvement (a condition de proceder composantepar composante), se mettent bien sous cette forme. On peut aussi citer le flux thermiqued’energie
−→j th · −→dS (cf. section 7.2.3) et le flux d’energie electromagnetique dϕem =
(−→E ∧ −→
H ) · −→dS avec−→E ∧−→
H vecteur de Poynting.
3.2.5 Sphere, angle solide et applications
� Coordonnees spheriques (figures 35 et 36)
Ce sont les coordonnees r, θ et ϕ definies par
x = r sin θ cosϕ , y = r sin θ sinϕ , z = r cos θ .
θ ∈ [0, π] est la colatitude (la latitude estπ
2− θ) et ϕ ∈ [0, 2π[ la longitude (ou
angle azimuthal). Pour la sphere x2 + y2 + z2 = r2, le point θ = 0 est le pole nord,θ = π le pole sud, et θ =
π
2correspond a l’equateur. Quand r, θ et ϕ varient de
facon infinitesimale, le point M se deplace respectivement de dr, r dθ et r sin θ dϕ dansles directions definies par les vecteurs unitaires r (“verticale”), θ (“sud”) et ϕ (“est”)formant un triedre direct. On en deduit que des elements de longueur dl, de surface dSsur la sphere, et de volume dV s’ecrivent :
dl =√
dr2 + r2 (dθ2 + sin2 θ dϕ2) , dS = r2 sin θ dθ dϕ , dV = r2 sin θ dr dθ dϕ .
72 3 • Espace ; symetries ; calcul vectoriel
� � �
O
u
r
P
M
y
z
xu
z
P
M
r
r�
�
Figure 35
����������������������������������������������������������������������������������������������������������������������������������
����������������������������������������������������������������������������������������������������������������������������������
������������������������������������������������������������
������������������������������������������������������������
équateur
anneau
calotte
S
N
��r
���r sin
Figure 36
EXEMPLES DE LONGUEURS : rΔθ pour un arc de meridien (ϕ fixe) et r sin θΔϕpour un arc de parallele (θ fixe). La forme quadratique r2 (dθ2+sin2 θ dϕ2) est appeleemetrique de la sphere de rayon r.
EXEMPLES DE SURFACES : 2πr2 sin θ dθ pour un anneau infinitesimal et donc2πr2 | cos θ2 − cos θ1| pour un anneau (θ ∈ [θ1, θ2]) ; 2πr2(1− cos θ0) pour un calotte(θ ∈ [0, θ0], surface decoupee sur la sphere par le cone d’angle au sommet θ0) ; 2r2 Δϕpour un secteur (“quartier d’orange” ϕ ∈ [ϕ1, ϕ2]) ; 2πr2 pour une demi sphere (sec-teur avec Δϕ = π ou calotte avec θ0 =
π
2) et 4πr2 pour la sphere.
EXEMPLES DE VOLUMES : les volumes des cones de sommet O et limites par une
surface spherique quelconque d’aire S s’obtiennent en remplacant r2 parr3
3dans S
(integration de r2 dr) ; par exemple V =43πr3 pour la sphere.
� Angle solide
Toutes les surfaces precedentes divisees par r2 definissent l’angle solide Ω =S
r2du cone
de sommet O qui “decoupe” la surface S sur la sphere. Plus generalement, pour un cones’appuyant sur une surface orientee
−→dS (figure 37), on definit un angle solide elementaire
algebrique :dΩ =
−→dS · rr2
.
|−→dS · r| est la surface decoupee sur la sphere de rayon r. Le volume de ce cone est13r3 dΩ =
13r dS cosα =
13h dS .
Applications. Le volume d’un cone quelconque de hauteur h et de base plane d’aire
S vaut13Sh. Le flux a travers une surface
−→dS du champ electrique du a une charge
placee a l’origine estq
4πε0r2r · −→dS =
q
4πε0dΩ. Donc pour une surface fermee orientee
vers l’exterieur et entourant une charge totale Q, le flux total vautQ
ε0: theoreme de
3.2 Calcul vectoriel ; applications 73
Gauss. Les charges exterieures ne contribuent pas car pour elles l’addition algebriquedes angles solides donne zero (figure 38).
�O
r dS
r
h
Figure 37
q
q
int
ext
Figure 38
� Etendue d’un pinceau lumineux (figure 39)Considerons un pinceau, ensemble de rayons rectilignes, traversant une surface
−→dS et presentant en tout
point O de−→dS une dispersion angulaire dΩ autour de la direction moyenne u ; son etendue est :
de = (−→dS · u) dΩ .
����������������������������������������������������������������������������������������������������
����������������������������������������������������������������������������������������������������
dS
dS’
u�d
�d
O’
O
Figure 39
�
�
�
n
dS
1
n 2
2
1
Figure 40
La propriete importante de l’etendue est d’etre independante de la section consideree. En effet a la
distance r de−→dS la section apparente
−→dS′ · u = r2 dΩ est differente, mais cette difference est compensee
par le fait que en tout point O′ de−→dS′ la dispersion des rayons issus de
−→dS est devenue dΩ′ =
−→dS·ur2
.
Quand un pinceau traverse un dioptre (figure 40), la quantite n2 (sin θ dθ dϕ) (dS cos θ) reste constante
a cause des lois de Descartes (n1 sin θ1 = n2 sin θ2 et ϕ1 = ϕ2) et de leurs differentielles (n1 cos θ1 dθ1 =
n2 cos θ2 dθ2 et dϕ1 = dϕ2). Donc l’etendue optique n2 de du pinceau se conserve. Il en est de meme
de sa luminance definie par L = dFn2 de
ou dF est le flux d’energie, suppose constant en negligeant les
pertes en cours de propagation. Une consequence non triviale est que l’energie et donc le nombre de
photons par cellule elementaire de l’espace de phase, emis par une source (thermique, laser, etc.), se
conserve lui aussi dans la propagation : c’est une caracteristique de la source.
DEMONSTRATION : considerons un pinceau quasi-monochromatique de luminance dL = l(ω) dω (l(ω)
luminance spectrale) et de section droite dxdy qui se propage dans le vide selon Oz (ω = ckz). Soient
dω = cdkz et dkx, dky , dkz les dispersions en pulsation et vecteur d’onde des photons associes ; alors
74 3 • Espace ; symetries ; calcul vectoriel
dF = l(ω) dω dxdy dΩ avec dΩ =dkx dky
k2z. Le nombre de photons contenus dans un volume dxdy dz
(avec dz = cdt) est : dN = (�ω)−1 dF dt = c2
�ω3 l(ω) dkx dky dkz dx dy dz. Comme une cellule correspond
a dkx dky dkz dxdy dz = (2π)3 (equivalent a d3r d3p = h3), ce nombre par cellule est (2π)3 c2
�ω3 l(ω) ; ilse conserve (comme ω et l(ω)).
REMARQUE : pour une source thermique, ce nombre n’est autre que le facteur de Planck(exp �ω
kBT−1
)−1multiplie par deux (pour tenir compte des deux etats d’helicite des photons ; cf. section
4.4.1).
3.2.6 Geometrie spherique ; notion de transport parallele
� Geodesiques
Sur la sphere les geodesiques (plus court chemin d’un point a un autre) sont les grands cercles intersectionsavec les plans passant par O, les meridiens par exemple mais pas les paralleles a l’exception de l’equateur.Les triangles spheriques, triangles dont les cotes (de longueurs a, b, c) sont des arcs de grands cercles,ont des proprietes trigonometriques qui ressemblent a celles des triangles plans (dont les cotes rectilignessont des geodesiques du plan) ; par exemple :
sin Asin(a/R) = sin B
sin(b/R) = sin Csin(c/R) ; cos c
R= cos a
Rcos b
R+ sin a
Rsin b
Rcos A .
Pour R � a, b, c ces formules donnent celles bien connues du plan sin Aa = sin B
b = sin Cc et c2 =
a2 + b2 − 2ab cos A. Une propriete facile a verifier est que la somme des angles d’un triangle spheriquevaut :
A+ B + C = σ = π + SR2 (S aire du triangle ABC) .
On remarque en effet en coupant un triangle en deux que σ = σ1 + σ2 − π (figure 41a) ce qui suggere,puisque σ − π = (σ1 − π) + (σ2 − π), que σ − π est proportionnel a l’aire du triangle et meme plusprecisement a S
R2 puisque σ est sans dimension ; reste a verifier que le coefficient de proportionnalitevaut 1 ce qui est evident pour un triangle trirectangle : sa surface vaut le huitieme de celle de la sphere
(figure 41b) et on a bien σ = 3 π2
= π + 1R2
πR2
2.
(a) (b)
RS =2π 2
2π=σ 3
S 2σ2
S1σ1
A
b
a
c
BC
Figure 41
� Courbure et transport parallele
De facon generale on definit la courbure de Gauss (ou intrinseque) d’une surface en un point Mde la maniere suivante. On considere un circuit elementaire ferme entourant M dont les cotes sontdes geodesiques et on transporte le long de ce circuit un vecteur tangent a la surface en maintenantconstant la longueur du vecteur et l’angle qu’il fait avec les geodesiques ; on dit alors que le vecteursubit un transport parallele (generalisation naturelle, au cas d’une surface quelconque, du trans-port d’un vecteur dans le plan euclidien, parallelement a lui meme). Soient dS la surface delimitee parle circuit et dα l’angle dont a tourne le vecteur apres un tour ; la courbure de Gauss est le rapportdαdS
(dα et dS sont algebriques). Pour un triangle spherique α = σ − π = SR2 (cf. exemple figure 42a) ;
3.2 Calcul vectoriel ; applications 75
la courbure de la sphere est donc la meme en tout point, positive et egale a 1R2 . Pour un triangle plan
α = 0 et la courbure du plan euclidien est evidemment nulle, comme celle du cylindre, ce qui est moinsintuitif (figure 42b). La figure 42c montre un exemple de surface a courbure negative.
(a) (b)
�
�
S
S
(c)
S
Figure 42
REMARQUE. Transport parallele et pendule de Foucault. Le transport parallele d’un vecteur
tangent d’un point A (θ,ϕ) a un point B voisin (θ, ϕ+dϕ) sur le meme parallele ne conserve pas l’angle
qu’il fait avec le parallele car ce dernier n’est pas une geodesique. La variation de cet angle est − cos θ dϕ.
On obtient ce resultat en considerant le transport le long du chemin geodesique ferme ACDBA qui
correspond a une rotation δα = aire(ACDBA)R2 = cos θ dϕ et en remarquant que le transport de A a B le
long de ACDB ne modifie pas l’angle du vecteur avec le parallele (figure 43a) ; − cos θ dϕ correspond donc
bien au seul transport de A a B. Plus intuitivement, en remarquant que l’arc “infinitesimal” de grand
cercle de A a B (geodesique) est asssimilable au segment AB et en maintenant l’angle du vecteur avec ce
segment constant lors de son transport de A a B, on voit que la variation d’angle avec le parallele (comme
avec le meridien) est (figure 43b) : −APB = −ABPA
=−R sin θ dϕR tgθ =− cos θ dϕ. Pour un transport fini le
long du parallele, cette variation vaut − cos θΔϕ.
−
P
(b) (c)
parallèle de A
αP
P
(a)
parallèle
�
�
�
�
C D
B
A
A
A B
A B
Figure 43
Si on admet que la direction d’oscillation d’un pendule de Foucault (tangente au globe terrestre) est
transportee parallelement a elle meme lors de la rotation de la terre, − cos θ dϕ est aussi l’angle de
rotation du plan d’oscillation du pendule par rapport a la direction nord locale. En une journee, cet
angle est −α = −2π cos θ (α angle du cone de sommet P “deploye” ; figure 43c).
76 3 • Espace ; symetries ; calcul vectoriel
3.3 VECTEURS TOURNANTS ; MECANIQUE DU SOLIDE
Les rotations et mouvements de rotation jouent un role tres important en physique (cf.aussi section 6.3).
3.3.1 Vecteurs tournants ; changements de referentiels
� Representation vectorielle des rotations
Soit n le vecteur unitaire de l’axe de rotation, et soit
−→V = (
−→V · n) n+
−→V − (
−→V · n) n =
−→V ‖ +
−→V ⊥
la decomposition d’un vecteur−→V en vecteurs parallele et orthogonal a n (
−→V ‖ ∧ n = 0 ;−→
V ⊥ · n = 0)(figure 44). La rotation laisse−→V ‖ =
−−→OH inchange et tourne
−→V ⊥ =
−−→HM d’un
angle θ dans un plan orthogonal a n, donc :
−→V
′= RO(n, θ)
−→V =
−→V ‖ + cos θ
−→V ⊥ + sin θ n ∧ −→
V .
n
V=
OM
�
O
H
N
M’
M
Figure 44
(n∧−→V = n∧−→V ⊥ =−−→HN se deduit de
−→V ⊥ par une rotation de π/2). Pour les composantes
de−→V , cette egalite correspond a Z ′ = Z,X ′ = X cos θ−Y sin θ et Y ′ = X sin θ+Y cos θ,
l’axe Z etant choisi selon n. Pour une rotation infinitesimale on a :
d−→V =
−→V
′ −−→V = dθ n ∧−→
V .
On en deduit que l’equation caracteristique d’un vecteur tournant−→V (t) est
d−→V
dt= −→ω ∧ −→
V ,
ou −→ω (t) =dθdtn(t) est la vitesse angulaire, et que :
d2−→Vdt2
=d−→ωdt
∧ −→V + −→ω ∧ (−→ω ∧ −→
V)
=d−→ωdt
∧ −→V − ω2−→V ⊥ .
3.3 Vecteurs tournants ; mecanique du solide 77
Cas particulier : si −→ω est constant (θ = ωt), l’expression de−→V (t) en fonction de
−→V 0 =−→
V (t = 0) est
−→V (t) =
−→V 0‖ +
−→V 0⊥ cos ωt+ n ∧ −→
V 0⊥ sin ωt ,
etd2−→Vdt2
= −ω2−→V ⊥(t) correspond a une acceleration centripete.
� Formules generales des changements de referentiels (figure 45)
�’
�
yx
z
X
Y
MZ
O
O’
Figure 45
Soit O′XY Z un referentiel R′ mobile par rapport au referentiel R ≡ Oxyz, et soit unpoint M mobile repere par ses coordonnees X(t), Y (t) et Z(t) dans R′ :
−−→OM =
−−→OO′ +
−−−→O′M =
−−→OO′ +XX + Y Y + ZZ .
A l’aide des relationsddtXX = X
dXdt
+ XX ,d2
dt2XX = X
d2X
dt2+ 2X
dXdt
+ XXet des
relationsdXdt
= −→ω ∧ X etd2X
dt2=
d−→ωdt
∧ X +−→ω ∧ (−→ω ∧ X)faisant intervenir le vecteur
unitaire tournant X (et leurs analogues pour Y et Z), on obtient immediatement :
−→v =d−−→OM
dt=
[ ddt−−→OO′ + −→ω ∧ −−−→
O′M]
+[XX + Y Y + ZZ
]= −→v e + −→v r ,
−→a =d2−−→OM
dt2=
[ d2
dt2−−→OO′ +
d−→ωdt
∧ −−−→O′M + −→ω ∧ (−→ω ∧−−−→
O′M)]
+ 2−→ω ∧−→v r+
[XX + Y Y + ZZ
]= −→a e + −→a c + −→a r .
−→v e et −→a e sont les vitesse et acceleration d’entraınement, vitesse et acceleration dupoint M ′ fixe dans R′ avec lequel M coıncide a l’instant t ; −→v r et −→a r sont les vitesseet acceleration relatives (“mesurees”dans R′) ; −→a c = 2−→ω ∧−→v r est l’acceleration deCoriolis.
78 3 • Espace ; symetries ; calcul vectoriel
� Referentiel local (figure 46)
�
�
�S
T
x
z
yT
L
X
YZ
H
Figure 46
Soit R le referentiel de Copernic (inertiel) centre au centre de masse (c.d.m.) S du systemesolaire, et R′ le referentiel LXY Z centre en un lieu L de latitude λ a la surface de laTerre et dont les axes sont diriges vers le sud, l’est et le zenith. R′ tourne a la vitesse −→ωconstante par rapport a R. L’equation du mouvement d’un point materiel M de massem dans R s’ecrit
m(−→a e + −→a c + −→a r) = m(−→g A(M) +−→g T (M)) + (autres forces) ,
ou −→g A est le champ de gravite du aux astres du systeme solaire (Soleil, Lune etc...) et−→g T celui du a la Terre. Comme le c.d.m. T de la Terre est “en chute libre” autour de Savec l’acceleration −→g A(T ) et que
−−→TM ′, fixe dans R′, est un vecteur tournant a la vitesse−→ω dans R, on a
−→a e =d2−−→SM ′
dt2=
d2−→STdt2
+d2−−→TM ′
dt2= −→g A(T )− ω2
−−−→HM ′ ,
ou H est la projection de M ′ (ou L) sur l’axe de rotation. Le mouvement de M dans R′
(mouvement relatif) est alors regi par l’equation :
−→a r =(−→g A(M)−−→g A(T )
)+
(−→g T (M) + ω2−−→HM)− 2−→ω ∧ −→v r +
1m
(autres forces) .
Dans le second membre le premier terme est en general negligeable (sauf pour decrire lephenomene de maree), et le second est le champ de pesanteur −→g (local). Les effetsdu terme de Coriolis (deviation vers l’est et pendule de Foucault) sont etudies ala section 6.3.
3.3.2 Referentiel du centre de masse
Les formules cinematiques de changements de referentiels se simplifient grandementlorsque R′ effectue un mouvement de translation (−→ω = 0) par rapport au referentielR, car alors −→a c = 0, −→v e = −→v O′ et −→a e = −→a O′ ne dependent pas du point considere.
� Theoremes de Koenig
En mecanique, pour decrire la dynamique globale d’un systeme de points materiels Mi
de masses mi, on utilise le referentiel Rcm d’axes paralleles a ceux de R et d’origine G(c.d.m.) defini par :
m−−→OG =
∑i
mi−−→OMi (m =
∑i
mi masse totale) ou∑i
mi−−→GMi = 0 .
3.3 Vecteurs tournants ; mecanique du solide 79
Rcm se translate par rapport a R a la vitesse −→v G donnee par m−→v G =∑
imi−→v i =−→
P (quantite de mouvement totale dans R) ; l’acceleration −→a G est telle que m−→a G =∑imi
−→a i =∑i
−→f i =
−→F (force totale dans R). On notera que la quantite de mouvement
totale dans Rcm est nulle :−→Pcm
=∑imi
−→v cmi =
∑imi(−→v i −−→v G) = 0.
Un calcul elementaire utilisant −→v cmi = −→v i−−→v G montre que le choix de Rcm permet de
relier simplement les energies cinetiques Ec =∑i
12mi
−→v 2i et Ecmc =
∑i
12mi
−→v cm 2i ,
ainsi que les moments cinetiques−→J O =
∑i
−−→OM i∧mi
−→v i et−→Jcm
G =∑i
−−→GM i∧mi
−→v cmi
(aussi egal a∑i
−−→GM i ∧mi
−→v i) dans R et Rcm :
Ec =12m−→v 2
G + Ecmc ;−→J O =
−−→OG ∧m−→v G +
−→Jcm
G .
On obtient de meme des expressions simples dans Rcm pour les theoremes de l’energiecinetique et du moment cinetique :
dEcmcdt
=∑i
−→v icm · −→f i ;d−→Jcm
G
dt=
∑i
−−→GM i ∧ −→
f i .
Elles ne font intervenir que les forces−→f i dans R, et pas l’acceleration d’entraınement,
alors que pour chaque masse mi−→a cmi =
−→f i −mi
−→a G.
� Reduction du probleme a deux corps(systeme isole de deux points materiels (M1,m1) et (M2,m2))
Comme la force totale−→F =
−→f 1→2 +
−→f 2→1 est nulle, Rcm se deplace a vitesse uni-
forme. Pour decrire le mouvement dans Rcm on introduit les quantites −→r =−−−−→M1M2,
μ =m1m2
m1 +m2(masse reduite) et
−→f =
−→f 1→2. Alors a l’aide des relations
−−−→GM2 =
m1
m−→r ,
−−−→GM1 = −m2
m−→r , et de leurs derivees −→v cm2 =
m1
m−→r et −→v cm1 = −m2
m−→r , on obtient facile-
ment :
Ecmc =12μ−→r 2
;−→Jcm
G = −→r ∧ μ−→r ;dEcmc
dt= −→r · −→f ;
d−→Jcm
G
dt= −→r ∧ −→
f .
M’2
M’1
M2 m 2
M1 m1
G
M μ
M’
Figure 47
La dynamique du vecteur −→r est donc celle d’un point materiel fictif M , tel que −→r =−−→GM ,
de masse μ et soumis a la force−→f . On peut aussi obtenir ce resultat en remarquant que
80 3 • Espace ; symetries ; calcul vectoriel
m1−→a 1 =
−→f 2→1 et m2
−→a 2 =−→f 1→2 entraınent μ−→r =
−→f (par exemple −→r = −G (m1 +
m2)r
r2dans le cas du probleme de Kepler ; cf. section 2.3.3). Une fois la trajectoire de
M connue, celles de M1 et M2 dans Rcm s’en deduisent par homothetie (figure 47).En particulier si
−→f est parallele a −→r ,
−→Jcm
G est constant (L.C. du moment cinetique).Donc,
−−−→GM1 et
−−−→GM2 colineaires a −→r etant orthogonaux a
−→Jcm
G , les trajectoires de M1
et M2 sont, dans le cas d’une force centrale, situees dans le plan passant par G etperpendiculaire a
−→Jcm
G .
3.3.3 Cinematique et dynamique d’un corps solide
On se limite a l’introduction des principaux outils necessaires a la description de ladynamique des solides et a la presentation de deux exemples.
� Champ des vitesses d’un solide
Comme les distances entre points d’un corps solide sont par definition invariantes, unvecteur
−−→AB joignant deux points du solide ne peut que tourner :
d−−→AB
dt= −→v B −−→v A = −→ω ∧−−→
AB .
Comme −→ω ∧−−→AB est orthogonal a −→ω il en resulte que, a un instant donne, tous les pointsdu solide ont meme composante de vitesse −→v ‖ parallele a −→ω et que sur un axe parallele a−→ω tous les points ont de plus meme composante −→v ⊥ orthogonale a −→ω . En faisant varierB dans la relation −→v B⊥ = −→v A⊥ +−→ω ∧−−→AB, on verifie qu’il existe un point B ≡ I tel que−→v I⊥ = 0 (figure 48) ; il y a donc un axe parallele a −→ω et passant par I tel que −→v ⊥ = 0pour tous ses points. La relation
−→v A = −→v I + −→ω ∧ −→IA
montre, comme deja etabli a la section 3.1.3, que le mouvement d’un solide est une suitede vissages elementaires.
vA
vA
�
AI
Figure 48
So
�
�
Cr
p
g
M. .v
S
Figure 49
REMARQUE. Pour un solide mobile S en contact ponctuel avec un solide fixe S0, la vitesse du point de
contact C (appartenant a S) s’appelle vitesse de glissement −→v g, et les composantes −→ω r et −→ω p de −→ωrespectivement parallele et orthogonale au plan de contact sont les vitesses angulaires de roulement
et de pivotement (figure 49). Pour tout point M de S : −→v M = −→v g + −→ω ∧ −−→CM .
3.3 Vecteurs tournants ; mecanique du solide 81
� Grandeurs mecaniques relatives a un solide
On a vu que, pour un systeme quelconque, la quantite de mouvement totale est relieede facon simple a la vitesse du centre de masse :
−→P = m−→v G. De meme pour un solide
il est possible d’exprimer le moment cinetique et l’energie cinetique en fonction de −→v Get de −→ω . Les differentes formules s’obtiennent en particularisant un point A du solide eten ecrivant pour tous les autres points Mi : −→v i = −→v A +−→ω ∧−−→
AMi. En general on choisitpour A, soit un point fixe (−→v A = 0) lorsque le solide est attache par ce point, soit lec.d.m. G ≡ A (alors
∑imi
−−→AMi = 0).
Dans ces deux cas le moment cinetique−→J A =
∑i
−−→AMi ∧mi
(−→v A +−→ω ∧−−→AMi
)depend
lineairement de −→ω (utilisation du double produit vectoriel) :
−→J A =
∑i
mi−−→AMi
2 −→ω −∑i
mi
(−−→AMi · −→ω
)−−→AMi .
Il est naturel de l’ecrire dans un referentiel (AXY Z) lie au solide car alors les compo-santes Xi, Yi et Zi de
−−→AMi sont independantes du temps. On a par exemple JA,X =∑
imi
((X2
i +Y 2i +Z2
i )ωX−Xi(XiωX+YiωY +ZiωZ))
et plus generalement−→JA = IA−→ω
ou :⎛⎝JA,XJA,YJA,Z
⎞⎠ =
⎛⎝∑imi(Y 2
i + Z2i ) −∑
imiXiYi −∑imiXiZi
−∑imiXiYi
∑imi(X2
i + Z2i ) −∑
imiYiZi−∑
imiXiZi −∑imiYiZi
∑imi(X2
i + Y 2i )
⎞⎠ ⎛⎝ωXωYωZ
⎞⎠ .
La matrice d’inertie IA etant symetrique, il existe des axes orthogonaux dits axes prin-cipaux d’inertie en A, tels qu’elle soit diagonale (cf. section 4.2.3).
L’energie cinetique EC =∑i
12mi(−→v A + −→ω ∧ −−→
AMi)2 prend elle aussi une forme
simple dans ces deux cas a cause de la disparition des termes lineaires en −→ω . Comme
(−→ω ∧ −−→AMi)2 = ω2 −−→AMi
2 − (−→ω · −−→AMi)2 on verifie que :
EC =12−→J A · −→ω (pour A fixe) ou EC =
12m−→v 2
G +12−→J G · −→ω (pour A ≡ G) .
Une autre grandeur utile est la puissance des forces appliquees∑i(−→v A+−→ω ∧−−→AMi)·−→f i
qui, quel que soit le point A du solide, s’ecrit :
P = −→v A · −→F + −→ω · −→Γ A (−→F =
∑i
−→f i ;
−→Γ A =
∑i
−−→AMi ∧ −→
f i) .
Dans P seules les forces exterieures appliquees sont a considerer, car les forces interieures−→f i→j = −−→f j→i, supposees paralleles a
−−−−→MiMj, ne contribuent, ni a la force resultante
−→F ,
ni au moment resultant des forces−→Γ A (
−−→AMi∧−→f j→i+
−−−→AMj∧−→f i→j =
−−−−→MiMj∧−→f i→j = 0).
82 3 • Espace ; symetries ; calcul vectoriel
EXEMPLE 1 : equations d’Euler. Le mouvement libre d’un solide dans Rcm obeit a
l’equationddt
(−→Jcm
G = IXω
XX+I
Yω
YY +I
Zω
ZZ) = 0, ou GX , GY et GZ sont les axes
principaux d’inertie en G. En ecrivantdXdt
= −→ω ∧X, etc. avec −→ω = ωXX+ω
YY +ω
ZZ,
on obtient les E.D. d’Euler :
IX ωX = (IY −IZ )ωY ωZ , IY ωY = (IZ −IX )ωZ ωX , IZ ωZ = (IX −IY )ωX ωY .
Les rotations a vitesse angulaire constante autour des axes GX , GY et GZ sont dessolutions particulieres. Si on perturbe une telle solution, par exemple ω
X= ω, ω
Y=
ωZ
= 0, on obtient facilement ωY,Z
=(I
Z− I
X)(I
X− I
Y)
IYI
Z
ω2 ωY,Z
, en se limitant a
l’ordre le plus bas dans les perturbations ωY
et ωZ. Il y a instabilite de la rotation
autour de l’axe GX si IY < IX < IZ (les rotations autour de GY et GZ etant alorsstables).
vg
vG
�P
G
M
C
Figure 50
EXEMPLE 2 : mouvement d’une boule de billard (figure 50). Le but est d’expliquer la trajec-
toire,en general parabolique, du c.d.m. de la boule et le role des conditions initiales(facon dont la
boule est frappee avec la queue). Rappelons que pour une boule de rayon r on a−→J G = I−→ω , avec
I = 25mr2. La cinematique de ce probleme se resume a la relation
−→v G = −→v g + −→ω ∧ −−→CG (−→v g vitesse de glissement) ,
et la dynamique aux equations
m−→a G = m( d−→v g
dt + d−→ωdt ∧−−→CG)
=−→F et
d−→J G
dt = I d−→ωdt = −−→
GC ∧ −→F ,
qui conduisent a : md−→v g
dt=
−→F
(1 + mr2
I
); la force totale
−→F colineaire a −→a G est parallele a la table
et donc orthogonale a−−→GC.
Au cours du mouvement et tant que la boule glisse−→F se reduit a une force de frottement et
d−→v g
dtpa-
rallele a−→F l’est donc aussi a −→v g ; −→v g et
−→F gardent donc une direction commune fixe. De plus comme
pour un frottement solide |−→F | est constant, le vecteur−→F lui meme est constant : le mouvement de G
est alors uniformement accelere et sa trajectoire parabolique. Bien sur au bout d’un certain temps,−→v g finit par s’annuler et la boule roule alors sans glissement tout en continuant a pivoter.
A l’origine du mouvement il faut une percussion−→P : force
−→f tres grande et tres breve (telle que∫ −→
f dt =−→P ) exercee en un point M a la hauteur h. Des equations m−→a G =
−→f +
−→N et I d−→ω
dt=
−−→GM∧−→
f
(la reaction normale−→N du billard assurant que
−→f +
−→N est parallele a la table), on deduit les condi-
tions initiales m−→v G =−→P ‖, I−→ω =
−−→GM ∧ −→
P et −→v g = −→v G −−→ω ∧ −−→CG (la boule etant au repos avant
la percussion). Si−→P n’est pas parallele a la table (
−→P �= −→
P ‖), on verifie que −→v g et −→v G different en
direction. Si−→P est parallele a la table, −→v g =
−→Pm
(1− 5
2r(h−r)r2
)est du sens de −→v G si h < 7
5r (“retro”)
et de sens contraire si h > 75r (“coule”).
3.4 Systemes physiques possedant des symetries 83
3.4 SYSTEMES PHYSIQUES POSSEDANT DES SYMETRIES
L’“argument de symetrie”, analogue a l’“argument dimensionnel” discute en 1.3.2, esttres utilise en physique pour simplifier la description mathematique d’un systeme presen-tant des symetries ; mais il est souvent mal justifie a cause de la confusion frequente entresymetrie du systeme et symetrie (invariance) des lois le regissant (cf. section 3.1.1).
3.4.1 Schema general ; principe de Curie
� Principe de Curie
Soient x les parametres caracterisant un systeme ; par exemple pour une distributionde charges, il s’agit des positions −→r i et des valeurs qi des charges (ou de la fonctiondensite ρ(−→r )). Soit y une grandeur relative a ce systeme, par exemple le moment dipolaire−→p = Σqi−→r i, le champ electrique
−→E (−→r ) cree au point −→r , etc. On a vu que l’invariance des
lois par rapport a une symetrie g signifie que, au systeme transforme dont les parametress’ecrivent symboliquement x′ = gx, est associee la grandeur y′ = gy. Pour la distribution
de charges et une rotation R, on a : −→r i ′ = R−→r i, q′i = qi et −→p ′ = R−→p ,−→E
′(R−→r ) =
R−→E (−→r ), etc. Si g est de plus une symetrie du systeme, alors par definition x′ = gx = x
et donc y′ = gy = y. On en deduit que les grandeurs relatives a un systeme ou creees(“causees”) par lui possedent au moins les symetries du systeme (Principe de Curie).
EXEMPLES. Si une distribution de charges ou de courants admet une symetrie derevolution d’axe Oz, son moment dipolaire electrique −→p ou magnetique −→μ est portepar Oz ; si elle admet un plan P de symetrie, −→p doit etre contenu dans P , tandis que−→μ (pseudovecteur) doit etre perpendiculaire a P , seule possibilite pour qu’ils soientinchanges par l’operation SP (figure 51).
�
pi
− +
Figure 51
p �i
−
+
Figure 52
� Generalisation
Si la grandeur y depend lineairement des parametres x du systeme, et si l’operationg a pour effet de multiplier x par un facteur constant C (par exemple −1 pour uneantisymetrie), alors la grandeur y est elle aussi multipliee par C par l’operation g :
x′ = gx = Cx =⇒ y′ = gy = Cy .
EXEMPLES (figure 52). Si une distribution de charges ou de courants admet un planP d’antisymetrie, −→p doit etre perpendiculaire a P , tandis que −→μ doit etre contenudans P , seule possibilite pour qu’ils soient multiplies par C = −1 dans l’operation SP .
84 3 • Espace ; symetries ; calcul vectoriel
REMARQUE. Le groupe de symetrie de y peut etre plus grand que celui de x. Ainsi de nombreuses
proprietes macroscopiques d’un cristal a symetrie cubique (axes x, y, z) sont celles d’un milieu isotrope.
De meme les moments d’inertie d’un cube homogene par rapport a des axes passant par son centre sont
tous egaux comme pour une sphere. En effet considerons par exemple les quantites Ix = Σmi(y2i + z2i ),
Iy = Σmi(x2i + z2i ) et Ixy = Σmixiyi. Pour le cube tourne de π
2autour de Oz, on a x′i = −yi et y′i = xi,
et donc I′x = Iy, I′y = Ix et I′xy = −Ixy. Comme cette rotation est une symetrie, on en deduit Ix = Iy et
Ixy = 0 et donc, pour tout vecteur unitaire n du plan xOy, In = Σmi((xi cos θ + yi sin θ)2 + z2i
)= Ix.
3.4.2 Symetries de translation ; lois de Descartes et generalisations
L’obtention de ces lois donne un exemple non trivial d’application de l’invariance par destranslations d’espace et de temps. Considerons deux milieux lineaires, homogeneset stationnaires separes par un plan infini P (xOy), et une source qui emet uneonde plane incidente e−i(ω0t−−→
k 0·−→r ). Soit Ae−i(ωt−−→k ·−→r ) eiϕ une onde plane reflechie ou
transmise, issue de l’onde incidente. Si l’onde incidente est retardee de τ et translatee de−→a parallelement au plan P (pour laisser P inchange), elle devient e−i
(ω0(t−τ)−−→
k 0·(−→r −−→a ))
et est donc multipliee par C = ei(ω0τ−−→k 0·−→a ). La meme operation effectuee sur l’onde
reflechie ou transmise la multiplie par le facteur ei(ωτ−−→k ·−→a ), qui doit etre aussi egal a C
quels que soient τ et −→a . On en deduit les relations de continuite :
ω = ω0 et−→k ‖ =
−→k 0‖ (loi de Descartes pour les ondes) .
Donc les plans d’incidence, de refraction et de reflexion, definis par−→k 0‖ et la normale
n au plan P , sont confondus. Les ondes ont memes periodicites temporelle2πω0
=2πω
et
spatiale2πk0x
=2πkx
en x (ou en y), et “balayent” l’axe des x a une meme vitesseω
k0x=
ω
kx(idem pour l’axe des y). Ces resultats restent valables si il y a plusieurs ondes reflechiesou transmises, si les milieux sont anisotropes, si l’onde transmise est evanescente (kzimaginaire pur).
Pour un reseau plan infini a une dimension, par exemple des traits paralleles a Oydistants de a, le plan n’est invariant que par les translations de vecteur −→a = ay y +nax (ay quelconque, n ∈ Z). La condition precedente sur les vecteurs d’onde devient(−→k −−→
k 0) · (ay y+nax) = 0 modulo 2π. On en deduit la formule des reseaux valable aussibien en transmission (figure 53) qu’en reflexion :
−→k ‖ =
−→k 0‖ + p
2πax (p ∈ Z) .
Pour un cristal (a l’echelle de l’Angstrom tout cristal macroscopique est quasi infini),l’invariance n’a lieu que pour les translations
−→t (m,n,p) = m−→a + n
−→b + p−→c . Il faut donc
(−→k −−→
k 0) · −→a = (−→k −−→
k 0) · −→b = (−→k −−→
k 0) · −→c = 0 modulo 2π soit (cf. section 3.2.2) :
−→k −−→
k 0 = 2π−→σ (h,k,l) (h, k, l quelconques)= 2πη−→σ (h,k,l) (h, k, l premiers entre eux, η ∈ Z) .
3.4 Systemes physiques possedant des symetries 85
Les ondes incidente et diffractee (en dehors du cristal) ayant meme longueur d’onde, ona la condition supplementaire |−→k | = |−→k 0| (une contrainte qui n’apparaissait pas dansles exemples precedents, kz n’etant pas fixe). La figure 54 montre que
−→k et
−→k 0 doivent
etre symetriques par rapport aux plans reticulaires, comme si il y avait reflexion sur cesplans avec un angle d’incidence θ tel que :
sin θ =2πη|−→σ (h,k,l)|
2|−→k |= η
λ
2d(h,k,l)(condition de Bragg) .
�
k0
p = 0
p = 1
p = −1
p = −2
p = −3
2a
Figure 53
�
�
�� �k
k0
réticulairesplans
2 (h,k,l)
Figure 54
REMARQUE. Les lois de conservation en physique quantique de la quantite de mouvement, de
l’energie, et du moment cinetique (pour un systeme isole), ont une origine semblable. En effet, d’une
part la correspondance entre etats quantiques a des instants differents est lineaire, et d’autre part un
etat ayant une valeur bien definie de −→p = �−→k , ou E = �ω, ou Jz = m�, est par definition multiplie
respectivement par
C = exp(−i−→k · −→a ) ou C = exp(iωτ) ou C = exp(−imϕ) ,
dans une translation −→a , ou un retard τ , ou une rotation d’axe z et d’angle ϕ (cf. sections 4.4).
3.4.3 Symetries de rotation et symetries discretes ; applications enelectromagnetisme et en acoustique
Les formules reliant les symetries de la source a celles de ses effets sont applicables auxchamps en tenant compte de la loi de transformation de ces derniers : f ′(g−→r ) = gf(−→r ).Si l’operation g multiplie par C les parametres de la source dont depend le champ, on af ′ = Cf et donc :
Cf(g−→r ) = gf(−→r ) (C = 1 pour une symetrie et C = −1 pour une antisymetrie) .
EXEMPLE 1. La figure 55 montre, dans les cas ou g est une symetrie de rotation d’axeOz, comment sont relies les champs electrique
−→E au point M(−→r ) et son transforme
M ′(g−→r ) : les composantes z, radiale et orthoradiale ne dependent pas de θ.
EXEMPLE 2. La figure 56a montre le cas d’une symetrie plane SP . En particulier enun point du plan P le champ
−→E (“vrai” vecteur) est dans le plan et
−→B (pseudovecteur)
est perpendiculaire a P . Ces resultats s’echangent si le plan est un plan d’antisymetrie(figure 56b).
86 3 • Espace ; symetries ; calcul vectoriel
��
�
M E
E
r
z
Ez
EzEr
M’
E
axe
de s
ymét
rie
Figure 55
M’
MM
M’(b)(a)
E
B
B
E
. .
Figure 56
EXEMPLE 3. Si Oz est un axe de symetrie de rotation pour le systeme qui creeles champs et si de plus tout plan P contenant Oz est un plan de symetrie (resp.d’antisymetrie) seuls Ez, Er et Bθ (resp. Eθ, Bz et Br) sont non nuls. Si le plan z = 0est un plan de symetrie (resp. d’antisymetrie) du systeme alors en deux points M etM ′ symetriques par rapport a ce plan les composantes Er, Eθ et Bz (resp. Ez, Br etBθ) sont egales et les composantes Ez, Br et Bθ (resp. Er, Eθ et Bz) sont opposees.Le lecteur est encourage a trouver des exemples physiques pour chacun de ces cas eta dessiner les figures correspondantes. C’est sur la base de ces arguments de symetriequ’on montre “sans calcul” (en se rappelant que
−→B est un pseudovecteur) qu’une
antenne dipolaire electromagnetique (figure 57) ne rayonne pas dans la directionde son axe (
−→E ∧ −→
B = 0, car−→B = 0, sur l’axe), ou qu’il n’y a pas de rayonnement
monopolaire en electromagnetisme car pour un systeme a symetrie spherique−→B = 0
en tout point.
E
E
E
E�
�
= 0B
= 0B
B
Bz
r
r
z
plan desymétrie
plan d’antisymétrie
z
I
−q
+q
Figure 57
EXEMPLE 4. En acoustique ou l’analogue du vecteur de Poynting est P ′−→v (produitde la surpression par la vitesse du fluide), on montre pareillement qu’un dipole nerayonne pas d’onde sonore dans une direction perpendiculaire au dipole (pas de com-posante du “vrai” vecteur −→v dans le plan d’antisymetrie du dipole), et qu’un systemea symetrie spherique (pour lequel −→v est radial) rayonne egalement dans toutes lesdirections (rayonnement monopolaire).
Chapitre 4
Calcul et physique lineaires ;relativite ; quantique
Le calcul lineaire trouve ses origines dans l’etude des systemes d’equations lineaires et leurresolution par les techniques de determinants et de transformations lineaires (a partir de1750). Ces techniques appliquees egalement a la diagonalisation des formes quadratiquesont conduit vers 1850 au calcul matriciel (Cayley), ainsi qu’a la notion plus abstraited’espace vectoriel (E.V.). Son extension aux E.V. de fonctions (Hilbert 1912), leformalisme matriciel etant generalise aux operateurs, a joue un role essentiel pour lamise en forme mathematique, entre 1922 et 1927 (Schrodinger, Heisenberg, Born, etc.),de la “physique des quanta”. Par ailleurs, les travaux inities a partir de 1870 par Klein etLie sur les groupes et leurs representations lineaires (par des groupes de matrices agissantsur des E.V.), ont recu de nombreuses applications en physique quantique a partir de1930, l’exemple le plus simple etant l’action des rotations sur les etats de spin 1/2.
Bien que d’un usage relativement tardif en physique classique, le calcul matriciel estla aussi tres utile. Il permet de decrire, dans l’approximation lineaire, les relationsentre grandeurs additives, que ce soient des vecteurs de l’espace ordinaire (etude desdeformations, relation entre −→ω et
−→J en mecanique du solide, entre
−→D et
−→E en electroma-
gnetisme...) ou des vecteurs d’E.V. plus abstraits (quadrivecteurs en relativite d’Einstein,E.V. des rayons lumineux en optique matricielle de Gauss...). Le lecteur trouvera d’autresapplications inportantes aux chapitres 5 (analyse des signaux) et 6 (etude des systemesdynamiques lineaires dans l’espace de phase).
4.1 ESPACES VECTORIELS
4.1.1 Definitions ; changements de bases ; applications lineaires
Rappelons qu’un espace vectoriel (E.V.) est un ensemble E d’elements, les vecteurs x,muni de deux lois : une loi d’addition, qui fait de E un groupe commutatif avec unelement neutre 0, et une loi de multiplication par des scalaires λ reels (E.V. reel) oucomplexes (E.V. complexe). Ces deux lois sont distributives l’une par rapport a l’autre :(λ1 +λ2)x = λ1x+λ2x et λ (x1 + x2) = λx1 +λx2. Le vecteur 0 = 0× x est simplementnote 0.
88 4 • Calcul et physique lineaires ; relativite ; quantique
� Vecteurs independants ; bases
p vecteurs sont independants si l’egalite λ1x1+· · ·+λpxp = 0 implique λ1 = · · · = λp = 0.Cette notion d’independance permet de definir d’une part la dimension de E, dimE, quiest le nombre maximum n de vecteurs independants dans E (ou de degres de libertedans E), et d’autre part d’introduire la notion de base, qui est un ensemble discret devecteurs independants (e1, · · · , en) tels que tout x ∈ E s’ecrit de maniere unique :
x =∑i
xi ei (xicomposantes ou coordonnees de x dans la base) .
On dit aussi que la base {ei} engendre E. dimE peut etre infinie ; c’est le cas de l’E.V.des polynomes P (x) engendre par la base des monomes {xn, n ≥ 0}, ou de celui desfonctions de periode a engendre par la base des exponentielles complexes {ei2πnx
a , n ∈ Z).
REMARQUES. 1) Somme directe. Si E1 est un sous E.V. de E (sous ensemble de E laisse invariantpar les lois ci-dessus), on appelle sous E.V. complementaire E2 tout sous E.V. tel que tout vecteurx admet une decomposition unique x = x1 + x2 avec xi ∈ Ei. E est appele somme directe E = E1 ⊕E2
de E1 et E2 et dimE = dimE1 +dimE2 (addition des degres de liberte). Exemple dimE = 2 (basee1, e2) : si E1 est engendre par e1 tout vecteur e2 + λe1 peut engendrer E2 (qui n’est donc pas unique ;figure 1).
E’2 E2
1E
E1
e1
2e
Figure 1
ee e’
xx
x’
2
2 e22
2
1
1
1e’1 x 1
x’2 x
e =
2
=
+=
Figure 2
2) Produit tensoriel. Le produit tensoriel E ⊗ F de deux E.V. (E base {ei} et F base {fj}) est
l’E.V., de dimension dimE × dimF (produit des nombres de degres de liberte), engendre par
la base {ei ⊗ fj}. Par exemple l’E.V. des fonctions de deux variables, periodiques de periode a selon
x et b selon y, est engendre par la base {ei2πn xa ei2πp
yb }, n, p ∈ Z. De meme un champ
−→A (�r, t) =
Ax(�r, t) x + Ay(�r, t) y + Az(�r, t) z est un element du produit tensoriel de R3, qui caracterise les degres
de liberte d’un vecteur, et d’un E.V. convenablement choisi de fonctions, qui caracterise ceux de la
dependance spatio-temporelle. On fera attention qu’un element∑ij xij ei ⊗ f
jde E ⊗ F (par exemple
2 cos 2π(xa
+ yb
)= ei2π
xa ei2π
yb + e−i2π
xa e−i2π
yb ) ne s’ecrit pas, sauf exception, comme le produit
tensoriel de deux vecteurs x⊗ y =∑ij xiyj ei ⊗ f
j(ce qui est par contre le cas de cos 2π x
acos 2π y
b).
� Changements de bases et de coordonnees
Ils sont relies par :e′i =
∑j
Pji ej⇐⇒xj =∑i
Pji x′i .
4.1 Espaces vectoriels 89
En effet : x =∑
i x′i e
′i =
∑ij x
′i Pji ej =
∑j xj ej . On notera que si les e′i sont donnes en
fonction des ej , ce sont les xj qui se deduisent simplement des x′i ; l’expression des x′i enfonction des xj necessite une operation d’inversion (cf. section 4.2.2).
EXEMPLE (dimE = 2) : les relations e′1 = e1 et e′2 = e2+2e1 entraınent x1 = x′1+2x′2et x2 = x′2 (figure 2).
� Applications lineaires
Etant donnes deux E.V., E et F , une application lineaire A de E dans F associe a tout xde E un vecteur y = Ax de F de sorte qu’a λ1x1+λ2x2 corresponde λ1 (Ax1)+λ2 (Ax2).Dans des bases {ei} et {f
j}, l’application est decrite par la relation lineaire entre les
composantes :
yj =∑i
Aji xi avec Aji = composante de Aei selon fj.
(On ecrit y = A∑
i xi ei =∑
i xi (Aei) =∑
i xi (∑
j Aji f j).) Des exemples avec E =
F = R3 sont : les rotations (cf. section 3.3.1) ; la relation entre −→ω et−→J en mecanique du
solide (cf. section 3.3.3) ; la relation entre le champ electrique−→E et la densite de courant
j = Nqv lorsque mv
τ= q (
−→E + v ∧ −→
B 0) (etude de l’effet Hall), qui s’ecrit explicitement
si−→B 0 ‖ z : jx,y =
(1 +
q2B20τ
2
m2
)−1Nq2τ
m
(Ex,y ± qB0τ
mEy,x
)et jz =
Nq2τ
mEz ; la
relation entre−→E et
−→D dans un dielectrique parfait anisotrope (cf. section 8.2.1).
AUTRES EXEMPLES : les evolutions x(t0) → x(t) = Ftt0 x(t0) de systemes regis par des E.D.
lineaires (cf. section 6.1.1) ; les operations de translation f(t) → f(t − τ), de derivation et plus
generalement de filtrage sur les signaux (cf. section 5.2.1) ; les relations entre f.e.m et intensites ej =∑iRji Ii en electricite et entre flux magnetiques et intensites Φj =
∑iMji Ii en magnetostatique.
Noyau et image. Pour A fixe, les x tels que Ax = 0 forment un sous E.V. de E, lenoyau de A note KerA. L’ensemble des Ax est un sous E.V. de F , l’image de A noteeImA ; sa dimension definit le rang de A et verifie : rangA = dimE − dim(KerA).
EXEMPLES. Pour l’application r → Ar = n ∧ r, KerA est constitue par les vecteursparalleles a n et ImA par ceux perpendiculaires a n ; rangA = 2. Dans un filtragepasse-bas ideal (|ν| < ν0) de signaux de periode T , KerA (resp. ImA) est engendre parles ei2πn
tT avec |n| > ν0T (resp. |n| < ν0T ).
Resolution d’equations lineaires yj =∑iAji xi (j = 1, · · · , p ; i = 1, · · · , n ; xi
inconnues ). Ces equations sont equivalentes a y = Ax (avec dimE = n, dimF = p).Donc il n’y a de solutions que si y ∈ ImA. La solution est unique si q = dim(KerA) = 0,et elle depend de q parametres si q �= 0. (x(1) et x(2) etant deux solutions, la relationy = Ax(1) = Ax(2) entraıne x(1) − x(2) ∈ KerA.) En particulier pour les equations sanssecond membre
∑iAji xi = 0, une solution x �= 0 n’existe que si le noyau est non trivial
(q > 0).
90 4 • Calcul et physique lineaires ; relativite ; quantique
4.1.2 Structures metriques ; fonctions orthonormees
� Produit scalaire
Souvent, comme dans l’espace ordinaire, il existe dans E une structure metrique deduited’un produit scalaire (appele produit hermitien si E est complexe). Ce produit verifie(x , λ1y1
+λ2y2) = λ1 (x , y
1)+λ2 (x , y
2) et (x , y) = (y , x), ce qui implique, attention,
(λx , y) = λ (x , y). Dans le cas non degenere (considere dans la suite), x �= 0 entraıne(x , x) =‖ x ‖2> 0 et x = x ‖ x ‖− 1
2 est un vecteur norme (‖ x ‖= 1). Le vecteur
Px y = (x , y) x
est la projection orthogonale de y sur (la direction de) x ; en effet, son complementairey′ = y − Px y est orthogonal a x : (x , y′) = 0. L’operateur Px est un projecteur.
REMARQUE. Plus generalement, a tout sous E.V. E1 est associe un unique sous E.V. complementaire
orthogonal E2 = E⊥1 tel que x = x1 + x2 avec (x1 , x2) = 0 et xi ∈ Ei (cf. figure 1).
Inegalite de Schwarz. En ecrivant que pour tout λ on a (x+λy , x+λy) = |λ|2 ‖ y ‖2
+2�e (λ (x , y)
)+ ‖ x ‖2≥ 0, et en choisissant λ de sorte que �e (
λ (x , y))
= |λ| |(x , y)|,on obtient :
|(x , y)| ≤‖ x ‖ ‖ y ‖ (egalite si y = Cste x) .
Application aux signaux. Dans l’E.V. des signaux complexes de carre sommable le produit scalaire
est : (f1 , f2) =∫f1(t) f2(t) dt. Pour un signal normalise (‖ f ‖= 1), on definit les dispersions en temps
Δt et en pulsation Δω par (Δt)2 =∫(t − t0)2 |f(t)|2 dt, ou t0 =
∫t |f(t)|2 dt est le temps moyen,
et (Δω)2 =∫ ∣∣( 1
iddt
− ω0)f(t)
∣∣2 dt, ou ω0 =∫f(t) 1
idf(t)dt
dt est la pulsation moyenne (penser pour
T grand a f(t) proche de T− 12 eiω0t sur
[−T2, T
2
]et nulle ailleurs). En posant x = (t − t0) f(t) et
y =(
1i
ddt
− ω0)f(t), et en notant que |(x , y)| ≥ |m(x , y)| = 1
2(calcul simple d’integration par
parties), on obtient :ΔtΔω ≥ 1
2.
Cette relation est l’analogue pour les signaux de l’inegalite de Heisenberg. Le lecteur montrera que
l’egalite entraıne f(t) ∝ eiω0te−b2 (t−t0)2 avec b reel (cf. aussi section 4.4.3).
Bases orthonormees (orthogonalisation de Schmidt). Soit e1 un vecteur norme. Enchoisissant un vecteur e independant de e1 et un nombre λ1, on construit une combinaisonlineaire e2 = e+ λ1 e1 orthogonale a e1 ; partant ensuite d’un vecteur e′ independant dee1 et e2, on construit de meme e3 = e′ + λ1 e1 + λ2 e2 orthogonal aux deux precedents.En iterant cette procedure et en normant les vecteurs on obtient une base telle que(ei , ej) = δij (δij = 0 si i �= j et δii = 1 symbole de Kronecker). Dans une telle base :
(x , y) =∑i
xiyi (=∑i
xiyi dans le cas reel) .
Si dimE est infini il faut “completer” E par des “suites de Cauchy” de vecteurs (commepour R) : E est alors un espace de Hilbert.
� E.V. de fonctions
Un exemple est l’E.V. engendre par les fonctions eimϕ (m ∈ Z), qui forment une baseorthonormee, pour le produit scalaire (f , g) = (2π)−1
∫ 2π
0 f(ϕ) g(ϕ) dϕ, de l’E.V. desfonctions de periode 2π de norme finie (cf. aussi series de Fourier section 5.3.1).
4.1 Espaces vectoriels 91
AUTRES EXEMPLES. 1) On peut obtenir une base orthonormee de l’E.V. des fonctions definies
sur [−1, 1], muni du produit scalaire (f , g) =∫ 1−1 f(x) g(x) dx, en appliquant l’orthogonalisation de
Schmidt aux fonctions independantes 1, x, · · · , xn,... La base des polynomes ainsi obtenus coıncide,aux facteurs de normalisation pres, avec les polynomes de Legendre P0(x) = 1, P1(x) = x,
P2(x) = 12
(3x2 −1)..., qui sont definis par (1−2tx+ t2)−12 =
∑∞l=0 t
l Pl(x), ou, de facon equivalente,par
1|�r−�r0| =
∑∞l=0
rl0
rl+1 Pl(cos θ) ,
avec r0 < r et cos θ = r · r0 (developpement multipolaire utilise en electrostatique). D’autres po-lynomes, de Tchebychev (cf. section 11.3.1), de Hermite (cf. section 4.4.4) etc., formant une baseorthogonale pour d’autres produits scalaires, sont aussi utilises en physique (rayonnement d’antennes,faisceaux optiques gaussiens, etc.) (cf. ouvrages specialises).
2) Fonctions orthogonales sur la sphere. Puisque |d(cos θ)| = sin θ dθ, on pourrait prendre lesfonctions Pl(cos θ) e
imϕ (avec l ∈ N et m ∈ Z) comme base orthogonale, pour le produit scalaire
(f , g) =∫∫
f(n) g(n) dΩ (avec n ≡ (θ, ϕ) et dΩ = sin θ dθ dϕ), de l’E.V. des fonctions f(θ, ϕ) de norme
finie. Mais, comme le produit scalaire est invariant par rotation ((f , g) =∫∫
f(R−1n) g(R−1n) dΩ), onprefere regrouper les fonctions de base par sous espaces laisses chacun invariant par rotation (cf. section
4.2.5). On demontre, et on admettra, que les fonctions P|m|l (cos θ) eimϕ (avec m = −l,−l+1, · · · , l et
P|m|l (u) = (1−u2)
|m|2 d|m|
du|m| Pl(u)), sont orthogonales et forment pour chaque l un sous E.V. invariant
(auquel appartient Pl(cos θ), cas m = 0). Ces fonctions convenablement normalisees forment la basedes harmoniques spheriques Yml (θ, ϕ) ; les premieres (l = 0, 1, 2) s’ecrivent :
Y 00 = 1√
4π, Y 0
1 =√
34π
cos θ , Y ±11 = ∓
√38π
sin θ e±iϕ ,
Y 02 =
√5
16π(3 cos2 θ − 1) , Y ±1
2 = ∓√
158π
sin θ cos θ e±iϕ , Y ±22 =
√1532π
sin2 θ e±i2ϕ .
Remarques. 1) A un facteur pres ces fonctions sont 1, z et x± iy, 3z2 − 1, z(x± iy) et (x± iy)2 ; plus
generalement Y ±ll ∝ sinl θ e±ilϕ ∝ (x ± iy)l. 2) Les P
|m|l (u) ont l − |m| zeros dans ] − 1, 1[, et donc
les fonctions �eYml et mYml s’annulent sur l − |m| paralleles et |m| cercles meridiens formant un
“quadrillage” de la sphere. (cf. ouvrages de mecanique quantique.)
4.1.3 Formes quadratiques et antisymetriques ; volume
On suppose dimE = n. Par definition une forme p-lineaire associe a p vecteursx(1), . . . , x(p) un nombre f(x(1), . . . , x(p)) qui depend lineairement de chaque vecteur.Dans une base :
f(x(1), . . . , x(p)) =∑
i1,··· ,ipai1···ip x
(1)i1
· · ·x(p)ip
avec ai1···ip = f(ei1 , · · · , eip) .
EXEMPLE. Le plus simple est l’E.V. des 1-formes f(x) =∑i ai xi, appele E.V. dual
E∗ de E ; il est engendre par la base duale {fi} definie par fi(x) = xi. Si E est munid’un produit scalaire et si {ei} est une base orthonormee, la relation fi(x) = (ei , x)permet d’identifier E et E∗.
� Formes quadratiques
Ce sont des formes bilineaires (p = 2) symetriques reelles, appelees metriques lorsqueles xi sont des coordonnees d’espace ou d’espace-temps :
f(x, y) =∑ij
aij xi yj (aij = aji ; xi et yj reels) .
La forme est definie positive si f(x, x) > 0 pour tout x �= 0.
92 4 • Calcul et physique lineaires ; relativite ; quantique
EXEMPLE PHYSIQUE (figure 3). L’energie du circuit
e =12
(q21C1
+q22C2
)+
12
(L1 q
21 +L2 q
22 +L(q1 + q2)2
)=
12
∑ij
qiKij qj +12
∑ij
qiMij qj
et la puissance dissipee P = −(R1q
21 + R2q
22 +R(q1 + q2)2
)= −∑
ij qi Fij qj sont desformes quadratiques respectivement positive et negative. Ici E = R4, x ≡ (q1, q2, q1, q2)
et M11 = L1, M22 = L2, M12 = M21 = L, K11 =1C1
, K22 =1C2
, K12 = K21 = 0,
F11 = R1 +R, F22 = R2 +R, F12 = F21 = R. Le bilan
dedt
=∑ij
(qiKij qj + qiMij qj) = P
conduit a∑ij qi
(Mij qj + Fij qj + Kij qj
)= 0, ou, puisque les qi peuvent etre pris a
tout instant quelconques, aux equations d’oscillateurs couples :∑j
Mij qj = −∑j
Kij qj −∑j
Fij qj .
(Le lecteur verifiera que ces equations, qui generalisent celle d’un oscillateur amortimx = −kx− fx, sont bien celles du circuit.)
R
R R
L1 L 2
21
qq CCL
2211
Figure 3
�
Sy
x
z
r
P
P1
2
O�
Figure 4
EXEMPLE GEOMETRIQUE. L’equation d’une surface S tangente en O au plan(xOy) s’ecrit pres de O :
z =12
(ax2 + 2bxy + cy2) ;
la forme est definie positive si la surface est convexe en O (figure 4). Soit z =r2
2R(ϕ)l’equation de la courbe Γ, intersection de S avec le plan (x = r cosϕ,
y = r sinϕ). R(ϕ) =(a+ c
2+a− c
2cos 2ϕ+ b sin 2ϕ
)−1
est le rayon de courbure
de Γ en O (cf. section 3.2.1). Il est compris entre les valeurs (algebriques) extremes,appelees aussi rayons de courbure principaux :
4.1 Espaces vectoriels 93
R1 =
⎛⎝a+ c
2−
√b2 +
(a− c
2
)2⎞⎠−1
et R2 =
⎛⎝a+ c
2+
√b2 +
(a− c
2
)2⎞⎠−1
.
En optique, la difference R−11 − R−1
2 relative a une surface d’onde est responsable del’aberration d’astigmatisme (cf. figure 34 section 7.3.2).On appelle usuellement courbure de la surface S la quantite :
C = a+ c = R−1(ϕ) +R−1(ϕ+
π
2
)= R−1
1 +R−12 .
Elle vaut2R
pour une sphere,1R
pour un cylindre et peut etre nulle si R1 = −R2
(surface en forme de “selle de cheval”). Elle intervient en hydrodynamique dans la loide Laplace de la tension superficielle P1−P2 = T C relative a la difference de pressionde part et d’autre d’une surface separant deux fluides (cf. cours de physique ; P1 > P2
sur la figure 4). Elle est differente de la courbure de Gauss introduite a la section3.2.6, et qui vaut ici :
CG
= ac− b2 = R−11 R−1
2 .
� Formes p-alternees (ou antisymetriques)
Ce sont des formes p-lineaires (p ≤ n) dont le signe change quand on echange deuxvecteurs, f(· · ·x · · · y · · · ) = −f(· · · y · · ·x · · · ), ou (c’est equivalent) qui s’annulent desque deux vecteurs sont proportionnels. Des exemples pour p = 2 et p = 3 sont (i < j < k)
σi,j (x, y) =∣∣∣∣ xi yixj yj
∣∣∣∣ = xiyj − xjyi
et σi,j,k (x, y, z) =
∣∣∣∣∣∣xi yi zixj yj zjxk yk zk
∣∣∣∣∣∣ = xi(yjzk−ykzj)+yi(zjxk−zkxj)+zi(xjyk−xkyj) .
Les quantites | · · · | sont les determinants des matrices (· · · ) (cf. section 4.2.1). σi,j (x, y)represente l’aire (algebrique) du parallelogramme construit avec les projections de xet y sur le plan (O, ei, ej), l’unite d’aire etant σi,j (ei, ej) = 1. Si E est l’espace usuel,σ1,2,3 (x, y, z) est le produit mixte des vecteurs. De facon generale il y a Cpn p-formesalternees independantes.
� Forme volume
Toute n-forme alternee est multiple de la forme definie par :
vol (x(1), . . . , x(n)) =
∣∣∣∣∣∣∣∣x
(1)1 · · · x
(n)1
.... . .
...x
(1)n · · · x
(n)n
∣∣∣∣∣∣∣∣def=
∑i1,...,in
εi1··· in x(1)i1
· · · x(n)in
.
εi1··· in est un symbole qui est nul des que deux indices sont egaux, et qui vaut ±1 selonque la suite ordonnee de ses indices se deduit de la suite {1, . . . , n} par une permutationpaire ou impaire (cf. remarque ci-dessous) :
94 4 • Calcul et physique lineaires ; relativite ; quantique
εP(1)···P(n) = (−1)|P | (|P | = 0 si la permutation P est paire et |P | = 1 si elle est impaire) .
vol (· · · ) est le volume de l’hyperparallelepipede construit avec les n vecteurs x(1), . . . , x(n)
et vol (e1, . . . , en) = 1. Son caractere alterne entraıne que vol (· · · ) = 0 si un des vecteurss’exprime lineairement en fonction des autres et donc que vol (· · · ) �= 0 est un critered’independance des n vecteurs. Dans le cas de l’espace usuel (n = 3) le symbole εijk estaussi note eijk ; en utilisant la convention de sommation d’Einstein, qui consiste asommer sur un indice apparaissant deux fois, et la correspondance (x ≡ 1, y ≡ 2, z ≡ 3),le produit vectoriel et le produit mixte s’ecrivent :
(−→A ∧−→
B )i = εijk Aj Bk ;−→A · (
−→B ∧ −→
C ) = εijk AiBj Ck .
REMARQUE. On rappelle que toute permutation est la composition de transpositions (echange dedeux elements), et que la parite du nombre de transpositions necessaires ne depend pas de la manieredont on procede ; par exemple la permutation qui fait passer de {1, 2, 3} a {3, 2, 1} est impaire car onpeut la realiser a l’aide d’une transposition (echange de 1 et 3) ou de trois (echange de 1 et 2 puis de 1et 3 puis de 2 et 3), mais pas de deux.
4.2 CALCUL MATRICIEL
4.2.1 Bases du calcul matriciel ; lien avec le calcul vectoriel
� Definitions et regles de calcul
Rappelons qu’une matrice p × n est un tableau M de nombres (elements du corps desreels, des complexes, etc.) a p lignes et n colonnes ; exemples (la notation etant justifieeci-dessous) :
x =
⎛⎝x1
x2
x3
⎞⎠ , A =(
2 0 −11 4 0
), At =
⎛⎝ 2 10 4−1 0
⎞⎠ , x† =(x1 x2 x3
).
Le nombre situe a l’intersection de la ligne j et de la colonne i est l’element Mji de lamatrice (exemple A21 = 1). x est une matrice colonne et x† est une matrice ligne.
On peut ajouter des matrices p×n entre elles ou les multiplier par λ : (A+B)ji = Aji+Bjiet (λA)ji = λAji (structure d’E.V.). Le produit de deux matrices est defini par :
C = BA⇐⇒Cki =∑j
Bkj Aji .
Ceci implique que le nombre de colonnes de B soit egal au nombre de lignes de A.
EXEMPLES : Ax =(
2x1 − x3
x1 + 4x2
), AAt =
(5 22 17
), AtA =
⎛⎝ 5 4 −24 16 0−2 0 1
⎞⎠.
La matrice transposee At deduite de A par echange des lignes et des colonnes ((At)ij =Aji), et la matrice adjointe A† definie par (A†)ij = Aji verifient :
4.2 Calcul matriciel 95
(At)t = (A†)† = A , C = BA⇐⇒Ct = AtBt⇐⇒C† = A† B† ;
par exemple (Ax)t = xtAt =(2x1 − x3 x1 + 4x2
). Quand elle est possible, la multi-
plication est associative (C (BA) = (CB)A = CBA) et distributive (C (A + B) =CA + CB) ; donc si dA est une variation infinitesimale de A (c.a.d. (dA)ji = d(Aji)),on a d(AB) = (dA)B + A dB. Par contre elle n’est pas commutative (cf. ci-dessusAtA �= AAt). Si p = n on appelle commutateur de A et B la matrice [A,B] =AB − BA = −[B,A] ; elle verifie [A,BC] = [A,B]C + B [A,C] et [A, [B,C]] +[B, [C,A]] + [C, [A,B]] = 0 (identite de Jacobi).
� Ecritures matricielle et vectorielle
Dans une base determinee {ei} de E, on represente tout vecteur x =∑
i xi ei par unematrice colonne, notee aussi x, d’elements xi (cf. exemple ci-dessus) ; en particulier lamatrice ei est la colonne dont tous les elements sont nuls, sauf celui de la ligne i qui estegal a 1. On en deduit l’ecriture matricielle d’une application lineaire de E (base {ei})dans F (base {f
j})
yj =∑i
Ajixi⇐⇒y = Ax
(en identifiant l’application et sa matrice representative dans les bases choisies). La ieme
colonne de A n’est autre que le produit matriciel Aei et Aji = f tjAei. Si E ≡ F , un
produit scalaire de vecteurs dans une base orthonormee s’ecrit :
(x, y) =∑i
xiyi = x†y (= xty dans le cas reel) ; (Ax,By) = x†A†By .
4.2.2 Matrices n× n ; exponentielle ; trace ; determinant ; inverse
� Matrices remarquables
1) La matrice identite I d’elements Iji = δji. Elle verifie IA = AI = A et c’est la seule(a un facteur pres) a commuter avec toutes les autres.2) Les matrices reelles symetriques S = St, antisymetriques A = −At, et les matricesorthogonales OOt = OtO = I qui conservent le produit scalaire reel : (Ox,Oy) =xtOtOy = (x, y). Par exemple pour n = 2 :
S =(a bb d
); A =
(0 −λλ 0
); O = Rθ =
(cos θ − sin θsin θ cos θ
)ou Sθ =
(cos θ sin θsin θ − cos θ
).
Rθ correspond a une rotation d’angle θ dans le plan (xy), et S2θ = RθS0R−1θ est une
symetrie par rapport a un axe faisant l’angle θ avec Ox.3) Les matrices complexes hermitiennes H = H†, antihermitiennes iH telles que(iH)† = −iH, et les matrices unitaires UU† = U†U = I qui conservent le produitscalaire hermitien : (Ux,Uy) = x†U†Uy = (x, y).4) Les projecteurs. P = mm† (avec m norme) projette le vecteur x sur la direction m.On verifie : P = P†, P2 = P, P1P2 = m1(m
†1m2)m
†2 = 0 si m1 et m2 sont orthogonaux.
96 4 • Calcul et physique lineaires ; relativite ; quantique
EXEMPLE. En optique ondulatoire, un polariseur rectiligne, ou circulaire gauche
(resp. droit), est un appareil qui projette le champ complexe(ExEy
)e−iωt sur les vec-
teurs(
cos θsin θ
), ou
1√2
(1i
)(resp.
1√2
(1−i
)). Ces vecteurs normes representent les
etats de polarisation des photons associes au champ (cf. section 4.4.1). Les projecteurs(cos2 θ sin θ cos θ
sin θ cos θ sin2 θ
)ou
12
(1 ∓i±i 1
)representent l’“action” du polariseur.
� Exponentielles ; groupes continus
On demontre, et on admettra, que l’etude des groupes “continus” (rotations par exemple)se ramene a celle de sous groupes a un parametre (rotations autour d’un axe par exemple) ;ces sous groupes font intervenir des exponentielles de matrices (generateurs des sousgroupes). Comme pour les nombres, eA est defini par la serie convergente
eA = I + A +A2
2!+ · · ·+ An
n!+ · · ·
et les matrices M(t) = etA verifient les proprietes :
et1A et2A = e(t1+t2)A ,ddtetA = A etA , etA = lim
n→∞
(I + t
An
)n.
Ces matrices forment un groupe commutatif a un parametre entierement determine par
son generateur A =dM(t)
dt
∣∣∣t=0
.
EXEMPLE 1. Les rotations (actives) d’angle θ dans le plan (x, y), les transformations(passives) de Lorentz de rapidite ϕ dans le plan (x, ct) ou de Galilee de vitesse V
dans le plan (x, t) s’ecrivent respectivement :(
cos θ − sin θsin θ cos θ
)= exp
[θ
(0 −11 0
)],(
coshϕ − sinhϕ− sinhϕ coshϕ
)= exp
[−ϕ
(0 11 0
)]et
(1 −V0 1
)= exp
[−V
(0 10 0
)]; le
calcul de eA est immediat car A2 = −I, I ou 0.
EXEMPLE 2. Les rotations dans l’espace d’angle θ autour d’un axe passant par Oet de vecteur directeur n(α, β, γ) s’ecrivent :
Rn(θ) = eθAn avec An =
⎛⎝ 0 −γ βγ 0 −α−β α 0
⎞⎠ .
En effet, de An r = n ∧ r on deduit Rn(ε)r = r + ε n ∧ r, qui correspond bien aune rotation infinitesimale autour de n. Les matrices Rn(θ) s’identifient aux matricesorthogonales 3 × 3 de determinant 1.
EXEMPLE 3. Si A = −At est reelle, les matrices O(t) = etA sont orthogonales(en effet (exp tA)t = exp tAt = exp−tA), et reciproquement (on ecrit O(ε)Ot(ε) =(I+εA) (I+εAt) = I a l’ordre ε). Si H = H† est hermitienne, les matrices U(t) = e−itH
sont unitaires et reciproquement (demonstration analogue).
4.2 Calcul matriciel 97
EXEMPLE 4. Les solutions de x = Ax, equation a laquelle se ramene toute E.D.L.S.(cf. section 6.2.2), sont x(t) = etA x(0).
REMARQUE. Groupe de Lie. On fera attention que eA eB �= eA+B si les matrices A et B ne
commutent pas. Le resultat exact, dont la demonstration est non triviale, est eA eB = eC avec C =
A+B+ 12[A,B]+· · · , ou les « · · · » ne font intervenir que des matrices obtenues a partir de commutations
avec A ou B de leur commutateur [A,B]. On le verifie a l’ordre deux en ecrivant eA eB = (I+A+ A2
2+
· · · ) (I+ B+ B2
2+ · · · ) = I+A +B + (A+B)2
2+ AB−BA
2+ · · · . Ce resultat a pour consequence qu’une
famille de matrices M(t) dependant continument de p parametres t1, · · · , tp, et reliees continument a
l’identite M(0) = I, forme un groupe (de Lie) si et seulement si les commutateurs des p generateurs
Ai = ∂M(t)∂ti
|t=0 sont des combinaisons lineaires des Aj . Par exemple pour les generateurs An ci-
dessus du groupe des rotations, un calcul elementaire montre que : [Ax,Ay ] = Az , [Ay,Az ] = Ax et
[Az,Ax] = Ay .
� Trace et determinant
On appelle trace de A le nombre
trA =∑i
Aii (somme des elements diagonaux) .
On verifie facilement : trI = n, trAt = trA et trAB = trBA.Le determinant est defini par :
detA =
∣∣∣∣∣∣∣A11 · · · A1n
.... . .
...An1 · · · Ann
∣∣∣∣∣∣∣ =∑i1···in
εi1···inAi11 · · ·Ainn .
Cette quantite, ecrite explicitement pour n = 2 et n = 3 a la section 4.1.3, n’est autreque vol(Ae1, · · · ,Aen). On en deduit que detA est multiplie par λ si une colonne estmultipliee par λ (donc det(λA) = λn detA), et qu’il reste inchange si on ajoute a unecolonne une combinaison lineaire d’autres colonnes ; la condition detA �= 0 caracterisel’independance des vecteurs “colonnes” Aei. On montre que les determinants verifient :
detAt = detA , detAB = detA detB , det eA = etrA .
La derniere propriete resulte de : det(I + A/n
)n � (1 + trA/n)n pour n grand.
REMARQUE. Dans la somme qui definit det A, chaque terme non nul contient un et un seul element
Aji pour j fixe. On peut donc regrouper les termes de cette somme pour developper le determinant par
rapport aux elements d’une ligne j quelconque (mais fixee) et ecrire det A =∑iAjiAji. Le coefficient
Aji, appele cofacteur de Aji, est le produit par (−1)i+j du determinant de la matrice obtenue en
supprimant dans A la ligne j et la colonne i. On ramene ainsi le calcul d’un determinant n× n a celui
de determinants (n − 1) × (n − 1) (cf. σi,j,k(x, y, z) section 4.1.3). On a aussi∑iAjiAki = det A δjk ,
car (reflexion laissee au lecteur) pour k �= j la somme est le determinant de la matrice A dans laquelle la
ligne k a ete remplacee par la ligne j, et un determinant est nul si deux lignes j et k sont egales, d’ou :
AAt = AtA = (det A) I (A matrice des cofacteurs).
� Inverse
La matrice inverse A−1 de A est telle que A−1A = AA−1 = I. Son unicite est facile ademontrer ; la remarque ci-dessus etablit sa condition d’existence detA �= 0.
98 4 • Calcul et physique lineaires ; relativite ; quantique
EXEMPLE.(a bc d
)−1
=1Δ
(d −b−c a
)si Δ = ad− bc �= 0.
Application aux changements de bases. Si y = Ax est une relation matricielleentre vecteurs de E, un changement de base induit les changements de coordonneesx = Px′, y = Py′ (cf. section 4.1.1) ; il conduit a y′ = A′x′ avec A′ = P−1AP, matricerepresentative de la relation dans la nouvelle base.
4.2.3 Spectre d’une matrice n× n ; vecteurs propres ; exemples
Le spectre de A est l’ensemble des nombres λ pour lesquels A−λI n’est pas inversible,donc pour lesquels det(A−λI) = 0, ou encore tels que Ker(A−λI) �= 0. Sa connaissanceest essentielle pour mettre A sous une forme simple (diagonale ou de Jordan), et pourramener toute fonction de A a un polynome simple.
� Polynome caracteristique de A
Defini parPc(z)
def= det(zI−A) = Πni=1 (z − λi) ,
donc de la forme zn + an−1zn−1 + · · · + a0, avec (−1)na0 = detA = Πi λi et −an−1 =
trA =∑
i λi, il a pour zeros le spectre de A. Comme det(PP−1) = detP det(P−1) =det I = 1, les matrices A et A′ = P−1AP, qui correspondent a la meme applicationlineaire dans differentes bases, ont meme polynome caracteristique.
Theoreme de Cayley-Hamilton. Le polynome caracteristique est annule par A : Pc(A) = 0 ; par
exemple pour n = 2 : A2 − (a+ d)A + (ad − bc) I =
(0 00 0
)avec A =
(a bc d
).
DEMONSTRATION. Elle repose sur la remarque que dans la matrice des cofacteurs de zI − A, et
donc aussi dans sa transposee notee B(z), le plus haut degre possible pour z est zn−1. En ecrivant
(zI − A)B(z) = Pc(z) I avec B(z) = zn−1Bn−1 + · · · + B0, et en identifiant les termes en zp (p =
0, · · · , n) dans les deux membres, il vient a0I = −AB0, a1I = −AB1 + B0, · · · , I = Bn−1, d’ou
a0I + a1A + · · · + an−1An−1 + An = 0.
De ce theoreme decoule l’existence d’un polynome minimal Pm(z) de degre p ≤ n, unique a un facteur
pres (identique a Pc(z) si p = n), et tel que Pm(A) = 0. On peut montrer, en divisant Pc(z) par Pm(z),
que Pm(z) possede, avec eventuellement des multiplicites moindres, tous les zeros de Pc(z). Par exemple
les matrices(λ1 00 λ2
)et
(λ 10 λ
)ont pour polynome minimal respectif (z − λ1)(z − λ2) = Pc(z)
si λ1 �= λ2 ou (z − λ) si λ1 = λ2 = λ, et (z − λ)2 = Pc(z) (verification immediate). L’interet de Pm est
d’assurer que tout polynome P (A), ou toute serie convergente de A, s’exprime en fonction des seules
matrices I,A, · · · ,Ap−1 ; en effet, de la division P (z) = Pm(z)Q(z) + R(z) on deduit explicitement
P (A) = R(A).
� Vecteurs propres et valeurs propres ; diagonalisation
Soit λ un element du spectre de A. La propriete det(A−λI) = 0 entraıne que l’equationAm = λm admet au moins une solution m �= 0. Le vecteur m, defini a une constantemultiplicative pres, est appele vecteur propre associe a la valeur propre λ. Si la matriceA possede une base de vecteurs propres
Ami = λimi (i = 1, · · · , n; mi vecteurs independants) ,
4.2 Calcul matriciel 99
elle devient une matrice diagonale (avec les λi comme elements diagonaux et des zerosailleurs) lorsqu’on l’ecrit dans cette base et on retrouve :
detA = Πi λi et trA =∑i
λi .
En effet, si P est la matrice qui a pour colonne i les composantes de mi dans la baseinitiale, P−1P = I entraıne que A′ = P−1AP = P−1
(λ1m1 · · · λnmn
)a pour
elements A′ij = λi δij . Une telle base existe toujours si il y a n valeurs propres differentes
car des vecteurs propres relatifs a des valeurs propres differentes sont independants ;par exemple si m2 = am1 �= 0, l’application de A donne λ2m2 = aλ1m1, ce qui estcontradictoire pour λ2 �= λ1 ; on ne peut avoir de meme m3 = am1 + bm2, avec m1 etm2 independants et λ1 �= λ2 �= λ3.REMARQUES. 1) La relation An = (PA′P−1)n = PA′nP−1 simplifie le calcul de An puisque(A′n)ij = λni δij (et le calcul d’autres fonctions de A comme exp A). 2) Si A et B sont diagonali-sables et si [A,B] = 0, on peut montrer qu’elles ont une base commune de vecteurs propres.
Matrice de Jordan. A n’est pas diagonalisable si, lorsque λ est un zero d’ordre q > 1 de Pc(z) (λ
degeneree q fois), l’equation (A− λI)m = 0 ne fournit pas q vecteurs independants. On montre que par
contre (A − λI)qm = 0 a q solutions independantes mi qu’on peut choisir de sorte que Ami = λmi ou
Ami = λmi +mi−1. Par exemple pour n = q = 2 ou n = q = 3, et A non diagonalisable, A′ peut etre
reduite a la forme
(λ 10 λ
)ou a l’une des deux formes
⎛⎝λ 0 00 λ 10 0 λ
⎞⎠ ou
⎛⎝λ 1 00 λ 10 0 λ
⎞⎠.
� Matrices remarquables
Les matrices hermitiennes H = H† (ou symetriques reelles S = St), les matrices anti-hermitiennes iH (ou antisymetriques reelles A = −At), les matrices unitaires UU† =U†U = I (ou orthogonales reelles OOt = OtO = I) possedent toutes une base ortho-normee de vecteurs propres. Les valeurs propres de ces trois groupes de matricessont respectivement reelles, imaginaires pures, de module 1 ; les vecteurs propressont reels pour les matrices symetriques reelles. Ces proprietes reposent sur la relation(x,Ay) = x†Ay = (A†x)†y. En decomposant les vecteurs sur la base orthonormee desvecteurs propres mi de A, il vient (x,Ay) = (
∑iXimi, A
∑j Yjmj) =
∑iXiYiλi =∑
i λi (x,mi) (mi, y). La matrice A s’ecrit donc aussi (decomposition spectrale de A) :
A =∑i
λiPi avec Pi = mim†i (projecteur sur mi) .
JUSTIFICATION (on admet la diagonalisabilite). Considerons le cas A = A† ; en prenant x = y = m
vecteur propre on obtient λ = λ, et en prenant x = m1 et y = m2 on obtient λ1(m1,m2) = λ2(m1,m2),
donc (m1, m2) = 0 si λ1 �= λ2 ; (si λ1 = λ2 il existe des combinaisons de m1 et m2 orthogonales). Le cas
A = −A† se ramene au cas precedent car iA est hermitienne. Quant aux matrices unitaires, on deduit
de (Um1, Um2) = λ1λ2 (m1, m2) = (m1,m2) que |λ| = 1 en posant m1 = m2 = m et que (m1, m2) = 0
si λ1 �= λ2.
EXEMPLE 1. La conique ax2 + 2bxy+ dy2 =(x y
) (a bb d
) (xy
)= 1 s’ecrit λ1X
2 +
λ2Y2 = 1 dans la base des vecteurs propres normes. Si le determinant ad− b2 = λ1λ2
est positif, c’est un ellipse de demi axes λ−12
1,2 et donc d’aire π (ad− b2)−12 .
100 4 • Calcul et physique lineaires ; relativite ; quantique
EXEMPLE 2. Les matrices de rotation Rθ (cf. section 4.2.2) ont pour valeurs propres
et vecteurs propres normes λ± = e∓iθ et m± =1√2
(1±i
). Les polarisations gauche
et droite en optique ondulatoire, et les etats des photons associes, sont donc desvecteurs propres des rotations autour de l’axe de propagation z avec pour valeurspropres e−iθ et eiθ (cf. section 4.4.1).
� Modes propres d’oscillateurs couples
En notation complexe, on appelle ainsi les solutions de l’equation (cf. exemple electriquesection 4.1.3)
Mx = −Kx
du type x(t) = eiωtm (avec M et K symetriques definies positives). m et ω doiventverifier (K − ω2M)m = 0 et det(K − ω2M) = 0 ; ce probleme est equivalent a larecherche des valeurs et vecteurs propres de la matrice symetrique M− 1
2 KM− 12 . De
mt1Km2 = ω2
2 mt1Mm2 = (mt
2Km1)t = ω2
1 mt1Mm2 on deduit, en faisant m1 = m2 = m,
que ω2 > 0 (ω reel), et que les moyennes temporelles des “energies potentielle” 12 x
tKxet “cinetique” 1
2 xtMx sont egales dans un mode propre ; si ω1 �= ω2 on a : mt
1Mm2 = 0.Ces modes sont etudies a la section 6.2.2.
� Calculs de perturbation
Matrices hermitiennes A = A†. 1) Si λi est une valeur propre (relle) non degeneree et si la pertur-
bation δA de A est “petite”, alors δmi est “petit”. De λi = m†i Ami on deduit :
δλi = λi((δm†i )mi +m†
i (δmi)) +m†i (δA)mi = m†
i (δA)mi
car δ(m†i mi = 1) = 0. 2) Pour δA = 0 cette relation entraıne δ(m†
iAmi) = 0 ; donc tout vecteur propre
norme extremalise (m†Am). Cette propriete est utilisee pour la recherche des vecteurs et valeurs propres
par des methodes variationnelles (Rayleigh-Ritz).
Oscillateurs couples. Pour F “petite”, on trouve les pulsations propres deMx+ Fx+ Kx = 0
(cf. section 4.1.3) en posant x(t) = ei(ω+δω)t(m + δm). A l’ordre le plus bas il vient (K − ω2M)δm +
(−2ω δωM + iωF)m = 0, et en multipliant a gauche par mt on obtient δω = i2mtFmmtMm
(imaginaire pur
en raison des pertes d’energie). 2) On montre de meme pour l’equation (M + δM) x + (K + δK)x = 0
que δω =mt(δK−ω2δM)m
2ωmtMm.
� Fonctions propres
Les notions de valeurs et vecteurs propres s’etendent aux applications (operateurs) lineairessur les fonctions. Par exemple les translations de temps (Tτ f)(t) = f(t − τ) pour
les fonctions de periode T ont les exponentielles e−iωt (ω =2πnT
) comme fonctions
propres avec eiωτ comme valeurs propres. Plus generalement des champs f(r, t) ayantune dependance de type onde plane en e−i(ωt−�k·�r) sont, au moins formellement, fonc-tions propres des operations T�a,τ de translation spatiale et temporelle, definies parT�a,τ f(r, t) = f(r − a, t − τ) avec les valeurs propres eiωτ e−i�k·�a (resultat utilise a lasection 3.4.2).
4.2 Calcul matriciel 101
AUTRES EXEMPLES. La symetrisation ou l’antisymetrisation d’une fonction de n variables,
qui intervient quand on construit les fonctions d’onde de bosons ou de fermions, correspond aux
operations lineairesf(x1, · · · , xn) → (Sf) (x1, · · · , xn) = (n!)−1
∑P f(x
P (1) , · · · , xP (n))
ou f(x1, · · · , xn) → (Af) (x1, · · · , xn) = (n!)−1∑P (−1)|P | f(x
P (1) , · · · , xP (n) ) .∑P est la somme sur toutes les permutations, au nombre de n!. Par exemple pour n = 2 :
f1(x1) f2(x2) → 12
[f1(x1) f2(x2) ± f1(x2) f2(x1)].
Si P est l’operation de permutation definie par (Pf) (xP (1) , · · · , xP (n)) = f(x1, · · · , xn), on verifie fa-
cilement que Sf et Af , qui sont respectivement symetrique et antisymetrique, sont fonctions propres
de P avec les valeurs propres 1 et (−1)|P |.
4.2.4 Matrices de Pauli ; groupe de symetrie de la physique ; spineurs
Ces matrices 2×2, forme moderne des quaternions inventes par Hamilton pour generaliserles nombres complexes et pour algebriser l’espace a trois dimensions, sont utiles non seule-ment pour obtenir la loi de composition des rotations, mais aussi pour decrire l’espace-temps en relativite, et traiter les systemes a deux niveaux en quantique (cf. section 4.4.2).
� Definition et proprietes
Les matrices de Pauli (hermitiennes de trace nulle)
σx =(
0 11 0
), σy =
(0 −ii 0
), σz =
(1 00 −1
)forment avec l’identite I une base des matrices 2 × 2. La matrice la plus generale peuten effet s’ecrire :(
a bc d
)=
(V0 + Vz Vx − iVyVx + iVy V0 − Vz
)= V0 I + −→σ · −→V = V .
(La notation vectorielle −→σ ·−→V = Vx σx+Vy σy+Vz σz est justifiee par ce qui suit.) V esthermitienne si V0 et
−→V sont reels. Dans ce cas on peut poser
−→V = V n avec n ≡ (θ, ϕ) :
V = V0 I + V−→σ · n = V0
(1 00 1
)+ V
(cos θ sin θe−iϕ
sin θeiϕ − cos θ
).
Les valeurs propres et vecteurs propres normes de V sont :
λ± = V0±V , m+ =(
cos θ2sin θ
2 eiϕ
), m− =
( − sin θ2
cos θ2 eiϕ
), (−→σ · n)m± = ±m± .
DEMONSTRATION. On considere le cas V0 = 0, ce qui revient simplement a decaler les valeurs propres
(de −V0) sans changer les vecteurs propres. det(λI−H) = λ2 −V 2 = 0 donne λ±. Les composantes x et
y des vecteurs propres se deduisent de cos θ x+sinθ e−iϕ y = ±x (et de la normalisation |x|2 + |y|2 = 1) ;
ces vecteurs sont definis a un facteur eiφ pres. Les projecteurs associes sont : P± = (I ±−→σ · n)/2.
Les matrices −→σ · −→V verifient la loi de multiplication (consequence de σ2x = σ2
y = σ2z = I
et de σx σy = −σy σx = iσz · · · ) :
102 4 • Calcul et physique lineaires ; relativite ; quantique
(σ · −→V 1
)(σ · −→V 2
)= (
−→V 1 · −→V 2) I + iσ · (−→V 1 ∧ −→
V 2) .
Elle permet d’ecrire (car (σ · n)2 = I)) les exponentielles
Un(θ) = e−i2 �σ·n θ = cos
θ
2I− i sin
θ
2σ · n (matrices unitaires) ,
Hn(ϕ) = e−12 �σ·n ϕ = cosh
ϕ
2I− sinh
ϕ
2σ · n (matrices hermitiennes) ,
qui, on va le voir, constituent une representation des rotations et des transformationsde Lorentz pures. En particulier :
Ux(θ) =(
cos θ2 −i sin θ2
−i sin θ2 cos θ2
); Uz(θ) =
(e−i
θ2 0
0 eiθ2
).
� Matrices de Pauli et espace-temps
A un intervalle d’espace-temps (cT ,−→R ) de coordonnees (cT,X, Y, Z) (cf. section 3.1.2)
on peut associer mathematiquement la matrice hermitienne
X = cT I + −→σ · −→R , detX = c2T 2 −−→R 2 .
Les transformations, avec M matrices 2 × 2 complexes de determinant 1,
X′ = MXM† (detM = 1)
induisent sur (cT,X, Y, Z) des changements qui definissent le groupe de Lorentz :
transformations lineaires telles que c2T 2−−→R 2 = c2T ′2−−→
R ′2. En effet, elles conservent lecaractere hermitien de X, ce qui permet d’ecrire X′ = cT ′ I+−→σ ·−→R ′, et son determinant.On verifie aussi que les matrices M (4 elements complexes et determinant reel egal a 1)dependent de 8− 2 = 6 parametres reels comme ce groupe.
Rotations. Si M est unitaire (M† = M−1) la trace 2cT de X est inchangee donc aussi|−→R |. En considerant la transformation infinitesimale de
−→R associee a une matrice Un(ε)
σ · −→R ′ =(I− iσ · n ε
2)σ · −→R(
I + iσ · n ε2),
on obtient−→R ′ =
−→R + εn∧−→
R et on en deduit que Un(θ) correspond a une rotation d’axen et d’angle θ. (On peut aussi faire le calcul pour θ fini et retrouver le resultat de lasection 3.3.1.) On notera que Un(θ) et −Un(θ) = Un(θ + 2π) correspondent a la memerotation de
−→R . La loi de multiplication des Un(θ)
Un2(θ2)Un1(θ1) = ±Un(θ)
s’ecrit, en posant c = cosθ
2et s = sin
θ
2n (petit calcul) :
c = c1c2 − s1 · s2 et s = c2s1 + c1s2 + s2 ∧ s1 ;
modulo l’equivalence (c, s) ≡ (−c,−s), c’est la loi de composition des rotations(formule de Hamilton). On retrouve que seules les rotations de meme axe (s1 ‖ s2), oud’angle π et d’axes perpendiculaires (c1 = c2 = 0 et s1 ⊥ s2) commutent (cf. section3.1.3).
4.2 Calcul matriciel 103
REMARQUE. Les matrices Un(θ) decrivent en physique l’action des rotations sur lesetats de particules de spin 1
2 au repos (electrons, protons, neutrons, quarks), et la pro-priete etonnante Un(2π) = −I (et non I) a ete verifiee experimentalement. Elle signifieque le “vrai” groupe de symetrie n’est pas le groupe des rotations des vecteurs de R3,mais le groupe SU(2) des matrices 2 × 2 unitaires “speciales” (c.a.d. de determinant 1).
Transformations de Lorentz pures. On verifie de meme que la relation
cT ′I + σ · −→R ′ = (I− σ · n ε2)(cT I + σ · −→R )(I− σ · n ε
2) ,
correspond (cf. section 4.3.3) a une transformation (passive) de Lorentz pure infinitesimale
cT ′ = cT −−→ε · −→R ,−→R ′ =
−→R −−→ε cT .
REMARQUE. On peut aussi associer a (cT,−→R ) la matrice X conjuguee de X :
X = cT I−−→σ · −→R = εX ε−1 avec ε =(
0 1−1 0
).
(On verifie que pour chaque matrice de Pauli : εσiε−1 = −σi, i = x, y, z.) Alors lestransformations X → X′ equivalent a :
X′ = MXM† avec M = εMε−1 = M†−1 (car detM = 1) .
Les matrices M constituent une seconde representation a deux dimensions du groupe deLorentz. Elle ne peut etre ramenee a la premiere par un changement de base car il n’existepas de matrice P telle que M = PMP−1 pour tout M (cela impliquerait U = PUP−1
pour toute matrice unitaire).
� Spineurs
On appelle ainsi des vecteurs complexes a deux composantes qui se transforment selon :ψ ′ = Mψ ou ψ ′ = M ψ .
(ψ et ψ se transforment avec la meme loi pour une rotation car alors M = M). On
verifie aisement que εψ se transforme comme ψ (et εψ comme ψ). Par exemple : εψ ′ =εM(ε−1ε)ψ = M(εψ). ψ et ψ sont dits spineurs conjugues (application section 4.4.5).
4.2.5 Groupe de rotation et classification des grandeurs physiques
On a vu au chapitre 3, avec le principe de Curie, l’ importance des lois de transformationdes grandeurs (et champs) physiques. L’objet de cette section est de montrer que pourles rotations ces grandeurs ne se limitent pas aux scalaires et aux vecteurs.
� Classification des matrices 3 × 3 reelles
Soit−→W = M
−→V une relation entre grandeurs vectorielles reelles relatives a un systeme
physique. Pour le systeme tourne les grandeurs et la relation deviennent−→W ′ = R
−→W ,−→
V ′ = R−→V et
−→W ′ = M′−→V ′ avec M′ = RMRt. Si M = λI, ou M = A antisymetrique,
ou M = M symetrique de trace nulle, M′ a les memes proprietes que M. On en deduitque pour une matrice quelconque la decomposition
M =13
(trM) I +12(M−Mt) + M (ou Mij =
12
(Mij +Mji)− 13δij
∑k
Mkk)
104 4 • Calcul et physique lineaires ; relativite ; quantique
est invariante par rotation. La matrice λI invariante est une grandeur scalaire ; l’actiond’une matrice antisymetrique sur
−→V pouvant toujours s’ecrire sous la forme d’un produit
vectoriel (cf. exemple 2 section 4.2.2) la matrice A = 12 (M −Mt) est assimilable a une
grandeur vectorielle ; Q = M caracterise une grandeur quadrupolaire. L’E.V. desmatrices 3 × 3 est ainsi decompose en une somme directe de trois sous espaces laissesinvariants par les rotations ; pour les dimensions, on verifie que 3 × 3 = 1 + 3 + 5 (Adepend de trois parametres et Q de cinq).
EXEMPLES. Le developpement multipolaire au second ordre du potentiel electro-statique a grande distance cree par une distribution de charges est (cf. |r − rα|−1 �
r−1
(1 − 2
rα · rr
+r2αr2
)− 12
et section 5.1.2)
V (r) =1
4πε0
∑α
qα|r − rα| =
14πε0
(q
r+p · rr2
+r ·Qr2r3
+ · · ·),
avec q =∑
α qα, p =∑
α qαrα et Qij =∑
α qα(3xiα xjα − r2α δij
). Pour le potentiel
de gravitation, en prenant l’origine au centre de masse, on obtient de meme
V (r) = −G∑α
mα |r − rα|−1 = −G (r−1m+ (2r3)−1 r ·Qr + · · · )
avec m =∑
αmα et Qij =∑αmα
(3xiα xjα − r2α δij
)(pas de terme dipolaire).
� Representations lineaires du groupe des rotations
Une action lineaire (cf. section 3.1.1) du groupe des rotations (en fait du groupe SU(2)) sur les parametres
x ≡ (x1, · · · , xn) qui caracterisent un systeme s’ecrit x′ = R(U) x avec R(U1 U2) = R(U1)R(U2) .
R(U) est une matrice n × n qui represente la rotation dans l’espace vectoriel des parametres X = {x}(matrice orthogonale 3 × 3 lorsqu’elle agit sur les vecteurs de l’espace ordinaire). La representation est
dite irreductible si il n’existe pas de sous espace de X laisse globalement invariant.
On demontre (cf. ouvrages de physique quantique) que pour toute dimension n, ecrite traditionnellement
n = 2j + 1 avec j demi-entier positif ou nul,
il existe une representation irreductible unique, a un changement de base pres. Les grandeurs sca-
laires (invariantes), vectorielles, quadrupolaires et les spineurs ci-dessus se transforment selon les
representations j = 0, 1, 2 (n = 1, 3, 5) et j = 12
(n = 2, matrices Un(θ)). Pour j fixe quelconque, la base
{ejm} (m = −j,−j + 1, · · · , j)peut etre choisie de sorte que les matrices soient unitaires, et que les ejm soient vecteurs propres des
rotations d’angle α autour de z avec les valeurs propres e−imα. Pour j = 12
les vecteurs e 12
12
et e 12 − 1
2,
notes aussi ci-dessous ψ+
et ψ−, correspondent a
(10
)et
(01
). Pour j = 1 les vecteurs e11, e10 et e1−1
sont proportionnels a x+ iy, z et x− iy. Des exemples d’espaces de representation avec j = l entier sont
les E.V. de fonctions engendres par la base des harmoniques spheriques Yml (θ, ϕ) ≡ elm. On verifie que
Yml (θ, ϕ − α) = e−imα Yml (θ, ϕ) (cf. section 4.1.2). Les orbitales atomiques s, p, d, f · · · sont donc
associees aux representations l = 0, 1, 2, 3, · · · .On montre aussi que l’E.V. produit tensoriel Ej1 ⊗ Ej2 (de dimension (2j1 + 1)(2j2 + 1)) engendre
par les vecteurs ej1m1⊗ ej2m2
, qui sont chacun change en R1 ej1m1⊗ R2 ej2m2
dans une rotation, se
decompose en une somme directe ⊕jEj de sous E.V. invariants, la somme sur j portant sur les valeurs
4.3 Applications en physique classique 105
j = |j1 − j2|, |j1 − j2 + 1|, · · · , j1 + j2 .
Cette propriete correspond en physique quantique a la composition des moments cinetiques. Par
exemple si j1 = j2 = 12
(E.V. engendre par les quatre vecteurs ψ± ⊗ ψ±) alors j = 0 ou 1. On verifie
facilement que 2−12 (ψ
+⊗ ψ− − ψ− ⊗ ψ
+) est invariant (consequence de ψ
+→ U11ψ+
+ U21ψ−,
ψ− → U12ψ++U22ψ− et de det U = U11U22 −U12U21 = 1). L’E.V. complementaire j = 1 est engendre
par ψ+
⊗ ψ+
, 2−12 (ψ
+⊗ ψ− + ψ− ⊗ ψ
+) et ψ− ⊗ ψ−. En physique classique la decomposition des
matrices 3 × 3 en scalaire, vecteur et quadrupole correspond au cas j1 = j2 = 1.
4.3 APPLICATIONS EN PHYSIQUE CLASSIQUE
4.3.1 Deformations et contraintes ; elasticite ; viscosite
Un corps se deforme lorsque les distances entre ses points varient. On se limite ici auxdeformations infinitesimales et aux lois lineaires entre deformations et contraintes.
� Deformations lineaires infinitesimales
Elles correspondent a des transformations qui changent les vecteurs l =−−→AB en l ′ = l+
−→δl
avec−→δl = Ml, M etant une matrice “infinitesimale”. Leur composition revient a multi-
plier des matrices de la forme I + M, c.a.d. a ajouter les matrices infinitesimales M, car(I + M1) (I + M2) = I + M1 + M2 a l’ordre le plus bas ; ceci equivaut a ajouter les
−→δl .
Comme une rotation infinitesimale, qui correspond a une matrice M antisymetrique, nechange pas les distances, les deformations sont caracterisees par les matrices symetriquesnotees [ε] : ⎛⎝δlxδly
δlz
⎞⎠ =
⎛⎝εxx εxy εxzεxy εyy εyzεxz εyz εzz
⎞⎠ ⎛⎝lxlylz
⎞⎠ ;
ces matrices de deformation dependent de six parametres.
EXEMPLES. Les translations ne changeant pas les distances entre points, on considereles deformations qui laissent l’origine O fixe : r ′ = r+[ε]r. Les figures 5a,b,c montrentl’effet sur le carre [−1, 1]× [−1, 1] des trois transformations planes
(a)(x′
y′
)=
(1 + ε1 0
0 1 + ε1
) (xy
),
(b)(x′
y′
)=
(1 + ε2 0
0 1 − ε2
) (xy
),
(c)(x′
y′
)=
(1 ε3ε3 1
) (xy
),
dont toute deformation infinitesimale plane est la composee. (a) est une dilatation(homothetie) de rapport 1+ε1. (b) et (c), qui ne changent pas la surface, sont appeleescisaillement ; (c) se ramene a (b), pour ε3 = ε2, par une rotation de
π
4des axes.
106 4 • Calcul et physique lineaires ; relativite ; quantique
�
x
y
1
1�
�
1 x
y
1+1−
1�
� �
�
1+
1+y
x1
1
(a)
Xy
Y
x
(c) (d)(b)
Figures 5
Enfin la figure 5d montre l’effet de la transformation(x′
y′
)=
(1 ε0 1
) (xy
)appelee
cisaillement simple ; elle resulte de la composition d’un cisaillement “pur” de type(c) avec ε3 =
ε
2, et d’une rotation d’angle − ε
2, comme le montre les figures 5c et 5d
ou l’addition des matrices(
0 ε2
ε2 0
)et
(0 ε
2− ε2 0
).
En considerant la deformation des vecteurs x, y et z, par exemple x → (1 + εxx) x +εxy y + εxz z, on voit que εxx est l’allongement relatif d’un vecteur parallele ax, que 2εxy est le rapprochement angulaire (symetrique) des directions x et y, etque le volume du cube construit sur (x, y, z) devient det(I + [ε]) = 1 + εxx + εyy + εzz ;tr[ε] est donc la variation relative de volume. La relation [ε] = 1
3 tr[ε] I + [ ε ], ouεij = 1
3
∑k εkk δij + (εij − 1
3
∑k εkk δij), montre que toute deformation se decompose
en une dilatation (homothetie), associee a la variation de volume, et des cisaillements(qui ne modifient pas le volume car tr[ ε ] = 0). Enfin dans la base X, Y , Z qui rend [ε]diagonale, la deformation apparaıt comme la composition d’affinites 1 + ε
X, 1 + ε
Y, et
1 + εZ
dans les directions X, Y , Z (εX
, εY, ε
Zvaleurs propres de [ ε ]).
Champ de deformations. Si chaque point �r se deplace de−→ψ (�r, t), le vecteur
−→dr joignant deux points
voisins devient−→dr +
−→dψ avec par exemple (cf. section 7.1.1) dψx = ψx(�r +
−→dr, t) − ψx(�r, t) = ∂xψx dx+
∂yψx dy+∂zψx dz, ou plus generalement dψi =∑j(∂jψi) dxj soit d
−→ψ = M
−→dr. Si M est infinitesimale, sa
partie antisymetrique traduit une rotation de−→dr ; sa partie symetrique [ε] correspond a une deformation
dont la matrice a pour elements et trace
εij = 12(∂iψj + ∂jψi) et tr[ε] = div
−→ψ = δV
V.
δVV
represente une variation relative locale de volume. Si le deplacement−→ψ s’effectue dans le temps
dt on ecrit−→ψ = �v dt ; la vitesse de deformation est definie par la matrice notee [ε], d’elements
[ε]ij = 12
(∂ivj + ∂jvi) et de trace tr[ε] = div−→v = ddtδVV
(cf. section 7.1.3 ).
� ContraintesSoient, au sein de la matiere, un element de surface
−→dS oriente de 1 vers 2 et
−→dF ≡ −→
dF 2→1
la force de contact exercee par la region 2 sur la region 1. La relation de proportionnalite−→dF = [σ]
−→dS = −[p]
−→dS (donc [p]
−→dS =
−→dF 1→2) definit les matrices de contrainte [σ]
et de pression [p]. Explicitement :⎛⎝dFxdFydFz
⎞⎠ =
⎛⎝σxx σxy σxzσyx σyy σyzσzx σzy σzz
⎞⎠ ⎛⎝dSxdSydSz
⎞⎠ avec σxy = σyx, σyz = σzy, σzx = σxz .
4.3 Applications en physique classique 107
En prenant−→dS = dS x, on voit que σxx et (σxy, σxz) representent les composantes normale
et tangentielles de la force exercee sur une surface unite orientee selon x. La figure 6represente, en perspective et dans le cas ou les σij sont positifs et constants, les forcesexercees sur les faces d’un cube de cote unite. Le caractere symetrique de [σ] admis iciest discute a la section 7.2.3. Comme pour les deformations on pose [σ] = [σ]isotrope +[σ]
(avec [σ]isotrope =13
tr[σ] I et tr[σ] = 0). Si [σ] = 0 alors [σ] = [σ]isotrope = −p I et on
retrouve l’expression−→dF = −p−→dS de la force de pression due a un fluide parfait.
�
�
�
�
�
��
�
�
xx
xy
zz
yz
xy
yz
yyxz
xz
Figure 6
�
T dS
dS
dS][
1 2
dSN
Figure 7
REMARQUE. La figure 7 represente les composantes normale N et tangentielle T de la force par unite
de surface. Dans la base ou [σ] est diagonale, et ou les composantes du vecteur unitaire n de−→dS sont
(α, β, γ), on a : N = σX α2 +σY β2 +σZ γ2 et T 2 +N2 = σ2Xα2 +σ2
Yβ2 +σ2
Zγ2. Ces relations permettent
d’illustrer comment N et T dependent de la direction n. Le domaine de variation du couple (N, T ) en
fonction de (α, β, γ) (en gris sur la figure 8 dans le cas σX > σY > σZ ) est limite par les cercles de
Mohr ; par exemple si γ = 0, en eliminant α et β on obtient le cercle T 2 +(N − σ
X+σ
Y2
)2=
( σX
−σY
2
)2.
Tmax intervient dans les criteres de rupture (ou de fluage) d’un materiau.
� � � N
T
Z Y X
Figure 8
� Lois lineaires entre deformations et contraintes
Dans les matrices [ε], ou [ε], et [σ] apparaissent une composante “isotrope” (scalaire) etune composante “quadrupolaire”. La proportionnalite entre deformations et contraintesrespecte ce decoupage en vertu de l’invariance des lois physiques.Pour les effets d’elasticite elle s’ecrit [σ]isotrope = χ−1 tr[ε] I et [σ] = 2μ [ ε ], soit :
σij = 2μ εij +(χ−1 − 2μ
3
) ∑k εkk δij ; par exemple σxx =
(χ−1 + 4μ
3
)εxx − 2μ
3(εyy + εzz) .
La definition de la compressibilite χ est bien connue (cf. χ = − 1VδVδP
). Celle du module de rigidite
μ est illustree sur la figure 9a pour un cisaillement simple (−→ψ = εyx d’ou [ ε ] = 1
2
(0 εε 0
)) ; la force
108 4 • Calcul et physique lineaires ; relativite ; quantique
surfacique est alors−→dFdS
= μεx. On peut aussi exprimer les deformations en fonction des contraintes ; les
relations εxx = 1E
(σxx − ν(σyy + σzz)), σyy = · · · et σzz = · · · definissent le module d’Young E et
le coefficient de Poisson ν. La figure 9b represente l’etirement d’une barre de section S par une force
F : δll
= εxx = 1EFS
si σyy = σzz = 0. La variation relative de volume etant alors εxx + εyy + εzz =1E
(1− 2ν) FS
, on en deduit χ =3(1−2ν)
E, d’ou ν < 1
2. Enfin μ = 0 caracterise un fluide. Pour les effets
���������������������
���������������������
Æ
�
�
dS
dFdSdF
v
x
y
lx
(a)S
l
F
1
2
1
2
x
y
(b)
(c)
Figure 9
de viscosite les contraintes sont proportionnelles aux vitesses de deformation, ce qui se traduit par le
remplacement de ψi par vi dans les lois de l’elasticite : [σ]isotrope = ζ div�v I et [σ] = 2η [ ˜ε ], soit :
σij = η (∂ivj + ∂jvi) +(ζ − 2η
3
)div�v δij .
La signification du coefficient de viscosite η (seul coefficient non nul si le fluide est incompressible)
est illustree sur la figure 9c :−→dFdS
= η (∂yvx) x est proportionnel au gradient de vitesse. La relation pour
la pression isotrope totale δp = −(χ−1 δV
V+ ζ d
dt
(δVV
))(si η = 0) montre que la presence du coefficient
de seconde viscosite ζ > 0 traduit, hors de l’equilibre, une avance temporelle de δp sur δV ; cet effet
concerne les gaz non monoatomiques (cf. cours de physique).
4.3.2 Optique matricielle des systemes centres
On considere des systemes presentant une symetrie de revolution autour de l’axe optiqueOz et des rayons situes dans un plan meridien (plan contenant Oz), peu inclines parrapport a Oz et intersectant les dioptres pres de cet axe (approximation de Gauss).Un systeme centre est alors caracterise par une correspondance lineaire entre rayons“entrant” et “sortant”, qui justifie les constructions geometriques habituelles.
� Coordonnees d’un rayon ; formules de conjugaison (figure 10)
Dans un plan z1 situe dans un milieu d’indice n1, un rayon meridien est defini par unecoordonnee spatiale transverse x1 et une coordonnee “angulaire” p1 = n1α1, ou α1 est sa
pente (algebrique), donc par un vecteur R =(x1
p1
). Les vecteurs tels que x1 = α1q1, avec
q1 = z1 − zS1 fixe correspondent aux rayons issus de (ou allant vers) une source S1 reelleou virtuelle sur l’axe et d’abscisse zS1 ; si la source est hors de l’axe x1 = xS1 + α1q1.Quand un rayon passe d’un plan z1 a un plan z2, dans un milieu d’indice n2, apres avoirtraverse des dioptres, le changement de ses coordonnees est donne par une matrice detransfert M(z2, z1) de determinant 1 (demonstration ci-dessous) :
4.3 Applications en physique classique 109
(x2
n2α2
)= M(z2, z1)
(x1
n1α1
)=
(a bc d
) (x1
n1α1
)avec ad− bc = 1 .
On en deduit immediatement que les rayons x1 = α1q1 issus de S1 sont transformes enrayons x2 = α2q2 issus de S2 avec :
q2n2
=a q1n1
+ b
c q1n1+ d
(relation de conjugaison entre S1 et S2) ;n2α2
n1α1= c
q1
n1+ d .
Par exemple (cf. matrices particulieres ci-dessous) : n2q−12 − n1q
−11 = c si a = d = 1 et
b = 0 ; q1q2 = n1n2c−2 si a = d = 0. On verra que
n1α1
n2α2est le grandissement γS2/S1
(relation de Lagrange Helmholtz).
��
MMx
n
z
1
1
1
n 2x x
22
1 x
z1 z2S1q
1
S2
2q
2
Figure 10
DEMONSTRATION (figure 11a,b). La propagation rectiligne dans un milieu d’indice nconstant et les lois de Descartes entraınent, pour une simple translation de Δz et pourun dioptre :
M translation =(
1 Δzn
0 1
), M dioptre =
(1 0−C 1
)(C =
n′ − n
R) .
(Pour le dioptre x′ = x et n(α+
x
R
)= n′
(α′ +
x
R
)ou R = SC). Le produit de telles
matrices est une matrice de determinant 1.
�
�
�
�
S
n
1
n n’
C
R
=
1
2 12
x
x
(a) (b)z z
z
x=x’
Figure 11������������������������������������������������������
������������������������������������������������������
S C z
x=x’
Figure 12
REMARQUES. 1) Si les rayons se dirigent vers les z < 0, les resultats ci-dessus restent valables a
condition de remplacer nα par (−n)α. Par exemple, pour le miroir de la figure 12, α+ xR
= − (α′ + x
R
)et C = − 2
R. 2) Si les rayons ne sont pas dans des plans meridiens, les formules ci-dessus s’appliquent
aux projections des rayons sur de tels plans. 3) det M = 1 entraine n1 dx1 dα1 = n2 dx2 dα2 et donc la
conservation de l’etendue optique (cf. section 3.2.5).
110 4 • Calcul et physique lineaires ; relativite ; quantique
� Matrices de transfert particulieres
Soient n et n′ les indices des milieux d’entree et de sortie d’un systeme optique, et Oe etOs des origines dans chacun de ces milieux. La figure 13 represente un systeme afocal(avec n = n′ = 1) ; la forme generale de la matrice est alors :
MOsOe =(γ b0 γ−1
)(γ independant de Oe et Os) .
� ��
1afocal
système
Gz
Figure 13
01
01
HO Oe H’ s
K
zA’
B’
K’B
A F
F’
γγ
a−C
Cd
Figure 14
La relation angulaire α′ = γ−1α donne le grossissement G = γ−1. La figure 14
represente, pour un systeme focal, le rayon emergent(a−C
)associe a l’incident
(10
)et l’incident γ
(dC)
associe a l’emergent γ(
10
), la forme generale de M et M−1 etant :
MOsOe =(a b−C d
)(C convergence) M−1
OsOe=
(d −bC a
);
a depend du choix de Os (par exemple a = 1 pour Os ≡ H ′ point principal image eta = 0 pour Os ≡ F ′ foyer image) et d depend de celui de Oe (par exemple d = 1pour Oe ≡ H point principal objet et d = 0 pour Oe ≡ F foyer objet) ; par contre laconvergence C, qui ne depend ni de Oe ni de Os, est une caracteristique du systeme. On
voit aussi que C =n′
H ′F ′ = − n
HFet on deduit de detM = 1 que MH′H =
(1 0−C 1
)et MF ′F =
(0 C−1
−C 0
). Enfin la geometrie des triangles semblables FAB et FHK d’une
part et F’H’K’ et F’A’B’ d’autre part donne les relations de Newton γA′/A
=A′B′
AB=
FH
FA=F ′A′
F ′H ′ (γA′/A
= γ = −1 sur la figure).
Condition de conjugaison. La figure 15 illustre la marche de rayons particuliers pour tout couple
Oe ≡ A et Os ≡ A′ tel que b = 0 ; elle montre que b = 0, qui entraıne x′ = ax quel que soit α, est la
condition de conjugaison de A et A′ et que a = γA′/A
est le grandissement. Pour des rayons passant par
A, detM = ad = 1 conduit a la relation de Lagrange Helmholtz : n′θ′ = γ−1A′/A
nθ.
Association de deux systemes focaux de foyers Fi et F ′i . On suppose n = 1 en dehors des deux
systemes. Le calcul du produit MF ′2F2
MF2F′1MF ′
1F1donne C = C1C2 F ′
1F2 ; donc C = 0 si F ′1 ≡ F2, et
alors G = − C2C1
.
4.3 Applications en physique classique 111
Cavite laser (figure 16) : R1 = S1C1, R2 = −S2C2 et l = S1S2. Pour un rayon incident sur le miroir
2, apres deux reflexions la matrice de transfert s’ecrit :
MS2S2 =
(1 l0 1
) (1 0
− 2R1
1
) (1 l0 1
) (1 0
− 2R2
1
)=
(a bc d
).
La cavite est dite stable si les rayons restent proches de l’axe donc si les elements de Mn restent bornes ;
les valeurs propres de M doivent donc satisfaire |λ| ≤ 1. Comme det M = λ1λ2 = 1, ceci n’est possible
que si λ = e±iϕ, soit |trM| = |a+ d| = |2 cosϕ| < 2. Remarque : si λ = ±1 est une valeur propre double
et si M n’est pas diagonalisable il y a instabilite :
(1 b0 1
)n=
(1 nb0 1
)(cas par exemple de deux
miroirs plans).
� �
�
1’
A A’ z
A’/A
Figure 15������������������������������������������������
������������������������������������������������
���������������������������������������������������
���������������������������������������������������
zS
C
S21
1C 2
Figure 16
� Optique matricielle et principe de Fermat (figure 10)
Le chemin optique L(x1, x2) joignant deux points M1 et M2 des plans z1 et z2 verifie :
L(x1, x2)− L(0, 0) =12b
(ax21 + dx2
2 − 2x1x2) .
DEMONSTRATION. Que L(x1, x2) − L(0, 0) soit une forme quadratique, a l’ordre le plus bas, resulte
simplement de la symetrie de revolution du systeme autour de l’axe z. Pour montrer que les coefficients
a, b et d sont bien les elements de la matrice M introduite precedemment, on calcule n1α1 et n2α2 en
fonction de x1 et x2 a l’aide de la formule dL = b−1 (dx2 − x1) dx2 + b−1 (ax1 − x2) dx1 = n2α2 dx2 −n1α1 dx1, cas particulier de dL(A,B) = nB uB · −→drB − nA uA · −→drA (cf. section 3.2.3). Ce calcul montre
que la propriete detM = 1 est liee a l’existence d’un principe d’extremum.
Cas particuliers : L(x1, x2) − L(0, 0) vaut12n
Δz(x2 − x1)2 pour Mtranslation et −Cxx′
pour MF ′F . Pour MH′H ou M dioptre et des points conjugues avec x = x′ (sinon il n’y
a pas de rayon joignant ces points), on obtient “00” ; pour lever l’indetermination on note
que ad− bc = 1, donc a = 1 + bc si d = 1, et on obtient −12Cx2.
4.3.3 Relativite d’Einstein et quadrivecteurs
Rappelons que le groupe de symetrie (groupe de Lorentz), associe aux changementsde referentiels inertiels, correspond aux transformations lineaires qui laissent invariantela metrique c2T 2 − −→
R 2, ou T et (X,Y, Z) ≡ −→R sont les composantes d’un intervalle
112 4 • Calcul et physique lineaires ; relativite ; quantique
d’espace-temps. Une transformation de Lorentz pure de rapidite ϕ (tanhϕ =V
c,
coshϕ =(
1 − V 2
c2
)− 12
) selon l’axe x s’ecrit :
cT ′ = cT coshϕ−X sinhϕ , X ′ = X coshϕ− cT sinhϕ , Y ′ = Y et Z ′ = Z .
Si la transformation se fait dans la direction n, il faut remplacer X par−→R · n et le couple
(Y, Z) par−→R⊥ =
−→R − (
−→R · n) n =
−→R − −→
R ‖ ; en particulier pour une transformationinfinitesimale :
cT ′ = cT − ε · −→R ,−→R ′ =
−→R − cT ε avec ε =
V
cn .
L’invariance des lois physiques par ces transformations infinitesimales entraıne leur inva-riance par les “transformations finies” (en vertu de la loi de groupe).
� Classification des evenements et des vitesses
La figure 17 represente les courbes c2T 2−−→R 2 = Cste dans le demi-plan (cT, |−→R |). Chaquecourbe montre les valeurs possibles de T et |−→R |, pour un intervalle d’espace-temps donne,quand on change de referentiel.
RO
futur
passé
cT
aille
urs
Figure 17
On voit sur cette figure que la notion de simultaneite, T = 0, de deux evenements distinctsn’est pas invariante. Quant a la notion de causalite, qui pour etre valable demande quele signe de T soit invariant, on voit qu’elle n’est applicable qu’a des evenements tels quec2T 2 −−→
R 2 > 0 ou c2T 2 −−→R 2 = 0 ; dans ce dernier cas T ne peut changer de signe car si
T = 0 dans un referentiel alors−→R = 0 egalement et les deux evenements sont confondus.
Pour un evenement origine O on distingue ainsi les evenements qui sont dans son futurou son passe, et qui peuvent etre relies a lui par causalite, et ceux tels que c2T 2−−→
R 2 < 0,qui dans tout referentiel se produisent toujours “ailleurs” (|−→R | �= 0) et anterieurementou posterieurement suivant le referentiel. Dans l’espace a quatre dimensions (cT,X, Y, Z)les futur et passe de O sont a l’interieur d’un cone appele cone de lumiere.
4.3 Applications en physique classique 113
Si on pose v = T−1−→R (v est la vitesse moyenne d’un point qui, par la pensee, “joindrait”
les deux evenements), la relation c2T 2 − −→R 2 = c2T 2
(1 − v2
c2
)montre que les vitesses
se classent de maniere invariante en trois categories : |v| < c, |v| = c (vitesse c “limite”des precedentes) et |v| > c. Pour la premiere seulement il existe un referentiel inertiel R0
dans lequel les evenements se produisent au meme endroit (−→R 0 = 0).
REMARQUES. 1) La loi de transformation des vitesses, obtenue en divisant X′, Y ′ et Z′ par T ′,s’ecrit vectoriellement
�v ′ =(1 − �v·−→V
c2
)−1 (�v‖ −−→
V + �v⊥√
1 − V 2
c2
)d’ou v′ = v−V
1− vVc2
a une dimension .
Si on remplace �v et−→V par les vitesses �v2 et �v1 de deux mobiles, le vecteur �v′ represente la vitesse
relative �v21 de 2 par rapport a 1 et v221 =(1 − (�v1·�v2)2
c2
)−2 ((�v2 − �v1)2 − 1
c2(�v1 ∧ �v2)2
)est une
quantite invariante. On a �v21 = �v2 − �v1 dans l’approximation galileenne. 2) Dans l’espace des vitesses
(vx, vy, vz), interieur de la sphere |�v| < c, les transformations ci-dessus, et les rotations, transforment les
droites en droites et conservent la “distance” Φ21 de deux “points” definie comme la rapidite relative
(v21 = c tanh Φ21). Ceci definit une geometrie equivalente a la geometrie non euclidienne de Lo-
batchevski. On verifie que les points |�v| = c sont les points “a l’infini” ; deux droites etant par definition
paralleles si elles se coupent a l’infini, la figure 18 montre que par tout point M passe deux droites MA
et MB paralleles a une droite donnee AB.
v
v2v1
xM
v = cpoints "à l’infini"
O
B
A
Figure 18
dr = v dt
(B, t )2 1(A, t )
Figure 19
� Temps propre ; ralentissement des horloges ; effet Doppler
Si dans un referentiel R, un point materiel se deplace de−→dr dans le temps dt (a la vitesse
v), l’invariance de c2 dt2− |−→dr|2 montre que le temps dτ ecoule dans le referentiel inertiel
R0 ou−→dr0 = 0 (referentiel qui change avec t), est tel que dτ2 = dt2
(1− v2
c2
). On appelle
temps propre entre deux “positions” (A, t1) et (B, t2) du mobile dans R l’invariant :
τ =∫ (B,t2)
(A,t1)
√1 − v2
c2dt
(dτ = dt
√1 − v2
c2
).
Si (A, t1) et (B, t2) sont fixes τ est maximum pour un mouvement inertiel. Cettepropriete (exploitee a la section 9.2.1) est evidente si on se place dans le referentielinertiel ou A et B coıncident (figure 19) ; en effet le mouvement inertiel de A a B ≡ Acorrespond alors a v = 0 et τ = t2 − t1 est maximum.
114 4 • Calcul et physique lineaires ; relativite ; quantique
����
����
����
����
����������������
����������������c t
c t
������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������
������������������������
������������������������
x = ctx
= vt
����������������������������
����������������������������
x = − ct
= 0τ
c−vc+v
Δ2v c2
Δ1−
(b)(a)
L
tτ =Δ
O L
ct
x
x
L
c−vc+vL
Figure 20
REMARQUES. 1) La figure 20b represente dans l’espace-temps (ct, x) d’un referentiel l’aller-retour d’un
signal lumineux entre deux miroirs, distants de L dans leur referentiel propre (fusee de la figure 20a),
lorsque la fusee est soit au repos soit a la vitesse v dans ce referentiel. Les aires hachurees sont egales car
une transformation de Lorentz (ici active) preserve c2t2 − x2 = (ct+ x)(ct− x). Le systeme des miroirs
est un exemple d’horloge (avec periode propre Δt = 2L/c) qui, dans le referentiel (ct, x), manifeste un
ralentissement (periode Δt(1− v2
c2
)− 12 ) quand elle est en mouvement. 2) Meme si le temps (propre)
de vie d’une particule est petit, τ � 10−10 s par exemple, celle ci peut parcourir dans R des distances
vτ(1 − v2
c2
)− 12 arbitrairement grandes quand v s’approche de c. 3) L’acceleration du mobile dans R est
�a = d�vdt
; en posant−→V = �v(t) et �v = �v(t+ dt), on deduit de la loi de transformation des vitesses que son
acceleration propre (dans R0) �v ′dτ
est �a(0) =(1 − V 2
c2
)− 32
(�a‖ + �a⊥
√1 − V 2
c2
). 4) Effet Doppler.
L’etude a ete faite a la section 3.2.3. Si la vitesse de propagation du signal est cu (lumiere) et celle du
detecteur vD = 0, la relation entre frequences s’ecrit νD = νS(1− �vS ·u
c
)−1(1− v2S
c2
) 12
; si �vS est parallele
a u cette relation devient νD = νS eϕ ou ϕ est la rapidite de la source (cf. section 1.1.2.).
� Quadrivecteurs
On appelle ainsi tout ensemble A de quatre composantes (A0,−→A ≡ {Ax, Ay, Az}) qui
se transforme comme X = (cT,−→R ). Le carre de la norme d’un quadrivecteur, defini
par A20 −
−→A 2, est un invariant (scalaire de Lorentz) de meme que le produit scalaire
A · B def= A0B0 − −→A · −→B (consequence de l’invariance de (A0 + B0)2 − (
−→A +
−→B )2).
Un quadrivecteur est du genre temps, lumiere ou espace selon que ce carre est positif,nul ou negatif ; dans le premier cas le signe de A0 est un invariant. Un exemple est laquadrivitesse (de norme 1)
U =
(dtdτ,
−→drc dτ
)=
(1 − v2
c2
)− 12
(1,v
c
)obtenue en divisant dX = (c dt,
−→dr) par le scalaire c dτ . On construit a partir de U le
quadrivecteur energie quantite de mouvement P d’une particule ponctuelle parmultiplication par le scalaire mc (la masse m est supposee invariante) :
P =(
1 − v2
c2
)− 12
(mc,m−→v ) =(E
c,−→p
)d’ou −→v =
c2−→pE
.
4.3 Applications en physique classique 115
AUTRES EXEMPLES. 1) On construit de meme le quadrivecteur courant J d’une distribution
de charges, de densite ρ0 dans son referentiel propre et animee d’une vitesse �v dans R :
J = ρ0 U =(ρ,�jc
)avec �j = ρ�v et ρ = ρ0
(1 − v2
c2
)− 12
;
ρ est la densite volumique de charges dans R car (cf. section 3.3.1, figure 3) la charge ρ0 d3r0 (supposee
invariante) se retrouve a un instant donne t dans R dans le volume d3r = d3r0
√1 − v2
c2. 2) Si pour une
onde plane exp−i(ωt−�k ·�r) on suppose que le dephasage ωT −�k ·−→R est un invariant, on en deduit que
k =(ωc, �k
)(“quadrifrequence”)
est un quadrivecteur. (Demonstration : ωT − �k · −→R = ω(T ′ + 1c�ε · −→R ′) − �k (
−→R ′ + cT ′�ε) s’ecrit aussi
ω′T ′ − �k′ · −→R ′ avec ω′c
= ωc− �ε · �k et �k′ = �k − ω
c�ε.) Les relations de Planck-Einstein et de de
Broglie E = �ω et �p = ��k, equivalentes a p = �k, sont donc invariantes. 3) L’operateur gradient
∂ = ( 1c∂t,−−→∇)
est aussi un quadrivecteur ; applique a une onde plane, i∂ est la multiplication par k.
� Mecanique des points ; defaut de masse ; collisions ; forces
Elle repose sur la definition de P qui entraıne E2 − c2 p 2 = m2c4 ; pour les particules de
masse nulle E = c |p|. Si m �= 0, mc2 est l’energie au repos et E −mc2 (� 12mv2 si
v � c) est l’energie cinetique.
EXEMPLES. En chimie ou physique nucleaire, on pose mc2 = m∗c2 + E liaison, oum∗ est la somme des masses des constituants isoles et E liaison l’energie de liaison ;par exemple pour l’atome d’hydrogene : mHc
2 = (me +mp)c2 − 13, 6 ev. La variationd’energie cinetique lors d’une reaction (“energie liberee”) est alors :
ΔE cin =∑f (Ef −mfc
2)−∑i(Ei −mic
2)
= −c2 (∑
f mf −∑imi) (conservation de l’energie)
= −(∑f E
liaisonf −∑
i Eliaisoni ) si les constituants restent inchanges .
Elle est positive si∑
f mf <∑
imi (defaut de masse, c.a.d. en chimie etats finauxdavantage lies).
Collisions entre particules. Elles obeissent a la loi de conservation invariante (egaliteentre quadrivecteurs) :
ΣfP f = ΣiP i = P .
Comme Ei ≥ c |−→p i| on a P 2 > 0 sauf si les particules incidentes sont de masses nulleset ont des vitesses paralleles. Alors il existe un referentiel Rcm ou la somme p cm des
quantites de mouvement est nulle (sa vitesse dans R est v cm =Σic2piΣiEi
). On en deduit :
P cm = (Ecm
c,0) ;
(Ecm)2
c2= P 2 = (
∑i
P i)2 .
116 4 • Calcul et physique lineaires ; relativite ; quantique
EXEMPLES. 1) Pour la collision d’une particule (2) sur une particule cible (1) au repos dans R :
(Ecm)2 = (m1c2 + E2)2 − �p 22 c
2 = (m21 +m2
2) c4 + 2m1c2E2 .
La quantite Ecm − (m1 +m2) c2 est l’energie disponible pour la creation de particules ; la figure 21a
represente ce qu’on observe dans R au seuil de production. A basse energie on retrouve (petit
calcul) l’expression galileenne de l’energie disponible 12
m1m2m1+m2
�v2 2 (proportionnelle a Ecin2 ; cf. sec-
tion 3.3.2) ; a tres haute energie elle vaut√
2m1c2E2 (proportionnalite a√Ecin
2 qui montre l’interet
d’utiliser plutot des anneaux de collision).
2) Dans une collision elastique, l’angle de diffusion de la particule incidente (2) s’obtient en eliminant
les parametres de la particule cible (1) apres le choc : P ′21 = m2
1c2 = (P 1 + P 2 − P ′
2)2 ; par exemple
si (2) est un photon (m2 = 0) qui diffuse sous un angle θ, la relation s’ecrit
m21c
4 = (m1c2 + E2 − E′2)
2 − (�p2 − �p2 ′)2 c2 ou 2m1c2 (E2 − E′2) = 2E2E′
2 (1 − cos θ) ,
ou encore :λ′ − λ = h
m1c(1 − cos θ) (effet Compton ; figure 21b).
�
m(a)
m2 2v 1 vcm
(b)E2 1m
projectile cibleE’2
Figure 21
chainette
parabole
z
xv0
E
Figure 22
Force et quadriforce. La differentiation de E2 − p 2c2 = m2c4 montre que dE = v ·−→dp ;en gardant la definition usuelle de la force on a :
−→dpdt
=−→F et
dEdt
=−→F · v .
En parametrant la trajectoire d’espace temps par le temps propre τ , et en notant par un
point la derivationddτ
, ceci s’ecrit aussi :
P = mX = F avec F =(
1 − v2
c2
)− 12
(−→F · vc
,−→F
)quadriforce .
EXEMPLE : mouvement d’une particule chargee dans un champ electrique constant−→E =
Ez z.mc2 t = qEz z,mx = my = 0 etmz = qEz t. Sans perte de generalite (reflexion laissee au lecteur),
on peut choisir x(0) = y(0) = z(0) = t(0) = 0, y(0) = z(0) = 0 et x(0) = v0, d’ou t(0) =(1− v20
c2
)− 12 =
γ0. L’integration de t donne la L.C. de l’energie totale (cinetique et potentielle) mc2 t−qEzz = mc2γ0 ;
celle de x et de y conduit a : x(τ) = γ0v0τ et y(τ) = 0 ; enfin mz = qEz
mc2(qEzz +mc2γ0) et les C.I.
donnent z(τ) = −mc2γ0qEz
(1 − cosh qEz
mcτ)
et t(τ) = mzqEz
= γ0mcqEz
sinh qEzmc
τ . Pour τ petit t = γ0τ ,
x = v0t, z = 12qEzγ0m
t2 et la trajectoire est une parabole. Pour τ grand c’est une chaınette (figure 22) ;
px restant constant, vx tend vers zero tandis que vz tend vers c.
4.4 Physique quantique et espaces vectoriels 117
� Invariance de l’electromagnetisme
La loi de force de Lorentz−→F = q (
−→E + v ∧ −→
B ) est invariante par transformation deLorentz et la loi de transformation infinitesimale de
−→E et
−→B est :
−→E ′ =
−→E + ε ∧ c−→B (=
−→E +
−→V ∧ −→
B ) et−→B ′ =
−→B − ε ∧ 1
c
−→E
(cf. demonstration 1). On en deduit facilement que−→E ·−→B et
−→E 2−c2−→B 2 sont invariants, et
que−→E et c
−→B se transforment comme
−→B et −1
c
−→E . Cette correspondance, appelee relation
de dualite, entraıne que la loi−→F = qm
(−→B − 1
c2 v ∧−→E
)est elle aussi invariante ; c’est
la force que subirait une charge magnetique qm s’il existait des monopoles magnetiques.On deduit aussi des lois de transformation de
−→E et
−→B que les equations de Maxwell
dans le vide (cf. section 7.5.1), div−→E =
ρ
ε0,−→rot
−→B = μ0 (j + ε0∂t
−→E ), div
−→B = 0 et
−→rot
−→E + ∂t
−→B = 0 sont invariantes (cf. demonstration 2).
DEMONSTRATION 1. Il suffit d’ecrire la loi de force sous la forme−→dp = q (
−→E dt +
−→dr ∧ −→
B ) ; comme
(dEc,−→dp) est un quadrivecteur, la transformation de
−→dp a l’ordre �ε est :
−→dp ′ =
−→dp− �ε
1
cdE = q
(−→E (dt′ + �ε · 1
c
−→dr ′) + (
−→dr ′ + �εcdt′) ∧−→
B) − �ε
1
cq−→E · −→dr ′
= q (−→E ′ dt′ +
−→dr ′ ∧ −→
B ′) ;
l’identification des termes en dt′ donne la loi de transformation de−→E et celle des termes en
−→dr ′, et
l’utilisation de la formule du double produit vectoriel, celle de−→B . L’integration des relations d
−→E (ϕ)dϕ
=
c n ∧ −→B (ϕ) et
d−→B (ϕ)dϕ
= −n ∧ 1c
−→E (ϕ) (ϕ rapidite) donne, pour des transformations finies :
−→E′
‖ =−→E ‖ ,
−→B′
‖ =−→B ‖ ,
−→E′
⊥ = coshϕ−→E⊥ + sinhϕ n ∧ c−→B⊥ et
−→B′
⊥ = coshϕ−→B⊥ − sinhϕ n ∧ 1
c
−→E⊥ .
DEMONSTRATION 2. On vient de voir que les lois de transformation de−→E et
−→B sont telles que
les quantites ( 1c
−→E · d�r,−→E dt + d�r ∧ −→
B ) et (−→B · d�r, c−→B dt − 1
cd�r ∧ −→
E ) sont des quadrivecteurs. Comme
( 1c∂t,−−→∇) et (c dt, d�r) se transforment de la meme facon, on en deduit que (− 1
c
−→∇ ·−→E , 1c2∂t−→E −−→∇∧−→
B )
et (−−→∇ ·−→B, 1c∂t−→B +
−→∇ ∧ 1c
−→E ) sont aussi des quadrivecteurs. Les equations de Maxwell, qui expriment
l’egalite de ces quadrivecteurs avec les quadrivecteurs − 1ε0c
(ρ, 1c�j) et (0,�0) (proportionnels aux courants
electrique et magnetique), sont donc invariantes.
REMARQUE. Les equations pour les potentiels(Δ − 1
c2∂2t
)V = − ρ
ε0et
(Δ − 1
c2∂2t
)−→A = −μ0
�j (cf.
section 7.5.2) montrent, l’operateur d’Alembertien Δ − 1c2∂2t etant invariant, que A = ( 1
cV,
−→A ) est
un quadrivecteur et que la condition de Lorentz div−→A + 1
c2∂tV = 0 ou ∂ · A = 0 est invariante.
4.4 PHYSIQUE QUANTIQUE ET ESPACES VECTORIELS
L’approche quantique des phenomenes, qui depuis plus de quatre-vingts ans a permisde comprendre la plupart des grandes decouvertes de la physique, repose sur le calcullineaire. En effet les etats d’un systeme physique sont specifies par les vecteursnormes d’un E.V. complexe dont la dimension caracterise le nombre de degres deliberte du systeme considere. Quant aux “operations” sur le systeme (sa preparationdans un etat particulier, l’action sur lui d’une symetrie telle que translation ou rotation,une operation de mesure, son evolution, etc.), elles sont decrites a partir d’applicationslineaires (operateurs, matrices) agissant sur l’E.V. des etats.
118 4 • Calcul et physique lineaires ; relativite ; quantique
Rappelons que la physique quantique a son origine dans l’etude de l’interaction rayonnement-
matiere, resumee tres schematiquement par : 1) la decouverte que l’optique ondulatoire du 19eme
siecle, expliquee par les ondes electromagnetiques, met en fait en jeu des particules, les photons, avec les
“regles de correspondance” E = �ω et �p = ��k pour l’energie et la quantite de mouvement d’un photon
associe a une onde plane (ces regles etant valables pour d’autres particules et concernant aussi le moment
cinetique : Jz = m� avec m entier ou demi entier) ; 2) l’observation que la spectroscopie atomique et
l’idee de photon impliquent la quantification des niveaux d’energie, d’ou la necessite d’expliquer cette
quantification ainsi que l’existence des transitions entre niveaux.
4.4.1 Cadre general ; etats quantiques ; moyennes ; evolution
� E.V. des etats quantiques
Considerons a titre d’exemple les photons associes a une onde plane electromagnetique(ExEy
)e−i(ωt−kz) (Ex,y ∈ C). On decrit leur etat de polarisation par :
ψ(t) =(αβ
)e−iωt avec
(αβ
)= (|Ex|2 + |Ey|2)− 1
2
(ExEy
).
L’espace (complexe) engendre par ces etats est ici de dimension 2. La preparation d’unautre etat ϕ a partir de ψ se traduit mathematiquement par l’application du projecteurPϕ :
Pϕ ψ = (ϕ, ψ)ϕ ;
le produit scalaire (ϕ, ψ) est appele amplitude de probabilite de trouver l’etat ϕ apartir de ψ et le carre de sa norme |(ϕ, ψ)|2, compris entre 0 et 1 (inegalite de Schwarz),
est la probabilite correspondante. Par exemple Pϕ =(
1 00 0
)pour ϕ =
(10
)correspond
a l’action d’un polariseur selon x, et |(ϕ, ψ)|2 = |α|2 est aussi le rapport des flux lumineuxa la sortie et a l’entree du polariseur.
REMARQUE. Si {ϕi} est une base orthonormee ((ϕ
i, ϕ
j) = δij), les probabilites
pi = |(ϕi, ψ)|2
verifient∑i pi = 1 (consequence de ψ =
∑i(ϕi, ψ)ϕ
iet de (ψ, ψ) = 1)). On fera
attention a ce que ce sont les amplitudes complexes (ϕi, ψ), et non les pi, qui caracterisent
entierement ψ (modulo une phase globale).
Symetries. De maniere generale une operation de symetrie est decrite par l’action d’unoperateur unitaire. Par exemple une rotation autour de l’axe z se traduit par la matrice
Rz(θ) =(
cos θ − sin θsin θ cos θ
)= exp− i
�θJz (definition de Jz) .
Les etats propres de Jz = �
(0 −ii 0
)sont
1√2
(1±i
)(cf. section 4.2.3) ; les valeurs
propres ±� sont appelees helicites du photon (moment cinetique selon la direction depropagation). Le signe + correspond a une polarisation tournant dans le sens directpuisque ψ(t) ∝ e−iωt (polarisation dite gauche en optique cf. section 2.3.4).
4.4 Physique quantique et espaces vectoriels 119
� Moyenne quantique ; matrice densite
La moyenne d’un operateur A dans un etat ψ, definie par
< A >= (ψ, Aψ) ,
vaut∑
i aipi (d’ou le nom de moyenne) si A est diagonalisable dans une base orthonormeede vecteurs propres ϕ
iassocies aux valeurs propres ai.
EXEMPLE 1. Pour les photons la moyenne(α β
)Jz
(αβ
)de Jz dans l’etat
(αβ
)vaut �
(∣∣∣∣α− iβ√2
∣∣∣∣2 − ∣∣∣∣α+ iβ√2
∣∣∣∣2)
(= 0 pour une polarisation rectiligne) ; elle peut se
mesurer directement a partir du couple Γ (Γ =< Jz > × flux de photons) qu’exerce lalumiere incidente sur une lame anisotrope lorsque la polarisation sortante est rectiligne(Bethe-Harris 1935).
EXEMPLE 2. Pour A =(
0 e−iωτ
0 0
)(non hermitienne et non diagonalisable) la
moyenne quantique < A >=(α β
) (0 e−iωτ
0 0
) (αβ
)= α e−iωτ β n’est autre que
la moyenne temporelle < Ex(t)Ey(t + τ) >, divisee par < |Ex|2 + |Ey|2 > ; elle estmesuree a partir d’experiences d’interferences (cf. section 2.5.3).
REMARQUES. 1) La moyenne dans un etat ψ s’ecrit aussi < A >= tr(APψ) ; en effet, en choisissant
une base orthonormee {ϕi} telle que ϕ
1= ψ, on obtient : tr(APψ) =
∑i(ϕi, APϕ1
ϕi) = (ϕ
1, Aϕ
1).
2) On rencontre aussi des situations experimentales ou la moyenne s’effectue par rapport a un melange
statistique (une superposition incoherente) d’etats ; c’est le cas en optique lorsqu’on superpose des
faisceaux incoherents entre eux. Si ψn
designent les etats des photons relatifs a chaque faisceau n et
pn les “poids” relatifs des faisceaux (leurs intensites relatives qui verifient∑n pn = 1), alors < A >=∑
n pn (ψn, Aψ
n) = tr(ρA) avec ρ =
∑n pnPψn
=∑n pn
( |αn|2 αn βnαn βn |βn|2
). ρ est appelee matrice
densite ; elle verifie ρ = ρ†, trρ = 1 ; elle est positive (valeurs propres ρn ≥ 0) et trρ2 ≤ 1 ; enfin trρ2 = 1
equivaut a ρ = Pψ et correspond a un etat pur. (cf. aussi section 2.5.3.)
� Evolution ; equation de Schrodinger
L’evolution d’un etat norme est necessairement decrite par un operateur unitaire ψ(t) =U(t, t0)ψ(t0), avec les proprietes U(t′, t0) = U(t′, t)U(t, t0) et U(t, t) = I. Pour un inter-
valle de temps infinitesimal on peut poser U(t+ε, t) = I− i
�εH(t), et on montre, comme
a la section 4.2.2, que l’operateur hamiltonien H(t) ainsi defini est hermitien. Comme
U(t+ ε, t0) = U(t+ ε, t)U(t, t0), on verifie facilement que U(t, t0) = − i
�H(t)U(t, t0), et,
par application des deux operateurs a ψ(t0), on obtient l’equation de Schrodinger :
i� ψ(t) = H(t)ψ(t) .
Si H ne depend pas de t, sa solution est ψ(t) = exp[− i
�Ht
]ψ(0) ; elle vaut
ψ(t) = exp[− i
�Et
]ψ(0)
si ψ(0) est etat propre de H , avec la valeur propre E (energie de l’etat). L’evolution
120 4 • Calcul et physique lineaires ; relativite ; quantique
laissant les etats propres de H invariants, a une phase pres, on les appelle etats station-naires. Les moyennes dans ces etats de tout operateur A independant du temps restentconstantes lors de l’evolution ; on peut montrer que reciproquement cette propriete ca-racterise un etat stationnaire. Une symetrie de H est alors un operateur unitaire S telque Sψ(t) obeit a la meme equation que ψ(t) ; de i�S ψ(t) = S
(Hψ(t)
)= H
(Sψ(t)
),
pour tout ψ(0), on deduit que S commute avec H :
[H,S] = 0 .
REMARQUE. Pour tout A independant de t, une moyenne dans un etat quelconque(ψ(t), Aψ(t)) =< A >t verifie
d < A >tdt
=i
�< [H(t), A] >t;
il suffit d’ecrire ψ†(t + ε)Aψ(t + ε) = ψ†(t)(I +
i
�εH(t)
)A
(I− i
�εH(t)
)ψ(t) (en
notation matricielle), puis de developper. L’operateur A defini par A =i
�[H,A] est
appele vitesse d’evolution de A (cf. section 9.1.2 pour l’equivalent classique).
4.4.2 Dynamique des systemes a deux etats ; transitions quantiques
On considere l’exemple de la molecule NH3 dont le plan des atomes d’hydrogene peutoccuper deux positions autour de z0 et −z0 de part et d’autre de l’atome d’azote (imageclassique), comme une particule dans un double puits de potentiel symetrique (figures23a et b).
0z
0z
0z
z
0
0−
−
V(z)
E0
(a) (b)
Hz
H
z
H
N−
+
p
Figure 23
Une description quantique simplifiee, ne faisant pas appel aux fonctions d’onde, consiste a
considerer que l’espace des etats est engendre par deux vecteurs ψ+
=(
10
)et ψ− =
(01
)associes respectivement aux positions z0 et −z0 ; ils sont etats propres de l’operateur
Z = z0
(1 00 −1
)(valeurs propres ±z0) et se deduisent l’un de l’autre par l’operateur
S =(
0 11 0
)associe a la symetrie z → −z du systeme.
4.4 Physique quantique et espaces vectoriels 121
� Evolution libre
Un hamiltonien obeissant a la symetrie (HS = SH) s’ecrit alors
H0 =(E0 −A−A E0
)= E0 I−Aσx
(avec A reel car H0 hermitien) ; dans la suite on suppose A > 0 et on pose A =�ω0
2.
Pour tout etat initial ψ(0) =(αβ
), l’evolution est (cf. Un(θ) section 4.2.4) :
ψ(t) =(α(t)β(t)
)= e−
i�tH0
(αβ
)= e−
i�E0t
(cos ω0t
2 i sin ω0t2
i sin ω0t2 cos ω0t
2
) (αβ
).
Elle conduit aux probabilites |α(t)|2 =∣∣∣∣α cos
ω0t
2+ iβ sin
ω0t
2
∣∣∣∣2 d’etre dans l’etat ψ+
a
l’instant t, et |β(t)|2 = 1 − |α(t)|2 d’etre dans l’etat ψ− ; par exemple |α(t)|2 = cos2ω0t
2et |β(t)|2 = sin2 ω0t
2si α = 1 et β = 0 ; alors la position moyenne a l’instant t est
z(t) = z0 (|α(t)|2−|β(t)|2) = z(0) cosω0t. Les etats stationnaires (vecteurs propres de H0,
donc de σx) sont l’etat fondamental ψf
=1√2
(11
)et l’etat excite ψ
e=
1√2
(−11
)d’energies Ef = E0 − A et Ee = E0 + A. Il sont aussi etats propres de S et pour euxz(t) = 0 et z(t) = 0. L’hypothese A > 0 garantit que ψ
fest symetrique.
� Polarisabilite de NH3
La polarisation de la liaison N − H se traduit, pour la molecule NH3, par la presenced’un dipole p oriente selon l’axe z et, en presence d’un champ electrique Ez, par uneenergie supplementaire ∓pEz pour les etats ψ±. Dans la base ψ± l’evolution est doncdecrite par
i�
(α
β
)= H
(αβ
)avec H =
(E0 − pEz −A
−A E0 + pEz)
= E0 I−−→σ · −→V
(Vx = A = V sin θ, Vy = 0, Vz = pEz = V cos θ). Les valeurs propres sont E∓ = E0 ∓√A2 + p2E2
z et les vecteurs propres s’ecrivent (cf. section 4.2.3)(
cos θ2sin θ
2
)et
(− sin θ2
cos θ2
).
Si Ez est constant ces etats evoluent en etant simplement multiplies par exp(− i
�tE∓
),
et pour eux, le moment dipolaire moyen est :
< p > (t) = ±p (cos2θ
2− sin2 θ
2) = ±p cos θ � ±p
2EzA
si |pEz| � A ;
pour l’etat fondamental il a le signe de Ez, conformement a la description classique de lapolarisabilite de NH3, et decroıt quand A augmente (interpretation physique laissee aulecteur).
122 4 • Calcul et physique lineaires ; relativite ; quantique
� Transitions ; resonance ; regle d’or de Fermi
On considere un champ Ez(t) dependant du temps. Dans la base ψf,e
l’evolution d’un
etat ψ = cf ψf + ce ψe est donnee par (cf,e =1√2
(β ± α)) :
i�
(cfce
)=
(Ef pEz(t)
pEz(t) Ee
) (cfce
).
Le changement de variables cf,e(t) = exp(− i
�Ef,et
)γf,e(t), qui conduit aux equations
i� γf(t) = p Ez(t) e−iω0t γe(t) et i� γe(t) = p Ez(t) eiω0t γf (t) ,
est bien adapte a l’etude des transitions entre ψe
et ψf
induites par Ez(t) car γf (t) =γe(t) = 0 pour Ez(t) = 0. Si Ez(t) e±iω0t est une fonction qui oscille vite, on s’attend a ceque γf,e(t) � 0, et donc a l’absence de transitions. Considerons alors le cas parfaitementmonochromatique Ez(t) = E0 e
−iωt + E0 eiωt avec ω proche de ω0. On obtient
i� γf(t) � pE0ei(ω−ω0)t γe(t) et i� γe(t) � pE0e
−i(ω−ω0)t γf (t)
en ne gardant en facteur de γf,e(t) que les coefficients a variation lente ; cette approxi-mation, identique a la methode des equations d’amplitude de la section 6.4.5, ne seravalide que si les solutions ainsi trouvees sont a variation lente par rapport a e±iω0t. Alors
γe(t) satisfait l’E.D. a coefficients constants γe+ i(ω−ω0) γe+Ω2 γe = 0 avec Ω =p|E0|
�.
Si on suppose qu’initialement l’un des etats n’est pas occupe, par exemple γe(0) = 0 etγf (0) = 1, on obtient (petit calcul) :
|γe(t)|2 = Ω2sin2
√(ω−ω0
2
)2 + Ω2 t(ω−ω0
2
)2 + Ω2.
L’approximation est donc valable pour Ω � ω0 et |ω − ω0| � ω0.
Transition resonnante. Si ω = ω0 on obtient |γe(t)|2 = sin2 Ωt (resultat qui decouleaussi plus directement des equations γf,e + Ω2 γf,e = 0). Ce basculement reversible deψf
vers ψe, lorsque ω = ω0, est appele resonance quantique.
REMARQUE. Si ω �= ω0, et dans la mesure ou les termes en Ez(t) dans le hamiltonienpeuvent etre consideres comme perturbatifs, la solution ci-dessus devient, au premierordre du calcul de perturbation,
|γe(t)|2 = Ω2 F (ω − ω0, t) avec F (ω − ω0, t) =sin2 ω−ω0
2 t(ω−ω0
2
)2 .
Cette expression, qui s’obtient aussi par integration de l’E.D. pour γe(t) entre 0 et t enmaintenant γf (t) egal a un, suppose |γe(t)| � 1. Elle reste valable pour tout ω si Ω estarbitrairement petit.
4.4 Physique quantique et espaces vectoriels 123
Regle d’or de Fermi. Souvent, dans la realite, le champ E(t) n’est que quasi-monochro-matique et l’energie du niveau excite presente une dispersion. Ces deux phenomenes ontpour effet de distribuer la valeur de Ω2 sur un continuum de valeurs de ω (pour lepremier) et de Ee (pour le second), et donc de rendre pour chaque ω et Ee fixe la valeurcorrespondante de Ω2 arbitrairement petite. Dans le premier cas, pour tenir comptede la dispersion en ω de E(t), il faut remplacer Ω2 = �−2p2|E0|2 par �−2p2I0(ω) dωsur l’intervalle [ω, ω + dω] (I0(ω) densite spectrale d’intensite du champ) ; |γe|2 devient�−2
∫p2 I0(ω)F (ω−ω0, t) dω. Comme F (ω−ω0, t), dont l’integrale sur ω vaut exactement
2πt, est de plus en plus “piquee” autour de ω0 lorsque t → ∞ (F (0, t) = t2 et Δω �2πt−1), cette integrale pour t grand vaut t wef avec :
wef = 2π�−2p2I0(ω0) .
wef est la probabilite de transition par unite de temps de ψf
a ψe. (En considerant
le cas γe(0) = 1 on calcule de meme wfe et on verifie que wfe = wef : microreversibilite).Dans le second cas, pour tenir compte de la dispersion de Ee et donc aussi de ω0 =�−1 (Ee −Ef ), on introduit une densite ρe(E) de niveaux excites par unite d’energie (cequi revient a remplacer Ω2 par Ω2 ρe(E) dE sur l’intervalle [E,E + dE]) et |γe|2 devient
�−2 |p E0|2∫ρe(E)F (ω − E − Ef
�, t) dE = t w{e}f avec :
w{e}f � 2π�−1|pE0|2 ρe(Ef + �ω) (regle d’or de Fermi) .
Dans les deux cas le comportement de F montre que la transition est impossible lorsquel’egalite Ef = Ee− �ω (L.C. de l’energie) n’est pas satisfaite. La presence de probabi-lites de transition traduit le caractere irreversible de ces transitions (cf. section 10.3.2).
� Interactions avec d’autres systemes a deux etats ; loi exponentielle
Ci-dessus les transitions sont dues au terme de couplage pEz present dans le hamiltonien. Des calculssemblables conduisent aux memes resultats en supposant que la molecule NH3 interagit avec un autresysteme S a deux niveaux, par exemple un champ quantique dont les etats ϕ
f,ea n ou n+ 1 photons
(n fixe) ont des energies εf,e avec εe−εf = �ω. Si dans l’E.V. engendre par les quatre vecteurs ψf,e
⊗ϕf,e
on suppose que les transitions n’ont lieu qu’entre les deux etats ψe⊗ ϕ
fet ψ
f⊗ ϕ
e, ce qui est vrai si
�ω � �ω0, on est conduit a traiter l’ensemble NH3 − S comme un systeme a deux etats. Les equationsd’evolution pour les composantes d’un etat quelconque sur ces deux vecteurs sont alors de la formei� cfe = (Ef + εe) cfe+K cef et i� cef = (Ee+ εf ) cef +K cfe, et un changement de variable semblable
a celui effectue plus haut les change en i� γfe = K ei(ω−ω0)t γef et i� γef = K e−i(ω−ω0)t γfe.
On peut modeliser la loi exponentielle de desexcitation spontanee de NH3 en supposant que NH3
interagit non pas avec un, mais avec une infinite de systemes a deux niveaux dont les differences d’energie
�ωk forment un continuum autour de �ω0 ; ce sont en pratique les modes du champ electromagnetique
dans le vide, avec zero ou un photon. On suppose que les transitions s’effectuent entre l’etat Ψe (NH3
dans l’etat excite et les modes avec zero photon), et les etats Ψf,k (le mode k avec un photon et NH3 et les
autres modes dans leur etat fondamental). La resolution exacte des equations i� γf,k = Kk ei(ωk−ω0)t γe
et i� γe =∑kKk e
−i(ωk−ω0)t γf,k par transformee de Laplace (cf. section 5.3.3), avec γe(0) = 1 et
γf,k(0) = 0, donne (petit calcul) : pΓe(p) − 1 = − 1�2
∑kK
2k [p+ i(ωk − ω0)]−1 Γe(p). Si on pose
ωk = ω0 + kΔω, Kk = K pour tout k ∈ Z on peut utiliser la formule exacte :∑∞k=−∞(p + ikΔω)−1 = π
Δωcotanh πp
Δω.
Dans la limite Δω → 0 et πK2
�2 Δω→ a, elle donne Γe(p) = 1
p+ad’ou γe(t) = e−at. La loi exponentielle
124 4 • Calcul et physique lineaires ; relativite ; quantique
et son irreversibilite sont donc associees a des transitions de l’etat excite vers un continuum d’etats ; a
l’oppose, si il y a transition vers un seul etat avec ω = ω0, on obtient Γe(p) = pp2+Ω2 (avec Ω = K
�) et
on retrouve la resonance γe(t) = cos Ωt.
4.4.3 Fonctions d’ondes ; E.D.P. de Schrodinger ; etats gaussiens
� Degres de liberte spatiaux ; translation ; percussion
Pour decrire ces degres de liberte, en se limitant a une particule et a une seule dimensiond’espace, il faut introduire l’E.V., de dimension infinie, des fonctions de z muni du produitscalaire (g, f) =
∫g(z) f(z) dz. La composante spatiale d’un etat est alors representee
par une fonction normee ψ(z, t) appelee fonction d’onde ou encore “paquet d’ondes” car,en vertu de l’analyse de Fourier, elle peut s’ecrire comme une “somme”
∫ψ(k, t) eikz dz
d’ondes planes. Dans cet espace l’operateur quantite de mouvement est P =�
i
∂
∂z(noter que Pf � p0f si f est la fonction d’onde d’une particule de quantite de mouve-
ment p0 quasi fixee, c.a.d. si f est “proche” de exp[ i�p0z
]) ; celui de position Z est la
multiplication par z (Zf � z0f si f est “piquee” en z0, cf. l’interpretation de |f(z)|2ci-dessous). L’operateur exp
[− i
�aP
], qui change f(z) en f(z−a) (cf. developpement de
Taylor section 1.1.3), correspond a une translation (figure 24). On verifie qu’il change
< Z >=∫f(z) z f(z) dz en < Z > +a et laisse inchange < P >=
∫f(z)
�
if ′(z) dz.
L’operateur exp[ i
�pZ
], qui multiplie f(z) par exp
ipz
�, ne change pas < Z > mais change
< P > en < P > +p ; il correspond a une “percussion” de l’etat (figure 24). Z et Pverifient :
Z = Z† , P = P † et [Z,P ] = i� .
DEMONSTRATION. L’adjoint d’un operateur etant defini par (g, Af) = (A†g, f) (comme pour les
matrices), le resultat est trivial pour Z et se deduit d’une integration par parties de
∫g(z)
�
if ′(z) dz
pour P . Enfin la relation de commutation [Z,P ] = i� resulte de
(z∂
∂z
)f(z) − ∂
∂z(z f(z)) = −f(z).
état translaté
zétat "percuté"
état
Figure 24
��
z
11= 0 = 0
Figure 25
L’inegalite de Schwarz (cf. section 4.1.2) pour les etats (Z− < Z >) f et (P− < P >) fconduit, comme pour les signaux, a l’inegalite de Heisenberg :
δz δp ≥ �
2avec (δz2) =< (Z− < Z >) >2 et (δp2) =< (P− < P >) >2 .
4.4 Physique quantique et espaces vectoriels 125
� E.D.P. de Schrodinger ; lien avec la mecanique classique
On se limite ici au cas de particules galileennes de masse m. Pour des particules libres on
pose H =P 2
2m(noter que Hf � p2
0
2mf pour f “proche” de exp
[ i�p0z
]). Si les particules
ont classiquement une energie potentielle V (z), un choix frequent (discute ci-dessous) est
H =P 2
2m+ V (Z). L’equation i� ψ(t) = H ψ(t) devient alors l’E.D.P. de Schrodinger
(equation d’onde) :
i�∂ψ(z, t)∂t
= − �2
2m∂2ψ(z, t)∂z2
+ V (z)ψ(z, t) .
Elle conduit a la loi de conservation locale :
∂ρ(z, t)∂t
+∂j(z, t)∂z
= 0 avec ρ = |ψ|2 et j = −i �
2m
(ψ∂ψ
∂z− ψ
∂ψ
∂z
).
ρ(z, t) est interprete comme une densite de probabilite de presence de la particule enz a l’instant t et j(z, t) comme un courant de probabilite ; si ψ est proche d’une onde
plane exp[ i
�pz
], alors j � ρv avec v =
p
m, expression classique de la vitesse, ou vitesse
de groupe du paquet d’ondes (cf section 8.2.1).
REMARQUE. Les moyennes de Z et P obeissent aux equationsddt
< Z >=< P >
met
ddt
< P >= − < V ′(Z) > (par exempleddt
< P >=i
�(ψ, [H,P ]ψ) avec
i
�[H,P ]ψ =
V ∂zψ − ∂z(V ψ) = −V ′ψ). Ce resultat, qui ressemble aux equations de la mecaniqueclassique (sauf que < V ′(Z) >= V ′(< Z >) uniquement pour V quadratique), justifieen partie le choix de H fait plus haut. L’introduction des interactions electromagnetiquesa partir d’un principe de jauge est faite a la section 9.2.2.
� Etats gaussiens ; etats coherents ; lien avec l’espace de phase
La famille de fonctions
ψ(z) ∝ exp[i
�
(p0z +
β
2(z − z0)2
)],
avec p0 et z0 reels et β = β1 + iβ2 (β2 > 0) se prete a des calculs explicites et est stablevis-a-vis des evolutions associees a des hamiltoniens au plus quadratiques dans le couple
(Z,P ). ψ(z) qui verifie |ψ|2 ∝ exp[−β2
�(z − z0)2
]est representee (pour p0 = 0) sur la
figure 25.
Dispersion en z et p. On deduit des proprietes des gaussiennes reelles que < Z >= z0et que (δz)2 =< (Z − z0)2 >= �(2β2)−1. Comme (Pψ)(z) = (p0 + β(z − z0)) ψ(z) on a
aussi < P >= p0 et (δp)2 =< (P − p0)2 >= �|β|2(2β2)−1 ; en particulier δz δp =�
2si
β1 = 0. Enfin, il resulte de [P − p0, Z − z0] = −i� que :
126 4 • Calcul et physique lineaires ; relativite ; quantique
12< (P − p0)(Z − z0) + (Z − z0)(P − p0) >=< (Z − z0)(P − p0) > −i�
2= �β1(2β2)−1 .
Si on assimile ces valeurs moyennes aux correlations Γ de deux v.a. gaussiennes Z et P(cf. section 10.2.1), leur densite de probabilite conjointe est proportionnelle a
exp−[
1�β2
(|β|2(z − z0)2 − 2β1(z − z0)(p− p0) + (p− p0)2)]
,
resultat evident si β1 = 0. En ecrivant que le crochet [. . . ] est par exemple plus petit que2 on peut associer a ψ une tache elliptique dans l’espace de phase (z, p) assimilableau support de la densite de probabilite (figure 26). Cette tache, d’aire h independantede β (petit calcul ; cf section 4.2.3), est inclinee par rapport aux axes (z, p) si β1 �= 0 etinscrite dans un rectangle de cotes 4 δz, 4 δp (propriete facile a verifier si β1 = 0).
4
4 Æ
Æ
zz
p
p
0
0
t = 0 t > 0
0
z
p
Figure 26
z
p
t = 0
t > 0
Figure 27
Evolution. Si H =P 2
2m+
12mω2Z2 (oscillateur harmonique), une evolution infi-
nitesimale exp[− i
�εH
]= 1 − i
�εH donne :
ψ(z) → ψ(z)(1 − i ε
2m�
((p0 + β(z − z0))2 − iβ� +m2ω2z2
))∝ ψ(z) exp
[−i ε2m�
((p0 + β(z − z0))2 +m2ω2z2
)].
Elle conserve donc le caractere gaussien. Par identification on voit que, dans le temps ε,δβ = −ε(mω2 +m−1β2) et (petit calcul) δp0 = −εmω2z0 et δz0 = εm−1p0. On en deduitles equations d’evolution :
dβdt
= −(mω2 +m−1β2) ,dp0
dt= −mω2z0 et
dz0dt
= m−1p0 .
Les deux dernieres sont attendues (cf. remarque ci-dessus) ; la premiere est identique acelle verifiee par
p0
z0, ce qui permet de la resoudre facilement.
4.4 Physique quantique et espaces vectoriels 127
EXEMPLES. 1) ω = 0 (particule libre)(z0(t)p0(t)
)=
(1 t
m0 1
)(z0(0)p0(0)
)et donc β(t) = β(0)
(1 +
t
mβ(0)
)−1
;
cette expression permet de discuter l’etalement en z d’un paquet d’ondes (figure 26).On verifie que :
(δp)2(t) = (δp)2(0) ; |β(t)|2 (δz)2(t) = |β(0)|2 (δz)2(0) .
2) Si β(0) = imω on a β(t) = β(0) ; un tel etat, dont la tache dans le plan (z, p) ne sedeforme pas au cours du temps, est appele etat coherent (figure 27 ou m = ω = 1).
REMARQUE. Dans le cas general :(z0(t)p0(t)
)=
(cos ωt (mω)−1 sinωt
−mω sinωt cosωt
) (z0(0)p0(0)
).
L’evolution des etats gaussiens est donc entierement determinee par des matrices de transfert de determi-
nant 1 reliant
(z0(t)p0(t)
)a
(z0(0)p0(0)
). Le lecteur fera le lien avec l’optique matricielle, z et p jouant le
role des coordonnees x et p d’un rayon et t celui de la coordonnee z sur l’axe optique. L’analogue des
ces etats gaussiens sont, en optique ondulatoire, les faisceaux gaussiens (ondes spheriques si β2 � 0).
4.4.4 Oscillateur harmonique ; champ electromagnetique
� Oscillateur harmonique ; operateurs d’annihilation et de creation
Si dans l’hamiltonien
H =P 2
2m+
12mω2Z2 ,
on remplace �, m et ω par 1, ceci revient a choisir comme unite de temps, de longueur
et d’energie respectivement ω−1,(
�
mω
) 12
et �ω. On verifie alors facilement qu’en intro-
duisant les operateurs
a =Z + iP√
2, a† =
Z − iP√2
([a, a†] = 1 car [Z,P ] = i) ,
on obtient l’expression de H et les relations de commutation :
H = a†a+12
, [H, a] = −a , [H, a†] = a† .
On en deduit (demonstration ci-dessous) que les etats propres ψn
de H forment unesuite d’etats orthogonaux relies les uns aux autres par a et a† et que les niveauxd’energie sont quantifies et regulierement espaces :
H ψn
=(n+
12
)ψn
avec a† ψn
=√n+ 1ψ
n+1et aψ
n=√nψ
n−1(n = 0, 1, 2 · · · ) .
(aψ0
= 0 pour l’etat fondamental ψ0.) L’action sur ψ
nde a et a† faisant disparaıtre ou
apparaıtre un quantum d’energie, a et a† sont appeles operateurs d’annihilation et
128 4 • Calcul et physique lineaires ; relativite ; quantique
de creation. Comme < a >= i < [H, a] >= −i < a >, leur moyenne dans un etat ψ(t)verifie (en retablissant ω) :
< a > (t) = e−iωt < a > (0) et < a† > (t) = eiωt < a† > (0) .
DEMONSTRATION. Soit ψ un etat tel que Hψ = Eψ, alors φ = aψ verifie Hφ = (E − 1)φ (car
Haψ = (aH − a)ψ) et (φ, φ) = (ψ, a†aψ) = E − 12. Comme (φ, φ) est toujours positif il en resulte
l’existence d’un etat d’energie minimale ψ0
tel que E0 = 12
et aψ0
= 0 (unique puisque (z+∂z)ψ0(z) = 0
definit la fonction d’onde ψ0(z) = (π)−14 exp− z2
2). CommeH (a†ψ) = (E+1) a†ψ (et ‖ a†ψ ‖2= E+ 1
2),
les etats ψn
se deduisent de ψ0
par action de a† ; l’introduction du facteur√n+ 1 dans le passage de
ψn
a ψn+1
assure que ‖ ψn+1
‖2= 1 si ‖ ψn‖2= 1.
REMARQUE. Fonctions propres. De ψn
= (n!)−12 a†n ψ
0, on deduit : ψn(z) = (
√π 2n n!)−
12 ×(
(z−∂z)n e− z22
). (z−∂z)n e− z2
2 s’ecrit aussi Hn(z) e−z22 ou Hn(z) est le neme polynome de Hermite
(H0(z) = 1, H1(z) = z, H2(z) = 4z2 − 2, H3(z) = 8z3 − 12z · · · ; cf . figure 28). Si on retablit �, ω et
m on obtient :
ψn(z) = (√π 2n n!)−
12
(mω
�
) 14 Hn
(√mω
�z)e−
12
mω�
z2
(en n’oubliant pas que la normalisation de ψn(z) entraıne que sa dimension est [L]−12 ).
�
�
�
� �
z0
V(z)3
2
hn=0
n=1
n=2
n=3
E
1
0
Figure 28
� Etats coherents et limite classique
Ces etats introduits plus haut par (Pψ)(z) = (p0 + β(z − z0))ψ(z), avec β = i, sont lesetats propres de a. Si on les repere par leur valeur propre α, on a
aψα
= αψα
avec α =1√2
(z0 + ip0) ,
ou z0 et p0 sont les valeurs moyennes de Z et P . On verifie :
(ψα, aψ
α) =< a >= α , (ψ
α, a†ψ
α) =< a† >= α et (ψ
α, a†aψ
α) =< a†a >= |α|2 .
Dans la base ψn
la relation aψα
= αψα
et la condition de normalisation conduisent a :
ψα
= exp−|α|22
∞∑n=0
(n!)−12 αn ψ
n;
4.4 Physique quantique et espaces vectoriels 129
en particulier ψα=0
≡ ψn=0
(etat fondamental).
Pour |α| � 1, l’oscillateur quantique dans un etat coherent devient assimilable a unoscillateur classique. En effet, dans un tel etat les dispersions deviennent negligeablescar z0 � δz = 2−
12 et p0 � δp = 2−
12 (cf. etats gaussiens) ; l’energie E est elle aussi
quasi fixee car la loi de probabilite
pn = |(ψn, ψ
α)|2 = exp
[−|α|2] |α|2nn!
pour les valeurs de n dans un etat ψα
(loi de Poisson, cf. section 10.2.2) donne une
moyenne < n >= |α|2 et une dispersion σ = |α|, d’ouδE
E∼ σ
< n >= |α|−1 � 0. Enfin
l’evolution des etats ψn
entraıne qu’un etat ψα(0)
evolue (a une phase globale pres) en
ψα(t)
avec α(t) = α(0) e−iωt ; si on pose α(t) =1√2
(z(t)+ ip(t)) l’evolution donnant α(t)
conduit a l’evolution classique pour les variables z(t) et p(t).
� Champ electromagnetique ; emissions induite et spontanee
En physique classique, ce champ defini par son action−→F = q (
−→E + v ∧ −→
B ) sur uneparticule chargee, est une grandeur reelle. Par exemple
−→E ∝ cos(ωt − kxx) z pour un
mode propagatif selon x et polarise rectilignement selon z. (On rappelle que dans uneboite cubique de volume V = L3, un mode est defini par (kx, ky, kz) = 2π
L (m,n, p) avecm,n, p ∈ Z). Quand ce champ intervient dans le hamiltonien de NH3, on a vu queles termes en eiωt et e−iωt jouent des roles differents en induisant respectivement destransitions ψ
e→ ψ
fet ψ
f→ ψ
e, transitions dont on sait qu’elles s’accompagnent de
l’emission et de l’absorption d’un photon. Cette remarque, et aussi le fait qu’un mode estl’analogue d’un oscillateur, conduisent a remplacer la fonction classique Ez(t) = E0e
−iωt+E0e
iωt par le champ quantique
Ez = C (a+ a†) avec C =√
�ω
2V ε0,
operateur dont la moyenne est < Ez > (t) = C (< a > (0) e−iωt+ < a† > (0) eiωt). a et a†
sont les operateurs sans dimension d’annihilation (absorption) et de creation (emission)d’un photon du mode considere et C, dont la valeur est justifiee ci-dessous, assure l’ho-mogeneite dimensionnelle. Les etats propres ψ
nde l’oscillateur designent maintenant les
etats a n photons. Cette expression pour Ez permet de montrer que les probabilites detransition “atomiques” de ψ
evers ψ
fet de ψ
fvers ψ
een presence de n photons sont
respectivement proportionnelles a n+1 (emissions induite et spontanee) et a n (ab-sorption) (demonstration 1 et application a la section 10.3.2). On retrouve le champclassique, avec une amplitude et une phase bien definies, lorsque les etats du mode sontdes etats coherents a grand nombre moyen de photons (demonstration 2).
DEMONSTRATION 1. Dans la transition ψe
→ ψf
(resp. ψf
→ ψe) il y a passage de n a n + 1
photons (resp. de n a n− 1). Dans la regle d’or de Fermi la quantite |E0|2 doit alors etre remplacee par|(ψ
n+1, Ez ψn)|2 = C2(n+ 1) (resp. |(ψ
n−1, Ez ψn)|2 = C2n).
DEMONSTRATION 2. Dans un etat ψα
on a < Ez >= C (αe−iωt + αeiωt) et (petit calcul) < E2z >=
< Ez >2 +C2. Les fluctuations de Ez deviennent donc negligeables si |α|2 � 1 (par exemple |α|2 > 1015
130 4 • Calcul et physique lineaires ; relativite ; quantique
pour un faisceau laser), et Ez est alors assimilable a sa valeur moyenne. L’energie electromagnetique
classique contenue dans un volume V , qui est la moyenne temporelle de deux fois 12ε0E2V (facteur 2
pour tenir compte de l’energie magnetique), vaut ε02C2|α|2V = |α|2�ω, ce qui justifie la valeur de C.
On notera que dans un etat ψn, < E2
z >= 2C (n + 12) mais que < Ez >= 0 ; on interprete ce resultat
en associant a un tel etat un champ classique dont la phase est indeterminee (equirepartie sur [0, 2π]).
C’est le cas aussi de la phase du champ associe a une lumiere thermique qui correspond a un melange
statistique d’etats ψn.
4.4.5 E.D.P. relativistes de Klein-Gordon, Weyl, Dirac ;champs quantiques ; particules et antiparticules
Dans cette section on pose � = c = 1 pour simplifier l’ecriture des formules, et on se limitea la description de particules libres pour lesquelles l’energie E positive et la quantite demouvement −→p verifient (cf. section 4.3.3) :
E = (p2 +m2)12 ; E = |−→p | si m = 0 .
Comme la relation entre E et −→p est non polynomiale, contrairement au cas galileenE = p2/2m, il n’y a pas d’E.D.P. relativiste ayant pour seules solutions des fonctionsd’onde exp−i(Et − −→p · −→r ). Les E.D.P. admettant ces solutions ont aussi des solutionsexp i(Et − −→p · −→r ) historiquement dites d’energie negative et considerees alors a tortcomme des fonctions d’onde d’antiparticules.
� E.D.P. de Klein-Gordon ; champs classiques et quantiques ; particuleset antiparticules
De la meme facon que l’E.D.P. de Schrodinger est associee a la relation E = p2/2m(cf. section 4.4.3), l’E.D.P. de Klein-Gordon est associee a la relation relativiste E2 =p2 +m2. Elle s’ecrit
(Δ − ∂2t )ψ = m2ψ (ψ scalaire)
et admet, suivant que le champ est reel ou complexe, des solutions ondes planes :
ψ−→p = α−→p e−ip·x + α−→p e
ip·x ou ψ−→p = α−→p e−ip·x + β−→p e
ip·x
(avec p · x = Et − −→p · −→r ). Tant que le champ ψ reel est considere comme classique, lesamplitudes α−→p et α−→p sont des nombres, mais si le champ est quantique ces nombres, quisont respectivement en facteur de e−iEt et eiEt deviennent, comme on l’a justifie pour lechamp electromagnetique, des operateurs proportionnels aux operateurs d’annihilationa−→p et de creation a†−→p , qui concernent ici des particules de masse m et de quantite demouvement −→p . On peut aussi considerer que le champ classique correspond a une somme(discrete ou continue) de modes d’oscillateurs caracterises chacun par une valeur de −→p (cf.sections 8.1-2) ; le champ quantique est alors obtenu par quantification de ces oscillateurs.
Ce qu’apporte de nouveau un champ complexe, c’est l’operation de conjugaison faisantpasser de ψ−→p a :
ψ−→p = α−→p eip·x + β−→p e
−ip·x .
Si le champ est quantifie α−→p , α−→p et β−→p , β−→p deviennent a un facteur pres des operateursd’annihilation et de creation a−→p , a†−→p et b−→p , b†−→p , associes respectivement a la particule
et a son antiparticule (l’appellation “particule” etant conventionnelle puisque ψ et ψjouent des roles semblables).
4.4 Physique quantique et espaces vectoriels 131
� E.D.P. de Weyl ; particules de masse nulle et d’helicite ±12
L’E.D.P. de Klein-Gordon est du second ordre en temps. Les E.D.P. invariantes relati-vistes du premier ordre les plus simples sont les E.D.P. conjugees (la notion de conjugaisonetant celle introduite a la section 4.2.4) :
∂ψ = 0 , ∂ψ = 0 (∂ = I∂t −−→σ · −→∇ ; ∂ = I∂t + −→σ · −→∇) .
Elles concernent des spineurs et ont pour solutions onde plane
ψ−→p =(α−→p e
−ip·x + β−→p eip·x)m−(p) , ψ−→p =
(β−→p e
−ip·x + α−→p eip·x)m+(p) ,
avec E2−−→p 2 = 0 et (−→σ · p)m±(p) = ±m±(p). Si on se limite au terme en e−ip·x, on peutconsiderer que ψ−→p decrit une particule de masse nulle et d’helicite −1/2, par exempleun neutrino ; ψ−→p decrit alors un antineutrino (masse nulle, helicite 1/2). Quand le
champ est quantifie, α−→p , α−→p et β−→p , β−→p deviennent proportionnels a des operateursd’annihilation et de creation de particule (neutrino) et antiparticule (antineutrino).
JUSTIFICATION. L’invariance resulte des lois de transformation de ψ et ψ et de ce que ∂ et ∂ se trans-
forment comme X et X puisque (∂t,−−→∇) est un quadrivecteur ; par exemple ∂ ′ψ ′ = (M∂M†)(M†−1ψ)
= 0 equivaut a ∂ψ = 0. La conjugaison des equations se deduit de ∂ = ε∂ε−1 ; par exemple si ∂ψ = 0,
on a ε∂ε−1εψ = 0 et donc aussi ∂(εψ) = 0. Si on cherche les solutions exp±ip · x de ∂ψ = 0 par
exemple, on est conduit a (EI +−→σ · −→p )ψ = 0, ce qui implique det (EI +−→σ · −→p ) = E2 −−→p 2 = 0 (masse
nulle) et (−→σ · p)ψ = −ψ, donc ψ proportionnel a m−(p) (cf. section 4.2.4). Dans une rotation d’axe p
et d’angle θ, m−(p) est multiplie par eiθ2 (action de Up(θ)). Si on se rappelle (cf. sections 3.4.2, 4.2.5
et 4.4.1) qu’une fonction d’onde correspondant a un moment cinetique Jz = m selon z est multiplieepar e−imθ dans un rotation d’axe z et d’angle θ, on en deduit que l’onde e−ip·xm−(p) correspond a
une helicite −1/2. Quant a la solution eip·xm−(p), son evolution en temps est eiEt et correspond a unerotation dans le sens direct ; il est naturel qu’elle soit associee a l’antiparticule d’helicite 1/2 quand lechamp est quantifie.
REMARQUES. 1) Les champs ψ et ψ sont aussi notes ψL
et ψR
(L pour left et R pour right). 2) L’etude
plus detaillee de la quantification de ces champs montre que les operateurs a−→p , a†−→p , b−→p , b†−→p doivent
verifier des relations d’anticommutation (au lieu de commutation). Cette regle est a l’origine du principe
d’exclusion de Pauli relatif aux particules de spin (ou d’helicite) demi entier (fermions) : impossibilite
d’avoir deux particules dans le meme etat quantique (cf. ouvrages specialises).
� E.D.P. de Dirac ; particules massives de spin 12
L’E.D.P. de Dirac couple des spineurs de types ψ et ψ, notes ici ψL
et ψR
:
i∂ψL
= mψR , i∂ψR
= mψL .
Le lecteur verifiera comme ci-dessus son invariance et le fait que la conjugaison est uneoperation interne :
ψD
=(ψR
ψL
)solution =⇒ ψC
D=
(−εψ
L
εψR
)solution , avec ε =
(0 1−1 0
).
132 4 • Calcul et physique lineaires ; relativite ; quantique
L’E.D.P. admet des solutions exp∓ip · x si :
±(EI + −→σ · −→p )ψL
= mψR
, ±(EI−−→σ · −→p )ψR
= mψL.
Ceci implique en particulier (E2−−→p 2)ψR,L
= m2ψR,L
et donc E2 = −→p 2 +m2. Si −→p = 0(E = m, particules au repos), on a ψ
R= ±ψ
L, et la solution a la forme generale :
ψD
= e−imt[α+
(m+
m+
)+ α−
(m−m−
)]+ eimt
[β+
(−εm+
εm+
)+ β−
(−εm−εm−
)].
L’E.D.P. de Dirac decrit donc, lorsqu’elle est quantifiee, des particules et antiparticulesde masse m et de spin 1/2 (avec leurs deux etats de spin) par exemple des electrons etdes positrons (cf. ouvrages specialises).
REMARQUE. Il existe des equations invariantes plus simples, les E.D.P. de Weyl-Majorana
∂ϕL
= meiαεϕL
ou ∂ϕR
= meiβεϕR
(phases α, β arbitraires) conduisant a E2 = −→p 2+m2. Mais, comme elles couplent un champ spinoriel
a son conjugue, les solutions onde plane sont de la forme ϕ−e−ip·x + ϕ
+eip·x avec a la fois ϕ− et ϕ
+
non nuls ; elles n’ont pour l’instant pas d’interpretation physique simple. Le lecteur peut verifier a titre
d’exercice que l’E.D.P de Dirac qui concerne un spineur ψD
a quatre composantes se separe en deux
E.D.P. de Weyl-Majorana pour les combinaisons a deux composantes ψR± εψ
L.
� Masse et frequence
En physique quantique, la conception “classique” de la masse comme resistance a la modification de la
vitesse n’a pas de sens. Une particule libre n’est pas decrite par sa position et sa vitesse mais par sa
fonction d’onde exp−i(Et − −→p · −→r ) dans laquelle E et −→p figurent comme des frequences (a 2π pres).
En physique quantique relativiste, la masse (energie au repos) est donc une frequence temporelle. Pour
l’interpreter simplement, considerons un espace a une dimension et les equations couplees
(∂t + ∂z)ϕ1 = mϕ2 , (∂t − ∂z)ϕ2 = −mϕ1 .
Pour des solutions exp−i(Et − pz) elles conduisent a la relation de dispersion E2 = p2 + m2 et a
(E − p)ϕ1 = imϕ2. Pour m = 0, ϕ1 et ϕ2 sont associees aux etats de mouvement c = 1 et c = −1.
La masse peut donc etre consideree comme une frequence de transition entre ces etats, en analogie
avec le couplage des deux etats de repos z = ±z0 de la molecule NH3 a la section 4.4.2. Si ϕ1 et ϕ2
sont prises comme amplitudes de probabilite de ces etats, on verifie que la vitesse moyenne definie par
v = (|ϕ1|2 − |ϕ2|2)/(|ϕ1|2 + |ϕ2|2) est bien la vitesse p/E de la particule de masse m ou la vitesse
de groupe dE/dp de l’onde. Une image “classique” de ces transitions est donnee a la figure 20b (avec
Δt = m−1). Le lecteur verifiera que pour des solutions ne dependant que de t et z, les E.D.P. de
Klein-Gordon et de Dirac peuvent se ramener aux equations pour ϕ1 et ϕ2, de meme que les E.D.P.
de Weyl-Majorana en changeant ϕ2 en ϕ2. Cette interpretation suggere que les etats de mouvements
(invariants) a la vitesse c sont en physique plus fondamentaux que les etats inertiels galileen de repos ou
de vitesse constante v < c.
Chapitre 5
Fonctions d’une variable ;analyse des signaux
L’etude des fonctions, longtemps limitee a celles connues pour leur “utilite” (polynomes,logarithme, fonctions trigonometriques...), a connu une premiere approche generale avecl’introduction vers 1670 du “calcul infinitesimal” par Leibnitz et Newton et ses appli-cations a la mecanique et a la geometrie analytique. Ce savoir-faire base sur les calculsde derivees, d’integrales et de developpements limites reste tres utile en physique.
Cette etude a change d’objectif quand il s’est agit, dans la seconde moitie du XIX eme
siecle, de distinguer des proprietes “fines” comme celles de continuite, de derivabiliteet d’integrabilite ou d’etablir l’existence (auparavant admise) de fonctions ecrites sousforme de series de Taylor ou de Fourier. Ce developpement de l’analyse contemporain dela construction des reels a conduit, les fonctions etant des objets beaucoup plus “riches”que les nombres, a la definition de criteres de convergence et d’espaces fonctionnels varies,adaptes a tel ou tel theoreme. Au XX eme siecle un point de vue “integral” (“theorie dela mesure”), initie par Lebesgue (1902), a conduit a abandonner la notion de fonction“definie point par point” pour celle plus generale de distribution (1940-60). Ce point devue “moderne” n’est pas eloigne de celui de la physique.
En effet, dans la deuxieme moitie du XX eme siecle, s’est degagee en physique une ap-proche “traitement du signal” des fonctions. Elle correspond au developpement demethodes experimentales generales d’analyse des signaux basees souvent sur des tech-niques d’integration : filtrage, detection synchrone (analyse de Fourier), correlation,echantillonnage, analyse en ondelettes, etc. L’interet de ces methodes est d’etre appli-cables a des signaux extremement divers : de duree “finie” (decharge d’un condensateur)ou “infinie” (champ electrique du a une source lumineuse), periodiques (signaux d’ungenerateur BF) ou chaotiques (bruit de fond d’une resistance), deterministes (regis parune equation differentielle) ou non, d’apparence “continue” ou “discrete” (suite d’im-pulsions delivrees par un photomultiplicateur), etc. Comme on le verra aussi dans cechapitre, elles s’etendent aux fonctions de plusieurs variables (ondes ou images en op-tique). De plus en plus elles concernent des signaux numerises (apres echantillonnage etquantification).
134 5 • Fonctions d’une variable ; analyse des signaux
Cette approche a contribue a donner en physique une importance primordiale aux opera-tions effectuees sur les fonctions et leurs proprietes mathematiques formelles plutotqu’a l’appartenance des fonctions a tel ou tel espace fonctionnel. Paradoxalement l’hy-pothese la plus raisonnable est de considerer que les fonctions en physique sont a priori lesplus “braves” possibles (pourquoi pas indefiniment derivables a support compact ?). Lesfonctions “singulieres” (discontinues, fonction δ. . .) ou dont le support va a l’infini, tresutiles conceptuellement, correspondent a des situations idealisees (transition “brutale”entre deux milieux, source ponctuelle, ou milieu infini, signal permanent. . .) ; ces fonc-tions peuvent toujours etre approchees par des “braves” fonctions, non au sens naıf dela convergence point par point mais a celui des distributions (cf. exemple de l’impulsionde Dirac).
5.1 SAVOIR-FAIRE CONCERNANT LES FONCTIONS
5.1.1 Graphe et informations sur une fonction
L’interet d’un graphe par rapport a une tabulation est de mettre en valeur certainesinformations qualitatives importantes.
� Domaine et comportement aux bornes
Pour construire le graphe, les premiers points a examiner sont le domaine de la variablex pour lequel la correspondance x → y = f(x) est bien (univoquement) definie, etle comportement aux bornes de f(x). Par exemple pour x → ∞ on peut chercher si ilexiste une droite asymptote (cas ou f(x)−(ax+b) → 0), ou une branche parabolique
d’axe Ox ou Oy (cas ouf(x)x
tend vers zero ou l’infini), par exemple f(x) = xα pour
0 < α < 1 ou pour α > 1 (figure 1).
�
�
�
�
�
�1
1
> 1
< 1
x
= 1x
< 0
= 0
0 <
Figure 1
Il peut etre plus judicieux d’utiliser un graphe log-log (c.a.d. log|f(x)| versus logx)pour faire apparaıtre une asymptote si f(x) a un comportement en xα (exemple des dia-grammes de Bode pour les fonctions de transfert en electronique) ou un graphe semi-log
5.1 Savoir-faire concernant les fonctions 135
(en general log|f(x)| versus x) pour distinguer par exemple des comportements f(x) → 0tres differents pour x→∞ tels que xα (α < 0), e−x ou e−x
2. Si x0 est un point singu-
lier ou un point d’arret du domaine on etudie, lorsque x → x0 par valeur superieureou (et) inferieure, si f(x) devient infinie, par exemple comme |x − x0|α pour α < 0 ouln|x−x0|, ou si f(x) tend vers une constante, par exemple comme |x−x0|α pour α > 0 ;dans ce dernier cas il faut preciser la direction de la tangente en x0 (verticale si α < 1 ethorizontale si α > 1). Souvent cette etude “aux bornes” et quelques valeurs particulieressuffisent pour avoir une allure du graphe.
� Derivees
Un complement d’information, la ou f(x) a un comportement regulier, est donne parl’etude des derivees premiere
f ′(x) = limε→0
f(x+ ε) − f(x)ε
egale, en coordonnees cartesiennes, a la pente tgα(x) de la tangente au graphe, etseconde f ′′(x) qui permet, grace au developpement de Taylor (cf. section 1.1.2)
f(x+ a) = f(x) + a f ′(x) +a2
2!f ′′(x) + · · · ,
de situer le graphe par rapport a la tangente : l’ecart en x + a avec la tangente en x
est f(x + a) − (f(x) + a f ′(x)
) � a2
2f ′′(x) pour a petit et f ′′(x) �= 0. Rappelons que
localement la fonction f est croissante si f ′(x) > 0, decroissante si f ′(x) < 0 et qu’elleest stationnaire (ou extremale) en x0 si f ′(x0) = 0 (maximum si f ′′(x0) < 0, minimumsi f ′′(x0) > 0). f est une fonction concave si f ′′(x) ≤ 0, convexe si f ′′(x) ≥ 0 (grapherespectivement en dessous et au dessus de la tangente), et presente un point d’inflexionen x0 si f ′′(x) s’annule en ce point en changeant de signe.
EXEMPLE. L’equation d’etat de Van der Waals en variables reduites s’ecrit :(p+
3v2
)(3v − 1)− 8t = 0 = F (p, v, t) .
(p =P
Pc, v =
V
Vcet t =
T
Tcsont les valeurs de la pression, du volume et de la
temperature en prenant les coordonnees du point critique comme unites). Les graphes
des fonctions pt(v) =8t
3v − 1− 3v2
, pour differentes valeurs fixees de t (isothermes du
fluide en coordonnees de Clapeyron) (figure 2a) se deduisent des remarques suivantes :
p→ 0+ pour v →∞ (asymptote horizontale p = 0) ; p→∞ pour v → 13
+
(asymptote
verticale v =13) ; pt2(v) > pt1(v) si t2 > t1 ; annulation avec changement de signe
dedptdv
sur la courbe en cloche p =3v2
− 2v3
, par le sommet C (p = 1, v = 1) delaquelle passe l’isotherme critique t = 1. Pour les autres informations presentes sur legraphe (palier de liquefaction AB, zones de retard AA′ a la vaporisation et BB′ a laliquefaction), le lecteur se reportera a la section 7.4.1 et aux ouvrages de physique.
136 5 • Fonctions d’une variable ; analyse des signaux
p
1
1 v1/3
A
C
t>1B’
B
t=1t<1A’
lieu des extrema
(a)
y
p
t = 1
t > 1
t > 1
Mt = tt > t M
C1
1
asymptote
(b)
Figure 2
En coordonnees d’Amagat (p, y = pv) l’equation s’ecrit :
3y − p + 9py
− 3p2
y2− 8t = 0 = G(y, p, t) .
On en deduit facilement que les isothermes se comportent pour p petit (c.a.d pres de y = 83t) comme
yt ∼ 83t +
(13− 9
8t
)p, pour p grand (c.a.d. pour p
y= v−1 ∼ 3) comme yt ∼ 1
3p + 8
3t (asymptotes
obliques paralleles) et que leurs pentes s’annulent sur la parabole de Mariotte y2 − 9y+6p = 0 (obte-
nue en annulant ∂G∂p
) ; noter aussi que dyt
dp= v+ pt
dvdpt
devient infini au point critique C (figure 2b).
Pour t < 1 les fonctions yt(p) (comme v(pt)) ne sont plus definies partout de facon univoque.
� Autres informations (figure 3)
��������������������
������������������������
����������������������������������������������������
��������������������������������������������������������
�
f−x f’
ff’
x−(x)
d
Rdlf’(x)
0
�
�
x
f(x)
+
−x
Figure 3
Le graphe de f(x) permet aussi de donner une representation geometrique d’un certain
nombre de fonctions reliees a f telles que : les primitives Fx0(x) =∫ x
x0
f(s) ds, somme
des aires algebriques des boucles orientees sur la figure ; la derivee logarithmique
d ln |f(x)|dx
=f ′(x)f(x)
=1
Δ(x);
les fonctions f(x)−xf ′(x) et x− f(x)f ′(x)
, dont les valeurs sont donnees par les intersections
5.1 Savoir-faire concernant les fonctions 137
de la tangente avec les axes ; la fonction inverse f−1 definie par la correspondance
y = f(x) ←→ x = f−1(y)
et dont le graphe, ensemble des points de coordonnees (y, x), est le symetrique par rapporta la premiere bissectrice de celui de f , ensemble des points (x, y) ; on fera attention quef−1 n’est definie que si la correspondance entre x et y est biunivoque, par exemple y = ex
et x = ln y, ou y = sinx et x = arcsiny pour x ∈] − π/2, π/2]).
REMARQUE. Si y = f(x) represente une courbe du plan euclidien, le profil d’une cordevibrante, la section d’un dioptre par un plan..., les quantites intrinseques a cette courbe,c.a.d. independantes du systeme d’axes orthonormes choisi, sont son element de lon-
gueur dl =√
dx2 + dy2 et sa courbure1
R(x)=
dα(x)dl
; R(x) est le rayon du cercle
(osculateur) qui approche au mieux la courbe pres de x, et dα(x) l’angle dont tourne latangente lorsque on se deplace de dl sur la courbe (cf. section 3.2.1). On a
dl =√
1 + f ′2(x) dx et1
R(x)=
f ′′(x)(1 + f ′2(x))
32� f ′′(x) si f ′2(x) � 1 ,
car f ′′(x) =d tgα(x)
dx=
(1 + f ′2(x)
) dα(x)dx
; la courbure en x = 0 de y =x2
2Rest
1R
.
5.1.2 Derivation, developpements limites : principaux resultats
� Regles de derivation (rappels)
Derivee d’une fonction de fonction :ddxf (g (x)) = f ′ (g (x)) g′(x) (= 1 si f et g
sont inverses l’une de l’autre).
Addition des derivations “partielles” : lorsque x apparaıt a plusieurs endroits dansune expression il faut ajouter les derivees obtenues en ne faisant varier x qu’a uneseule place a la fois par exemple (uv)′ = u′v + uv′, (uv)′′ = u′′v + 2u′v′ + uv′′ ouddx
∫ x+a
x+b
f(x, y) dy = f(x, x+ a)− f(x, x+ b) +∫ x+a
x+b
∂f(x, y)∂x
dy. Si y(x) est defini de
maniere implicite par G(y(x), x) = 0, on obtient y′ par∂G
∂yy′ +
∂G
∂x= 0 (donc y′ = 0
pour∂G
∂x= 0 ; cf. isothermes de Van der Waals ci-dessus).
Derivee logarithmique :ddx
ln |f(x)| =f ′(x)f(x)
. Elle est tres utile pour calculer f ′
quand f contient des produits et des quotients :(fα11 fα2
2 . . .)′ =
(fα11 fα2
2 . . .)(α1
f ′1
f1+ α2
f ′2
f2+ . . .
);
par exemple le maximum de la distribution de Maxwell P (v) ∝ v2 exp − 12mv2
kBTest
obtenu pour2v− mv
kBT= 0 et celui de la loi de Planck u(ν) ∝ ν3
(exp
hν
kBT− 1
)−1
pour
138 5 • Fonctions d’une variable ; analyse des signaux
3ν− h
kBTexp
hν
kBT
[exp
hν
kBT− 1
]−1
= 0 soit hν � 3kBT .
EXEMPLES de derivees et de primitives. Si on designe le passage d’une fonction fa sa derivee f ′ par f ′ ↽ f et a sa primitive la plus simple F par f ⇀ F on a : ex � ex ;
coshx � sinhx � coshx ; cosx � sinx � − cosx ; αxα−1 � xα � xα+1
α+ 1(α �= −1 et
x > 0 si α n’est pas entier) ; x−1 � ln |x| � x ln |x| − x ;1
cos2 x� tgx � − ln | cosx| ;
1cosh2 x
� tanhx � ln coshx ;1
1 + x2� arctgx = ϕ (x = tgϕ ; ϕ ∈
]− π
2,π
2
[) ;
1√1 − x2
� arcsinx = ϕ (x = sinϕ ; ϕ ∈[− π
2,π
2
]) ;
1√1 + x2
� argsinhx =
ln(x+
√1 + x2
)= ϕ (x = sinhϕ) ;
1√x2 − 1
� ln∣∣x+
√x2 − 1
∣∣ = ϕ (x = ± coshϕ).
EXEMPLES de developpements limites. Le developpement en serie de Taylor
f(x) =∞∑n=0
f (n)(0)xn
n!de quelques fonctions “classiques” s’ecrit : ex =
∞∑n=0
xn
n!, coshx =
∞∑n=0
x2n
(2n)!, sinhx =
∞∑n=0
x2n+1
(2n+ 1)!, cosx =
∞∑n=0
(−1)nx2n
(2n)!, sinx =
∞∑n=0
(−1)nx2n+1
(2n+ 1)!,
(1 + x)α = 1 +∞∑n=1
α(α− 1) · · · (α− n+ 1)xn
n!(attention |x| < 1 pour la convergence),
et ln(1 + x) =∞∑n=1
(−1)n+1xn
n(attention |x| < 1).
Remarque : en physique il est rare que la serie complete soit utile ; en effet cesdeveloppements, qui interviennent lors de calculs de perturbation ne pouvant etreconduits que jusqu’a un certain ordre, n’ont d’interet que si les premiers termes cor-rectifs sont “petits” (ce qu’il faut toujours verifier a posteriori) et suffisants (ce qu’onespere mais qu’il est souvent difficile de prouver). En pratique les developpementssuivants suffisent souvent :
ex = 1+x+x2
2, coshx = 1+
x2
2, sinhx = x+
x3
3!, cosx = 1−x
2
2, sinx = x−x
3
3!,
(1 + x)α = 1 + αx +α(α− 1)
2x2 et ln(1 + x) = x− x2
2.
Rappelons qu’on peut faire tous les calculs a partir des developpements limites a condi-tion de rester coherent quant aux ordres traites ; par exemple la connaissance de coshx
et sinhx a l’ordre 3 permet de determiner tanhx = x
(1 +
x2
3!
) (1 − x2
2
)= x − x3
3
a l’ordre 3, mais cotanhx − 1x
=1x
((1 +
x2
2
) (1 − x2
3!
)− 1
)=
x
3uniquement a
l’ordre 1 ; de meme (1 − 2ax + x2)−12 = 1 − 1
2(−2ax + x2) +
38(−2ax + x2)2 + · · · =
1 + ax+(3a2 − 1)
2x2 a l’ordre 2 (application section 4.2.5).
5.1 Savoir-faire concernant les fonctions 139
5.1.3 Integration ; cas des fonctions piquees ou rapidement oscillantes
� Regles d’integration (rappels)
Changement de variable d’integration :∫ x2
x1
f(x) dx =∫ ϕ2
ϕ1
f (x (ϕ))dxdϕ
dϕ a condi-
tion de prendre garde que x(ϕ) couvre bien une fois [x1, x2] lorsque ϕ parcourt [ϕ1, ϕ2](exemple : f(x) = (1 + x2)−1, x = tgϕ, f(x) dx = dϕ, ϕ ∈
]− π
2,π
2
[).
Integration par parties :∫ x2
x1
u′v dx = uv∣∣∣x2
x1
−∫ x2
x1
uv′ dx, formule que l’on peut iterer
si on sait integrer u ; par exemple une primitive de eax P (x) est eax(P (x)a
− P ′(x)a2
+
P ′′(x)a3
· · ·)
, formule utile si P (x) est un polynome, et applicable a eiaxP (x) pour obtenir
la primitive de cos axP (x).
Derivation par rapport a des parametres introduits ou choisis astucieusement(exemples) :
1)∫ ∞
0
e−xxn dx =[− d
da
]n [∫ ∞
0
e−ax dx =1a
] ∣∣∣∣a=1
= n! ;
2) a l’aide de∫ ∞
−∞e−ax
2x2n dx =
[− d
da
]n [∫ ∞
−∞e−ax
2dx =
√π
a
]=√π
12
32· · · 2n− 1
2a−(n+ 1
2 ) ,
on obtient les moments de la loi gaussienne :< x2 >= σ2, < x4 >= 3σ4 et de facongenerale
< x2n >= (2πσ2)−12
∫ ∞
−∞x2n e−
x2
2σ2 dx = 1 × 3 × · · · × (2n− 1)σ2n ;
3) la moyenne du module de la vitesse (loi de Boltzmann) est, avec a =m
2kBT:
< v > =(∫ ∞
0
e−av2v3 dv
) (∫ ∞
0
e−av2v2 dv
)−1
=(− d
da
∫ ∞
0
e−av2v dv
) (− d
da
∫ ∞
0
e−av2dv
)−1
=(− d
da12a
) (− d
da12
√π
a
)−1
=2√πa−
12 .
Le lecteur trouvera de nombreux autres exemples en physique statistique.
140 5 • Fonctions d’une variable ; analyse des signaux
� Approximation de la “methode du col” (figure 4a)
Si f(x) est maximale en x∗ ∈]x1, x2[ on a pour K grand
I =∫ x2
x1
g(x) eK f(x) dx � g(x∗)
√2π
K|f ′′(x∗)| eK f(x∗) (K � 1) ,
ou en pratique ln I � Kmaxf(x). Ce resultat se justifie en remarquant que exp(Kf(x)
)est tres piquee autour de x∗ et qu’on peut par consequent remplacer g(x) par g(x∗), f(x)
par f(x∗) +(x− x∗)2
2f ′′(x∗) et considerer que l’integrale de la gaussienne va de −∞ a
+∞.
EXEMPLE : n! =∫ ∞
0
xn e−x dx x→ny= n
∫ ∞
0
en(lnn+ln y−y) dy � √2πnnn e−n, d’ou
la formule de Stirlinglnn! � n(lnn− 1)
pour n grand (qu’on a aussi par lnn! = ln 1 + · · ·+ lnn � ∫ n1
lnxdx).
REMARQUES. 1) On a de meme∫e
1kB
(S1(U1)+S2(U−U1)
)dU1 � exp
(1kB
maxU1
[S1(U1) + S2(U −
U1)])
: le nombre total d’etats microscopiques pour un systeme de deux corps dont l’energie totale U
est fixee est donc pratiquement egal, pour le calcul de l’entropie, au nombre d’etats microscopiques
correspondant a l’etat macroscopique d’equilibre (cf. section 1.1.4). 2) Si f a plusieurs maxima seul le
plus grand “compte”. 3) La methode du col et l’expression de ln I s’etendent aux fonctions de plusieurs
variables.
cos Kx2
eK f(x)
g(x)
xx*
0
xx*
g(x)
(a) (b)
Figure 4
� Approximation de la phase stationnaire
La formule precedente s’applique au cas de fonctions rapidement oscillantes (remplace-ment de K par iK). La region de x autour de x∗ qui contribue a I est alors celle ouexp
(iK f(x)
)oscille le moins (figure 4b). Attention : Kf ′′(x∗) peut ici etre positif ou
negatif et∫ ∞
−∞e±i|Kf
′′(x∗)| (x−x∗)2
2 dx =
√2π
|Kf ′′(x∗)| e±iπ
4 .
EXEMPLE 1. Toute combinaison d’ondes planes |A(k)|e−i(ω(k)t−kx+ϕ(k)
)telles que
|A(k)| varie lentement mais dont chaque terme de la phase varie “vite” (donc en par-ticulier pour t et x grands) s’ecrit, a un facteur pres,∫
D|A(k)|e−i
(ω(k)t−kx+ϕ(k)
)dk ∝ |A(k∗)|e−i
(ω(k∗)t−k∗x+ϕ(k∗)
),
5.1 Savoir-faire concernant les fonctions 141
ou k∗(x, t) ∈ D (vecteur d’onde local) est tel que vg(k∗)t−x+dϕdk
(k∗) = 0 (separation
des ondes selon leur vitesse de groupe vg(k∗) =dωdk
(k∗)). Si il n’existe pas de
valeur de k∗ satisfaisant cette condition l’onde resultante (l’integrale) est “negligeable”.Dans le cas particulier ou D est un domaine etroit autour de k0 (et k0 = k∗ sinon iln’y a pas d’onde resultante), on a affaire a un paquet d’ondes localise a l’instant t
autour du point x = vg(k0)t+dϕdk
(k0) ; il se deplace a la vitesse de groupe vg(k0) (cf.
une autre approche a la section 8.2.1).
EXEMPLE 2. Dans l’integrale d’Huygens-Fresnel A(M) =
∫ ∫A(m)
ei2πλmM
iλmMd2m etendue a une
surface d’onde (argument de A(m) fixe) le point m∗ qui contribue essentiellement a A(M) dans
l’approximation de l’optique geometrique (λ “petit”) est celui pour lequel m∗M est stationnaire,
c’est-a-dire tel que−−−→m∗M est orthogonal a la surface d’onde : m∗M est alors un rayon. Si il y a plusieurs
points m∗ (cas ou M est proche d’une caustique ; cf. section 7.3.2), il faut ajouter leurs contributions
(qui donnent alors des franges d’interferences).
5.1.4 Concavite de l’entropie ; travail maximum ; transitions de phase
On considere le cas simple ou l’entropie S ne depend que de l’energie interne U (et pas duvolume V : systemes quasi incompressibles tels que des solides, des liquides...). Le but estd’illustrer sur des graphes le lien entre le second principe et les proprietes (admises ici)
de croissance monotone(
dSdU
=1T> 0
)et de concavite
(d2S
dU2= − 1
T 2
dTdU
≤ 0)
de S,
ainsi que quelques resultats classiques (travail maximum extrait, transitions de phase...)consequences directes de ces proprietes. Dans la suite on utilise les grandeurs massiques
u =U
met s =
S
m. (Remarque : pour des systemes compressibles et des transformations
a pression constante, par exemple la vaporisation d’un corps pur, il faudrait considererl’entropie comme fonction de la variable enthalpieH , qui est la seule variable dont dependalors S, et utiliser S′(H) = T−1.)
� Thermalisation et travail maximum
������������������������
IM1IM2
m1
m2=
R
M
s
s
s
u uI2
2
I
1 E
u
I
u1
1
M2
s(u)s
Figure 5
EXEMPLE. Sur la figure 5 les points Mi (i = 1, 2) de coordonnees (ui, si) corres-pondent aux etats d’equilibre initiaux de deux corps de massemi constitues d’un meme
142 5 • Fonctions d’une variable ; analyse des signaux
materiau, l’un (i = 1) chaud et l’autre (i = 2) froid. Ils se trouvent sur le graphe de lafonction s(u) caracteristique du materiau. Les energie et entropie massiques moyennes
du systeme des deux corps sont uI =m1u1 +m2u2
m1 +m2et sI =
m1s1 +m2s2m1 +m2
, coordonnees
du point I representatif de l’etat initial hors equilibre du systeme.Si le systeme est isole, la mise en contact thermique des corps conduit chacun d’euxdans le meme etat d’equilibre E sur s(u) tel que uE = uI (energie conservee, premierprincipe). L’augmentation d’entropie (sE > sI : second principe) est donc associee ala concavite de s(u).Si le systeme est en contact avec un systeme “mecanique” (Smeca = 0 ; cf. section
1.1.4), l’etat d’equilibre final F est sur la courbe s(u) a l’abcisse uF = uI +W
m1 +m2(premier principe ; W travail recu) avec sF ≥ sI (second principe). On voit sur la figureque le travail maximum que le systeme peut fournir est (−W )max = (m1+m2)(uI−uR),R etant le point de s(u) tel que sR = sI (evolution reversible). Si u = u0 + c(T − T0),
alorsduds
= T implique s = s0 + c lnT
T0, et pour m1 = m2 = m on obtient aussitot
TE =T1 + T2
2, TR =
√T1T2 et (−W )max = 2mc(TE − TR).
� Transition de phase
sL(u)
M2sS(u)
M1
axe
s
MA
B
I
(solide)
(liquide)S’
axe u
S(liquide surfondu)
Figure 6
EXEMPLE 1. La figure 6 montre les graphes (concaves et croissants) des entropiess
S(u) et s
L(u) des phases solide et liquide d’un meme corps, en supposant que
sL(u) > s
S(u) pour u grand (etat liquide stable a haute temperature) et s
S(u) > s
L(u)
pour u petit (etat solide stable a basse temperature). La reunion des parties stables desdeux graphes n’etant pas concave, elle ne peut representer la fonction s(u) du corps.Soit AB leur tangente commune de pente T−1
0 ou T0 est la temperature des phasessolide (en A) et liquide (en B). Si on part du point I representatif d’un melange (hors
equilibre) de solide dans l’etat M1 et de liquide dans l’etat M2 (M1I
M2I=m
L
mS
) tel que
5.1 Savoir-faire concernant les fonctions 143
uA < uI < uB, l’evolution spontanee vers l’equilibre se fait par transformation d’unephase dans l’autre : M1 se deplace donc sur s
S(u) et M2 sur s
L(u) en respectant pour I
(melange) les conditions u = constante et s maximum a l’equilibre ; ceci amene le pointI en M sur AB. La courbe representative de s(u) (arcM1A, segment AB, arc BM2) estappelee enveloppe concave des deux graphes. Le segmentAB correspond au domainede coexistence des deux phases (palier de fusion a T0), et L = uB−uA = T0(sB − sA)est la chaleur latente massique de fusion.Remarques. 1) Metastabilite. Experimentalement on observe le graphe de s
L(u) au
dela de B (existence de liquide surfondu tel que S). Si on introduit un germe, uneevolution irreversible amene S en S′ (uS = uS′ , sS′ > sS) ; l’etat final est soit dusolide (cas de la figure), soit un melange liquide-solide. 2) Des graphes de sS(u) etde s
L(u), on deduit les energies libres fS,L(T ) = u − Ts
S,L(u), intersections de la
tangente avec l’axe des u (cf. section 5.1.1) ; on voit sur la figure qu’a T fixe (s′(u)fixe) la phase stable est celle qui a la plus petite energie libre.
EXEMPLE 2. Paramagnetisme et ferromagnetisme. Pour un systeme deN moments magnetiques
alignes selon Oz et pouvant prendre les valeurs ±μ, le nombre d’etats microscopiques correspondant
a un taux d’aimantation x =N+−N−
N= M
Nμest Ω = N!
N+!N−!. En utilisant la formule de Stirling
lnN ! = N lnN −N , on a :
S(x) = kB ln Ω = −NkB(
1+x2
ln 1+x2
+ 1−x2
ln 1−x2
).
Le graphe de S(x) est represente sur la figure 7 : dSdx
= −NkB2
ln 1+x1−x est infini en x = ±1 et se com-
porte comme NkBx au voisinage de 0. Soit
U(x) = −N (μBx+ 1
2Kx2
)l’energie du systeme (figure 8) ; le terme −NμBx rend exactement compte des energies de couplage
∓μB de chaque moment ±μ avec un champ magnetique exterieur B selon Oz ; le second terme rend
compte des energies de couplage de chaque moment avec ses voisins, mais de facon approchee, les
moments individuels etant remplaces par des moments moyens (theorie de champ moyen ; cf. section
10.2.3). K > 0 correspond aux corps ferromagnetiques et K = 0 aux corps paramagnetiques.
−1 0 1 x
S(x)
Figure 7
�
U(x)
−1x
0M
1M
B = 0
B > 0
NK−2
Figure 8
L’observation des graphes de S(x) et de U(x) conduit aux graphes de S(U) (figures 9a pour le para-
magnetisme et 9b pour le ferromagnetisme). Dans le cas ferromagnetique et pour B = 0, on verifie que
lorsque U passe de la valeur −NK2
a 0, la temperature T = dUdx
(dSdx
)−1passe de 0 a Tc = K
kBet |x|
passe de 1 a 0 : il existe donc une aimantation spontanee pour T < Tc ; pour T > Tc il faut considerer
que x = 0 (cf. la limite B → 0 ci-dessous). Pour B > 0, la partie physiquement acceptable du graphe
144 5 • Fonctions d’une variable ; analyse des signaux
de S(U) correspond au passage de l’energie U de −NμB −N K2
(energie la plus basse, x = 1, T = 0,
point M0) a 0 (x = 0, T infini, point M∞) ; la partie en pointille ne l’est pas car pour U < 0 elle ne
maximise pas S, et pour U > 0 elle ne verifie pas a la fois dSdU
> 0 et d2SdU2 < 0.
Remarque : on retrouve ces resultats en representant les graphes de FT (x) = U(x)−TS(x) ; a T fixee
la phase stable est celle qui minimise FT (figure 10 pour B = 0).
�
SS
U 0 U
B>0
(b)(a)B=0
0−N B
Figure 9
TcT
TcT =
Tc
−1 1
U(x)−TS(x)
x
T = 0
T
Figure 10
Un calcul simple montre que l’egalite dUdx
= T dSdx
donne l’equation d’etat :
x = tanh(μBkBT
+ xTcT
)(kBTc = K) .
La courbe d’aimantation x(T,B = 0) (figure 11a) et les isothermes xT (B) (figure 11b) s’obtiennent
en etudiant les intersections de la droite y = x respectivement avec les courbes y = tanh xTcT
, dont la
pente a l’origine vaut TcT
(figure 12a), et avec les courbes y = tanh(μBkBT
+ xTcT
), qui se deduisent
les unes des autres par translation lorsque B varie (figure 12b). Un developpement limite pres de
x = 0 et B = 0 donne pour l’equation d’etat x(1 − Tc
T
)= μB
kBT− 1
3
(μBkBT
+ xTcT
)3+ · · · . Il permet
d’obtenir facilement les comportements critiques pres de T = Tc : x(T,B = 0) =√
3Tc−TTc
(T < Tc),
|xTc(B)| ∝ B
13 (isotherme critique),
dxT
dB
∣∣∣B=0
= μkB(T−Tc)
pour T > Tc, et μ2kB(Tc−T )
pour T < Tc
(temperature de Curie).
1
−1
(B)
(a) (b)
1(T,0)xT
T B
x
−1
Figure 11(b)
y
x
(a)
x
y
Figure 12
5.2 Operations sur les fonctions ; analyse de Dirac 145
5.2 OPERATIONS SUR LES FONCTIONS ; ANALYSE DE DIRAC
5.2.1 Operations sur les fonctions
Les principales operations sur les fonctions f(x), ou signaux f(t), sont les suivantes.
� La dilatation f(x) → [Dkf ](x) = f(xk
)k > 0
Comme f(xk
)prend la valeur f(x0) en x = kx0, cette operation se traduit par une
homothetie de rapport k du graphe de f suivant l’axe des x. Le signal f( tk
)varie plus
lentement que f(t) si k > 1 et plus vite si 0 < k < 1 (cf. cos ωt et cosω
kt ou figure 15).
Dans l’operation l’aire sous le graphe est multipliee par k.
� La parite f(x) → [Pf ](x) = f(−x) (P2 = I)
Les fonctions paires f(−x) = f(x) et impaires f(−x) = −f(x) sont fonctions propresde P associees aux valeurs propres 1 et -1. Toute fonction est la somme f = f+ + f−
de telles fonctions f±(x) =f(x) ± f(−x)
2. Une consequence importante est que tout
probleme physique lineaire possedant la symetrie x → −x admet une base de solutionsayant chacune une parite bien definie ; en effet si f est solution, Pf l’est aussi par raisonde symetrie, et donc f+ et f− aussi par linearite. Dans le cas non degenere une seule de cesfonctions est non nulle (cf. par exemple les fonctions propres de l’oscillateur quantique,section 4.4.3).
� La translation f(x) → [Taf ](x) = f(x− a)
Comme f(x − a) prend la valeur f(x0) en x0 + a cette operation se traduit par unetranslation a du graphe de f selon x. Le signal f(t − τ) a un retard (algebrique) de τpar rapport a f(t) (cf. figure 15).
� La periodisation f(x) → fper(x) =∞∑
n=−∞f(x− na)
REMARQUE : toute fonction periodique de periode a, c.a.d. pour laquelle Ta est laplus petite translation la laissant invariante, peut s’ecrire comme la periodisee fper(x)d’une fonction f(x). Par exemple pour f(x) on peut prendre toute restriction de la fonc-tion periodique a un intervalle [x0, x0+a[ ; mais il existe une infinite d’autres decompositions,car rien n’interdit que les supports des fonctions f(x − na) se recouvrent (penser a uncircuit RC soumis a une suite periodique de creneaux et aux reponses a chaque creneau).
� L’echantillonnage f(x) → fech(x) = a
∞∑n=−∞
f(na) δ(x− na)
Cette operation etudiee a la section 5.3.2. revient a limiter la connaissance de f au sousensemble denombrable des points xn = na. On verra que dans cette “discretisation”l’information sur f peut cependant ne pas etre perdue.
146 5 • Fonctions d’une variable ; analyse des signaux
� Le produit avec une fonction g f(x) → f(x) g(x)
EXEMPLES : la restriction d’une fonction a un intervalle[x0 − a
2, x0 +
a
2
]qui corres-
pond a la multiplication par Π(x− x0
a
)ou Π(x) est la fonction porte (figure 13),
ou encore la multiplication de f(t) par cosω0t qui intervient dans l’operation de mo-dulation d’amplitude f(t) → a
(1 +mf(t)
)cosω0t. A deux dimensions, la diffraction
par une ouverture de coefficient de transmission t(x, y) dans le plan z = 0 corresponda la multiplication de l’onde incidente dans ce plan par t(x, y).
��������������������
�
1/2−1/2
(x)
x0
1
Figure 13
����������������
����������������
������������������������
������������������������
��
�
1/2−1/2
(x) (a−x)
(x)
1
1
x
x−1 1a
0
0
Figure 14
� La convolution avec une fonction g f(x) → [g ∗ f]
(x) =∫ ∞
−∞f(y) g(x− y) dy
Le produit de convolution est commutatif f ∗g = g ∗f et associatif f ∗ (g ∗h) = (f ∗g)∗h.Pour le translater ou le deriver il suffit de translater ou deriver un terme du produit.On verra qu’en physique le filtrage se traduit par la convolution (cf. section 5.2.4.). Unexemple est la moyennisation de f sur un intervalle de largeur a :
f(x) → fmoyennee(x) =1a
∫ x+a/2
x−a/2f(y) dy =
1a
∫ +∞
−∞f(y)Π
(x− y
a
)dy .
De facon generale la convolution avec Π(x) a un effet de lissage sur les fonctions et etaleleur support. Ainsi alors que Π est discontinue la fonction “triangle ” Λ = Π∗Π = Π∗2
est continue (figure 14), Π∗3 est partout une fois derivable... et on verra au chapitre 10
que(√
N Π(√N x
))∗Ntend vers une gaussienne lorsque N →∞. En plus de Π ∗Π = Λ
d’autres exemples classiques (en optique, probabilites...) sont La ∗ Lb = La+b (La(x) =a
π
1a2 + x2
fonction lorentzienne) et
Ga ∗Gb = G√a2+b2
(Ga(x) =
1√2πa2
e−x2
2a2 fonction gaussienne).
5.2 Operations sur les fonctions ; analyse de Dirac 147
REMARQUE. Pour des signaux nuls pour t < 0 (cf. electronique) la convolution s’ecrit :[g ∗ f]
(t) =∫ t
0
f(s) g(t− s) ds .
� La correlation avec une fonction g f(x) → Γf,g(a) =∫ ∞
−∞f(x) g(x − a) dx =
(Tag, f)
La fonction de correlation Γf,g verifie :
Γf,g(a) = Γg,f (−a) et |Γf,g(a)| ≤√
Γf,f (0) Γg,g(0) (inegalite de Schwarz) .
Si f = g, Γf,f (a) notee Γf (a) est maximum en 0. Si f et g sont des signaux periodiquesou stationnaires, l’integrale de −∞ a ∞ (non definie) est remplacee par une moyennetemporelle (cf. section 5.3.3.).
REMARQUE : Γf,g(a) est une mesure du “recouvrement” (des graphes) des fonctions f et Tag. Cette
notion se retrouve dans differentes methodes d’analyse des signaux. Par exemple dans l’analyse de
Dirac (cf. section 5.2.3), les valeurs f(t0) mesurent les recouvrements du signal f(t) avec les “fonctions
piquees” δ(t − t0) (correlation de f avec δ), dans l’analyse de Fourier les coefficients f(ν) mesurent
ceux avec les fonctions ei2πνt de frequence ν. Dans une analyse “temps-frequence” on considere les
recouvrements avec des fonctions ϕ(t − t0) ei2πνt (par exemple ϕ fonction porte) et dans l’analyse en
ondelettes (“temps-echelle”) ceux avec les ondelettes ϕ(ν(t − t0)) (ϕ fonction d’integrale nulle ; figure
15).
� �
t0 t 0
(t ) (2(t− t )0 )
Figure 15
� Linearite et stationnarite des operations
Considerees comme des systemes entree-sortie (cf. section 2.4.2), toutes ces operationssont lineaires (sauf f → Γf et la modulation d’amplitude). Parmi elles la translation,la periodisation et la convolution sont stationnaires (invariantes par translation). Onrencontre aussi en physique de nombreuses operations non lineaires qui peuvent etrestationnaires (detection quadratique f → f2, “redressement” f → |f |, decalage de zerof → f+constante, quantification...) ou non (modulations d’amplitude et de frequence...).
5.2.2 Impulsion de Dirac (« fonction delta ») ; exemples mecaniques
La fonction δ(x) (ou δ(r) = δ(x) δ(y) δ(z) a trois dimensions) ou l’impulsion δ(t) ont unesignification physique intuitive. Elles servent a decrire des grandeurs localisees surl’axe x en x = 0 (ou dans l’espace : charge electrique ou source lumineuse ponctuelles
148 5 • Fonctions d’une variable ; analyse des signaux
situees a l’origine), ou localisees dans le temps (signal bref a t = 0). La representationde toute fonction comme “somme continue” de fonctions delta (analyse de Dirac) estimplicite dans de nombreux domaines de la physique.
� Definitions
Pratiquement δ(x) est la limite (au sens indique ci-dessous)
δ(x) = limε→0
1|ε| g
( x
|ε|)
avec∫ ∞
−∞g(x) dx = 1
pour toute fonction g(x) (d’integrale egale a 1), par exemple Π(x) (figure 16), Λ(x),sinc(πx), gaussienne, lorentzienne, etc. Dans les calculs concrets cette limite intervienttoujours dans des integrales avec des “braves” fonctions ϕ(x), par exemple :∫ ∞
−∞
1|ε| g
(x− a
|ε|)ϕ(x) dx =
∫ ∞
−∞g(y)ϕ(a+ εy) dy → ϕ(a) .
Tout se passe comme si δ(x− a) (d’aire egale a 1) avait pour support le point x = a.
REMARQUE : pour representer le graphe de C δ(x−a), on dessine soit une fonction trespiquee en x = a dont on precise l’aire C, soit une fleche verticale proportionnelle a C.La fonction “cha” �� (x) =
∑∞n=−∞ δ(x− n) (periodisee de δ(x) de periode 1) s’appelle
“peigne” de Dirac.
O
1
1 1
primitive
x
Π
ε
ε εεx
Figure 16
� Proprietes ; derivees de fonctions discontinues
On deduit de la definition et de la “localisation” en a de δ(x− a) :∫ ∞
−∞δ(x) dx = 1 ; δ
(xk
)= |k|δ(x) donc δ(x) paire ; f(x) δ(x−a) = f(a) δ(x−a) .
Comme de plus∫ x
−∞
1|ε| g
( y
|ε|)
dy tend vers la fonction de Heaviside (ou echelon),
H(x) = 0 si x < 0 et H(x) = 1 si x > 0 (figure 16), on a aussi :
δ(x) =ddxH(x) .
5.2 Operations sur les fonctions ; analyse de Dirac 149
Plus generalement, au sens des distributions, on peut deriver une fonction f(x) ayant unediscontinuite en a (c.a.d. la limite d’une fonction a variation arbitrairement rapide entrea− et a+) et derivable ailleurs : on ajoute a la derivee habituelle l’impulsion
(f(a+) −
f(a−))δ(x− a) (dont l’integrale entre a− et a+ donne la discontinuite). On notera enfin
que∫ ∞−∞ δ(x) dx = 1 entraıne que la dimension de δ(x) est [x]−1.
� Applications mecaniques ; forces et percussions
Intuitivement un mouvement de vitesse continument variable v(t) peut etre approchepar un mouvement dont la vitesse vp(t) est constante par paliers, avec des sauts Δvnaux instants tn (figure 17). La force correspondante ne peut evidemment pas etre nulle.
En fait Fp(t) = mdvpdt
=∑n
mΔvn δ(t − tn) est une suite d’impulsions mecaniques
(percussions representees par des fleches sur la figure).
t
pv (t)
Figure 17
Inversement pour resoudre de facon approchee l’equation differentielle mdvdt
= F (t), on
peut remplacer F (t) par son echantillonnee Fech(t) = T∑n F (nT ) δ(t−nT ). On obtient
alors, en integrant entre les instants nT − ε et nT + ε, la discretisation mvn − vn−1
T=
F (nT ) de l’equation de depart (vn = v(nT + ε)).
Les exemples ci-dessus permettent de comprendre comment resoudre les equations
v +v
τ= δ(t) (1) et x+ 2λx+ ω2
0x = δ(t) (2) (λ < ω0)
avec conditions initiales nulles a t = −∞ (particule en milieu visqueux et oscillateuramorti au repos soumis a une percussion a t = 0). Comme δ(t) = 0 pour t �= 0, on a v(t)ou x(t) = 0 pour t < 0, et a priori v(t) = Ae−
tτ ou x(t) = Ae−λt cos (ωt+ ϕ) (avec ω =√
ω20 − λ2) pour t > 0. L’effet de δ(t) etant simplement une variation brutale de vitesse
de 1 a t = 0, on a v(0+) = x(0+) = 1, d’ou les solutions (reponse impulsionnelle) :
R(t) = H(t) e−tτ (1) ; R(t) = H(t)
sinωtω
e−λt (2) .
REMARQUE : le saut de vitesse etant fini il ne peut y avoir de deplacement instantanea t = 0 induit par δ(t).
150 5 • Fonctions d’une variable ; analyse des signaux
5.2.3 Analyse de Dirac ; reponse impulsionnelle ; convolution ; filtrage
La formule (consequence immediate des proprietes de δ)
f(x) =∫ ∞
−∞f(a) δ(x− a) da = [f ∗ δ](x) ,
montre, d’une part que δ(x) est l’unite de la convolution, et d’autre part que toutefonction f(x) peut s’interpreter comme somme “continue” d’impulsions f(a) δ(x − a),contribution a f(x) de chaque point a de son support. Cette decomposition de f(x) surla base des fonctions δ(x − a), limite continue de l’echantillonnage, constitue l’analysede Dirac de f(x).
� Reponse impulsionnelle ; convolution
Considerons une operation lineaire et stationnaire et soit R(x) (reponse impulsionnelle)le resultat de cette operation sur δ(x). La stationnarite et la linearite entraınent qu’a lafonction (de x) f(a)δ(x − a) correspond le resultat f(a)R(x − a) et, en sommant sur a,que l’operation sur f(x) s’ecrit sous la forme d’une convolution :
f(x) →∫ ∞
−∞f(a)R(x− a) da = [R ∗ f ](x) .
EXEMPLE 1. Circuit RC. Soit e(t) (“entree”) la tension aux bornes du generateuret s(t) (“sortie”) celle aux bornes de C. On deduit des formules (1) ci-dessus
τ s+ s = e =⇒ s(t) =∫ t
−∞
1τe−
t−t′τ e(t′) dt′ ,
ou τ = RC et R(t) = H(t)1τe−
tτ . Si τ est grand devant le temps caracteristique
de variation de e(t), alors s(t) �∫ t
−∞
1τe(t′) dt′ (circuit integrateur). Si τ est petit
l’exponentielle est concentree autour de t′ = t et s(t) � e(t) ; en prenant alors commesortie la tension sR aux bornes de la resistance, on obtient sR(t) = τ s(t) � τ e(t)(circuit derivateur).
EXEMPLE 2. Principe d’Huygens Fresnel. Si f(x, y, 0) est l’amplitude complexed’une onde en tout pointm du plan z = 0 (a la sortie d’un ecran), la formule d’Huygens-Fresnel (cf. section 2.5.2) dit qu’en tout M du plan z (pres de l’axe) :
f(X,Y, z) =1iλz
ei2πzλ
∫ ∫f(x, y, 0) eiπ
(X−x)2+(Y −y)2
zλ dxdy .
La propagation de z = 0 a z > 0 se traduit donc par une operation de convolution (adeux dimensions) dont la reponse impulsionnelle est l’onde spherique
Rz(x, y) =1iλz
ei2πλ
(z+ x2+y2
2z
)� 1iλr
ei2πλ r
emise par une source ponctuelle en O (r =√x2 + y2 + z2).
5.3 Transformation de Fourier ; analyse de Fourier 151
EXEMPLE 3. Electrostatique. La relation entre une distribution volumique de charges ρ(�r) et le
potentiel qu’elle cree V (�r) est elle aussi donnee par un produit de convolution (a trois dimensions)
V (�r) = 14πε0
∫∫∫ ρ(�r0)|�r−�r0| d3r0
dont la reponse impulsionnelle 14πε0r
est le potentiel cree par une charge ponctuelle unite en O.
EXEMPLE 4. Optique incoherente. La repartition d’intensite, dans le plan (x′, y′), de l’image d’un
objet incoherent dans le plan (x, y) s’ecrit I′(x′, y′) =∫∫
R(x′−γx, y′−γy) I(x, y) dx dy, ou R(x′, y′)est l’intensite de la tache de diffraction associee a une source ponctuelle δ(x)δ(y) sur l’axe optique ; γ
est le grandissement.
EXEMPLE 5. Signaux numeriques (cf. section 2.4.2). Le signal {Rn} joue le role de la reponseimpulsionnelle.
� Filtrage
La convolution appliquee a une exponentielle imaginaire donne (calcul deja vu a la sec-tion 2.4.2) :
R∗Aei2πνt =∫ ∞
−∞R(t− t′)Aei2πνt′ dt′ = R(ν)Aei2πνt (R(ν) =
∫ ∞
−∞e−i2πνtR(t) dt) .
Elle a donc pour effet de modifier le module et la phase de l’amplitude complexe dusignal de frequence ν. Ce resultat est tres important quand on sait que tout signal peuts’ecrire comme une somme d’exponentielles complexes (analyse de Fourier ; cf. section5.3.1). La linearite entraıne :
f(t) =∫ ∞
−∞f(ν) ei2πνt dν −→ [R ∗ f ](t) =
∫ ∞
−∞f(ν) R(ν) ei2πνt dν .
L’operation de convolution revient a multiplier chaque composante de Fourier f(ν) dusignal par R(ν), fonction de transfert de l’operation de filtrage. Suivant que |R(ν)| estgrand surtout pour ν petit, pour ν grand, ou pour ν dans un intervalle, on a affaire a unfiltre passe bas, passe haut, ou passe bande. Si R(ν) = eiϕ(ν) on parle de filtre de phase ;R(ν) = e−i2πντ pour une ligne a retard f(t) → f(t− τ) car : ei2πνt → ei2πν(t−τ).
REMARQUE. Il est important de noter qu’en physique on a souvent un acces plus directa la fonction de transfert R(ν) qu’a la reponse impulsionnelle R(t). Par exemple pour un
circuit RC, R(ν) =∫ ∞
−∞e−i2πνtH(t)
1τe−
tτ dt = (1 + i2πντ)−1 n’est rien d’autre que
le coefficient de ei2πνt dans la solution stationnaire de τ s+ s = ei2πνt (cf. section 2.4.2).R(ν) correspond a un filtre passe bas du premier ordre, integrateur si 2πντ = ωτ � 1.
5.3 TRANSFORMATION DE FOURIER ; ANALYSE DE FOURIER
L’analyse de Fourier s’identifie en physique a la ”volonte” de decomposer les fonctionssur la base, discrete ou continue, constituee par les exponentielles imaginaires, fonctionscaracterisees par une frequence “pure”. Comme on l’a vu ci-dessus elle est bien adapteea la physique lineaire et stationnaire et a la notion de filtrage. Historiquement introduitepour les fonctions periodiques a propos de l’etude de l’equation de la chaleur (Fourier1822), elle s’applique a une classe tres large de fonctions, aux distributions (donc a δ), etsert aussi a distinguer les signaux stationnaires chaotiques des signaux quasi-periodiques(cf. section 5.3.3). Les formules seront ecrites pour des signaux f(t) de transformee deFourier (T.F.) f(ν).
152 5 • Fonctions d’une variable ; analyse des signaux
5.3.1 Decomposition de Fourier ; spectre d’un signal ;formule de Poisson
� Formules de base et justifications
f(t) =∫ ∞
−∞f(ν) ei2πνt dν avec f(ν) =
∫ ∞
−∞f(t) e−i2πνt dt .
fper(t) =∞∑
n=−∞fn e
i2π nTt avec fn =
1T
∫ t0+T2
t0−T2
fper(t) e−i2πnTt dt def= < fper(t) e−i2π
nTt > .
La premiere formule est une consequence directe de la decomposition de Fourier dela fonction de Dirac :
δ(t) =∫ ∞
−∞ei2πνt dν .
JUSTIFICATION. La derniere egalite s’obtient en considerant la limite ε→ 0 d’expressions telles que :∫ 1/2ε
−1/2ε
ei2πνt
dν =1
ε
sinπt/ε
πt/εou
∫ ∞
−∞e−2πε|ν|
ei2πνt
dν =ε
π(t2 + ε2)
(cf.definition de δ(t) a la section 5.2.2). Comme f = f ∗ δ, on en deduit :
f(t) =∫f(t′)
[∫ei2πν(t−t
′) dν]
dt′ =∫f(ν) ei2πνt dν .
REMARQUES : 1) La correspondance f(t)⇐⇒f(ν) est biunivoque ; le passage de f(ν)a f(t) s’appelle la T.F. inverse. 2) La dimension de f est [f ] = [f ][t].
La seconde formule concerne seulement les fonctions periodiques. L’expression donnantles coefficients de la serie de Fourier fn (moyenne temporelle sur une periode T ), decouledes relations < ei2π
pT t e−i2π
qT t >= 0 si p �= q et 1 si p = q (en particulier f0 est la valeur
moyenne < f(t) >). Une formule equivalente, dite formule de Poisson, est :
fper(t) =∞∑
n=−∞f(t− nT ) =
1T
∞∑n=−∞
f( nT
)ei2π
nT t .
JUSTIFICATION. Cette formule est une consequence directe de la relation facile a verifier
fper(t) = f ∗ ∑∞n=−∞ δ(t − nT ) ,
et de la decomposition de Fourier du peigne de Dirac :∑∞n=−∞ δ(t − nT ) = 1
T
∑∞n=−∞ ei2π
nTt .
Cette derniere s’obtient en considerant la limite ε → 0 de∑∞n=−∞ e−ε|n| einϕ, ou la limite N → ∞ de∑N
n=−N einϕ (cf. figures 27 et 28 du chapitre 2).
REMARQUE. Dans la limite T → ∞, la formule de Poisson redonne f(t) =∫ ∞−∞ f(ν) ei2πνt dν : le
membre de gauche devient f(t) (les f(t− nT ), n �= 0, “partant a l’infini”), et la somme de Riemann du
second membre se transforme en integrale.
5.3 Transformation de Fourier ; analyse de Fourier 153
� Spectre d’un signalC’est l’ensemble des frequences ν impliquees dans la decomposition de Fourier du signal.Le spectre peut etre continu (cf. exemples ci-dessous) ou discret (par exemple le signalf(t) = ei2πν0t obtenu pour f(ν) = δ(ν − ν0)). Dans le premier cas il existe en general unlien entre les proprietes de regularite de f(ν) et la decroissance plus ou moins rapide def(t) lorsque t→ ±∞ (et reciproquement ; cf. section 5.3.2. “derivation”).Les fonctions periodiques ont un spectre discret dont les frequences
n
T(harmoniques
d’ordre n) sont multiples de la frequence fondamentale1T
. Cette frequence peut ne pas
apparaitre, par exemple fper(t) = cos 3t + cos 5t de periode 2π ne contient que les har-moniques ±3 et ±5). Remarque : traditionnellement on utilise plutot la decompositionqui fait intervenir les coefficients de Fourier que la formule de Poisson. Cependant cettederniere est non seulement tres utile, puisqu’on obtient en une seule fois tous les fn apartir de f(ν), mais aussi plus riche de sens physique : elle montre que periodiser une
fonction f a la periode T equivaut a echantillonner sa T.F. a la periode1T
c.a.d. consiste
a ne retenir dans son spectre que les frequences νn =n
T.
� Fonctions reellesSi f(t) est reelle f(−ν) = f(ν) ou f−n = fn : toute l’information concernant le si-gnal est contenue dans la partie ν ≥ 0 du spectre. On prefere alors souvent ecrire lesdeveloppements a l’aide de fonctions reelles. Par exemple
fper(t) = a0 +∑n≥1
(an cos 2π
n
Tt+ bn sin 2π
n
Tt),
avec a0 =< fper(t) >= f0, an = 2 < fper(t) cos 2π nT t > et bn = 2 < fper(t) sin 2π nT t >,donc 2fn = an − ibn pour n ≥ 1 ; bn = 0 si fper est paire et an = 0 si fper est impaire.
� Exemples de T.F.Parmi les exemples courants facilement calculables, citons la fonction porte de largeur
τ centree Π(t
τ
)TF=⇒ τ sincπτν et ν0 sincπν0t
TF−1⇐= Π(ν
ν0
)(fonction de transfert
d’un filtre passe bas ideal) ; δ(t) TF=⇒ 1 (donc dans la fonction δ toutes les frequencesapparaissent avec le meme poids), et 1 TF=⇒ δ(ν), qui sont des limites des cas precedents ;
exp(−|t|τ
)TF=⇒ 2τ
1 + (2πτν)2; H(t) e−
tτ
TF=⇒ τ
1 + i2πτν(filtre passe bas du premier
ordre). Un autre exemple important dans la pratique est celui de la fonction gaussienne
exp(−πt2) TF=⇒ exp
(−πν2), et aussi en optique
1√iexp(iπx2) TF=⇒ exp(−iπσ2).
� Exemple de fonction periodique (figure 18)
Les coefficients fn de la fonction creneaux s’obtiennent en prenant la moyenne sur[−T
2,T
2
]: fn =
1T
∫ τ2
− τ2
Ae−i2πnT t dt. On en deduit le developpement :
A
∞∑n=−∞
Π(t− nT
τ
)= A
τ
T
∞∑n=−∞
ei2πnT t sincπτ
n
T.
154 5 • Fonctions d’une variable ; analyse des signaux
�
t0
A
TFigure 18 Figure 19
On verifie sur cet exemple que fn =1Tf
( nT
)ou f(t) = AΠ
(t
τ
)(formule de Poisson).
Dans la limite τ → 0, A → ∞ avec Aτ = 1, on retrouve la relation∞∑
n=−∞δ(t − nT ) =
1T
∞∑n=−∞
ei2πnT t. Pour τ =
T
2, on remarque que les frequences ν2p =
2pT
(p �= 0) dispa-
raissent et que pour t =T
4la serie vaut
A
2, c.a.d. prend la valeur moyenne des deux va-
leurs situees de part et d’autre de la discontinuite. Ce dernier resultat est general dans lesdeveloppements de fonctions discontinues ; il s’accompagne au niveau numerique, quandon tronque la serie, de grandes oscillations pres de la discontinuite (phenomene deGibbs) ; la figure 19 correspond aux 15 premiers termes pour la fonction creneaux.
5.3.2 Proprietes : dualite temps frequence
En choisissant bien une des expressions donnant f(t) ou f(ν), on deduit en general sanscalcul les proprietes suivantes.
- Linearite : λf + μgTF=⇒ λf + μg .
- Aires : f(0) =∫ ∞
−∞f(t) dt ; f(0) =
∫ ∞
−∞f(ν) dν .
- Realite : f(t) reelle ⇐⇒ f(−ν) = f(ν) .
- Dilatation : f(t
k
)TF=⇒ k f(kν) .
Donc plus une fonction varie vite (resp. lentement), plus les hautes (resp. basses) frequencesdoivent etre presentes dans son spectre. Pour k → 0 (resp. k →∞) on retrouve δ(t) TF=⇒ 1(resp. 1 TF=⇒ δ(ν)). Cette dualite entre les echelles de temps et de frequence peut setraduire qualitativement par ΔtΔω � 1, formule analogue aux relations de HeisenbergΔtΔE � � ou ΔxΔpx � � en mecanique quantique.
- Parite : f(−t) TF=⇒ f(−ν) .Donc si f reelle est paire (resp. impaire), f est reelle paire (resp. imaginaire pure etimpaire).
5.3 Transformation de Fourier ; analyse de Fourier 155
- Translation et multiplication par une exponentielle :
f(t− τ) TF=⇒ e−2iπτν f(ν) et e2iπν0t f(t) TF=⇒ f(ν − ν0) .
Si l’instant d’emission d’un signal est decale dans le temps, ceci ne se traduit donc quepar un facteur de phase au niveau de sa T.F. La modulation d’amplitude
x(t) → f(t) = A(1 +mx(t)
)cos 2πν0t
a pour but de transferer le spectre basse frequence de x(t) (|ν| ∈ [0, B]) dans celui dehaute frequence de f(t) (|ν| ∈ [ν0 − B, ν0 + B]) qui permet les telecommunications.Apres transmission on peut demoduler par une operation de detection synchronef(t) → f(t) cos 2πν0t (spectre |ν| ∈ [0, B] et |ν| ∈ [2ν0 − B, 2ν0 + B] car cos2 2πν0t =12
(1 + cos 4πν0t)), suivie d’un filtrage passe-bas qui redonne x(t).
- Derivation et multiplication par une puissance :
dnf(t)dtn
TF=⇒ (i2πν)n f(ν) ; (−2iπt)n f(t) TF=⇒ dnf(ν)dνn
.
Si un signal a une discontinuite finie en t0, sa derivee contient un δ(t − t0) et f(ν) secomporte comme |ν|−1 a l’infini (cf. fonction porte) ; un comportement en |ν|−2 traduit
une discontinuite de f ′ (cf. exp(−|t|τ
))... : plus f est reguliere plus f decroıt vite a
l’infini (et reciproquement).
- Convolution et produit :
[f ∗ g] (t) TF=⇒ f(ν) g(ν) ; f(t) g(t) TF=⇒[f ∗ g
](ν) .
La premiere relation se demontre en ecrivant :
[f ∗ g] (t) =∫ ∞
−∞f(t′)
[∫ ∞
−∞g(ν) ei2πν(t−t
′) dν]dt′ =
∫ ∞
−∞f(ν) g(ν) ei2πνt dν .
Sa traduction en termes de filtrage a deja ete vue a la section 5.2.3. Pour la seconde on
verifie[f ∗ g
](ν) =
∫ ∞−∞ f(ν′)
[∫ ∞−∞ g(t) e−i2π(ν−ν′)t dt
]dν′ =
∫ ∞−∞ f(t) g(t)
e−i2πνt dt. Si g(t) = Π(t
T
)(troncature de f(t)), la convolution de f(ν) par g(ν) =
T sincπνT conduit a un elargissement du spectre de f .
- Causalite : l’idee de causalite (“l’effet ne precede pas la cause”) se traduit sur la reponse impulsionnelle
par R(t) = 0 pour t < 0, soit
R(t) = Θ(t)R(t) avec Θ(t) = 1 pour t > 0 et − 1 pour t < 0, ou R(ν) = [Θ ∗ R](ν) .
Comme Θ(t) est reelle impaire, Θ(ν) est imaginaire pure ; ceci entraıne l’existence de relations (Kramers-
Kronig) entre les parties reelle et imaginaire de la fonction de transfert R(ν). Un exemple est donne
par la reponse �P (t), polarisation dielectrique d’un milieu non parfait, a un champ electrique �E(t) et la
fonction de transfert associee ε(ω)− ε0 ; la permittivite complexe ε(ω) etant reliee a l’indice complexe
par ε(ω) = n2(ω) ε0, tout milieu dispersif (�e ε(ω) fonction dependant de ω) est en general aussi dissipatif
(mε(ω) �= 0), c.a.d. le siege de pertes d’energie.
156 5 • Fonctions d’une variable ; analyse des signaux
REMARQUES. 1) Un filtre passe bas ideal (R(t) = ν0 sincπν0t) n’est pas causal. 2) Techniquement
Θ(ν) est la limite pour ε → 0 de∫ ∞−∞ Θ(t) e−ε|t| e−i2πνt dt = 4πν
i(ε2+4π2ν2)(regularisation de 1
iπνpres
de ν = 0).
- Autocorrelation, densite spectrale d’energie. Un calcul semblable a celui fait pourla convolution conduit a la decomposition spectrale d’une fonction de correlation
Γf (τ) =∫ ∞
−∞f(t) f(t+ τ) dt =
∫ ∞
−∞|f(ν)|2 ei2πντdν ,
qui pour τ = 0 donne la formule de Parseval :∫ ∞
−∞|f(t)|2 dt =
∫ ∞
−∞|f(ν)|2 dν (= 2
∫ ∞
0
|f(ν)|2 dν pour f reelle) .
Par exemple l’energie E =∫ ∞−∞ |f(t)|2 dt contenue dans un signal lumineux est la somme
des contributions de chaque frequence : composantes violette, bleue...rouge de son spectreobtenu avec un prisme. La densite spectrale d’energie d’un signal reel E(ν) = 2|f(ν)|2est donc reliee a la T.F. de Γf . Ce resultat est l’equivalent pour les signaux d’energiefinie du theoreme de Wiener-Khintchine pour les signaux stationnaires (cf. sections5.3.3 et 10.3.3).
- Periodisation et echantillonnage. On a deja vu (formule de Poisson) que periodiserf(t) conduit a echantillonner f(ν) ; inversement echantillonner f(t) conduit a periodiserf(ν) :
fech(t) = T
∞∑n=−∞
f(nT ) δ(t− nT ) TF=⇒ fech(ν) =∞∑
n=−∞f
(ν − n
T
).
Cette relation se demontre en remarquant que fech(t) s’ecrit aussi fech(t) = T∑
n f(t)δ(t − nT ) = f(t)
∑n e
i2π nT t. Application : si f(t) a son spectre contenu dans [−B,B],
et si l’echantillonnage est assez serre (T <1
2Bcondition de Shannon), les graphes
des fonctions f(ν − n
T
)ne se recouvrent pas (figure 20). On peut alors reconstruire f(t)
a partir de fech(t) en effectuant une operation de filtrage dont la fonction de transfertR(ν) vaut 1 sur le support de f(ν) et 0 sur ceux des fonctions f(
(ν − n
T
)(n �= 0). On
en deduit :
f(t) = T∞∑
n=−∞R(t− nT ) f(nT ) ;
par exemple pour R(ν) = Π( νB
)on a R(t) = 2B sinc2πBt, mais en resserrant l’echantil-
lonnage et en prenant R(ν) plus reguliere, on peut assurer une convergence plus rapidede la somme sur n.
5.3 Transformation de Fourier ; analyse de Fourier 157
ech (t)f1T
�
�
−
t
1/T0
per )(
BB
fqf
0 T 2T 3T 4T 5T 6T
nf
Figure 20
REMARQUE. Le facteur T dans l’expression de fech(t) est necessaire pour que fech soitdimensionnellement homogene a f et pour que fech(t) et fech(ν) redonnent f(t) et f(ν)dans la limite “continue” T → 0.
- Transformee de Fourier discrete (T.F.D). Le traitement des signaux par les calculateurs necessite
le passage de l’analogique (signaux continus) au numerique (signaux discretises). La T.F.D. (et son
inverse) relie N echantillons fq representatifs de f(ν) a N echantillons fn = f(nT ) representatifs de f(t)
par :fq = 1
N
∑N−1n=0 fn e
−i2π nNq ; fn =
∑N−1q=0 fq e
i2π qNn .
Pour verifier que les fq ainsi definis conviennent, on ecrit fech(ν) = T∑∞n=−∞ f(nT ) e−i2πνnT (calcul
direct de la T.F. de fech(t)). Si f(t) est convenablement centree et negligeable en dehors de [0, NT [, la
fonction fN−ech(ν) = T∑N−1n=0 fn e−i2πνnT est proche de fech(ν). Si de plus l’echantillonnage de f est
assez serre, les valeurs de fech(ν) pour ν ∈ [0, 1T
]sont egales (modulo un rearrangement) a celles de f(ν)
pour ν ∈ [− 12T, 12T
](figure 20). L’ensemble des valeurs fN−ech
( qNT
)= T
∑N−1n=0 fn e
−i2π qNn = NT fq
(q = 0, 1, · · · , N − 1) est donc bien representatif de f(ν). L’interet numerique de la T.F.D. est que
pour N = 2p il existe un algorithme (T.F. rapide ou F.F.T. en anglais) qui ramene les N2 (en gros)
operations necessaires au calcul des fq a seulement N2
(p − 1). Un autre interet est l’existence, pour
chaque propriete de dualite ecrite ci-dessus pour f(t) et f(ν), d’une propriete analogue pour les suites
de nombres fn et fq (cf. ouvrages specialises).
5.3.3 Transformee de Laplace
Elle est donnee, pour les signaux definis sur [0,∞], par
f(t) → F (p) =∫ ∞
0
e−pt f(t) dt ,
et verifie les proprietes (faciles a etablir) :
δ(t) → 1, e−at → (p+ a)−1, cosωt→ p (p2 + ω2)−1, sinωt→ ω (p2 + ω2)−1 ,
ddtf(t) → pF (p)− f(0),
d2
dt2f(t) → p2 F (p)− df
dt(0) − p f(0) ,
158 5 • Fonctions d’une variable ; analyse des signaux
[f ∗ g](t) =
∫ t
0
f(s) g(t− s) ds→ F (p)G(p), e−λtf(t) → F (p+ λ) (�eλ ≥ 0) .
Elle a l’interet de prendre en compte les C.I. pour la resolution des E.D. ; par exemplede x + ω2 x = f(t) =⇒ X(p) = (p2 + ω2)−1
(F (p) + x(0) + px(0)
), on deduit x(t) =
x(0) cosωt+ x(0)sinωtω
+∫ t
0
sinω(t− s)ω
f(s) ds (cf. aussi section 6.2.1).
5.3.4 Signaux stationnaires ; signaux chaotiques ; langage probabiliste
� Signaux stationnaires ; detection synchrone
Ce sont, idealement, des signaux pour lesquels toutes les moyennes temporelles
< · · · >= limT→∞
1T
∫ t0+T2
t0−T2
( · · · ) dt
ont un sens (independant de t0), par exemple pour un signal reel les moments < (f(t))n >ou la fonction de correlation Γ(τ) =< f(t) f(t+ τ) >. De tels signaux ont une energie Einfinie mais une “puissance moyenne” Γ(0) finie. Parmi eux il y a les signaux periodiquesmais aussi plus generalement les signaux quasi-periodiques qui, par definition, ont unspectre discret sur lequel est concentree leur puissance :
fq−per(t) = A0 +∑νn>0
An cos(2πνnt+ ϕn) ; Γ(τ) = A20 +
∑n
A2n
2cos 2πνnτ .
Le signal est periodique si les frequences sont commensurables, par exemple cos 2t +cos(3, 14 t) mais pas cos 2t + cosπt qui est quasi-periodique ; cet exemple montre qu’iln’est pas toujours facile de distinguer pratiquement ces deux types de signaux.
Pour analyser un signal stationnaire f(t), on peut le multiplier par une fonction si-nusoıdale et effectuer la moyenne temporelle du produit ; on detecte ainsi la presence dela frequence correspondante dans le spectre de f(t) (methode de detection synchrone) :si fν0 =< f(t) e−i2πν0t > �= 0 on a f(t) = fν0 e
i2πν0t + g(t) avec < g(t) e−i2πν0t >= 0.On peut (en principe) en explorant ainsi toutes les frequences extraire la partie quasi-periodique d’un signal.
� Signaux chaotiques reels
Ces signaux apparaissent dans tous les domaines de la physique (fluctuations microsco-piques, emission de la lumiere par les atomes, telecommunications...). Tantot ils jouentun role fondamental dans la connaissance des phenomenes (mouvement brownien, lar-geur de raie...), tantot ils interviennent comme un “bruit” et on cherche a les eliminer(telecommunications...). Du point de vue de l’analyse de Fourier ce sont les signauxtels que < f(t) e−i2πνt >= 0 quel que soit ν : ils sont orthogonaux aux ei2πνt et secaracterisent par un spectre continu (puissance concentree sur aucune frequence par-ticuliere). Leur fonction de correlation s’ecrit (Theoreme de Wiener-Khintchine) :
Γ(τ) =∫ ∞
0
I(ν) cos 2πντ dν avec I(ν) = limT0→∞
2T0
∣∣∣fT0(ν)∣∣∣2 .
5.3 Transformation de Fourier ; analyse de Fourier 159
Elle est une version “continue en frequences” de celle des signaux quasi-periodiques.
DEMONSTRATION : soit fT0(t) le signal tronque sur un intervalle de largeur T0 et fT0(ν)
sa T.F., on a Γ(τ) = limT0→∞
1T0
∫ ∞
−∞fT0(t)fT0(t+τ) dt = lim
T0→∞1T0
∫ ∞
−∞
∣∣∣fT0(ν)∣∣∣2 ei2πντ dν
d’ou l’expression de I(ν) pour un signal reel (f(ν) = f(−ν)).Γ(τ) a la propriete importante de tendre vers zero lorsque τ → ∞ (ce qui n’est pas lecas pour un spectre discret, par exemple Γ(τ) = cos 2πν0τ pour I(ν) = δ(ν − ν0)). Onappelle temps de correlation τc une valeur typique de τ telle que Γ(τ) � 0 si τ > τc
(en general τc � 1Δν
ou Δν est la dispersion du spectre du signal). En optique τc est
un temps de coherence. On appelle bruit blanc (par reference a la lumiere blanche) unsignal chaotique dont le spectre de puissance est constant, au moins dans une tres largebande de frequences ; dans ce cas τc � 0.
EXEMPLE. En optique une lumiere quasi-monochromatique correspond a
I(ν) = P (ν − ν0) > 0 ,
ou le profil de la raie P a une largeur Δν � 1τc
� ν0. On a (theoreme ci-dessus)
Γ(τ) = �e[∫ ∞
0
P (ν − ν0) ei2πντ dν]� �e [
ei2πν0τ P (τ)]
ou P (τ) =∫ ∞−∞ P (ν′) ei2πν
′τ dν′ est une fonction lentement variable de τ (par exemple
P (τ) = Δν sinc(πΔν τ) pour P (ν − ν0) = Π(ν − ν0Δν
)). Dans une experience d’in-
terference, ou le detecteur mesure < |f(t) + f(t+ τ)|2 >= 2Γ(0) + 2Γ(τ) (cf. sec-tion 2.5.1.), le caractere quasi-monochromatique du signal se traduit par Γ(τ) �Γ(0) cos 2πν0τ pour τ � τc (contraste des franges proche de 1), tandis que le caracterechaotique se traduit par
Γ(τ)Γ(0)
� |P (τ)|P (0)
� 0
pour τ � τc (contraste nul aux grands ordres ν0τ d’interference).
Remarques. 1) L’etude de P (τ) renseigne sur le profil de la raie : il est gaussien si P (τ) est gaussien,
lorentzien si P (τ) ∝ e− |τ|
τc , symetrique si P (τ) est reel, etc. (Voir aussi la section 10.3.3. pour le profil
lorentzien.) 2) Si on modelise le signal lumineux par une somme de paquets d’ondes (reels) emis a
des instants aleatoires f(t) =∑i ϕ(t − ti) on peut montrer (a partir de fT0 (ν) = ϕ(ν)
∑i e
−i2πνti
avec ti ∈[−T0
2, T0
2
]) que I(ν) = n 2|ϕ(ν)|2 ou n est le nombre moyen de paquets par unite de temps.
� Filtrage des signaux chaotiques
Il decoule du theoreme ci-dessus et de la relation entree-sortie s = R e que la relation entre les spectres
de puissance des signaux chaotiques a l’entree et a la sortie d’un filtre est :
Is(ν) = |R(ν)|2 Ie(ν) .Si e(t) est un bruit blanc (Ie(ν) � 1) , Γe(τ) � δ(τ)) on a pour la sortie Is(ν) � |R(ν)|2 donc Γs(τ) �ΓR(τ), ce qui permet un acces aux proprietes du filtre (moins complet mais aussi moins “brutal” qu’avec
δ(t)).
160 5 • Fonctions d’une variable ; analyse des signaux
EXEMPLE 1. Filtrage passe bas. L’equation de Langevin m�v(t) + α�v(t) = �f(t) (bruit blanc)
decrit le mouvement brownien d’une particule soumise aux chocs moleculaires. Pour “le signal de
sortie” �v(t), on a
Iv(ν) ∝ |R(ν)|2 ∝ (1 + 4π2ν2τ2c )−1 avec τc = m
α
et donc Γv(τ) ∝ e− |t|
τc ; le coefficient de proportionnalite est Γv(0) =< v2 >. Le mouvement
peut donc etre assimile a une marche au hasard (cf. section 10.3.1) constituee de pas de longueur
l � τc√< v2 > separes par un intervalle de temps T � τc ; on obtient pour le coefficient de diffusion
D �< v2 > τc � kBTα
(relation d’Einstein).
EXEMPLE 2. Filtrage passe bande. Dans les telecommunications on sait que la modulation
de frequence x(t) → A cos 2π(ν0t +Δν∫ t x(s) ds) est moins sensible au bruit que la modulation
d’amplitude x(t) → A (1 +mx(t)) cos 2πν0t. Pour le comprendre on remarque que, puisque lors de
la detection on ne filtre que la bande [ν0 − B, ν0 + B], ou [−B,B] est le spectre de x(t), il suffit
d’etudier l’effet sur A cos 2πν0t de l’addition d’un bruit de la forme a(t) cos 2πν0t+ b(t) sin 2πν0t ou
les spectres de a(t) et b(t) sont dans [−B,B]. Sous l’hypothese que le bruit est faible, l’addition se
traduit par :
A cos 2πν0t −→ A(1 + a(t)
A
)cos
(2πν0t− b(t)
A
).
En modulation d’amplitude il faut donc comparer m2 < x2 > a <a2>A2 , et en modulation de frequence
4π2 (Δν)2 < x2 > a <b2>A2 = 1
A2
∫ B−B (2πν)2 |b(ν)|2 dν < 4π2B2 <b2>
A2 . Toutes choses egales par
ailleurs, on a m2 d’un cote et(
ΔνB
)2de l’autre ; typiquement m � 10−1 et
Δν
B� 5, soit une
amelioration par un facteur 2500 du rapport signal sur bruit.
� Langage probabiliste (figure 21)
�������
��������
��������
���������
���������
���������
�������
�������
������������������������
������������
������������
x
P(x)
f(t)
t
Figure 21
Il s’introduit naturellement quand on s’interesse (dans l’esprit de l’integration definie parLebesgue) a la fraction de temps P (D) pendant laquelle un signal f(t) a une valeur xcomprise dans un intervalle D. (P (D) est aussi la moyenne temporelle < χD (f(t)) > ouχD(x) = 1 si x ∈ D et 0 si x �∈ D.) P (D) satisfait en effet les axiomes des probabilites,par exemple :
P (D1 ∪ D2) = P (D1) + P (D2) si D1 ∩ D2 = ∅ , P (R) = 1 .
Si D =]x− dx
2, x+
dx2
[est infinitesimal, cette fraction s’ecrit en general P (x) dx ;
pour f(t) = A cos(ωt+ ϕ), on deduit de |df | = ω√A2 − f2 |dt| et de P (x) dx = 2
|dt|T
5.4 Optique de Fourier ; filtrage optique 161
que P (x) =1
π√A2 − x2
(figure 21). Si f(t) passe une fraction de temps finie pi sur une
valeur xi, alors P (x) = pi δ(x− xi) + · · · .A l’aide de P (x) on peut traduire les moyennes temporelles en moyennes probabi-listes ; en effectuant un rearrangement des intervalles de temps sur lesquels on integre,on obtient par exemple < fn(t) >=
∫ ∞−∞ xn P (x) dx ou < eiuf(t) >=
∫ ∞−∞ eiux P (x) dx
(fonction caracteristique des valeurs x du signal). De meme on peut recrire la fonctionde correlation d’un signal
Γf (τ) = limT→∞
1T
∫ t0+ T2
t0−T2
f(t) f(t+ τ) dt =∫ ∫
xy Pτ (x, y) dxdy ,
en introduisant la fraction de temps Pτ (x, y) dxdy pendant laquelle f(t) ∈]x− dx
2, x+
dx2
[et f(t+ τ) ∈
]y− dy
2, y+
dy2
[(cf. densite de probabilite conjointe : section 10.2.1).
Signaux a perte de memoire. Dans le langage probabiliste, l’independance des valeursdu signal a deux instants separes de τ se traduit par la factorisation Pτ (x, y) = P (x)P (y),et donc pour des signaux de moyenne nulle par Γf (τ) = 0. Donc la relation Γf (τ) → 0pour τ → ∞, qui caracterise les signaux chaotiques du point de vue de l’analyse deFourier, est une condition necessaire (dont on se contente souvent !) pour pouvoir affirmerque ce sont des signaux “a perte de memoire”. Elle entraıne que toute moyenne temporellepour ces signaux peut etre calculee sur des durees T finies pourvu qu’elles soient grandes
devant le temps de correlation τc ; l’erreur relative commise est alors de l’ordre de1√N
avec N =T
τc(comme pour une somme de N variables aleatoires independantes ; cf.
section 10.2.1).
5.4 OPTIQUE DE FOURIER ; FILTRAGE OPTIQUE
5.4.1 Decomposition en ondes planes ; filtrage
� Principe general
Soit f(x, y, 0) l’amplitude lumineuse (monochromatique) d’un objet coherent emettantvers les z > 0, et dont le developpement de Fourier s’ecrit
f(x, y, 0) =∫ ∫
f(σx, σy) ei2π(σxx+σyy) dσx dσy ,
avec f(σx, σy) =∫ ∫
f(x, y, 0) e−i2π(σxx+σyy) dxdy. On peut aussi l’ecrire
f(x, y, 0) =∫ ∫
f
(α
λ,β
λ
)ei
2πλ (αx+βy) dα
λ
dβλ
,
et interpreter f(x, y, 0) comme representant dans le plan z = 0 une somme d’ondesplanes allant dans des directions u(α, β, γ) donnees par α = λσx, β = λσy (γ =√
1 − α2 − β2).
162 5 • Fonctions d’une variable ; analyse des signaux
�
��
�
O
Xx x’
zF
u
plan lentille plan plan
système
optique
de Fourierobjet image
Figure 22
On suppose la longueur d’onde λ, ou les frequences spatiales σx,y, assez petites pour queλσx,y < 1. Si on place une lentille de distance focale d apres l’objet, chaque onde planeissue de l’objet va converger dans le plan focal image (F ;X,Y ) au point (X = αd, Y =βd) (figure 22). Cette “separation point par point” des ondes permet un filtrage optiqueimmediat en mettant dans ce plan (plan de Fourier) un filtre (pupille) de coefficient detransmission p(X,Y ). Si on place alors apres ce plan un systeme optique qui fait, avecla lentille, l’image du plan z = 0, cette image est celle que l’on obtiendrait (sans filtre)d’un objet (fictif) appele objet filtre dont l’amplitude lumineuse serait :
ffiltree(x, y, 0) =∫ ∫
f(σx, σy) p(λσxd, λσyd) ei2π(σxx+σyy) dσx dσy .
p(λσxd, λσyd) est la fonction de transfert du filtre.
EXEMPLE 1. Soit f(x, y, 0) = cos2 πxa
= 12
+ 14ei2π
xa + 1
4e−i2π
xa . A un trou en F correspond l’objet
filtre uniforme ffiltree(x, y, 0) = 12, et a un ecran ponctuel en F l’objet filtre ffiltree(x, y, 0) = 1
2cos 2πx
a
(dont l’intensite 14
cos2 2πxa
a une periode spatiale moitie de celle de l’objet initial).
EXEMPLE 2. Soit f(x, y, 0) = Aeiϕ(x,y) � Aeiϕ0 (1 + iδϕ(x, y)) un objet de phase dont on suppose
les fluctuations de phase petites. Si on place en F une lame introduisant un retard de ±π2
ou un ecran,
l’objet filtre est ffiltree(x, y, 0) = iA eiϕ0 (±1 ou 0 + δϕ(x, y)). Il presente des variations d’intensite et
son image devient observable (principe du contraste de phase ou de la strioscopie).
� Lien avec la diffraction de Fraunhofer
L’intensite observee dans le plan de convergence des ondes planes (F ;X,Y ) (avant fil-
trage) est proportionnelle a∣∣∣∣f (
α
λ,β
λ
)∣∣∣∣2. On retrouve l’intensite de la figure de diffraction
a “l’infini” associee a f(x, y, 0) et calculee autrement a la section 2.5.2.
� Lien avec la diffraction de Fresnel
Comme la propagation du plan z = 0 au plan z > 0 se traduit simplement pour l’ondeei
2πλ (αx+βy) dans le plan z = 0 par la multiplication par le facteur ei
2πλ γz (γ(α, β) =√
1 − α2 − β2), l’amplitude f(X,Y, z) dans le plan z est :
f(X,Y, z) =∫ ∫
f
(α
λ,β
λ
)ei
2πλ (αX+βY+γ(α,β)z) dα
λ
dβλ
.
5.4 Optique de Fourier ; filtrage optique 163
Le facteur de phase ei2πλ γz (analogue de R(ν) pour des signaux)), qui s’ecrit
ei2πλ z e−iπλz(σ
2x+σ2
y) = Rz(σx, σy)
dans l’approximation de Gauss (γ � 1 − α2 + β2
2), n’est autre que la transformee de
Fourier a deux dimensions de la reponse impulsionnelle Rz(x, y) introduite a la section5.2.3. Le principe d’Huygens Fresnel est donc une consequence de la propagation desondes planes (et de l’analyse de Fourier) et n’est pas un principe physique nouveau.
EXEMPLE. Si on eclaire avec un laser sous incidence normale un reseau periodique situe dans le plan
z = 0 de coefficient de transmission t(x, y) =∑n tn e
i2πn xa
(= f(x, y, 0)
), on a f(x, y, z) = ei2π
zλ ×∑
n e−iπλz( n
a )2 ei2πnxa . Dans les plans z = 2p a
2
λ(p entier) on retrouve (en intensite) le reseau :∣∣f(
x, y, 2p a2
λ
)∣∣ = |f(x, y, 0)|.
5.4.2 Illustrations optiques de la transformee de Fourier
Soit t(x, y) le coefficient de transmission d’un ecran eclaire sous incidence normale parune onde plane d’amplitude 1. On considere la relation
t(x, y) =∫ ∫
t
(α
λ,β
λ
)ei
2πλ (αx+βy) dα
λ
dβλ
qui exprime la decomposition en ondes planes de l’amplitude transmise. Le lecteur estencourage a representer les “ecrans” t et les “intensites” |t|2 dans les plans (x, y) et
(α
λ,β
λ) pour les exemples ci-dessous (cf. ouvrages d’optique).
� Intensite diffractee ; ouverture rectangulaire
La formule de Parseval∫ ∫
|t(x, y)|2 dxdy =∫ ∫ ∣∣∣∣t(αλ , βλ
)∣∣∣∣2 dαλ
dβλ
montre que
I(α, β) =1λ2
∣∣∣∣t(αλ , βλ)∣∣∣∣2
est l’intensite lumineuse diffractee (a l’infini) dans la direction (α, β) par unite d’anglesolide. Un exemple classique est t(x, y) = Π
(xa
)Π
(yb
)(ouverture rectangulaire), qui
conduit a
I(α, β) =(ab
λ
)2 (sinc
πaα
λ
)2(
sincπbβ
λ
)2
(l’integrale double etant ici un produit d’integrales simples).
� Linearite ; realite ; aires
Deux ecrans sont dits “complementaires” si t1 + t2 = 1 (fente fine et fil opaque) ; alorst1 = δ − t2 et les intensites diffractees sont les memes (sauf au centre α = β = 0) :theoreme de Babinet.
164 5 • Fonctions d’une variable ; analyse des signaux
Si t(x, y) est reel (ecran reel), I(α, β)=I(−α,−β): la figure de diffraction est symetriquememe si l’ecran ne l’est pas ! Si t(x, y) > 0 alors I(α, β) est maximum au centre (α=β=0) ; en particulier si l’ecran est un trou de surface S, alors I(0, 0)=λ−2
∣∣∫∫t(x, y) dxdy
∣∣2 =S2/λ2, tandis que l’intensite totale, integree sur toutes les directions vaut S ; ceci se com-prend en remarquant que la tache de diffraction a une extension angulaire ΔαΔβ � λ2/S.
� Dilatation
Un changement d’echelles sur l’ecran t(x, y) → t( x
k1,y
k2
)se traduit par I(α, β) →
k21 k
22 I(k1α, k2β) (changement d’echelles inverse) ; en particulier si k2 → ∞ (ouverture
tres large en y), I(α, β) se concentre sur les directions β = 0.
� Translation de l’ecran
t est multiplie par une phase et la figure de diffraction n’est donc pas modifiee. Par contrele facteur de phase se manifeste lors de la diffraction par plusieurs ecrans translates les
uns par rapport aux autres. Par exemple aN∑n=1
t(x−na, y) correspond I(α, β) |N∑n=1
einϕ|2
produit de I(α, β) par l’intensite d’une interferences a N trous ponctuels (ϕ = −2παaλ
).
� Multiplication de t(x, y) par ei2πλ
(α0x+β0y)
Elle correspond a un eclairage sous incidence oblique et conduit a I(α−α0, β− β0)(decalage angulaire de la figure de diffraction).
� Periodisation
Un reseau infini a un facteur de transmission periodique
t∞(x) =∞∑
n=−∞τ(x − na) =
1a
∞∑p=−∞
τ(pa
)ei2πp
xa
(formule de Poisson). τ(x) (restreint a [0, a]) caracterise le motif du reseau ; l’enjeudes reseaux “blazes” est de choisir judicieusement le motif τ(x) pour concentrer toutela lumiere diffractee dans un seul ordre q (pour augmenter la luminosite), le plus elevepossible pour avoir le pouvoir separateur maximum : τ
(pa
)= 0 sauf pour p = q. Un
exemple est τ(x) = ei2πxa . L’ecran correspondant est un prisme d’angle au sommet θ
petit et d’indice n tel que2πλ
(n− 1) θ = 2πq
a.
REMARQUE. Si le reseau est limite par une ouverture de coefficient de transmission O(x, y), alors :
t(x, y) = t∞(x)O(x, y) et t(αλ, βλ
)= 1
a
∑∞p=−∞ τ
( pa
) O(α−αp
λ, βλ
).
Cette formule peut s’interpreter comme la diffraction des differentes ondes planes ei2παpxλ par l’ouver-
ture. Si celle-ci est plus large que le pas du reseau a, les fonctions O(α−αp
λ, βλ
)(pour les differentes
valeurs de p) ne se recouvrent pas et l’intensite diffractee est 1a2
∑∞p=−∞
∣∣τ( pa
)∣∣2 IO(α − αp, β), ou
IO(α, β) designe l’intensite diffractee par l’ouverture.
5.4 Optique de Fourier ; filtrage optique 165
� Echantillonnage
Si t∞(x) correspond a un reseau de fentes fines (τ( pa
)=constante), on peut considerer que t∞(x)O(x, y)
est l’echantillonnee en x de “l’objet ”O(x, y) ; t(αλ, βλ
)est alors la periodisee de O(
αλ, βλ
). Dans le cas
de non recouvrement (condition de Shannon satisfaite), un filtrage passe-bas ne laissant passer que le
terme O(αλ, βλ
)permet de recuperer O(x, y) (principe du detramage).
� Discontinuite
Si t(x, y) est discontinu le long d’une ligne x = 0 la figure de diffraction s’etend dans la direction αsur l’axe β = 0. La technique d’apodisation consiste a reduire cette generation de hautes frequences,par exemple en remplacant t(x) = Π
(xa
)par tapod(x) = cos2 πx
aΠ
(xa
), dont la T.F. (petit calcul)
tapod(σ) = a2(1−a2σ2)
sincπσa est un peu plus etalee que t(σ) et decroıt comme σ−3 au lieu de σ−1
(discontinuite de t′′apod).
� Autocorrelation
EXEMPLE 1 : optique incoherente. Les exemples ci-dessus relevaient de l’optique coherente. Si une
repartition angulaire d’intensite I(α0, β0) en provenance d’un objet incoherent a l’infini arrive dans
la pupille d’entree d’un instrument de surface S et de coefficient de transmission t(x, y), l’intensite a
la sortie de la pupille est donnee par le produit convolution (normalise de sorte que If = I si I est
uniforme et t = 1)If (α, β) =
∫∫1Sλ2 I(α0, β0)
∣∣t( α−α0λ
, β−β0λ
)∣∣2 dα0 dβ0 .
(If resulte de l’addition des intensites des figures de diffraction associees chacune a une onde plane).
La pupille effectue donc un filtrage sur l’objet. Si on introduit les T.F. des intensites I et If par
I(σα, σβ) =∫∫
I(α, β) e−i2π(σαα+σββ) dαdβ
(σα et σβ frequences angulaires), on a If = T I avec pour fonction de transfert de l’instrument
T (σα, σβ) = 1S
∫∫t(x, y) t(x − λσα, y − λσβ) dx dy
la fonction d’autocorrelation de la pupille. Comme une pupille a toujours une extension finie,
T (σα, σβ) a un support borne et l’instrument coupe les hautes frequences. Si il s’agit de deux trous dis-
tants de a dans la direction x, il ne laisse passer que les frequences σα = σβ = 0 et σα = ± a
λ, σβ = 0.
On peut ainsi etudier I(σα, σβ) et remonter a I(α, β) (principe de l’interferometrie stellaire).
EXEMPLE 2 : diffusion. Si N diffuseurs isotropes identiques, occupant les positions −→r i dans un
volume, sont eclaires par une onde plane ei−→k 0·−→r , l’intensite diffusee dans la direction du vecteur
d’onde−→k est proportionnelle a :
S(−→σ ) =< |Σi e−i2π−→σ ·−→r i |2 > (2π−→σ =−→k −−→
k 0) .
(La moyenne < · > est a prendre si les positions des diffuseurs sont aleatoires.) Comme Σi e−i2π−→σ ·−→r i
est la T.F. (tridimensionnelle) de la densite de diffuseurs
n(−→r ) = Σi δ(−→r −−→r i) ,
S(−→σ ) est la T.F. de la fonction d’autocorrelation de la densite :
<∫n(−→r ′)n(−→r ′ + −→r ) d3r′ > = <
∑ij δ(
−→r −−→r i + −→r j) > � N g(−→r ) .
g(−→r ) d3r est le nombre moyen de diffuseurs dans d3r, sachant qu’il y en a un en −→r = 0.
Chapitre 6
Equations differentielles ;systemes dynamiques
Une equation differentielle (E.D.) ordinaire d’ordre n se presente comme une rela-tion, en general non lineaire, entre une fonction d’une variable et ses derivees d’ordre1, · · · , n. La resoudre consiste traditionnellement a en donner la solution generale, maisceci est rarement realisable a part quelques cas classiques, et fait perdre de vue l’in-formation “codee” par les E.D. en physique. C’est pourquoi il est utile de commencerpar l’approche qualitative et geometrique des systemes dynamiques (ou la variable est letemps). Cette approche repose sur la propriete d’un systeme d’E.D. d’ordres quelconquesd’etre equivalent a une E.D. “vectorielle” du premier ordre decrivant le mouvement d’unpoint dans l’espace de phase. Elle met en valeur le role important des conditions ini-tiales (C.I.). On verra que, lorsque la variable est l’espace, ce role est tenu plutot parles conditions aux limites (C.L.).
Quand une solution evidente est connue (par exemple l’etat de repos pour un pendule), ilest naturel de s’interesser a l’ E.D. satisfaite au premier ordre par une perturbation (pe-tites oscillations). C’est pourquoi les E.D. lineaires (E.D.L.) jouent un role privilegie.On etudiera leurs proprietes, non seulement lorsque les coefficients sont constants, casdes E.D.L. stationnaires (E.D.L.S), avec la notion de mode propre stable ou in-stable, mais aussi dans le cas general, avec la notion de matrice de transfert. L’approchelineaire ayant ses limites, on etudiera enfin quelques methodes, notamment la methodedes equations d’amplitude, permettant de traiter les corrections non lineaires et les bi-furcations de solutions.
6.1 Systemes dynamiques et espace de phase 167
6.1 SYSTEMES DYNAMIQUES ET ESPACE DE PHASE
6.1.1 Definitions ; proprietes generales
� Systemes dynamiques
L’idee de determinisme, dans sa version “continue”, se traduit par le fait que la connais-sance de l’etat x(t0) d’un systeme a un instant arbitraire t0 (conditions initiales) entraınesa connaissance a un instant voisin t0 + ε, ce qu’on ecrit :
x(t0 + ε) � x(t0) + εf(x(t0), t0
) ∀t0 et x(t0) soit lorsque ε→ 0 x(t) = f(x(t), t
).
L’etat est ainsi connu de proche en proche, au moins dans un certain intervalle de temps,aussi bien dans le futur que dans le passe, des que sa “vitesse d’evolution” f(x, t) l’est.On parle alors de systeme dynamique (S.D.) dont l’evolution est regie par l’E.D.“vectorielle” du premier ordre.
Attention. Une E.D. decrit l’evolution, non d’un etat initial particulier, mais celle den’importe quel etat initial x(t0). Elle “code” une correspondance generale, souvent trescompliquee, entre etats pour deux instants differents (figure 1) :
x(t0)Ft,t0−−−−−−→ x(t) .
t )(x 0 x ( t)
��
�
�
F F
tF
t
tt0
0t
t0
)(x
Figure 1
Cette correspondance n’est pas quelconque ; elle doit satisfaire la loi de composition :
Ft,t0 = Ft,τ ◦ Fτ,t0 .
Par exemple la relation x(t) = a x(t0) + (t − t0) ne satisfait cette loi que si a = 1.En effet, en prenant un instant quelconque τ , on doit avoir x(t) = a x(τ) + (t − τ) =a(a x(t0) + (τ − t0)
)+ (t− τ). Le cas a = 1 correspond au S.D. x = 1.
� Espace de phase ; degres de liberte
La notation x sous entend que pour caracteriser l’etat d’un systeme il faut, en general,se donner plusieurs grandeurs (ses composantes x1, x2, · · · , xn). En mecanique il fautconnaıtre initialement les positions et les vitesses des corps, en electricite les charges des
168 6 • Equations differentielles ; systemes dynamiques
condensateurs et les intensites dans les inductances, en cinetique chimique toutes lesconcentrations, etc. Ces grandeurs (fonctions du temps) qui caracterisent un etat definis-sent l’espace de phase, espace de tous les etats possibles, dans lequel tout etat initialdecrira une “trajectoire” au cours du temps. La dimension de cet espace caracterise lenombre de degres de liberte du S.D.
L’interet de la notion d’etat dans l’espace de phase est de ramener toute E.D. (ou systemed’E.D.) de n’importe quel ordre a un systeme du premier ordre (pour les composantesde l’etat). Par exemple l’equation du troisieme ordre
...x= g(x, x, x, t) s’ecrit aussi⎛⎝x1
x2
x3
⎞⎠ =
⎛⎝ x2
x3
g(x1, x2, x3, t)
⎞⎠ (de la forme x(t) = f
(x(t), t
)),
ou x1 = x, x2 = x, x3 = x sont les composantes de l’etat x, et x2, x3, g celles de f ; il ya trois degres de liberte et il faut trois C.I. x1(t0) = x(t0), x2(t0) = x(t0), x3(t0) = x(t0)pour definir une solution x(t).
Inversement il est a noter qu’en physique toutes les lois “de base” ne font intervenir queles derivees premieres des grandeurs : I = Q, V = LI en electricite, p = mr, p =
−→F (r, v, t)
en mecanique (loi de Newton), etc. Ce n’est que parce qu’on procede habituellement par“elimination” pour resoudre ces systemes d’E.D. du premier ordre, qu’apparaissent desE.D. d’ordre superieur, dont la difficulte technique fait du coup perdre de vue le role desC.I.
� Stationnarite
Lorsque t n’apparaıt pas explicitement dans f(x, t), c’est-a-dire lorsque les coefficientsdes E.D. (qui sont les parametres “caracteristiques” du systeme physique, la masse d’uncorps ou la raideur d’un ressort par exemple) ne dependent pas du temps, on parle d’unS.D. stationnaire (S.D.S.). Dans ce cas, la relation entre les etats x(t0) et x(t) ne faitintervenir les instants t0 et t qu’a travers leur difference t− t0 car il n’y a pas d’originedes temps privilegiee.
EXEMPLE : x = x(1 − x), qui decrit l’evolution d’une “population” x (biologique,chimique, etc.) dont le taux de variation 1− x decroit quand x croit. L’integration de
dt =(x(1 − x)
)−1 dx =(x−1 + (1 − x)−1
)dx = d
(lnx(1 − x)−1
)donne x(t) = x(t0) exp(t− t0)
(1 + x(t0)
(exp(t− t0) − 1
))−1 .
CONTRE EXEMPLE : x = λ(t)x, ou le taux de variation λ(t) de la “population” xdepend explicitement du temps. Alors x(t) = x(t0) exp
∫ tt0λ(s) ds ; on ne retrouve la
dependance en t− t0 que si λ est constant.
D’un point de vue geometrique f(x, t) represente un champ de vecteurs dans l’espacede phase. Dans le cas stationnaire, les trajectoires suivies par les etats sont les lignesde champ, lignes partout tangentes aux vecteurs f(x), puisque x = f(x). Le tableauci-dessous et les figures 2 presentent quelques exemples d’equations adimensionnees tireesde la mecanique ; les variables de l’espace de phase sont (x, x). La constante C est uneintegrale premiere des equations.
6.1 Systemes dynamiques et espace de phase 169
S.D.(a) mouvement
inertiel(b) mouvementunif. accelere
(c) pendule pres du pt.d’equilibre stable
(d) pendule pres du pt.d’equilibre instable
E.D. x = 0 x = 1 x = −x x = x
champ devecteurs f
(x0
) (x1
) (x−x
) (xx
)trajectoires dansl’espace de phase
x = Cdroites
x = 12x2 + C
parabolesx2 + x2 = C
cerclesx2 − x2 = Chyperboles
x et x fonctiondes C.I. a t = 0
x = x0 + x0tx = x0
x = x0 + x0t+ 12t2
x = x0 + tx = x0 cos t+ x0 sin tx = x0 cos t− x0 sin t
x = x0 cosh t+ x0 sinh tx = x0 cosh t+ x0 sinh t
representationmatricielle de Ft,0
(1 t0 1
) (cos t sin t− sin t cos t
) (cosh t sinh tsinh t cosh t
)
x.
x.
x.
x.
x x
x x
(a)
(c)
(b)
(d)
Figure 2
� Linearite
Un S.D. lineaire (S.D.L.) est un systeme tel que si x1(t) et x2(t) sont deux solutionsarbitraires λ1x1(t) + λ2x2(t) est aussi solution. L’espace de phase a alors une structured’espace vectoriel.
EXEMPLE : x+ a(t) x+ b(t)x = 0 ⇐⇒ x =(
0 1−b(t) −a(t)
)x avec x =
(xx
).
CONTRE EXEMPLE : x = 1 (cf. tableau).
La propriete essentielle d’un S.D.L. est que sa solution generale est une combinaisonlineaire de solutions lineairement independantes ou, ce qui est equivalent, que chaque
170 6 • Equations differentielles ; systemes dynamiques
composante de l’etat x(t) depend lineairement des composantes de l’etat x(t0). Ainsi lasolution generale de x+ a(t) x + b(t)x = 0 s’ecrit
x(t) = R0(t, t0)x(t0) +R1(t, t0) x(t0) ,
x(t) se deduisant simplement par derivation de cette relation. Dans cette expressionR0(t, t0) est la solution qui vaut 1 pour t = t0 et dont la derivee s’annule pour t = t0,tandis que R1(t, t0) est la solution qui s’annule en t = t0 et a une derivee egale a 1 pourt = t0. Cette remarque elementaire est a la base du formalisme de la matrice de transfertdeveloppe a la section 6.4.1.
6.1.2 Exemples de systemes dynamiques et de leurs portraits de phase
La representation des trajectoires des etats d’un S.D. dans l’espace de phase, appeleeportrait de phase, presente l’interet de visualiser toutes les solutions d’une E.D., enfonction des C.I., meme lorsqu’il n’y a pas de formule explicite ou que celle-ci est com-pliquee.
� Portrait de phase (a une dimension) de x = f(x)
L’evolution de x(t) est schematisee en placant simplement sur l’axe x les points ou fs’annule, et en mettant entre ces points une fleche dans le sens d’evolution de x(t), doncliee au signe de f(x). La seule chose qui reste a preciser est de savoir si x s’approche ous’eloigne des points ou f s’annule en un temps fini ou infini.
EXEMPLE 1. x = x(1 − x) et x > 0 (figure 3).Pres de x = 1 on a x � 1 − x, d’ou dt � (1 − x)−1 dx et t � − ln |1 − x| ; on retrouveque l’approche de 1 est exponentiellement lente. Pour x proche de 0, on a dt � x−1 dx ;il faut donc un temps Δt � | ln ε| pour s’ecarter d’une distance finie d’une positioninitiale x(t0) = ε arbitrairement proche de l’origine.
1 axe x0
Figure 3
EXEMPLE 2 (figure 4a). En mecanique, l’equation mx = −V ′(x) (V (x) energiepotentielle) dont l’espace de phase est a priori a deux dimensions, se reduit, compte
tenu de la conservation de l’energie E =12mx2 + V (x), a x = ±
√2m(E − V (x)).
Pour E = E1, x atteint ou quitte la valeur extreme xB1 , telle que V (xB1 ) = E1, en
un temps fini. En effet, au voisinage de xB1 l’E.D. s’ecrit dt ∝ (E1 − V (x)
)− 12 |dx| ∝
|xB1 − x|−12 |dx|, et donc Δt ∝ |xB1 − x
∣∣ 12 . La meme analyse vaut pour xA1 et, comme
l’acceleration x ne s’annule ni en xB1 ni en xA1 , x oscille indefiniment entre ces deuxvaleurs extremes.
6.1 Systemes dynamiques et espace de phase 171
Au contraire pour E = E2, au voisinage de xB2 on a dt ∝ (E2 − V (x)
)− 12 |dx| ∝
|xB2 − x|−1 |dx|, et donc xB2 apparaıt comme une valeur limite atteinte exponentiel-lement lentement.
E
E
2
1A 1
2B
x
V(x)
A 2
1B
x
(a)
(b)
x courbes E= Cste
Figure 4
� Portrait de phase (a deux dimensions) de x = g(x, x)
Les remarques suivantes aident a sa construction.a) Dans l’espace de phase parametre par (x, x) l’evolution de x (resp. x) est donneepar le signe de x (resp. g). Il convient de rechercher les eventuels points fixes (ceuxlaisses invariants par l’evolution) et d’etudier leur stabilite. Par exemple pour le systeme
mecanique ci-dessus, on a12mx2 +
12V ′′(x∗) (x−x∗)2 = Cste pres de toute valeur x∗ telle
que V ′(x∗) = 0. Si V ′′(x∗) �= 0, le portrait de phase (figure 4b) est localement analoguea celui des figures 2c et 2d.b) La pente d’une trajectoire est :
tg θ =dxdx
=x
x=g(x, x)x
.
Pour θ fixe, cette equation definit dans le plan (x, x) une courbe appelee isocline (enpointille sur la figure 2), le long de laquelle tous les vecteurs tangents aux differentestrajectoires sont paralleles a une direction donnee de pente tg θ. Deux trajectoires nepeuvent se couper (en vertu du determinisme) ; elles peuvent a la rigueur tendre l’unevers l’autre (par exemple a la fin de l’evolution).
� Autres exemples a deux dimensions
EXEMPLE 1 : x1 = k1x1(1− x2), x2 = −k2x2(1− x1) avec k1 et k2 > 0 (oscillateurde Lotka-Volterra d’un systeme proies-predateurs). Les proies x1 ont un taux de
172 6 • Equations differentielles ; systemes dynamiques
croissance k1(1−x2) limite par les predateurs x2. Les predateurs au contraire ont besoinde proies en nombre suffisant (x1 > 1) pour que leur taux de croissance −k2(1 − x1)devienne positif. Si on choisit comme variables (x1, x2) dans le plan de phase, lespoints O (0, 0) et A (1, 1) sont des points fixes (figure 5). Au voisinage de O les E.D.x1 � k1x1 et x2 � −k2x2 montrent que O est lineairement instable : bien qu’onse rapproche de O dans la direction Ox2 (“contractante”), on s’en eloigne dans ladirection Ox1 (“dilatante”). Au contraire le point A est “marginalement” stable(aucune direction dilatante ni contractante) ; dans son voisinage les E.D. s’ecriventu1 � −k1u2 et u2 � k2u1 (avec u1,2 = x1,2 − 1) et les trajectoires sont les ellipsescentrees en A d’equations k2u
21 + k1u
22 = Cste ; leur sens de parcours est donne par le
signe de x1 ou x2.
x
1O
1
x 1
2
A
Figure 5
EXEMPLE 2 : x = −x+ F (x). Si la force F (x) est telle que
F (x) = 1 si x < v , F (x) = −1 si x > v , −μ ≤ F (x) ≤ μ si x = v ,
c’est l’equation adimensionnee d’un oscillateur entraıne avec frottement solide(figure 6), μ ≥ 1 etant le rapport des coefficients de frottement statique et dynamique.
����������������
����������������
��������
���
���
����
���
���
����
����
����
��������������
��
x
v
Figure 6
Si x �= v alors x = −x± 1 et x2 + (x∓ 1)2 = constante. Les trajectoires sont donc desarcs de cercle centres en A (-1,0) si x > v, et des cercles (ou arcs de cercle) centresen B (1,0) si x < v (figure 7a). Le raccord des cercles sur la ligne x = v est tri-vial sauf si x ∈ [−μ, μ] (entre C et D). En tout point de CD le module de la forcede rappel | − x| est inferieur a μ. Ceci permet a la force de frottement solide F (x)de “s’adapter” pour avoir x = v. Ce mouvement uniforme se poursuit jusqu’en Dou l’adaptation cesse d’etre possible, et la trajectoire devient l’arc DEF centre en B.
6.1 Systemes dynamiques et espace de phase 173
A partir du point F ces trajectoires se confondent avec le cycle FDEF, suite d’adherencesau sol et d’oscillations liee a l’inegalite stricte μ > 1. Le cas particulier v = 0 (pasd’entraınement) μ = 1, est represente sur la figure 7b ; les trajectoires s’arretent sur lesegment AB.
IKB
A
=v
(1)
(3)
(2)
C D
x
xF
E
xO
(a)
A B x
x
(b)
Figure 7
EXEMPLE 3 : x + ω2(t)x = 0 (oscillateur parametrique lineaire ; figure 8). La
pulsation ω(t) est periodique (ω(t) = ω(t + T )) de periode T =T1 + T2
4avec ω(t) =
ω1 pour 0 < t <T1
4, ω(t) = ω2 pour
T1
4< t < T et T1,2 =
2πω1,2
. Pour chaque ωi
la quantite x2 + ω2i x
2 est conservee. Dans le diagramme (ω0x, x), ou ω0 designe unepulsation intermediaire (ω1 > ω0 > ω2), la trajectoire est donc une ellipse d’equation
x2 +ω2i
ω20
(ω0x)2 = Cste, dont le grand axe est alternativement l’axe x (si i = 1) puis
l’axe ω0x (si i = 2). Partant de A (1,0) a t = 0, on arrive donc en A1 (0,−ω1
ω0) a t =
T1
4,
�
B
B
M
M1
x
T
TA AO
M (1,1)
1
T
1B
A
0x
Figure 8
puis en AT (−ω1
ω2, 0) au bout d’une periode, etc. (spirale divergente). Partant de B (0,1)
a t = 0, on arrive en B1 (ω0
ω1, 0) a t =
T1
4, puis en BT (0,−ω2
ω1) au bout d’une periode,
174 6 • Equations differentielles ; systemes dynamiques
etc. (spirale convergente). Si maintenant on part a t = 0 d’un point M quelconque decoordonnees (ω0x(0), x(0)), egales a 1 sur la figure, donc tel que
−−→OM = ω0x(0)
−→OA +
x(0)−−→OB, alors la linearite de l’E.D. entraıne qu’on arrive a l’instant t en Mt tel que−−−→
OMt = ω0x(0)−−→OAt + x(0)
−−→OBt, ou At et Bt sont les positions respectives de A et B
a l’instant t. Il en resulte que, sauf si x(0) = 0, toutes les trajectoires divergent versl’infini : ceci traduit le phenomene de resonance parametrique.
EXEMPLE 4 : oscillateur de Van der Pol ; oscillations de relaxation (voir lasection 6.5.2).
6.2 EQUATIONS LINEAIRES STATIONNAIRES ;MODES PROPRES ; STABILITE
Nous commencons par rappeler les solutions bien connues des equations du premier etdu second ordre. Les modes propres de toute autre equation se ramenent, en general, al’un de ces deux cas.
6.2.1 Equations du premier et du second ordre sans et avec secondmembre
� E.D.L.S. du premier ordre reelle et complexe :
x+ λx = 0 et z + (λ+ iω)z = 0 (z = x+ iy) .
Leurs solutions s’ecrivent :
x(t) = x(0) e−λt et z(t) = z(0) e−(λ+iω)t ;
elles correspondent respectivement, pour λ > 0, a l’exemple le plus simple de relaxationsans oscillation vers le point d’equilibre x = 0, et de relaxation avec oscillations(pour les variables x et y) de pulsation ω vers le point d’equilibre x = y = 0. Dans cedeuxieme cas, l’equivalence avec l’equation habituelle d’un oscillateur amorti s’obtient enseparant parties reelle et imaginaire dans l’E.D. pour z, x = −λx+ωy et y = −λy−ωx,et en eliminant une des variables (par exemple y) :
x+ 2λx+ ω20x = 0 ou ω2
0 = ω2 + λ2 .
Donc le plan complexe z = x + iω−1(x + λx) est une reparametrisation de l’espace dephase (x, x) qui rend simple le mouvement de l’oscillateur amorti.
� E.D.L.S. du second ordre (reelle) : x+ ax+ bx = 0 (a = 2λ et b reels)
Rappelons qu’elle a pour solution generale (si p1 �= p2) :
x(t) = A1 ep1t +A2 e
p2t ; p1, p2 solutions de p2 + ap+ b = 0 .
Compte tenu de la linearite vis-a-vis des C.I. le lecteur peut etablir “de tete” l’expression :
x(t) = x(0)p2e
p1t − p1ep2t
p2 − p1+ x(0)
ep2t − ep1t
p2 − p1.
6.2 Equations lineaires stationnaires ; modes propres ; stabilite 175
Dans le cas ou p1 et p2 sont complexes conjugues (b > λ2 > 0 et p1 = −λ− iω = p2), onutilise les combinaisons lineaires de e−λt cosωt et e−λt sinωt :
x(t) = x(0) e−λt(cosωt+ λ
sinωtω
)+ x(0) e−λt
sinωtω
(ω =√b− λ2) .
Enfin dans le cas p1 = p2 (limite ω → 0 du cas precedent) :
x(t) = x(0) e−λt(1 + λt) + x(0) t e−λt .
Connaissant x(t) on deduit x(t) et l’etat x(t). Il s’ecrit, pour p1 �= p2 :
x(t) =(xx
)= A1e
p1t
(1p1
)+A2e
p2t
(1p2
)= A1(t)m1 +A2(t)m2 .
Si p1 et p2 sont reels, le vecteur x(t) s’obtient par addition de deux vecteurs paralleles am1 et m2 et d’amplitudes connues. Pour λ > 0, ces amplitudes sont decroissantes et levecteur x(t) tend a devenir colineaire avec le vecteur affecte de l’amplitude qui decroitla moins vite, soit m1 si p2 < p1 < 0. La trajectoire dans l’espace de phase finit donctangentiellement a la droite x = p1x. Une difference avec un S.D. du premier ordre estqu’il existe des C.I. telles que x(t), ou x(t), change de signe en tendant vers zero.
Si p1 et p2 sont complexes conjugues, il est preferable d’ecrire l’etat x(t) (reel), noncomme la somme de deux vecteurs complexes conjugues, mais comme la partie reelle del’un d’eux :
x(t) = Ae−λt�e{e−i(ωt+ϕ)
(1
−λ− iω
)}= �e
{z(t)m
}.
Pour λ > 0 la trajectoire tend vers zero en s’enroulant autour de l’origine. Les deuxportraits de phase correspondant aux cas p1 et p2 reels ou complexes conjugues sontrepresentes sur les figures 9 et 10. La construction des trajectoires utilise les isoclines quisont les droites (tgθ + a)x+ bx = 0.
������������������������������������������������������������������������������
������������������������������������������������������������������������������
������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������
x
2
1
x
Direction de
Direction de
m
m
Figure 9
x
x
0
��
�
�
2=isocline
isocline tg =−a
isocline =
Figure 10
176 6 • Equations differentielles ; systemes dynamiques
� E.D.L.S. avec second membre
Bien que non lineaires les equations
x+ λx = f(t) ; z + (λ+ iω)z = f(t) ; x+ ax+ bx = f(t) ,
dites “lineaires avec second membre”, et qui apparaissent en physique des qu’il y a dessources (forces en mecanique, generateurs en electricite, etc.), sont etudiees ici car leurresolution se ramene a l’etude precedente. La solution generale de ces equations dependlineairement des C.I. et du second membre f , ce qui pour f en particulier signifie unedependance lineaire vis-a-vis de toutes les valeurs f(s) dans l’intervalle [0, t]. Pour lesequations du premier ordre on verifie :
x+ λx = f(t) =⇒ x(t) = x(0) e−λt +∫ t
0
e−λ(t−s)f(s) ds ;
(z(t) est obtenu en faisant simplement les changements x → z et λ → λ + iω). Eneffet la derivee de l’integrale I(t) ci-dessus donne deux contributions : l’une obtenueen derivant l’exponentielle vaut −λI(t), et l’autre en derivant par rapport a la bornesuperieure d’integration vaut f(t). Pour l’equation du second ordre, on verifie de lameme maniere que :
x+ ax+ bx = f(t) =⇒ x(t) = R0(t)x(0) +R1(t) x(0) +∫ t
0
R1(t− s) f(s) ds .
R0(t) et R1(t) sont les solutions de l’equation sans second membre telles que R0(0) = 1,R0(0) = 0 et R1(0) = 0, R1(0) = 1. Les deux premiers termes constituent la solution del’equation sans second membre satisfaisant les C.I. ; l’integrale est la solution particulierex0(t) de l’equation avec second membre qui satisfait x0(0) = x0(0) = 0. Exemple :
x+ ω2x = f(t) =⇒ x(t) = x(0) cosωt+ x(0)sinωtω
+∫ t
0
sinω(t− s)ω
f(s) ds .
Pour l’E.D.L. du neme ordre x(n) + an−1x(n−1) + · · ·+ a1x+ a0x = f , on peut verifier
a titre d’exercice que sa solution s’ecrit (meme si les coefficients dependent du temps etqu’on ne peut pas la determiner explicitement) :
x(t) = R0(t, t0)x(t0)+R1(t, t0) x(t0)+· · ·+Rn−1(t, t0)x(n−1)(t0)+∫ t
t0
Rn−1(t, s) f(s) ds ,
ou Rj(t, t0) est la solution de l’equation sans second membre dont toutes les C.I. (prisesa t0) sont nulles sauf la derivee d’ordre j qui vaut 1 : R(k)
j (t0, t0) = δjk (j, k = 0 · · ·n−1).Donc l’effet du second membre f(t) dans tout intervalle [s, s + ds] est de generer unesolution Rn−1(t, s) f(s) ds de l’equation sans second membre. Rn−1(t, s) est la reponse aune impulsion δ(t− s) (on rappelle que f(t) =
∫f(s) δ(t− s) ds).
REMARQUE. On peut aussi, pour resoudre ces equations, commencer par la recherche d’une solution
particuliere. Une fois une telle solution x0(t) (resp. z0(t)) trouvee, il suffit de lui ajouter la solution
generale de l’equation sans second membre, puisqu’en effet x− x0 (resp. z− z0) satisfait cette equation.
6.2 Equations lineaires stationnaires ; modes propres ; stabilite 177
6.2.2 Cas general ; modes propres ; oscillateurs couples
� Modes propres
Si on a bien pris garde de ne pas eliminer de grandeurs, l’equation generale pour unsysteme lineaire stationnaire s’ecrit
x = Ax ,
ou A est une matrice n×n a coefficients constants. Exemple :ddt
(xx
)=
(0 1−b −a
) (xx
).
La solution est facile a obtenir lorsque la matrice A est diagonalisable, c’est-a-dire lors-qu’il existe une base de vecteurs propres m1,m2 · · ·mn satisfaisant Amα = pαmα
(pα valeurs propres). Si on decompose x(t) sur cette base, x(t) =∑α aα(t)mα, le
systeme de depart s’ecrit∑
α aαmα =∑α aα pαmα, et se ramene donc a des E.D. du
premier ordre pour chaque composante : aα(t) = pα aα(t). La solution generale est (Aαconstantes arbitraires) :
x(t) =∑α
Aα epαtmα (Amα = pαmα) .
Chaque solution particuliere epαtmα s’appelle un mode propre. La caracteristique d’unmode propre est que toutes les composantes x1(t), x2(t) · · ·xn(t) de x(t) ont le meme com-portement en temps, et donc ne different que par une constante multiplicative. LorsqueA est reelle, on distingue parmi ces modes les modes reels non oscillants (p et mreels) et les modes oscillants (p = −(λ+ iω) et m = c+ is, c et s vecteurs reels). Dansle premier cas, les trajectoires dans l’espace de phase sont des demi droites de direction mpassant par O. Dans le deuxieme cas, comme on l’a fait pour l’equation du second ordre,on regroupe les modes complexes m et m associes aux valeurs propres p et p complexesconjuguees sous la forme reelle :
Ae−λt�e{me−i(ωt+ϕ)
}= Ae−λt
(cos(ωt+ ϕ) c+ sin(ωt+ ϕ) s
).
Les trajectoires sont alors des spirales “elliptiques” dans le plan (c, s).
REMARQUE. En presence de “forces” ou de “generateurs” exterieurs, l’equation de-vient :
x(t) = Ax(t) + F (t) .
La decomposition F (t) =∑α fα(t)mα la ramene aux n equations decouplees (deja
resolues) aα(t) = pα aα(t) + fα(t) (α = 1 · · ·n). La solution peut aussi se mettresous la forme (valable meme si A n’est pas diagonalisable) :
x(t) = eAt x(0) +∫ t
0
eA(t−s) F (s) ds .
EXEMPLE. Resonance magnetique nucleaire (R.M.N.). L’equation generale pour l’aimantation−→M(t) d’un milieu en presence d’un champ magnetique exterieur constant
−→B 0 et d’un champ variable−→
B (t) (en pratique un champ tournant dans un plan perpendiculaire a−→B 0) est :
d−→M
dt= −
−→M‖ −−→
M0
τ‖−
−→M⊥τ⊥
+ γ−→M ∧
(−→B 0 +
−→B (t)
),
178 6 • Equations differentielles ; systemes dynamiques
ou−→M‖ et
−→M⊥ designent respectivement les composantes de
−→M(t) parallele et perpendiculaire a
−→B 0,
et ou−→M0 est un vecteur constant parallele a
−→B 0. Pour
−→B (t) = 0, cette equation vectorielle s’ecrit
d
dt
⎛⎝ M1
M2
M3 −M0
⎞⎠ =
⎛⎝−λ⊥ −ω0 0ω0 −λ⊥ 00 0 −λ‖
⎞⎠ ⎛⎝ M1
M2
M3 −M0
⎞⎠ avec λ⊥,‖ =1
τ⊥,‖et ω0 = −γB0 ,
l’axe 3 etant choisi selon−→B 0 (M3 ≡ M‖). C’est l’equation d’un S.D.L. a trois degres de liberte, qui
possede un mode propre reel correspondant a la relaxation sans oscillation (temps caracteristique τ‖)
de la composante M‖ vers sa valeur d’equilibre M0. Les deux autres modes sont complexes conjugues
et correspondent a la relaxation de−→M⊥ vers zero (temps caracteristique τ⊥), accompagnee d’une
rotation a la vitesse angulaire ω0 (figure 11) ; en effet z = M1 + iM2 verifie z = (−λ⊥ + iω0)z.
� � �
M − M03
1M
M2
;00
Figure 11
La presence de−→B (t) de composantes B1(t) = B cosωt et B2(t) = B sinωt a pour effet principal
d’induire le phenomene de resonance pour−→M⊥. Considerons pour simplifier le cas ou le terme en−→
M⊥ ∧−→B (t) est negligeable. L’evolution de
−→M‖(t) n’est alors pas modifiee ; par contre l’equation pour−→
M⊥, c.a.d. pour z, devient :
z = (−λ⊥ + iω0) z + iγM3Beiωt .
En regime permanent, donc pour t� τ‖, on peut remplacer M3(t) par sa valeur limite M0. On obtient
la solution stationnaire :
z(t) = |z| eiωt ; |z| = γM0B(λ2⊥ + (ω − ω0)2
)− 12 = |−→M⊥| .
|−→M⊥| presente une resonance pour ω = ω0 (quantite algebrique), c’est-a-dire lorsque−→B (t) tourne dans
le meme sens et a la meme vitesse que−→M en absence de champ tournant.
� Cas des oscillateurs couples sans frottement
Si12xtMx et
12xtKx sont les formes quadratiques definies positives exprimant l’energie
cinetique et l’energie potentielle en fonction des ecarts x1(t), x2(t) · · · a l’equilibre, l’equa-tion du mouvement en presence de forces exterieures a la forme generale (cf. section4.2.2) :
M x = −Kx+ F avec M et K matrices symetriques positives .
Par exemple pour le systeme de masses et de ressorts de la figure 12, les equations sont
6.2 Equations lineaires stationnaires ; modes propres ; stabilite 179
mx1 = −2kx1 + kx2 + F1 et mx2 = −2kx2 + kx1 + F2 ou :
m
(x1
x2
)= −
(2k −k−k 2k
) (x1
x2
)+
(F1
F2
);
m
F2
x
kkk
F1
m
Figure 12
le systeme non couple est obtenu en ne gardant que la partie diagonale de K. Plutotque de passer a des equations du premier ordre comme on l’a fait jusqu’a present, il estplus simple d’introduire les solutions de M x = −Kx de la forme x(t) = epαtmα. Ellesdoivent verifier
p2αMmα = −Kmα ,
ce qui implique que les pα sont solutions de det(K+p2
αM)
= 0. On a vu que les proprietesde M et K entraınent que les mα forment une base reelle, et que les p2
α sont du typep2α = −ω2
α. En ecrivant x(t) =∑
α aα(t)mα et F =∑
α fα(t)Mmα, on obtient commeprecedemment n E.D. decouplees, mais du second ordre, pour les nouvelles composantesaα(t) de x(t) :
aα(t) = −ω2α aα(t) + fα(t) .
Donc un ensemble d’oscillateurs couples x1(t), x2(t) · · · se ramene a un ensemble d’oscil-lateurs independants a1(t), a2(t) · · · a condition de choisir les bons vecteurs de base, ouce qui est equivalent, les bonnes combinaisons lineaires des xi(t). La solution generalepour F = 0
x(t) =∑α
Aα cos(ωαt+ ϕα)mα
se presente comme une somme de n solutions appelees modes propres d’oscilla-tion de pulsations ωα (a distinguer des modes propres introduits precedemment quisont en nombre double). Dans un tel mode, associe au vecteur mα, toutes les variablesx1(t), x2(t) · · · oscillent en phase, ou en opposition de phase (suivant les signes relatifsdes differentes composantes du vecteur mα), avec la meme pulsation ωα.
En presence de forces exterieures sinusoıdales F (t) = F cosωt, on observe une resonancelorsque ω est egal a l’une des pulsations propres ωα. Si par exemple ω = ω1, toutes lesamplitudes aα(t) (α �= 1) restent finies alors que a1(t) tend vers l’infini, et on a parconsequent x(t) � a1(t)m1 : une excitation a la pulsation propre ωα met en evidence lemode propre “α” correspondant.
Dans l’exemple ci-dessus on a :
m1 =(
11
), ω2
1 =k
m; m2 =
(1−1
), ω2
2 =3km
; F =F1 + F2
2m1 +
F1 − F2
2m2 .
180 6 • Equations differentielles ; systemes dynamiques
Le mode 1 (resp. 2) rentre en resonance si ω = ω1 (resp. ω2), sauf si F1 = −F2 (resp.F1 = F2). Les bonnes combinaisons lineaires de x1 et x2 sont dans ce cas x1 ± x2 :
m(x1 + x2) = −k(x1 + x2) + F1 + F2 et m(x1 − x2) = −3k(x1 − x2) + F1 − F2 .
x1 + x2
2= a1 et
x1 − x2
2= a2 sont les composantes de x =
(x1
x2
)dans la “bonne” base
m1, m2.
6.2.3 Stabilite et instabilite d’un systeme dynamique lineairestationnaire
� Conditions de stabilite
Un S.D.L.S. est stable si toute solution tend vers la valeur d’equilibre x = 0. Toutesolution etant une combinaison de modes propres, ceci implique que tous les modes(solutions dont le comportement est en epαt) soient stables, donc que :
�e pα < 0 ∀α .
EXEMPLE : stabilite d’un S.D.L.S. a deux degres de liberte. Suivant l’ecrituredes equations, les conditions de stabilite sont :
E.D. du second ordre forme matricielle forme complexe
x+ ax+ bx = 0ddt
(x1
x2
)= M
(x1
x2
)z = αz + βz
a > 0 , b > 0 trM < 0 , detM > 0 �e α < 0 , |α| > |β|
Demonstration : dans le cas de l’E.D. du second ordre, on a p2 + ap + b = 0 doncp1 + p2 = −a et p1p2 = b ; la condition a > 0 et b > 0 equivaut a, soit p1 et p2
reels negatifs, soit p1,2 = −λ± iω complexes conjugues avec une partie reelle negative.Dans le cas matriciel p1 et p2 sont les valeurs propres de M, donc p1 + p2 = trM etp1p2 = detM. Enfin l’E.D. complexe avec z = x1 + ix2, α = α1 + iα2 et β = β1 + iβ2
est equivalente a une E.D. matricielle pour x1, x2 avec M =(α1 + β1 β2 − α2
β2 + α2 α1 − β1
).
� Bifurcations vers l’instabilite (figure 13)
Quand, faisant varier un parametre, un systeme stable devient instable, en general quatrecas peuvent se produire :- soit une valeur propre p reelle negative devient positive (exemple 1) ;- soit deux valeurs propres complexes conjuguees −λ± iω ont leur partie reelle negativequi devient positive (exemple 2) ;- soit un mode oscillant disparaıt (exemple 3) ;- soit les frequences initialement distinctes de deux modes oscillants deviennent egales(exemple 4).
6.2 Equations lineaires stationnaires ; modes propres ; stabilite 181
��
��
��
�� ��
��
��
��p
p
p
p p
p
p
p
43
21
Figure 13
EXEMPLE 1. L’equation x + ax + bx = 0 avec a > 0 voit un de ses modes nonoscillants stables devenir instable (non oscillant) lorsque b passe d’une valeur positivea une valeur negative.
EXEMPLE 2. La meme equation avec b > 0 voit son mode oscillant stable devenirinstable (oscillant) lorsque a (“coefficient de frottement”) passe d’une valeur positivea une valeur negative.
EXEMPLE 3. L’equation x + bx = 0 voit son mode oscillant marginalement stabledonner naissance a deux modes non oscillants, dont un instable, lorsque b passe d’unevaleur positive a une valeur negative (passage d’un minimum a un maximum d’energiepotentielle).
EXEMPLE 4. Systeme a deux modes oscillants :....x + ax + bx = 0. Un exemple
est fourni par le systeme des oscillateurs couples de la figure 14
L L
M
C
C
(A−1)R
R
Q
Figure 14
qui est regi par l’equation
(L2 −M2)....
Q +2L−AM
CQ+
Q
C2= 0 ,
182 6 • Equations differentielles ; systemes dynamiques
ou sous forme adimensionnee :
(1 −m2)....x + (2 −mA)x+ x = 0 ;
m =M
Lest tel que |m| < 1. Ce systeme est marginalement stable pour a > 0, b > 0 et
a2 > 4b ; en effet il possede deux modes oscillants car l’equation p4+ap2+b = 0 a quatreracines imaginaires pures conjuguees deux a deux p1 = −p1 = iω1 et p2 = −p2 = iω2.Si, lorsque les parametres a et b (ou A et m) varient, ω1 tend vers ω2, c’est que dans leplan (a, b) le point representatif P se rapproche d’un point Q de la courbe d’equationa2 = 4b (figure 15). Si cette courbe est franchie (point R dans le plan (a, b)), p2
1 etp22 deviennent complexes, et les quatre racines ±√
p21 et ±√
p22 ont deux a deux des
parties reelles opposees. Un des modes oscillants devient stable et l’autre instable.
2−mA1−m²
P
2
R
Q
P0
a² = 4b
m fixé > 0
ba = 2b (A = 0)
= 11−m²
1
a =
Figure 15
Remarque. Cette instabilite par confusion de frequences ne peut se produire dans la realite que
si le systeme recoit de l’energie de l’exterieur. La condition d’instabilite (2−mA)2 < 4(1 −m2) n’est
jamais satisfaite sans amplificateur operationnel. Si A = 0 le systeme des oscillateurs couples par la
mutuelle M reste marginalement stable : point P dans le plan (a, b). Certes les frequences propres se
confondent pour m = 0, mais la courbe a2 = 4b n’est jamais franchie. L’instabilite par confusion de
frequences des modes de torsion et de flexion d’ailes d’avion est possible car le couplage de ces deux
modes se fait avec apport d’energie lie au mouvement de translation dans l’air avec frottement ; de
meme l’instabilite a l’origine du rayonnement laser correspond a la confusion d’une frequence de la
cavite et d’une frequence atomique avec apport d’energie lie au pompage optique.
6.3 DIX EQUATIONS VECTORIELLES CLASSIQUES
Un certain nombre de mouvements classiques faisant partie de la culture du physiciensont brievement etudies ici. Certains ont deja ete vu dans les sections 2.3.3 et 2.3.4.
� Mouvement uniformement accelere : �r = �a
La solutionr(t) = r0 + v0t+
12at2 ou r(0) = r0 , r(0) = v0
correspond a une trajectoire parabolique d’axe parallele a a et situee dans le plan passantpar r0 et parallele a v0 et a. Une propriete caracteristique moins connue de ce mouvement
6.3 Dix equations vectorielles classiques de la physique 183
est la possibilite d’exprimer exactement la vitesse et l’acceleration a l’aide d’accroisse-ments finis
v(t) =r(t+ T )− r(t− T )
2T, a(t) =
r(t+ T ) + r(t− T )− 2r(t)T 2
,
et donc d’avoir une construction geometrique precise de ces grandeurs : sur la figure 16a,
vA =−−→BC
2et a = 2
−−→AM (T = 1). Pour des mouvements quelconques l’expression de a
reste souvent une bonne approximation ; elle permet de deduire la position r(t + T ) apartir de r(t− T ), r(t) et a(t) ; la figure 16b fournit par exemple la resolution graphique
approchee de r = −r4
connaissant r(0) et r(1).
M
t+1
B
tA
C
va
A
t−1
(a)
t=3
t=5t=1
t=0
t=4 t=2
(b)
Figure 16
Une autre propriete utilisee en optique electronique, spectrographie de masse... est illustree sur la figure
17. Si une particule penetre a t = 0 en I dans un champ d’acceleration uniforme avec une vitesse �vI ⊥ �a,
et le quitte en J a l’instant t, la relation−→IJ = �vI t+ 1
2�at2 = 1
2(�vI t+ �vJ t) =
−→IK2
+ 12�vJ t
montre que la trajectoire, rectiligne a la sortie du champ, semble venir du milieu M du segment IK, quel
que soit le module |�vI | de la vitesse initiale.
I
a
K
J
M
Figure 17
REMARQUES 1) En presence de frottement visqueux, l’equation devient �v + �vτ
= �a et s’integre
facilement : �v(t) = �aτ + (�v0 −�aτ) e− tτ et �r(t) = �r0 +�aτt− (�v0 −�aτ) τ (e−
tτ − 1). La trajectoire presente
une asymptote parallele a �a et passant par le point de rayon vecteur �r0 + �v0τ .
2) L’equation de la chute libre dans le referentiel local est �v = �g − 2−→ω ∧ �v (cf. section 3.3.1). Elle
184 6 • Equations differentielles ; systemes dynamiques
se resoud, au premier ordre en ω, en posant �v(t) = �v0 + �gt dans le membre de droite. On obtient :
�r(t) = �r0 + �v0t+ 12�gt2 −−→ω ∧ (
�v0t2 + �g t3
3
).
Pour �v0 = 0, la correction −−→ω ∧ �g t33
decrit la “deviation vers l’est” (due a la force de Coriolis).
� Mouvement harmonique : �r + ω2�r = 0(ω2 =
k
m
)Sa solution
r(t) = r0 cosωt+ v0sinωtω
ou r(0) = r0 , r(0) = v0
a ete etudiee a la section 2.3.4. On verifie aisement qu’elle possede neuf integralespremieres (grandeurs conservees) x2 + ω2x2, y2 + ω2y2, z2 + ω2z2, xy + ω2xy, xz +ω2xz, yz + ω2yz, xy − yx, xz − zx, et yz − zy, soit cinq de plus que les quatre atten-
dues que sont l’energie E =12(mr
2+ kr2) et les trois composantes du moment cinetique
−→L = r ∧mr.
� Mouvement de Kepler : �r = −α�r
r3
Ce mouvement etudie a la section 2.3.3. possede les integrales premieres :
“E” =12r2 − α
r;−→C = r ∧ r ;
−→A = r ∧ −→
C − αr
r.
“E” est ici proportionnel a l’energie totale et−→C (constante des aires) au moment cinetique.
−→A est le vecteur de Lenz. (On verifie que
d−→A
dt= r∧(r∧ r)−αr
r+α
rr
r2= 0 en utilisant
l’equation du mouvement pour ecrire le premier terme sous la forme −α rr3
∧ (r ∧ r) =
−αr · rr3
r+αr
r, et en utilisant l’identite rr =
12
dr2
dt= r · r pour ecrire le troisieme terme
sous la forme αr(r · r)r3
). r etant orthogonal a−→C , la trajectoire est dans le plan passant
par O et perpendiculaire a−→C ;
−→A est situe dans ce plan. Les relations
−→A · r =
−→C
2 − αr et−→A
2= r
2−→C
2+ α2 − 2α
−→C
2
r= α2 + 2“E”
−→C
2
montrent que, avec un choix convenable de l’origine des angles, l’equation de la trajectoireen coordonnees polaires s’ecrit :
r =p
1 + e cos θavec p =
−→C
2
α, e =
|−→A ||α| =
√1 +
2“E”−→C
2
α2.
Il s’agit donc, comme on l’a deja vu, d’ellipses si e < 1 donc pour “E” < 0 (ce quiimplique α > 0), de paraboles si e = 1 donc pour “E = 0” (α > 0 aussi), et de branches
6.3 Dix equations vectorielles classiques de la physique 185
d’hyperboles si e > 1 donc pour “E” > 0 (α quelconque). On retrouve l’angle Δ de ladiffusion de Rutherford (cf. section 2.3.3) en ecrivant la conservation de
−→A a t = ±∞ :
−→A = v1 ∧ −→
C − αr1 = v2 ∧ −→C − αr2 =⇒ (v2 − v1) ∧ −→
C = α(r2 − r1) .
� Mouvements impliquant des vecteurs tournants
Rappelons l’equation satisfaite par un vecteur−→V (t) qui tourne a vitesse angulaire −→ω
uniforme, et l’expression de−→V (t) en fonction des valeurs initiales de ses composantes
parallele−→V 0‖ et perpendiculaire
−→V 0⊥ a −→ω :
d−→V (t)dt
= −→ω ∧ −→V (t) ;
−→V (t) =
−→V 0‖ + cosωt
−→V 0⊥ +
sinωtω
−→ω ∧ −→V 0⊥ .
Les exemples physiques sont multiples.
- Mouvement de precession d’une toupie (figure 18).
mg
n
O
G
Figure 18
Dans l’approximation gyroscopique, le moment cinetique est−→J = IΩn, ou
−→Ω = Ω n est
le vecteur rotation de la toupie et I le moment d’inertie selon l’axe−−→OG ; O est le point
de contact, suppose fixe, avec le sol et G le c.d.m. On deduit du theoreme du momentcinetique
d−→J
dt= l n(t) ∧mg (l = OG) ,
d’abord que |−→J | = IΩ est constant (−→J · d
−→J
dt= 0), puis que l’axe de la toupie (parallele
a n) precesse a la vitesse angulaire −→ω = −mlIΩ
g autour de la verticale. L’approximationest valable si ω � Ω.
- Precession d’un moment magnetique μ dans un champ magnetique−→B . (μ =
γg−→J ou γg est le facteur gyromagnetique). L’equation
d−→J
dt=
1γg
dμdt
= μ ∧ −→B montre
que μ precesse autour de−→B a la vitesse angulaire ω = −γg −→B .
186 6 • Equations differentielles ; systemes dynamiques
- Mouvement d’une particule chargee, relativiste ou non, dans un champ−→B (figure 19). La conservation de l’energie E = γmc2 =
(1 − v2
c2)− 1
2mc2 (ou12mv2),
consequence de v · dp = 0, implique celle du module de la quantite de mouvement p =γmv (ou mv). L’equation
dpdt
= qv ∧−→B = γm
dvdt
montre que la vitesse v precesse autour de−→B a la vitesse angulaire ω = − q
mγ
−→B (ou
− q
m
−→B ). La trajectoire r(t) s’obtient immediatement par integration de v(t) :
r(t) = r0 + v0‖ t+sinωtω
v0⊥ +1 − cosωt
ω2ω ∧ v0⊥ .
On voit sur cette expression que le mouvement transversal se fait sur un cercle centre en
r0 +ω ∧ v0⊥ω2
et de rayonv0⊥ω
, dans le sens direct par rapport a−→B si q < 0, et indirect
si q > 0. La trajectoire est une helice d’axe parallele a−→B et de pas
2πωv0‖ (representee
sur la figure pour des charges opposees et des C.I. identiques).
B
v
v
charge q<0charge q>00
0
Figure 19
- Pendule de Foucault et effet Zeeman. L’equation du pendule de Foucault est :
m�r = −mω20�r − 2m�ωT ∧ �r .
ω0 =√g/l est la pulsation du pendule ; −→ω T = ω cos θ z est la composante verticale locale de la vitesse de
rotation −→ω de la Terre. Cette equation apparaıt comme un cas particulier bidimensionnel, le deplacementdu pendule �r(t) s’effectuant dans le plan horizontal xOy, de l’equation tridimensionnelle
m�r = −mω20�r + q�r ∧−→
B ,
qui decrit le mouvement non amorti d’un electron atomique galileen en presence d’un champ magnetique−→B (selon Oz). En posant Z = x+ iy cette derniere equation se ramene a :
Z = −ω20 Z + iωcZ et z = −ω2
0 z ,
ou ωc = − qBm
est la pulsation cyclotron. Le mouvement selon z est celui d’un oscillateur harmonique.
6.4 Equations differentielles lineaires a coefficients variables 187
Quant au mouvement transverse il resulte, en vertu de la linearite de l’equation, de l’addition des vecteurstournants
Z+(t) = a eiω+t et Z−(t) = b eiω−t ,
ou ω± sont les racines positive et negative de l’equation ω2 − ωωc − ω20 = 0. Le premier tourne dans le
sens direct a la pulsation ω+ � ω0 + ωc2
(si |ωc| � ω0), le second dans le sens retrograde a la pulsationω− � −ω0 + ωc
2. L’effet Zeeman est la traduction experimentale de ces mouvements sur les champs
rayonnes par la charge : existence de trois frequences ω0 et |ω±|, avec leurs polarisations respectivementrectiligne et elliptiques obtenues par projection du mouvement sur un plan perpendiculaire a la directionde propagation (figure 20).
�
�
�
+
−
0
x
z
y
plan d’observation
B
Figure 20
Pour le pendule de Foucault seul le mouvement transverse existe. Les solutions Z±(t) sont valables, mais
correspondent a des conditions de lancement du pendule tres particulieres. La solution generale
Z(t) = a eiω+t + b eiω−t � (a eiω0t + b e−iω0t) eiωc2 t
correspond a la precession lente (due a la force de Coriolis) dans le sens retrograde, a la pulsationωc2
= −ωT = −ω cos θ, d’un mouvement elliptique (rectiligne si |a| = |b| ; cf. section 2.3.4) dans le plan
(xOy).
6.4 EQUATIONS DIFFERENTIELLES A COEFFICIENTSVARIABLES
Le but de ce paragraphe est d’exploiter la linearite d’une E.D. du second ordre pourdecrire aussi bien : la conjugaison objet-image en optique de Gauss, la quantification desniveaux d’energie en mecanique quantique, ou celle des frequences des ondes stationnairesen mecanique classique, la structure en bandes des niveaux d’energie electroniques dansun cristal, ou celle des frequences de resonance d’un oscillateur parametrique. Il est ausside montrer que, lorsque la variable est l’espace et non le temps, les conditions auxlimites (C.L.) jouent souvent un role plus important que les C.I.
6.4.1 Quatre exemples ; matrices de transfert
� Exemples : mecanique ; optique ; quantique ; ondes
Considerons les equations :
d2x
dt2+ ω2(t)x = 0 et
ddz
(α(z)
dx
dz
)= −β(z)x .
La premiere decrit le mouvement x(t) d’un oscillateur parametrique, dont la pulsation
188 6 • Equations differentielles ; systemes dynamiques
ω(t) varie. La seconde est une recriture de l’equation du second ordre la plus generale.Elle correspond par exemple a la trajectoire x(z) dans le plan xOz d’un rayon lumi-
neux “proche” de l’axe Oz d’une fibre optique d’indice n(x, y, z) � α(z)− β(z)x2 + y2
2(approximation lineaire de la loi de Descartes
ddl
(nu) =−−→gradn obtenue en posant dl � dz,
ux � dxdz
), ou encore a des trajectoires electroniques pres de l’axe dans un potentiel axi-symetrique.
Considerons de meme les equations d’ondes a une dimension :
− �2
2md2ψ
dz2+
(V (z)− E
)ψ = 0 et
ddz
(α(z)
dψdz
)= −β(z, ω)ψ .
La premiere decrit un etat stationnaire quantique Ψ(t, z) = e−iEt� ψ(z) d’une par-
ticule d’energie potentielle V (z) (E.D. de Schrodinger), et la seconde decrit des ondesclassiques Ψ(t, z) = e−iωtψ(z) en notation complexe. Par exemple, l’equation des ondessonores dans un fluide inhomogene de masse volumique ρ(z) et de compressibilite χ(z)
ρ(z)∂2Ψ∂t2
= −∂P′
∂zavec P ′ (surpression) = − 1
χ(z)∂Ψ∂z
conduit a une equation de cette forme pour ψ(z) avec α = χ−1 et β = ρω2. D’autresexemples sont fournis par les cordes vibrantes, les ondes electromagnetiques guidees, etaussi par bon nombre de problemes classiques ou quantiques ou les variables radiale etangulaires peuvent etre separees (cf. section 8.3.2).
� Matrice de transfert
Toutes ces equations recouvrent des realites physiques tres differentes, mais leur contenumathematique est essentiellement le meme. C’est pourquoi, afin d’eviter d’inutiles repeti-tions, nous enoncons les principaux resultats pour l’equation relative a x(z), resultats quenous transposerons ensuite aux autres exemples. Cette equation s’ecrit, comme pour unS.D.L.,
ddz
(x(z)p(z)
)=
(0 (α(z))−1
−β(z) 0
) (x(z)p(z)
)ou p(z) = α(z)
dxdz
,
et sa solution generale a donc la forme (dependance lineaire dans les C.I.) :(x(z)p(z)
)=
(a(z, z0) b(z, z0)c(z, z0) d(z, z0)
) (x(z0)p(z0)
)= M(z, z0)
(x(z0)p(z0)
).
M(z, z0) est appelee matrice de transfert de z0 a z. Elle possede les proprietes :
M(z, z0) = M(z, z1)M(z1, z0) et detM(z, z0) = 1 .
La premiere est la loi de composition vue a la section 6.1.1 ; la seconde est etablie ci-dessous.
6.4 Equations differentielles lineaires a coefficients variables 189
Le choix de p(z) au lieu dedxdz
est important, car meme si α(z) et β(z) sont discontinus
(tres souvent α(z) et β(z) sont constants par morceaux), x(z) et p(z) sont eux continus.On verifie de plus que ce choix conduit a la conservation du wronskien x1p2 − x2p1
de deux solutions arbitaires (x1, p1) et (x2, p2) :
ddz
(x1(z) p2(z)− x2(z) p1(z)
)= 0 .
Cette conservation equivaut a detM(z, z0) = 1 puisque (petit calcul) :
x1(z) p2(z)−x2(z) p1(z) =(x1(z0) p2(z0)−x2(z0) p1(z0)
) (a(z, z0) d(z, z0)−b(z, z0) c(z, z0)
).
Cas importants. Lorsque α et β sont constants, on ad2x
dz2= −β
αx, ce qui permet
d’exprimer facilement x(z) puis p(z) en fonction de x(z0) et de p(z0). On obtient lesexpressions :
M(z, z0) =(
cos k(z − z0) (αk)−1 sin k(z − z0)−αk sink(z − z0) cos k(z − z0)
)siβ
α= k2 > 0 , (1)
M(z, z0) =(
coshK(z − z0) (αK)−1 sinhK(z − z0)αK sinhK(z − z0) coshK(z − z0)
)siβ
α= −K2 < 0 . (2)
Lorsque z → z0, β →∞, β(z − z0) → A constante (c.a.d. β(z) = Aδ(z − z0)) la matricede transfert s’ecrit :
M(z+0 , z
−0 ) =
(1 0−A 1
). (3)
Dans ce cas singulier, x(z) est continu mais p(z) a une discontinuite −Ax(z0) en z0.Applications aux rayons. Le formalisme de la matrice de transfert est identique a celui introduita la section 4.3.2 ; x(z) et p(z), produit de l’indice n(0, 0, z) sur l’axe par la pente du rayon, sontles coordonnees d’un rayon. Les resultats vus alors peuvent etre repris. Par exemple la condition deconjugaison de deux plans z0 et z′0 s’ecrit b(z′0, z0) = 0, et on a O′M ′
0 = a(z′0, z0)OM0 ou a(z′0, z0) estle grandissement (figure 21).
z
M’
z
M00
x(z’0
0
)x(z0)plans conjugués
O’Oz’0
Figure 21��������������
��������������
������������������������
������������������������
����
������
������
�������������������������
�������������������������
z
x x
O’
21
M M’2O 1
Figure 22
De meme si la matrice (ses elements a, b, c, d) est connue pour les deux plans d’entree O1 et de sortie O′2
(dans l’air) d’un systeme optique, la relation de conjugaison de deux points objet M et image M ′ situessur l’axe (figure 22) s’ecrit comme a la section 4.3.2 :
q′ =aq + b
cq + d(MO1 = q , M ′O′
2 = q′) .
190 6 • Equations differentielles ; systemes dynamiques
Enfin la propriete detM(z, z0) = 1 equivaut a la conservation dx dp = dx0 dp0 de l’etendue optique
d’un pinceau lumineux (produit de ses dispersions spatiale dx et angulaire dp) lors du passage d’un plan
z0 a un autre plan z.
REMARQUE. Pour des equations d’ordre n quelconque la notion de matrice de transfertpersiste ainsi que la loi de composition mais la propriete detM = 1 n’est plus vraie engeneral.
6.4.2 Ondes stationnaires ; etats lies ; quantification
Dans de nombreux problemes d’ondes la solution est determinee non par les “C.I.” ψ(z0)
etdψdz
(z0) (ou p(z0) = α(z0)dψdz
(z0)), mais par deux conditions aux limites (C.L.)en deux points z1 et z2 > z1. Ces conditions en chaque point peuvent etre du type
ψ(zi) = 0 (tuyau sonore ferme ou corde fixee en zi),dψdz
(zi) = 0 (tuyau ouvert ou corde
libre), oudψdz
(zi) + μi ψ(zi) = 0 (tuyau ou corde branches sur un impedance acoustique
ou mecanique, μi etant reel si l’impedance est imaginaire pure). Les C.L. en z1 et z2entraınent automatiquement l’annulation d’une combinaison lineaire des coefficients a, b,c et d de la matrice M(z2, z1). Comme les elements de la matrice de transfert dependentde la pulsation ω (ou de l’energie E en quantique), les conditions aux limites ne peuventetre satisfaites, sauf exception tres rare, que pour des valeurs discretes, en nombre finiou infini, de ω (ou E). C’est l’origine de la quantification des frequences des ondesstationnaires ou des niveaux d’energie.
EXEMPLE 1. Frequences d’un tuyau sonore (milieu homogene : ρ et χ constants ;
longueur L = z2 − z1). On verifie que les C.L. ψ(z1,2) = 0, oudψdz
(z1,2) = 0, ou
ψ(z1) = 0 etdψdz
(z2) = 0, s’ecrivent respectivement b = 0, ou c = 0, ou d = 0. Ceci
implique que M est de la forme (1). Par exemple c = 0 conduit a sin kL = 0 et a la
quantification kn =nπ
L= ωn
√χρ. Plus generalement, si
dψdz
(z1,2) = k tgϕ1,2 ψ(z1,2),le lecteur verifiera en procedant comme dans l’exemple 2 la condition de quantificationkL = ϕ1 − ϕ2 (modπ).
EXEMPLE 2. Etats lies de l’E.D. de Schrodinger. Considerons le puits de poten-tiel plat tel que V (z) = V0 < 0 pour 0 < z < L et nul ailleurs, et un etat lie d’energie
E = − �2
2mK2 < 0. On pose k2
0 =2m�2
(E − V0) > 0. Pour les grandeurs continues ψ etdψdz
on a : (ψ(L)dψdz (L)
)=
(cos k0L k−1
0 sin k0L−k0 sin k0L cos k0L
) (ψ(0)dψdz (0)
).
Les conditions aux limites sontdψdz
(0) = K ψ(0) etdψdz
(L) = −K ψ(L), puisque ψ(z) ∝eKz pour z ≤ 0 et ψ(z) ∝ e−Kz pour z ≥ L. La quantification de l’energie est donneepar :
−K =−ko sin k0L+K cos k0L
cos k0L+K sin k0Lk0
ou k0L = 2ϕ (mod π) avec tgϕ =K
ko.
6.4 Equations differentielles lineaires a coefficients variables 191
Cette relation devient simple pour le puits “delta” V (z) = − �2
2mAδ(z), c’est-a-dire
dans la limite |V0| → ∞, L → 0 et |V0|L =�2
2mA fini (A > 0). En effet la matrice de
transfert est de la forme (3), et la condition de quantification devient −K = K − A ;
elle conduit a un seul etat lie d’energie E = − �2
2mA2
4.
Remarque. Dans le cas d’une barriere de potentiel carree de largeur L et de hauteurconstante V0 > 0, la matrice de transfert est de la forme (2) :
M =(
coshK0L K−10 sinhK0L
K0 sinhK0L coshK0L
)avec K2
0 = −2m�2
(E − V0) > 0 .
6.4.3 Ondes propagatives ; reflexion, transmission,adaptation d’impedance
L’etude de la reflexion et de la transmission d’ondes est un probleme avec comme condi-tion aux limites la forme de l’onde pour z → ∞. Dans la suite on considere des milieuxhomogenes pour z < 0 (α(z) = α1) et pour z > L (α(z) = α2).
� Reflexion et transmission
Considerons des ondes de la forme :
ψ(z < 0) = A1 eik1z +B1 e
−ik1z et ψ(z > L) = A2 eik2z .
Eventuellement k2 = iK2 pour une onde evanescente. Supposant connue la matrice detransfert M on a : (
ψ(L−)αdψ
dz (L−)
)=
(a bc d
) (ψ(0+)αdψ
dz (0+)
).
La continuite de ψ et de αdψdz
en 0 et L conduit aux deux equations
A2 eik2L = a(A1+B1)+iα1k1b(A1−B1) et iα2k2A2 e
ik2L = c(A1+B1)+iα1k1d(A1−B1)
qui permettent de determiner le coefficient de reflexion r =B1
A1et le coefficient de trans-
mission t =A2
A1. En physique classique ces coefficients sont souvent exprimes en fonction
des impedances des ondes dans chaque milieu Zi ∝ ω−1αi ki, le coefficient de propor-tionnalite ne dependant pas du milieu (cf. exemples section 8.1.2).
Pour L = 0 (contact de deux milieux semi infinis), la matrice de transfert est evidemmentegale a l’identite (a = d = 1; b = c = 0). On obtient :
r =α1k1 − α2k2
α1k1 + α2k2=Z1 − Z2
Z1 + Z2.
Le cas L �= 0 avec un milieu intermediaire entre 0 et L homogene (α(z) = α0, 0 < z < L)est calculable, la matrice M etant alors de la forme (1) ou (2). Il correspond a de nom-breux exemples connus en physique classique et quantique. En physique classique un casparticulier interessant est celui de l’adaptation d’impedance entre les milieux 1 et 2 :
192 6 • Equations differentielles ; systemes dynamiques
il s’agit de determiner le milieu intermediaire pour que le coefficient de reflexion du cote 1soit nul, donc B1 = 0. On deduit des relations ci-dessus entre A1, B1 et A2 la condition :
iα2k2(a+ ibα1k1) = c+ idα1k1 .
Comme α1k1 �= α2k2 par hypothese, et que a = d, l’egalite des parties imaginairesimplique a = d = 0. Ceci n’est possible que si M est de la forme (1) et a = cos k0L aveck0L =
π
2(milieu intermediaire propagatif et de longueur L egale a un quart de longueur
d’onde). Comme alors c = −α0k0 = −b−1, l’egalite des parties reelles c = −bα1k1α2k2
implique la condition sur les impedances Z20 = Z1Z2 (cf. section 8.1.2).
REMARQUE. Si les milieux 1 et 2 sont identiques (mais differents du milieu intermediaire) on etablit
de meme que r = 0 si sink0L = 0 soit k0L = nπ. C’est aussi la condition de transparence du puits de
potentiel plat quantique.
� Bilans energetiques
Dans l’expression Ψ(t, z) = e−iωt ψ(z) d’une onde, la partie spatiale ψ(z) est a prioricomplexe. Comme l’equation d’onde est a coefficients reels, ψ(z) et ψ(z) constituentdeux solutions auxquelles on peut appliquer la conservation du wronskien. On en deduitque la quantite reelle
j =i
2
(ψ
ddz
(αψ) − ψddz
(αψ))
ne depend pas de z. j est proportionnel en physique classique au flux d’energie (moyenne
dans le temps) et en quantique au courant de probabilite i�
2m
(ψ
dψdz
− ψdψdz
)(cf.
section 4.4.3).
Dans un milieu homogene (α et β constants) on obtient, pour des ondes propagatives :
ψ(z) = Aeikz +B e−ikz ; j = αk(|A|2 − |B|2) ;
j est alors la somme algebrique des flux associes aux deux ondes se propageant en sensopposes. Pour des ondes non propagatives on obtient :
ψ(z) = Ae−Kz +B eKz ; j = 2αK �m (BA) ;
donc j = 0 si B = 0 (cas d’une onde evanescente). Le bilan energetique pour un problemede reflexion transmission s’ecrit :
α1k1(1 − |r|2) = α2k2|t|2 pour k2 reel ou α1k1(1 − |r|2) = 0 pour k2 = iK2 .
|r| = 1 si dans le milieu 2 l’onde est evanescente.
� Matrice SLe cas ou il n’y a qu’une seule onde A2 eik2z pour z > L est particulier. Dans le cas general il y en adeux : ψ(z ≥ L) = A2 eik2z + B2 e−ik2z . Si la matrice de transfert est connue, on peut exprimer A2 etB1, coefficients des ondes sortant de la region [0, L], lineairement en fonction de A1 et B2, coefficientsdes ondes rentrant dans la region [0, L]. La matrice correspondante est appelee matrice S :(
A2
B1
)=
(S11 S12
S21 S22
) (A1
B2
).
Elle contient la meme information sur la region [0, L] que la matrice de transfert. Le bilan α1 k1(|A1|2 −|B1|2) = α2 k2(|A2|2 − |B2|2) montre que si les milieux 1 et 2 sont identiques, ou si on renormalise
convenablement A1, B1 et A2, B2, S est une matrice unitaire.
6.4 Equations differentielles lineaires a coefficients variables 193
6.4.4 Equations avec parametres periodiques ;theoreme de Floquet-Bloch
� Theoreme de Floquet
Quand une E.D. lineaire a des coefficients periodiques, la solution generale est unesomme de “modes”, chacun etant le produit d’une exponentielle (reelle ou complexe)par une fonction periodique de meme periode que les coefficients. Lorsque la periodeest nulle, on retrouve le cas des coefficients constants ou chaque “mode” est une simpleexponentielle.
Ce resultat general se comprend bien sur l’exemple des E.D. du second ordre. Consideronsle cas de l’oscillateur parametrique avec une pulsation ω(t) de periode T , et notonsMT sa matrice de transfert de t = nT a t = (n+ 1)T (n = · · · − 1, 0, 1 · · · ) :(
x(T )x(T )
)= MT
(x(0)x(0)
); MT =
(a bc d
).
Sim est un vecteur propre de MT correspondant a la valeur propre λ, et sim(t) designe lasolution telle que m(0) = m, alors m(T ) = λm(0). Dans l’intervalle [T, 2T ], la solution vadonc reproduire celle de l’intervalle [0, T ] multipliee par λ, et ainsi de suite. Ceci impliquem(t + T ) = λm(t), d’ou on deduit, en posant m(t) = λ
tT mper(t) = e
tT lnλmper(t), que
mper(t) est periodique (mper(t+ T ) = mper(t)). Il suffit alors de remarquer que des C.I.arbitraires peuvent s’ecrire sous la forme de combinaisons lineaires des vecteurs propresde MT (en supposant qu’ils forment une base) pour comprendre le theoreme.
� Resonance parametrique
Si l’un des “modes” m(t) correspond a une valeur propre de module superieur a 1, lesysteme est instable. Comme detMT = 1, ceci se produit lorsque les deux valeurs propresλ et λ−1 sont reelles, c’est-a-dire pour (a+ d)2 − 4 ≥ 0 ou |TrMT | > 2.
EXEMPLE. Considerons un oscillateur harmonique ordinaire x + ω20 x = 0 subissant
la perturbation suivante : a chaque instant nT (n = 1, 2 · · · ) sa vitesse x(nT ) estincrementee de la quantite −Ax(nT ) proportionnelle a son elongation a cet instant.Dans ces conditions, la matrice de transfert M′
T de l’oscillateur perturbe de t = 0+ at = T+ est le produit de la matrice de transfert de t = 0+ a t = T− de l’oscillateurharmonique non perturbe et de la matrice de transfert de T− a T+ qui rend comptede cette perturbation :
M′T =
(1 0−A 1
) (cos ω0T ω−1
0 sin ω0T−ω0 sin ω0T cos ω0T
).
Sa trace 2 cos ω0T − A
ω0sin ω0T =
√4 +
A2
ω20
cos (ω0T +ϕ) est representee en fonction
194 6 • Equations differentielles ; systemes dynamiques
de T sur la figure 23 pourA
ω0> 0 petit (tgϕ =
A
2ω0� ϕ) ; les zones d’instabilite sont
hachurees. La premiere instabilite correspond pour les perturbations a une frequencedouble de la frequence propre de l’oscillateur (ω0T � π).
4T
M’
� � � �
� � � �
−2
0
2
2
/ 0 / 0
/ 0 / 0
3
tr T
Figure 23
� Bandes d’energie dans les cristaux
L’E.D. de Schrodinger en presence d’un potentiel periodique, de periode L, a la memestructure que l’equation de l’oscillateur parametrique. Le theoreme de Floquet s’appellealors theoreme de Bloch. Cependant les fonctions d’onde ψ(z) doivent rester finiespour z → ±∞. Ceci implique que les valeurs propres λ de la matrice de transfert ML
sont de module 1 et donc du type e±ikL. Les facteurs exponentiels λz/L presents dans lesmodes propres sont alors de la forme e±ikz , c’est-a-dire des ondes planes. Cela corresponda |trML| = |2 cos kL| ≤ 2. On voit que a cause de la periodicite spatiale du potentiel, lesniveaux d’energie ne sont plus determines par des egalites entraınant leur quantification,mais par des inegalites impliquant leur regroupement par bandes d’energie.
EXEMPLE. Pour une suite infinie periodique de puits de potentiel “delta ”, separespar des regions de longueur L ou le potentiel est nul, la matrice de transfert ML de0+ a L+ est le produit de celle de la region “homogene” V = 0 par celle d’un “delta”(cf. section 6.4.2) :
ML =(
1 0−A 1
) (cos k0L k−1
0 sin k0L−k0 sin k0L cos k0L
)pour E =
�2k20
2m> 0
=(
1 0−A 1
) (cosh K0L K−1
0 sinh K0LK0 sinh K0L cosh K0L
)pour E = −�2K2
0
2m< 0 .
Pour E > 0 la condition |trML| ≤ 2 conduit a la structure en bandes correspon-dant aux zones non hachurees sur la figure 23 (zones de stabilite de l’oscillateur pa-
rametrique). Pour E < 0 on doit avoir |2 cosh K0L − A
K0sinh K0L| < 2, ce qui
implique A > 0 ; l’etat lie du puits “delta” (K0 =A
2) obtenu a la section 6.4.2. est
remplace par une bande d’energie. Inversement, en faisant tendre L vers l’infini (pour
n’avoir qu’un seul “delta”), l’inegalite precedente donne K0 =A
2et on retrouve l’etat
lie.
6.4 Equations differentielles lineaires a coefficients variables 195
6.4.5 Equations d’amplitude ; approximation adiabatique
La methode de l’equation d’amplitude s’applique a des systemes dont l’equation d’evolu-tion est “proche” de celle x + ω2
0 x = 0 d’un oscillateur harmonique non amorti (dont
la solution generale s’ecrit x0(t) =12(a0e
iω0t + a0e−iω0t)). Elle consiste a considerer
que toute “petite” modification de cette equation se traduit sur x0(t) par un effet demodulation (d’amplitude et de phase).
La solution x(t) de l’equation perturbee s’obtient en posant
x(t) =12(a(t) eiω0t + a(t) e−iω0t)
et en resolvant l’equation obtenue pour l’amplitude complexe a(t) supposee lentementvariable par rapport a e±iω0t.
� Oscillateur parametrique : x + 2λ x + ω20 (1 + h cos γt) x = 0
Cette equation s’ecrit aussi :
( a2
+ λa+ i ω0 (a+ λa))eiω0t +
(c.c.
)= −1
4ω2
0 h (eiγt + e−iγt)(a eiω0t + a e−iω0t) .
A priori tres compliquee, elle se simplifie beaucoup dans le cas ou les parametres λ > 0et h sont petits devant 1, car alors a(t) est une fonction lentement variable du temps.D’abord on peut negliger a et λ a devant ω0 (a + λa) ; ensuite, en multipliant les deuxmembres par e−iω0t, on peut ne conserver que les termes qui, comme a(t), sont a variationlente. Ceci est equivalent a ne retenir dans l’equation ci-dessus que les termes dont lavariation est proche de eiω0t. On est donc amene a eliminer le terme “complexe conjugue”(qui varie essentiellement comme e−iω0t). Quant au second membre, la seule possibilite,pour qu’il existe des termes variant comme eiω0t, est que γ = 2ω0 + δω avec δω � ω0.On obtient l’E.D. d’amplitude :
i ω0 (a+ λa) = −14ω2
0 h eiδωta .
Pour etudier la resonance parametrique posons a(t) = eiδω2 tb(t). L’equation
b(t) = −(λ+ i
δω
2)b(t) +
i
4ω0 h b(t) ,
de la forme z = α z + β z conduit a une instabilite (cf. section 6.2.3) pour(ω0h
4
)2
≥λ2 +
(δω2
)2
; la zone de resonance dans le plan (γ = 2ω0 + δω, h) est hachuree sur lafigure 24.
196 6 • Equations differentielles ; systemes dynamiques
�
�
�
�������������������������
������������������������
��������������������
��������������������
h
4
002
Figure 24
REMARQUE. Si la perturbation au lieu d’etre harmonique comme h cos γt est seulement periodique de
periode T = 2πγ
, la condition de resonance γ = 2ω0 devient n γ = 2ω0 ; c’etait le cas de l’oscillateur
soumis a une suite d’impulsions considere a la section 6.4.4.
� Oscillateur dont la pulsation varie adiabatiquement
Considerons l’oscillateurx+ ω2(t)x = 0
dans le cas ou la pulsation ω(t) est une fonction lentement variable du temps (temps
caracteristique de variation tres superieur a la periode instantanee2πω
). Il est alors naturelde poser :
x(t) =12(a(t) ei
∫t0 ω(s) ds + a(t) e−i
∫t0 ω(s) ds
).
L’equation exacte( a
2+ iωa+
i
2aω
)ei
∫t0 ω(s) ds +
(complexe conjugue
)= 0 conduit aus-
sitot a l’equation d’amplitude ω a+12ω a = 0 et au resultat
ω(t) |a(t)|2 = Cste ouE(t)ω(t)
= Cste (invariant adiabatique),
l’energie E d’un oscillateur etant proportionnelle a ω2|a|2. Donnons des exemples d’ap-plication.- Confinement magnetique. On a vu (cf. section 6.3) que le mouvement d’une particule chargee ga-lileenne dans un champ magnetique constant est, pour sa composante transverse, assimilable a celui d’un
oscillateur de pulsation∣∣∣ qBm ∣∣∣ et d’energie 1
2mv2⊥. Si la composante �v‖ est petite, et si
−→B varie lentement
d’un point de l’espace a l’autre, le mouvement transversal est celui d’un oscillateur de frequence variant
adiabatiquement ; la quantitev2⊥B
est donc conservee. Comme de plus l’energie totale E = 12m(v2⊥ + v2‖)
l’est aussi, le mouvement longitudinal est limite a des regions ou le champ n’est pas trop grand.
- Pression de radiation. Une onde stationnaire pouvant etre assimilee a un oscillateur, considerons
une corde vibrante de longueur L fixee a ses extremites. La condition de quantification k = nπ
Lentraıne
dωω
= − dLL
, d’ou on deduit que lorsque la longueur L de la corde varie adiabatiquement : dEE
= − dLL
.
La relation dE = −F dL donne la valeur F = EL
de la force de radiation exercee par la corde sur sonextremite. On etablit de meme que pour une cavite resonnante (sonore ou electromagnetique) cubiquede volume V = L3, la pression de radiation P , deduite de dE = −P dV , vaut P = E
3Vet que, pour une
particule libre quantique dans une boite (E = �ω = �2k2
2m), P = 2E
3V(pression cinetique du gaz parfait
monoatomique) (cf. aussi section 9.4).
6.5 Oscillateurs non lineaires 197
REMARQUE. L’E.D. de Schrodinger a une dimension etant mathematiquement semblable a l’equation de
l’oscillateur, l’espace jouant le role du temps et k(z) celui de ω(t), l’approximation adiabatique s’applique
aussi en quantique lorsque la longueur caracteristique de variation du potentiel est tres superieure a la
longueur d’onde locale. Une onde progressive Ψ(z) est alors de la forme :
Ψ(z) ∝ k(z)−12 exp i
∫ z k(z′) dz′ avec k2(z) = 2m�2
(E − V (z)
).
Cette approximation connue sous le nom d’approximation WKB s’applique aussi aux ondes classiques.
6.5 OSCILLATEURS NON LINEAIRES
L’etude des systemes dynamiques non lineaires (S.D.N.L.) se justifie pour de nombreusesraisons. La premiere est que les lois physiques lineaires ne sont souvent que des approxi-mations ; il faut donc au moins estimer les corrections non lineaires a apporter aux S.D.L.Une deuxieme reside dans l’instabilite de certains S.D.L. Le fait que leur solution tendevers l’infini necessite de revoir les hypotheses ayant conduit aux equations d’evolution,et d’examiner comment les non linearites modifient eventuellement les conclusions del’analyse lineaire. Enfin certains phenomenes “auto-entretenus” qui tendent asymptoti-quement vers un cycle limite xlim(t) ne peuvent pas decouler d’une evolution lineaire,puisque λxlim(t) n’est evidemment pas solution.
Un S.D.N.L. peut bien sur etre aborde numeriquement, mais son etude systematique enfonction des differents parametres (adimensionnes) presents dans l’equation devient viteimpossible et reste de toute facon “phenomenologique”. Dans l’immensite du domainenon lineaire, les aspects les plus interessants sont les changements qualitatifs de solution,appeles bifurcations, lorsque l’on fait varier un parametre. Il est remarquable que leuretude repose essentiellement sur une linearisation du probleme au voisinage du point debifurcation.
Dans la suite on utilisera principalement la methode de l’equation d’amplitude pouretudier des exemples d’oscillateurs non lineaires. (Cette methode constitue en fait lepremier ordre d’une methode generale : la “mise sous forme normale” d’equations presdes bifurcations.) Elle s’avere appropriee en particulier pour determiner les correctionsnon lineaires lorsque les coefficients des termes non lineaires sont petits.
6.5.1 Oscillateurs lineairement stables faiblement non lineaires
Considerons l’equation :
x+ 2λx+ ω20x+ αx2 + βx3 = f cosωt (λ > 0) .
Elle peut decrire les oscillations d’un pendule simple, auquel cas x ≡ θ est l’elongation
angulaire, α = 0 et β = −ω20
6(si on se limite a des valeurs de θ telles que l’approximation
sin θ = θ− θ3
6est valable). Elle peut aussi s’appliquer a la polarisation Nqx d’un milieu
dielectrique, x decrivant les oscillations non lineaires du nuage electronique en presence
d’un champ electrique oscillant (f =qE
m) ; les termes non lineaires sont alors dans la
realite “tres petits”. Souvent il apparaıt un seul terme, αx2 ou βx3, en liaison avecl’absence ou la presence de la symetrie x→ −x du probleme considere.
198 6 • Equations differentielles ; systemes dynamiques
� Methode de perturbation “naıve”
L’approche la plus naturelle consiste a poser x(t) = x0(t)+x1(t), ou x0(t) est la solutionde l’equation lineaire avec second membre et x1(t) une “petite” correction. En portantx(t) dans l’E.D., on obtient l’E.D. linearisee pour x1(t) (les termes en x2
1 et x31 sont
negliges devant ceux en x1) :
x1 + 2λx1 + ω20x1 + (2αx0 + 3βx2
0)x1 = −αx20 − βx3
0 .
On peut meme a priori supprimer (2αx0 + 3βx20)x1 puisque l’hypothese |x1| � |x0|
entraıne par exemple |αx0x1| � |αx20|.
Cette equation, avec x0(t) = a0 cos(ωt + ϕ0), rend compte des effets qualitatifs suivants. 1) Optique
non lineaire. Le terme αx20 (resp. βx3
0) conduit pour x1(t), et donc pour x(t), a des termes constant et
de pulsation 2ω proportionnels a f2 (resp. de pulsation ω et 3ω proportionnels a f3). Dans l’exemple de la
polarisation dielectrique, les effets associes sont connus sous le nom d’effet Kerr optique et de generation
de lumiere a la pulsation 2ω (resp. de dependance de l’indice vis-a-vis de l’intensite lumineuse E2 et
de generation de lumiere a la pulsation 3ω). 2) Ces harmoniques 2ω, 3ω · · · induites par les termes non
lineaires d’une E.D. peuvent expliquer des effets de resonance de l’oscillateur pour des sous multiples
ω = ω02, ω0
3· · · de sa pulsation naturelle de resonance ω0. 3) Le terme 2αx0x1 peut, pour ω = 2ω0,
induire un effet de resonance parametrique ; il n’est alors plus negligeable.
L’utilisation de cette methode merite attention. Dans le cas du mouvement libre d’unpendule λ = α = f = 0, l’equation pour x1(t) avec x0(t) = a0 cosω0t, qui s’ecrit
x1 + ω20x1 = −βa3
0 cos3 ω0t = −βa30
4(3 cosω0t+ cos 3ω0t) ,
conduit a :x(t) = a0 cosω0t− 3βa3
0
8ω0t sinω0t+
βa30
32ω20
cos 3ω0t .
La “perturbation” en t sinω0t, due au terme “resonnant” en cosω0t present dans lesecond membre de l’equation pour x1, surprend puisqu’elle tend vers l’infini et viole laconservation de l’energie. En fait elle n’a de sens que pout t petit ; x(t) se met alors sousla forme
x(t) = a0 cosωt+ a3 cos 3ωt avec ω = ω0 +3βa2
0
8ω0et a3 =
βa30
32ω20
,
et on retrouve le resultat connu que la periode depend de l’amplitude et qu’il y a desharmoniques. Une facon de montrer que ce resultat reste correct pour t grand consistea porter a priori x(t) = a0 cosωt+ a3 cos 3ωt dans l’equation du pendule. En ne gardantque les termes dominants, de pulsation ω et 3ω, on obtient
(ω20 − ω2) a0 cosωt+ (ω2
0 − 9ω2) a3 cos 3ωt+βa3
0
4(3 cosωt+ cos 3ωt) = 0 ,
d’ou on deduit les memes expressions pour a3 et ω − ω0.
� Methode de l’equation d’amplitude
Elle permet d’eviter le terme resonnant. Rappelons qu’elle consiste a porter
x(t) =12(a(t) eiω0t + a(t) e−iω0t)
dans l’equation de depart, et a ne retenir que les termes a variation proche de eiω0t.
6.5 Oscillateurs non lineaires 199
En remarquant que dans αx2 il n’y a pas de tels termes, que dans βx3 seul le terme ena2a est de ce type, et que dans f cosωt il n’y a de contribution que si ω − ω0 = δω estpetit devant ω0, on obtient l’E.D. d’amplitude :
(iω0 + λ) a+ iω0λa =12feiδωt − 3
8βa2a .
Si f = λ = 0 (cas du mouvement libre d’un oscillateur non amorti anharmonique) on
a : a = i38β
ω0|a|2a. Cette equation, avec l’equation complexe conjuguee pour a, montre
que |a| est constant (aa+ aa = 0) et conduit a a(t) = a0 exp(i38β
ω0|a0|2t
). On retrouve
ainsi rapidement le resultat ω = ω0 +38β
ω0|a0|2.
Si f et λ sont non nuls (etude de la resonance non lineaire pres de ω0), le regimepermanent est obtenu en cherchant une solution sous la forme a(t) = Aeiϕeiδωt. Tenant
compte deδω
ω0� 1 on obtient immediatement :
A2((δω − 3
8β
ω0A2)2 + λ2
)=
f2
4ω20
.
Les courbes A(δω) se deduisent par rotation de 90o du graphe de δω(A), qui lui resultesimplement de la superposition de la courbe bien connue associee a la resonance lineaire
et de la parabole38β
ω0A2 (figure 25) :
δω =38β
ω0A2 ±
√f2
4ω20A
2− λ2 .
On notera sur la figure 25 le deplacement de la frequence de resonance et la constancede la valeur du maximum de l’amplitude a la resonance, et sur la figure 26, la possibilited’hysteresis en frequence. (En effet quand ω augmente, l’amplitude de l’oscillateur sautede B a C, et lorsque ω diminue, elle saute de D a E, car on peut montrer que les pointsde l’arc BD de la courbe sigmoıde correspondent a des solutions instables.)
�
�� ���
�
��
A=++= f² ²
A²f² ²
A²4 ²0(résonance linéaire)
résonance nonlinéaire
= A²83
0
Figure 25
�
A
BE
D
C
Figure 26
200 6 • Equations differentielles ; systemes dynamiques
� Cas des oscillateurs couples ; instabilite non lineaire
La methode ci-dessus permet aussi d’etudier des oscillateurs decrits par les equations adimensionnees
x1 + x1 + βx31 = γ(x2 − x1) , x2 + x2 + βx3
2 = γ(x1 − x2) ,
lorsque les coefficients non lineaire β et de couplage γ sont comparables et petits. En posant xi(t) =12(ai(t) eit + ai(t) e−it), on obtient immediatement les E.D. d’amplitudes :
i a1 = − 38βa21a1 + γ
2(a2 − a1) , i a2 = − 3
8βa22a2 + γ
2(a1 − a2) .
Elles possedent les solutions particulieres (attendues) a1(t) = a2(t) = a0 exp(i 38β|a0|2t
)pour le mode
symetrique, et a1(t) = −a2(t) = a0 exp(i 38β|a0|2t
)exp iγt pour le mode antisymetrique. Un effet
moins attendu, facilement verifiable experimentalement avec des pendules, est l’instabilite du mode
symetrique si β < 0 et si 34|β||a0|2 > γ, c.a.d. si les amplitudes d’oscillation sont assez grandes. (Le
lecteur posera ai(t) = (a0 + bi(t)) exp(i 38β|a0|2t
), et etudiera la stabilite de l’equation linearisee pour
z = b1 − b2, qui s’ecrit iz = − (γ + 3
8β|a0|2
)z− 3
8βa20z.) Si β > 0 c’est le mode antisymetrique qui peut
devenir instable.
6.5.2 Oscillateurs lineairement instables ; exemple de Van der Pol ;bifurcations de Hopf et d’un cycle limite
L’equation adimensionnee, qui se rencontre dans de nombreux domaines de physique(mecanique, electronique...)
x− 2ε(1− x2)x+ x = f cosωt (ε > 0) ,
decrit un oscillateur (de Van der Pol) dont le coefficient d’amortissement −2ε(1 − x2),negatif pour x petit, peut redevenir positif si l’amplitude est assez grande ; le terme nonlineaire a donc pour effet de stabiliser le systeme. Sa resolution fournit un bon exempled’application de la methode des isoclines pour f = 0, et de la methode des equationsd’amplitudes pour f �= 0 et ε petit. On discutera ensuite la “genericite” de cet exemple.
� Methode des isoclines
Pour f = 0 l’equation s’ecrit plus simplement :
y + x = 0 avec y = x+ F (x) et F (x) = −2ε(x− x3
3
).
Ceci suggere de prendre x et y, plutot que x et x, comme coordonnees dans l’espace dephase. Des relations dy + xdt = 0 et
(y − F (x)
)dt = dx, on deduit (en eliminant dt)
l’equation(y − F (x)
) dydx
+ x = 0 satisfaite par les trajectoires y(x), et l’equation des
isoclines (dydx
= tg θ) :
y = −cotg θ x+ F (x) .
Les isoclines θ = 0 et θ =π
2sont respectivement l’axe Oy (x = 0) et la cubique y = F (x) ;
les isoclines θ = ±π4
sont les cubiques y = (−2ε∓ 1)x+ 2εx3
3.
6.5 Oscillateurs non lineaires 201
Dans le cas ε� 1 (figure 27), le lecteur se convaincra que la forme des isoclines impliquequ’une trajectoire initialement proche de O s’en eloigne, tandis qu’une trajectoire initia-lement loin de O s’en rapproche. Ceci conduit a penser que toute trajectoire tend vers uncycle limite. On estime sa “taille” a en posant xlim(t) = a cos t, et en ecrivant que sur laduree d’un cycle la force de frottement ne travaille pas, et donc que sa puissance moyenne< −2ε(1− x2)x2 > est nulle ; on obtient a = 2. Ce resultat est confirme ci-dessous.
�
�
�
��
�
x
yisocline 4
4
2
3
2==
=
Figure 27
x
yM
C
AB
D
N
Figure 28
Dans le cas ε � 1 (schematise sur la figure 28), c’est le terme −2ε(x − x3
3
)qui est
dominant dans l’equation des isoclines, sauf dans le voisinage immediat de θ = 0, ouc’est au contraire le terme −cotg θ x qui domine. Il en resulte que, a part celles quicorrespondent a θ � 0, toutes les isoclines sont tres proches de l’isocline θ =
π
2. Des
lors une trajectoire qui part d’un point M de Oy (ou θ = 0) reste quasiment horizontalejusqu’a ce qu’elle s’approche de N sur la courbe y = F (X). Elle se trouve alors “piegee”par le reseau tres serre d’isoclines jusqu’en A. Entre A et B elle redevient horizontale,puis “piegee” entre B et C, horizontale a nouveau entre C et D, pour finalement decrireindefiniment le cycle limite ABCDA. On peut deduire de cette rapide analyse du portraitde phase l’allure de la fonction x(t). Comme x = y − F (x), x sera petit sur les partiesDA et BC du cycle et grand sur CD et AB. x(t) va donc etre periodique et presenterdes oscillations avec des phases de variations lentes puis rapides bien separees : ce sontdes oscillations de relaxation (figure 29).
BC
x(t) DA
t
Figure 29
202 6 • Equations differentielles ; systemes dynamiques
� Methode de l’E.D. d’amplitude
Pour ε � 1 on porte l’expression x(t) =12
(a(t) eit + a(t) e−it
)dans l’equation et on
conserve seulement les termes a variation proche de eit :
a = − i
2f eiδωt + ε a
(1 − |a|2
4
)avec ω − 1 = δω � 1 .
Pour f = 0, en posant a(t) = A(t)eiϕ(t), on verifie que ϕ est constant et que A =
εA(1 − 1
4A2
). Comme A est du signe de
(1 − 1
4A2
), A(t) tend toujours vers 2 et on
etablit ainsi l’existence du cycle limite.
Pour f �= 0, toute solution stationnaire stable de la forme a(t) = a0 eiδωt, pour laquelle l’oscillateur
a (comme dans le cas lineaire) la meme pulsation 1 + δω = ω que la force, bien que sa frequence
“naturelle” soit egale a 1, caracterise ce qu’on appelle un accrochage de frequence. On montre que cet
accrochage a lieu si |f | > 4|δω|, c.a.d. si la force est assez grande. Demonstration : |a0|2 verifie l’equation((δω)2 + ε2(1− |a0|2
4)2
)|a0|2 = 14|f |2. Pour f petit elle admet une solution proche de |a0|2 = 0 et aussi,
a condition que |f | > 4|δω|, deux solutions |a0|2± � 4 ± ε−1√|f |2 − 16(δω)2 (proches de 4). On etudie
leur stabilite en posant a(t) =(a0 + a1(t)
)eiδωt, et en regardant si la perturbation a1(t) tend vers zero.
L’equation linearisee a1 =(ε(1 − |a0|2
2
) − i δω)a1 − 1
4ε a20 a1 conduit aux conditions de stabilite (cf.
section 3.2.4) |a0|2 > 2 et ε2(1− |a0|22
)2 + (δω)2 > 116ε2|a0|4. On verifie que la solution |a0|2+ est stable.
� Bifurcation de Hopf
L’oscillateur de Van der Pol donne un exemple de cycle limite, mais ne permet pasde decrire comment, quand on fait varier des parametres, un oscillateur lineairementstable peut bifurquer vers un tel cycle. Pres de la bifurcation la methode de l’equationd’amplitude, qui ne garde que les termes en eiω0t (du type
(a eiω0t
)p (a e−iω0t
)(p−1)),conduit en l’absence de forces exterieures a l’equation generale
a = εa− (γ + iδ)|a|2a ,
limitee ci-dessus a l’ordre trois. (Van der Pol correspond a γ > 0 et δ = 0, le penduleamorti a ε = −λ, γ = 0 et δ ∝ β.) De l’equation ρ = 2ρ (ε − γρ) verifiee par ρ = |a|2,on deduit en etudiant le signe de ρ que, lorsque ε varie, la solution a = 0 qui est stable
pour ε < 0 bifurque pour ε > 0 vers le cycle limite d’amplitude |a| =√ε
γsi γ > 0 ; −δ ε
γest la correction non lineaire a la pulsation. Si γ < 0 on ne peut pas donner de resultatgeneral a cet ordre du developpement en puissances de a.
� Bifurcations d’un cycle limite
Le cycle de Van der Pol est toujours stable, mais c’est un cas particulier. Pour etudier demaniere generale la stabilite d’un cycle limite xlim(t) de periode T dans l’espace de phase(a priori a n dimensions), on pose x(t) = xlim(t)+x1(t). L’equation linearisee pour x1(t)est a coefficients periodiques, et on est amene (cf. section 6.4.4.) a etudier sa matrice de
6.5 Oscillateurs non lineaires 203
transfert MT definie par x1(T ) = MT x1(0). Le cycle est stable si ses valeurs propres λiverifient |λi| < 1. Quand on fait varier des parametres, il peut devenir instable dans lestrois cas suivants (de traversee du cercle unite par les λi ; figure 30).
��
�
�
�� �
�O −−1 1
Figure 30
1) Une valeur propre devient egale a −1 ; la periode passe brutalement de T a 2T :doublement de periode (figure 31).2) Une paire de valeurs propres devient egale a e±iθ ; il apparaıt une nouvelle periode
2πT
θet x(t) devient quasi-periodique (de frequences
p
T+ q
θ
T; figure 32).
3) Une valeur propre devient egale a 1 ; il n’y pas alors de conclusion generale. x(t) peutmeme devenir chaotique si n ≥ 3 ; on parle alors de chaos deterministe (voir ouvragesspecialises).
T 2T 3T0 t
x1(t)
Figure 31
�
�
0
x ( )1
1T
2T
3T
Figure 32
Chapitre 7
Fonctions de plusieurs variables ;analyse vectorielle
Les fonctions de plusieurs variables apparaissent des qu’on fait de la geometrie dans l’es-pace (par exemple pour decrire en optique des surfaces d’onde et les rayons qui leurssont orthogonaux), ou qu’on considere des grandeurs (champs) dependant de l’espaceet du temps. Les notions de gradient (de champs scalaires), de divergence ou rotation-nel (de champs vectoriels), de derivee dans une direction ou en suivant le mouvement,etc. sont des outils naturels d’analyse “locale” des champs. Ils trouvent de nombreusesapplications en particulier en hydrodynamique. Cette description differentielle est relieepar les theoremes de Stokes et d’Ostrogradski a une description integrale basee sur lesnotions plus intuitives (deja vues au chapitre 3) de circulation et de flux. Cette approche“globale” plus generale (prise en compte des discontinuites), et moins technique, est bienadaptee aux bilans de grandeurs et a une introduction a l’electromagnetisme.
Un exemple classique qui concerne des variables non spatio-temporelles est la thermody-namique des etats d’equilibre ou l’etude experimentale des formes differentielles “chaleur”δQ et travail δW a joue un role historique pour la decouverte des grandeurs energieinterne U et entropie S (premier et second principes). Meme si l’approche modernea radicalement change (cf. section 1.1.4), le calcul differentiel reste un outil necessaire,notamment pour determiner les etats d’equilibre (extremum de “potentiels”) et maıtriserles changements entre les nombreux choix possibles de variables independantes.
7.1 CALCUL DIFFERENTIEL
7.1.1 Developpement de Taylor ; differentielles ; variation seconde ;extremum ; E.D.P. simples
� Derivees partielles
Une fonction de plusieurs variables f(x1, x2 · · · ) (ou f(x)) devient une fonction d’uneseule variable, x1 par exemple, lorsque les autres x2, x3 · · · restent constantes. La derivee
correspondante∂f
∂x1(x) (ou ∂1f(x)) mesure le “taux de variation de f(x) dans la direction
7.1 Calcul differentiel 205
“x1” au point x ; elle depend a priori de x1, x2 · · ·xn. Par exemple :
∂ixj = δij , ∂i(x2
1 + x22 + · · · + x2
n
) 12 = xi
(x2
1 + x22 + · · ·+ x2
n
)− 12 .
Si ∂1f = 0 pour tout x, f ne depend pas de x1.
Les operations de derivation ∂1, ∂2 · · · ∂n sur f(x) peuvent etre composees (comme pourune variable). Elles ont la propriete importante de commuter :
∂
∂xi
∂
∂xj=
∂
∂xj
∂
∂xi
(donc
∂2f
∂xi ∂xj=
∂2f
∂xj ∂xi: egalite de Schwarz
).
On en deduit, en integrant successivement sur x1 et x2, que la solution de l’equation auxderivees partielles ∂2 ∂1f = 0 s’ecrit : f(x) = f1(x2, x3 · · ·xn) + f2(x1, x3 · · ·xn).La commutation ci-dessus est une consequence de celle des operations de translation surles differentes variables x1 → x1 + a1 · · ·xn → xn + an et du lien (deja vu a la section1.1.3.) entre translation et derivation ; par exemple :
f(x1 + a1, x2 · · ·xn) =(
1 + a1 ∂1 +a21
2(∂1)2 + · · ·
)f(x) =
(ea1 ∂1
)f(x) .
Si on translate toutes les variables x→ x+ a, on obtient (pour des “bonnes” fonctions)le developpement de Taylor en puissances des ai de
(ea1 ∂1
) · · · (ean ∂n)f(x) :
f(x+ a) = f(x) +n∑i=1
ai∂f
∂xi(x) +
n∑i=1
n∑j=1
12aiaj
∂2f
∂xi∂xj(x) + · · · .
� Differentielle
La differentielle de f(x) est definie de facon formelle par :
df(x) =n∑i=1
∂f
∂xi(x) dxi .
Si les dxi representent des variations “petites” des xi, la quantite df(x), “variationinfinitesimale” de f(x), est l’approximation lineaire (ordre 1) de la variation exactef(x+ dx)− f(x). Elle est tres utile pour exprimer la derivee par rapport a λ de la fonc-tion d’une variable f
(x(λ)
)obtenue lorsque les xi dependent d’un parametre λ (chemin
parametre) :
ddλ
f(x(λ)
)=
∑i
xi(λ)∂f
∂xi
(x(λ)
)avec xi(λ) =
dxi(λ)dλ
.
Pour un chemin γ allant de x1 = x(λ1) a x2 = x(λ2) on en deduit∫γ
df def=∫ λ2
λ1
ddλ
f(x(λ)
)dλ = f(x2)− f(x1) ,
resultat independant du chemin γ (si f est bien definie cf. section 7.2.2).
206 7 • Fonctions de plusieurs variables ; analyse vectorielle
� Variation seconde
L’ecart entre la variation exacte de f et sa differentielle [f(x+ dx) − f(x)] − df(x) estdonne, si les dxi sont “petits”, par le deuxieme terme du developpement de Taylor :
δ2f =12
∑i,j
∂2f
∂xi ∂xjdxi dxj =
12
∑i
d(∂f
∂xi
)dxi .
Interpretation geometrique (figure 1) : soient z = ψ(x, y) l’equation d’une surfaceet, sur cette surface, un point fixe m0(x0, y0, z0) et un point courant m(x, y, z) proche dem0 (x = x0 + dx, y = y0 + dy). Le developpement de z − z0 limite au premier terme
z − z0 = (x− x0)∂ψ
∂x(x0, y0) + (y − y0)
∂ψ
∂y(x0, y0)
donne l’equation (exacte) du plan tangent P a la surface en m0. La variation seconde
δ2z =12
(∂2ψ
∂x2(x0, y0) dx2 + 2
∂2ψ
∂x∂y(x0, y0) dxdy +
∂2ψ
∂y2(x0, y0) dy2
)represente l’ecart “vertical” du point m a ce plan. Si δ2z > 0 quel que soit m proche dem0, la surface est situee au dessus du plan tangent tandis que, si δ2z < 0, elle est situeeen dessous (surface localement concave) ; si le signe de δ2z n’est pas defini, la surfacecoupe en general le plan selon deux directions obtenues en ecrivant δ2z = 0 (figure 2).
Æ
y
z
P
x
z
m
0 00 +
+
2
0
0m
x x dxy y dy
Figure 1
m 0
P
Figure 2
� Extremum
Par definition f(x) est extremum (stationnaire) en x0 si :
∂if(x0) = 0 (i = 1, 2 · · ·n) ou df = 0 en x0 .
Il s’agit d’un maximum si δ2f < 0 et d’un minimum si δ2f > 0. (Pour la surfacez = ψ(x, y) un extremum de ψ en m0 correspond a un plan tangent “horizontal” en cepoint.)
Extremum avec contraintes. Souvent on doit chercher un extremum de f(x) lorsqueles variables sont liees par des relations Cα(x) = 0 (α = 1, 2 · · ·p < n) qui ne permettentplus d’expliciter f comme fonction de variables independantes. On montre que la solution
7.1 Calcul differentiel 207
de df(x) = 0 avecCα(x) = 0 s’obtient en introduisant p parametres λα (multiplicateursde Lagrange) et en resolvant, pour les λα et les xi, les p+ n equations :
Cα(x) = 0 et d(f(x) +
∑α
λα Cα(x))
= 0 ⇐⇒ ∂f
∂xi= −
∑α
λα∂Cα∂xi
.
Verification : avec cette expression pour ∂if , on a bien df =∑
i ∂if dxi = −∑α λα dCα
= 0 si les contraintes sont satisfaites. (Voir applications aux sections 7.3.2 et 7.4.1,2.)
� E.D.P.∑
i ai(x) ∂if = G(f) et∑
i ai(f) ∂if = 0
La resolution de ces equations aux derivees partielles se ramene simplement a celle desystemes dynamiques. En effet dans le premier cas, soient x(λ) les chemins definis parx(λ) = a
(x(λ)
)et une condition initiale (C.I.) ; alors sur chacun d’eux f
(x(λ)
)obeit a
l’equation differentielle ordinairedfdλ
= G(f). Dans le second cas, si on se donne la valeur
f(x0) = K de la fonction en un point, on a aussi f(x) = K sur la droite x(λ) = a(K)
passant par x0 (car sur cette droitedfdλ
= 0).
EXEMPLE 1. E.D.P. d’Euler :∑i
xi ∂if = nf . Sur les chemins x(λ) = eλ x0 (x =
x), f verifieddλ
ln f(x(λ)
)= n, d’ou f
(eλ x0
)= enλ f(x0) pour tout x0. En posant
k = eλ (et en changeant x0 en x) on obtient f(kx) = kn f(x) (fonction homogene de
degre n). Inversementddkf(kx) = nkn−1 f(x) entraıne l’E.D.P. d’Euler pour k = 1.
Remarque : comme ∂j[f(kx)
]= k
[∂jf
](kx), ∂jf est homogene de degre n− 1, ∂j∂kf
de degre n− 2, etc.
EXEMPLE 2. E.D.P. d’onde simple : ∂tf+c(f) ∂xf = 0. Ici x = (t, x) et f(x, t) = Ksur la droite t = λ , x = x0 + c(K)λ. Par consequent on obtient le graphe de f(x, t)(en fonction de x) en translatant horizontalement chaque point M(x) du graphe def(x, 0) de la quantite c
(f(x, 0)
)t. Cette E.D.P. (etablie a la section 7.2.4) est la plus
simple qui decrit une propagation sans deformation si la vitesse c est constante ; si ccroit avec f , il y a generation d’une onde de choc (lorsque f(x, t) n’est plus definieunivoquement ; figure 3).
f(x,t)f f(x,0)
x
M(x)
x+c(f(x,0))t
Figure 3
208 7 • Fonctions de plusieurs variables ; analyse vectorielle
7.1.2 Derivees spatiales de champs scalaires et vectoriels
� Gradient et surfaces (figure 4)
grad f
Surf
aces
f =
Cst
e
nu
Figure 4
La differentielle df = ∂xf dx+∂yf dy+∂zf dz d’une fonction f(r) s’ecrit vectoriellement :
df =−−→gradf · −→dr avec
−−→gradf =
∂f
∂xx+
∂f
∂yy +
∂f
∂zz .
Donc le champ de vecteurs−−→gradf est orthogonal aux surfaces de niveau f(r) = Cste ou
df = 0 (equipotentielles, surfaces d’onde...), et le plan tangent en r0 a une telle surfacea pour equation
−−→gradf(r0) · (r− r0) = 0. La relation
−−→gradf =
∣∣−−→gradf∣∣ n definit le vecteur
unitaire normal a la surface f(r) = Cste.
EXEMPLE : f(x, y, z) = z − ψ(x, y) ;−−→gradf = −∂xψx − ∂yψy + z =
(1 + (∂xψ)2+
(∂yψ)2) 1
2 n. Une aire elementaire−→dS = dS n sur la surface z = ψ(x, y) est reliee a
sa projection dS n · z = dxdy sur le plan (x, y) par :
dS = dxdy
√1 +
(∂ψ
∂x
)2
+(∂ψ
∂y
)2
� dxdy
(1 +
12
(∂ψ
∂x
)2
+12
(∂ψ
∂y
)2)
si∣∣−−→gradψ
∣∣ � 1 .(Cette formule generalise l’expression d’un element de longueur dl surune courbe ; cf. section 5.1.1.)
� Exemples de gradients
Une fonction de gradient constant−−→gradf =
−→A s’ecrit f(r) =
−→A · r + Cste, et a pour
surfaces de niveau des plans (cf. section 3.2.2). Une fonction a symetrie spheriquef(r) (surfaces de niveau r =
√x2 + y2 + z2 = Cste) a pour gradient
−−→gradf = f ′(r) r ; en
particulier −−−→grad1r
=r
r2(cf. champ electrique cree par une charge ponctuelle en O dont
le potentiel estq
4πε0r). Si p est un vecteur fixe, −−−→grad
p · rr3
= − p
r3+ 3
(p · r)rr5
donne (a
(4πε0)−1 pres) le champ electrique en r cree par un dipole p en O, ou (aμ0
4πpres) le
7.1 Calcul differentiel 209
champ magnetique en r cree par une petite spire de moment magnetique p ≡ μ = i−→dS.
Enfin,−−→grad
(p1 · p2
r3− 3
(p1 · r) (p2 · r)r5
)= − 3
r4((p1 ·p2) r+p1(p2 ·r)+p2(p1 ·r)−5(p1·r)(p2 ·r) r
)donne (a (4πε0)−1 pres) la force exercee par un dipole p1 en O sur un dipole p2 en r(force non colineaire a r ; cf. section 7.3.1).
� Derivee dans une direction ; operateur nabla
Si−→dr = ε u on a df = ε (ux ∂xf + uy ∂yf + uz ∂zf). Donc
u · −→∇ = ux∂
∂x+ uy
∂
∂y+ uz
∂
∂z
correspond a la derivation dans la direction u (figure 4). On appelle nabla l’operateur−→∇ = x
∂
∂x+ y
∂
∂y+ z
∂
∂z(donc
−→∇f =−−→gradf)
dont le caractere vectoriel sera justifie a la section 7.1.4.
� Operateur laplacien ; solution de Δf(r) = Constante
Au second ordre : f(r+ εu) = f(r) + ε (u · −→∇)f(r) +ε2
2(u · −→∇)(u · −→∇)f(r). Une moyenne
sur les directions (< u2i >=
13;< uiuj >= 0 si i �= j) conduit a < f(r + εu) − f(r) >=
ε2
6Δf(r) avec :
Δf =∂2f
∂x2+∂2f
∂y2+∂2f
∂z2; Δ =
∂2
∂x2+
∂2
∂y2+
∂2
∂z2=−→∇2 operateur Laplacien .
Application : une fonction qui verifie dans un domaine l’E.D.P. de Laplace Δf = 0(potentiel electrostatique, gravitationnel...) est telle que sa valeur en un point est egale asa valeur moyenne sur une petite sphere centree en ce point ; ceci exclut tout maximumou minimum a l’interieur du domaine (donc pas d’equilibre stable pour une particuledans un tel potentiel).
Cas particuliers. Pour une fonction f(r) a symetrie spherique
Δf(r) = f ′′(r) +2rf ′(r) (= C si f(r) = A+
B
r+Cr2
6, et = −k2f si f ∝ e±ikr
r) ,
et a symetrie cylindrique (r =√x2 + y2) :
Δf(r) = f ′′(r) +1rf ′(r) (= C si f(r) = A+B ln r +
Cr2
4) .
REMARQUES. 1) Pour f(r =√x2
1 + x22 + · · ·+ x2
n), on a :
∂if = f ′ xir
, ∂i2f = f ′′
(xir
)2
+ f ′(
1r− x2
i
r3
)et Δf =
n∑i=1
∂2f
∂x2i
= f ′′ +n− 1r
f ′ .
210 7 • Fonctions de plusieurs variables ; analyse vectorielle
2) Pour un champ de vecteurs−→A (r) : Δ
−→A
def= ΔAx x+ ΔAy y + ΔAz z.
� Derivations spatiales d’un champ de vecteurs−→A (�r)
Les derivees partielles relatives aux composantes sont au nombre de neuf (∂iAj , i, j =1, 2, 3). Compte tenu du caractere vectoriel de
−→∇, on peut former avec−→A (cf. section
3.2.1) un champ scalaire, divergence de−→A ,
div−→A =
−→∇ · −→A =∂Ax∂x
+∂Ay∂y
+∂Az∂z
,
un champ vectoriel, rotationnel de−→A ,
−→rot
−→A =
−→∇ ∧−→A = (∂y Az − ∂z Ay) x+ (∂z Ax − ∂xAz) y + (∂xAy − ∂y Ax) z ,
et aussi un champ “quadrupolaire” (cf. section 4.3.1) de composantes :
12
(∂iAj + ∂jAi) − 13
div−→A δij .
Interpretation (figures 5a,b) : on verra a la section 7.2.3. que div−→A dV est le flux de−→
A a travers la surface infinitesimale qui limite le volume dV , et que le flux−→rot
−→A · −→dS
est la circulation de−→A le long du circuit infinitesimal ferme frontiere de dS (resultats
importants utilises a la section 7.1.3).
�������������������������������������������������������������������������������������������
�������������������������������������������������������������������������������������������
������������������������������������������
������������������������������������������
A
(a) (b)
dSA
dV
Figure 5
� Exemples de divergences et de rotationnels (Les calculs, elementaires, sontlaisses au lecteur.)
Pour un champ a symetrie spherique :
divf(r)r =2rf(r) + f ′(r) (= 0 si f(r) =
C
r2) et
−→rot f(r)r = 0 .
Pour un champ a symetrie cylindrique (r =√x2 + y2, r =
(xr,y
r, 0
)et θ =
(−yr,x
r, 0
)),
il y a trois cas :
- champ selon z : divf(r) z = 0 ,−→rot f(r) z = −f ′(r) θ (= 0 si f(r) = C) ;
7.1 Calcul differentiel 211
- champ radial : divf(r) r =1rf(r)+f ′(r) (= 0 si f(r) =
C
r) ,
−→rot f(r)r = 0 ;
- champ orthoradial : divf(r) θ = 0 ,−→rot f(r) θ =
(1rf(r)+f ′(r)
)z (= 0 si f(r) =
C
r) .
Autres exemples. Si ω est un vecteur fixe (par exemple (0, 0, ω)), on a div(ω ∧ r) = 0et
−→rot (ω ∧ r) = 2 ω ; pour le champ des vitesses d’un solide v = v0 + ω ∧ r =⇒−→
rotv = 2 ω ; pour un champ magnetique constant−→B =
−→rot
−→A le potentiel vecteur
est−→A =
12−→B ∧ r (a un gradient pres). De meme sur l’exemple p = (0, 0, p) constant, on
verifie div(p ∧ rr3
)= 0 et
−→rot
(p ∧ rr3
)= − 1
r3p +
3(p · r)rr5
(= −−−→gradp · rr3
d’ou deux
facons d’ecrire le champ d’un dipole) ; en prenant−→dl ‖ z, on verifie :
−→rot
(I−→dlr
)= I
−→dl∧ r
r2(cf. formule de Biot et Savart deduite du potentiel vecteur pour un element de courantsitue en O).
REMARQUE de vocabulaire. On prendra garde qu’un champ tel que div−→A �= 0 (resp.−→
rot−→A �= 0) n’a pas necessairement des lignes de champ qui divergent (resp. tournent)
(figures 6a,b). Inversement un champ dont les lignes divergent (resp. tournent) peut
verifier div−→A = 0 (resp.
−→rot
−→A = 0) (cf.
−→A =
r
ret
−→A =
θ
ren symetrie cylindrique ;
figures 6c,d).
A = f(x) x
div A = 0
x
y
(a)
A =rr
div A = 0
A = f(y) x
rot A = 0
y
x(b) (c)
rot A = 0
A =rθ
(d)
Figures 6
� Proprietes de l’operateur nabla−→∇ possede la double propriete de se comporter comme un operateur de derivationet comme un vecteur dans des formules telles que celles du double produit vectorielou du produit mixte. Cette remarque permet d’ecrire directement de nombreuses rela-tions concernant les gradients, divergences et rotationnels, sans avoir a passer par lescomposantes. Les plus utilisees concernant les gradients et les divergences sont−→∇(fg) = f
−→∇g + g−→∇f (
−−→grad(fg) = f
−−→gradg + g
−−→gradf) ,
−→∇ · −→∇f = Δf (= div−−→gradf) ,
−→∇ · (f−→A ) =−→∇f · −→A + f
−→∇ · −→A (div(f−→A ) =
−−→gradf · −→A + fdiv
−→A ) ,
−→∇ · (−→∇ ∧−→A ) = 0 (div(
−→rot
−→A ) = 0) ,
−→∇ · (−→A ∧−→B ) =
−→B · (−→∇ ∧−→
A ) −−→A · (−→∇ ∧−→
B ) (div(−→A ∧−→
B ) =−→B · −→rot
−→A −−→
A · −→rot−→B ) ,
212 7 • Fonctions de plusieurs variables ; analyse vectorielle
et, concernant les rotationnels :−→∇ ∧ (f
−→A ) =
−→∇f ∧ −→A + f
−→∇ ∧−→A (
−→rot (f
−→A ) =
−−→gradf ∧ −→
A + f−→rot
−→A ) ,
−→∇ ∧ (−→∇f) = 0 (
−→rot
−−→gradf = 0) ,
−→∇ ∧ (−→∇ ∧−→
A ) =−→∇(
−→∇ · −→A ) − Δ−→A (
−→rot (
−→rot
−→A ) =
−−→grad (div
−→A ) − Δ
−→A ) ,
(−→A · −→∇)
−→A =
−→∇−→A 2
2+ (
−→∇ ∧−→A ) ∧ −→
A ,
−→∇ ∧ (−→A ∧ −→
B ) = (−→∇ · −→B )
−→A + (
−→B · −→∇)
−→A − (
−→∇ · −→A )−→B − (
−→A · −→∇)
−→B .
DEMONSTRATION (un exemple). Pour calculer−→∇ ∧ (
−→A ∧ −→
B ) on ecrit−→∇ =
−→∇A +−→∇B
ou par definition−→∇A n’agit que sur
−→A et
−→∇B que sur−→B . Alors :
−→∇A ∧ (−→A ∧−→
B ) = (−→B · −→∇A)
−→A − (
−→∇A · −→A )−→B = (
−→B · −→∇)
−→A − (
−→∇ · −→A )−→B .
De meme−→∇B ∧ (
−→A ∧ −→
B ) = (−→∇B · −→B )
−→A − (
−→A · −→∇B)
−→B = (
−→∇ · −→B )−→A − (
−→A · −→∇)
−→B .
7.1.3 Derivees temporelles et applications hydrodynamiques
� Derivees partielle et particulaire
En physique les champs f(r, t) dependent en general du temps. La derivee partielle∂f
∂t(ou ∂tf) decrit l’evolution de f en un point r fixe. On peut aussi etre interesse, parexemple dans le cas d’un fluide en mouvement dont le champ de vitesse est v(r, t), parce que serait l’evolution locale de f “en suivant le fluide” (qui se deplace de εv dansl’intervalle de temps ε). La limite ε→ 0 de ε−1 (f(r + εv, t+ ε) − f(r, t)) egale a
dfdt
=(∂
∂t+ v · −→∇
)f
est la derivee particulaire (ou en suivant le mouvement) notee aussi en abrege dtf . Onremarquera que dtf est fonction de r et t, et que la definition entraıne que dt = ∂t+v ·−→∇possede toutes les proprietes d’une derivation : dt (fg) = f dtg+g dtf , dt (
−→A ·−→B ) = (dt
−→A )·−→
B +−→A · dt−→B ... Noter aussi que la propriete ∂tf = 0 caracteristique de la stationnarite
d’un champ n’implique en general pas dtf = 0 (et reciproquement).
EXEMPLES. Si f(r, t) = x alors ∂xx = 1, ∂tx = ∂yx = ∂zx = 0 et dtx = vx(r, t). Plusgeneralement dtr = v est le champ de vitesse et dtv = a le champ d’accelerationdu fluide. Si f(r, t) = 0 est l’equation de la surface de separation (evolutive) de deuxfluides 1 et 2, le fait que, par definition, un fluide ne puisse pas passer de f < 0 a f > 0conduit a dtf = 0 sur la surface ; ceci entraıne la continuite de la composantenormale de la vitesse puisque :
dtf = ∂tf + v1 · −→∇f = ∂tf + v2 · −→∇f .
Approximation dt � ∂t. Pour des ondes sonores planes la condition “v · −→∇ � ∂t” estsatisfaite si v � ω
k(vitesse d’oscillation du fluide tres inferieure a la vitesse du son, ou
deplacement tres inferieur a la longueur d’onde).
7.1 Calcul differentiel 213
� Champ de vitesse et deformations (figure 7)
vA dt
Æ+ dl )
A
B dl
dl
v Bdt (
Figure 7
Le vecteur−−→AB joignant deux points entraınes par le fluide varie de δ(
−−→AB) = (vB−vA) dt
entre les instants t et t + dt. Si A et B sont voisins (−−→AB =
−→dl), alors δ(
−→dl) =
−→dv dt ou
encore :
δ(−→dl) = dt
(12−→rotv ∧ −→
dl + [ε]−→dl
)avec [ε]ij =
12
(∂ivj + ∂jvi) .
DEMONSTRATION. On verifie pour δ(dlx) par exemple :12
((∂zvx−∂xvz) dz− (∂xvy−
∂yvx) dy)
+12
(2∂xvx dx+ (∂xvy + ∂yvx) dy + (∂xvz + ∂zvx) dz
)= ∂xvx dx + ∂yvx dy +
∂zvx dz = dvx.
La premiere contribution a δ(−→dl) correspond a une rotation de vitesse angulaire ω =
12−→rotv. La seconde correspond a une deformation, et entraıne une variation rela-
tive de volume dt tr[ε] = dt divv (cf. section 4.3.1). On en deduit que, en suivant lemouvement (cf. aussi section 7.2.3) :
ddt
(d3r) = divv d3r .
Un ecoulement est irrotationnel si−→rotv = 0 et incompressible si divv = 0.
� Theoremes de Bernouilli, Kelvin, Helmholtz et Lagrange
Le champ des vitesses d’un fluide possede des proprietes remarquables lorsque sa deriveeparticulaire est un gradient :
dvdt
=∂v
∂t+ (v · −→∇)v = −−−→gradf
(par exemple f =P
ρ+ gz pour un fluide incompressible dans le champ de pesanteur ; cf.
section 7.2.4).
- Theoreme de Bernouilli : si l’ecoulement est stationnaire, alorsv 2
2+ f est constant
le long d’une ligne de courant et, s’il est de plus irrotationnel, alorsv 2
2+ f est uniforme.
214 7 • Fonctions de plusieurs variables ; analyse vectorielle
DEMONSTRATION : la stationnarite implique dt ≡ v · −→∇ ; en particulier :
−dtf = −v · −→∇f = v · dtv = dt(v 2
2
)soit dt
(v 2
2+ f
)= 0 .
De plus (cf.−→∇
−→A
2
2ci-dessus) −−→∇f = (v · −→∇)v = (
−→∇ ∧ v) ∧ v +−→∇
(v 2
2
)soit, dans le cas
irrotationnel−→∇
(v2
2+ f
)= 0. (Ce resultat s’etend a
−→∇(v 2
2+ f + ∂tϕ
)si v =
−→∇ϕ n’est
pas stationnaire.)
- Theoreme de Kelvin : la circulation de v sur un contour ferme emporte par le fluidereste constante, soit
dt(∮
v · −→dl)
= 0 .
DEMONSTRATION : dt(∮�v·−→dl) =
∮(dt�v)·−→dl+
∮�v·(dt−→dl) = − ∮ −−→
gradf ·−→dl+∮�v·d�v =
∮d(−f+ �v 2
2
)= 0.
- Theoreme d’Helmholtz : les tubes de vortex (composes de lignes de vortex paralleles a−→rot �v =
2�ω) sont entraınes par le fluide et conservent leur “force” (flux de �ω a travers une section du tube).
DEMONSTRATION (figure 8) : la surface d’un tube etant par definition tangente en tout point a �ω, le
flux �ω · −→dS a travers tout element−→dS de cette surface est nul, et donc aussi la circulation de �v “autour”
de−→dS. Or cette circulation se conserve dans le transport (theoreme de Kelvin). Pour etablir le second
resultat on choisit−→dS ‖ �ω ; �ω · −→dS est une caracteristique du tube car div−→ω = 0 (considerer un volume
de tube limite par deux sections droites).
����������������������������
����������������������������
dS
�
Figure 8
- Theoreme de Lagrange : un ecoulement initialement irrotationel (�ω = 0 partout) reste irrotationnel.
DEMONSTRATION : si �ω devenait non nul quelque part, la circulation de �v “autour” d’un element �dSparallele a �ω serait non nul, ce qui contredit le theoreme de Kelvin.
Ces theoremes sont a la base de la physique des tourbillons (cf. ouvrages specialises).
7.1.4 Changements de variables ; regles de calcul
� Definition et mise en garde
Si les n variables xi sont des fonctions de p variables independantes x′j , l’egalite
f(x1, x2 · · ·xn) = f(x1(x′), x2(x′) · · ·xn(x′)
)= g(x′1, x
′2 · · ·x′p)
7.1 Calcul differentiel 215
definit une nouvelle fonction g des x′j differente de f (meme si p = n). Cependantl’habitude (facheuse) en physique est de conserver la meme appellation f , car on a affairea la meme grandeur ; par exemple pour l’entropie, on designe toujours par S les fonctionspourtant differentes S(U, V ) et S(P, T ). On corrige si necessaire cette ambiguıte lors descalculs de derivees partielles en precisant en indice les variables mises en jeu, par exempleen ecrivant :
∂
∂x′1f(x1(x′), x2(x′) · · ·xn(x′)
)=
∂f
∂x′1
∣∣∣x′2,x
′3···x′
p
.
EXEMPLE. L’energie d’un condensateur dont la capacite C depend d’un parametre xs’ecrit :
E =12C(x)V 2 =
12
Q2
C(x)(Q = C(x)V ) .
On a∂E
∂x
∣∣∣V
=12C′(x)V 2 a ne pas confondre avec
∂E
∂x
∣∣∣Q
= −12C′(x)C2(x)
Q2 = −12C′(x)V 2
(cf. section 7.3.1.).
� Regles de calcul
La differentielle de la nouvelle fonction et ses derivees partielles s’obtiennent en portant
les differentielles dxi =∑j
∂xi(x′)∂x′j
dx′j dans l’expression originale de df , et en regrou-
pant les termes en dx′j :
df =∑i
∂f
∂xidxi =
∑i,j
∂f
∂xi
∂xi∂x′j
dx′j =∑j
∂f
∂x′jdx′j avec
∂f
∂x′j=
∑i
∂xi∂x′j
∂f
∂xi,
d’ou la regle pour les operations de derivation :
∂
∂x′j=
∑i
∂xi∂x′j
∂
∂xi.
EXEMPLE 1. E.D.P. de propagation(∂2x −
1c2∂2t
)f =
(∂x +
1c∂t
) (∂x − 1
c∂t
)f =
0. Si u = x+ ct et v = x− ct, alors ∂x = ∂u+∂v et ∂t = c(∂u−∂v). L’equation devient4∂u∂vf = 0 et a pour solution f1(x− ct) + f2(x+ ct) (cf. section 7.1.1).
EXEMPLE 2. Caractere vectoriel de−→∇. Dans une rotation de θ du referentiel xOy,
on a, pour les coordonnees
x = x′ cos θ − y′ sin θ et y = x′ sin θ + y′ cos θ
d’ou, pour les derivees partielles :
∂x′ = cos θ ∂x + sin θ ∂y et ∂y′ = − sin θ ∂x + cos θ ∂y .
Ces relations sont identiques a celles qui font passer de (x, y) a (x′, y′). Plus generalementsi dx = M dx′ (M matrice n× p), alors ∂x′ = Mt ∂x (Mt transposee de M). Donc ∂xa la meme loi de transformation que dx si Mt = M−1 (matrice orthogonale n×n, parexemple une rotation pour n = 3).
216 7 • Fonctions de plusieurs variables ; analyse vectorielle
EXEMPLE 3. Dans une transformation de Lorentz, ct = ct′ coshϕ+x′ sinhϕ et x = ct′ sinhϕ+
x′ coshϕ, on verifie que ( 1c∂t, ∂x) se transforme comme (ct,−x) ; plus generalement ( 1
c∂t,−−→∇) se
transforme comme le quadrivecteur (ct, �r). Dans une transformation de Galilee : t = t′ et
�r = �r′ +−→V t′, d’ou : ∂t′ = ∂t +
−→V · −→∇ �= ∂t (donc stationnarite ∂t = 0 dependante du referentiel),−→∇ ′ =
−→∇ , et dt′def= ∂t′ + �v′ · −→∇ ′ = ∂t +
−→V · −→∇ + (�v −−→
V ) · −→∇ = dt (derivee particulaire invariante).
7.2 CALCUL INTEGRAL
7.2.1 Integration a n dimensions ; jacobien ; cas des tres grandesdimensions
� Integration et domaines d’integration
Rappelons que le volume dans Rn d’un “parallelepipede de base” P (produit desintervalles [ai, bi]) est μ(P) = (b1−a1)(b2−a2) · · · (bn−an). Dans l’approche de Riemannl’integrale
∫∫ · · · ∫D f(x1, x2 · · ·xn) dx1 dx2 · · ·dxn est definie, a partir du pavage de Rn
avec des parallelepipedes de base Pα, comme la limite lorsque les μ(Pα) tendent vers zerode la somme
∑α f(xα)μ(Pα) etendue aux Pα qui intersectent D (xα point de Pα). En
pratique le calcul d’une telle integrale se ramene a une suite de calculs d’integrales a unedimension (sur xi a xk( �=i) fixes puis sur xj a xk( �=i et j) fixes, etc.). Le resultat ne dependpas, lorsque l’integrale a un sens, de l’ordre dans lequel sont effectuees les integrationssuccessives ; par contre les domaines des integrations partielles eux en dependent. Parexemple (figure 9) :
��
�
�
( )
1
2
)(
x2
x1
x1
x2
�
Figure 9
∫∫Df(x1, x2) dx1 dx2 =
∫D1
[∫D(x1)
f(x1, x2) dx2
]dx1 =
∫D2
[∫D(x2)
f(x1, x2) dx1
]dx2 ;
meme si f(x1, x2) = f1(x1)f2(x2), le resultat n’est pas[∫
D1
f1(x1) dx1
]×
[∫D2
f2(x2) dx2
](sauf si D = D1 × D2). Heureusement le domaine D et la fonction f possedent souvent
7.2 Calcul integral 217
des proprietes de symetrie et, par un choix judicieux de nouvelles variables d’integration,on peut se ramener a un domaine simple (parallelepipede de base) ; reste a savoir recrireune integrale lorsqu’on fait un changement de variables.
� Changements de variables x(x′)
Le pavage avec des parallelepipedes infinitesimaux de base pour les coordonnees x′ cor-respond, pour les coordonnees x, a un pavage dont les parallelepipedes ne sont pas debase (figures 10 et 11).
����������������������������
����������������������������
����������������
����������������
� �
�
�
dr
y
x
r d
drd
r
r
OO
� �’
Figure 10
2x
1
x’2 1 2x+=
1x’1 =x
x
x
������������������
������������������
������������������������������������
������������������������������������
OO
�
�’
Figure 11
A chaque variation dx′j (j fixe) correspondent les variations∂xi∂x′j
dx′j des xi et donc,
dans l’espace x, un deplacement δjx =∑i
(∂xi∂x′j
dx′j
)ei qui n’est pas parallele a un
vecteur de base ek de cet espace. Le volume (algebrique) du parallelepipede construitsur les vecteurs δjx vaut (cf. section 4.1.3) J(x, x′) dx′1 dx′2 · · · dx′n, ou J(x, x′) est le
determinant (jacobien) de la matrice (de Jacobi) d’elements∂xi∂x′j
. Avec ce nouveau
pavage :∫ ∫· · ·
∫Df(x) dx1 dx2 · · · dxn =
∫ ∫· · ·
∫D′f(x(x′)
) |J(x, x′)| dx′1 dx′2 · · ·dx′n ,
ou D′ est le domaine (en x′) associe a D (en x).
REMARQUE : si J(x′, x) est plus facile a calculer que J(x, x′), on utilise J(x, x′) =[J(x′, x)]−1.
EXEMPLE 1. x1 = x′1 et x2 = ax′2 − x′1 ; alors δ1x = dx′1(e1 − e2) et δ2x = a dx′2 e2 ;
J = det(
1 0−1 a
)= a.
EXEMPLE 2. Si x = r et si les δjr forment un triedre orthonormal direct, le vo-lume infinitesimal est le produit des |δjr|, egal par exemple a (dr) (r dθ) (r sin θ dϕ) encoordonnees spheriques.
Exemple 3. Le potentiel rayonne par une distribution de charge quasi-ponctuelle (de charge totale q)
suivant une trajectoire �s(t) (parcourue a la vitesse �v(t) = �s(t)) s’ecrit (cf. section 7.5.2) :
218 7 • Fonctions de plusieurs variables ; analyse vectorielle
V (�r0, t0) = 14πε0
∫∫∫ ρ
(�r−�s
(t0− | r− r0|
c
))|�r−�r0| d3r .
Bien que le domaine d’integration soit concentre sur la charge et se limite donc au seul point
�s∗ = �s(t∗), position de la charge a l’instant retarde defini par t∗ = t0 − |�s(t∗)−�r0|c
, le resultat n’est
pas V (�r0, t0) = q4πε0R∗ (avec
−→R
∗= �r0 − �s∗ = R∗u∗) mais :
V (�r0, t0) = q4πε0R∗
(1 − �v(t∗)·u∗
c
)−1(potentiel de Lienart-Wiechert) .
La raison est que le jacobien qui correspond au changement de variable �r ′ = �r − �s(t0 − |�r−�r0|
c
)est
(petit calcul) J(�r ′, �r) = det∣∣δij− viuj
c
∣∣ = 1− �v·uc
. On retrouve ce resultat plus rapidement en ecrivant :
V (�r0, t0) = 14πε0
∫∫∫∫ ρ(�r−�s(t))|�r−�r0| δ
(t − t0 +
|�r−�r0|c
)d3r dt .
L’integration sur �r donne V (�r0, t0) = q4πε0
∫ |�s(t) − �r0|−1 δ(t − t0 +
|�s(t)−�r0|c
)dt et celle sur t, avec
le changement de variable t′ = t− t0 +|�s(t)−�r0|
c, conduit au resultat (car dt′
dt= 1 − �v·u
c).
� Volumes a tres grand nombre de dimensions
L’intuition des petites dimensions est trompeuse lorsque n devient grand. Exemples : levolume d’un domaine Dn,α(R) defini par
∑ni=1 |xi|α < Rα (sphere “pleine” si α = 2)
devient concentre sur sa surface et la loi de repartition d’une coordonnee devient “piquee”en 0 ; le “rayon” typique d’un cube de cote a (volume an) est proportionnel a a
√n.
DEMONSTRATION. Le volume de Dn,α(R) s’ecrit dimensionnellement Vn,α(R) = Rn Vn,α,
d’ou pour n grand (cf. section 1.1.4 : n = 1014 etδR
R= 10−6)
Vn,α(R − δR)Vn,α(R)
=(1 − δR
R
)n� exp
(−nδR
R
)� 0 (au lieu de 1 − n
δR
R� 1 pour n petit). Si on fixe par
exemple x1, le nouveau domaine defini par∑ni=2 |xi|α < Rα−|x1|α a un volume propor-
tionnel a (Rα− |x1|α)n−1
α , qui se comporte pour n grand comme Rn−1 exp(−nα
|x1|αRα
).
Si toutes les positions a l’interieur de Dn,α(R) sont supposees equiprobables, cette quan-tite est proportionnelle (cf. section 10.1.2) a la densite de probabilite Pn,α(x1) de x1
(figure 12). Pour le cube centre en O : R2 =<n∑i=1
x2i >= n
a2
12
−R R
largeurn
n grandn = 2n = 1R
P
1x
n,2 (x )1
Figure 12REMARQUE. Le calcul de Vn,α (volume pour R = 1) peut se faire en ecrivant
1 =∏ni=1
(∫ ∞−∞ e−A|xi|α dxi
)=
∫ ∞0
e−ArαnVn,α rn−1 dr .
7.2 Calcul integral 219
A = 2 si α = 1 et A = π si α = 2. A l’aide de la methode de derivation par rapport a un parametre
decrite a la section 5.1.3., on obtient exactement Vn,1 = 2n
n!, V2p,2 = πp
p!et V2p+1,2 = πp 2p+1
(2p+1)!!. Pour
α quelconque et n grand, le changement de variable r = n1α u donne le comportement dominant
Vn,α(R) ∼ Rn n− nα
(au lieu de Rn pour un cube de cote R). Le calcul de l’integrale restante, dans l’approximation de la
methode du col, ne donne que des facteurs “sous dominants” du type exp(Csten).
EXEMPLE (cf. section 1.1.4). En physique de tels volumes interviennent dans l’espace de phase en
physique statistique ; par exemple la region U − δU ≤ ∑Ni=1
12
( �p2im
+K�r2i) ≤ U a 6N dimensions pour
N oscillateurs (α = 2) a un volume d’ordre(UN
)3N, et la densite de probabilite P6N,2(xi ou pi,x)
n’est autre que la loi de Boltzmann (reflexion laissee au lecteur).
7.2.2 Formes differentielles ; formules de Stokes et Ostrogradski
� Forme differentielle
C’est une expression∑i Ai(x) dxi qui sert a definir des integrales curvilignes le long de
chemins γ parametres :∫γ
∑i
Ai(x) dxidef=
∫ λ2
λ1
∑i
Ai(x(λ)
) dxidλ
dλ .
Si le chemin est ferme (x(λ1) = x(λ2)) l’integrale curviligne est notee∮γ. La differentielle
d’une fonction f est un cas particulier pour lequel :
Ai(x) =∂f
∂xi(x) (1) d’ou
∂Ai∂xj
=∂Aj∂xi
(2) et∮γ
∑i
Ai(x) dxi = 0 (3) .
Inversement si (3) est verifiee pour tout chemin γ ferme dans un domaine D, la forme∑i Ai(x) dxi est bien la differentielle d’une fonction (unique a une constante additive
pres). Elle est definie par f(x) =∫ xx0
∑i Ai(x
′) dx′i + f(x0), car alors l’integrale de x0 ax ne depend pas du chemin suivi (figure 13).
x
x
0�
Figure 13
On va voir, sur les cas particuliers n = 2 et n = 3, que (2) implique aussi (1) sous lareserve importante que, dans D, tout chemin ferme peut etre reduit continument a unpoint.
220 7 • Fonctions de plusieurs variables ; analyse vectorielle
� Formule de Stokes (ou Green) dans le plan
����������������
������������
������������
������������
������������
−
+
+
(b)
(c)
(a)
(e)
(d)
x
y
+
−
+ +
+
−
Figure 14
Dans le cas simple d’un chemin ferme ne se coupant pas, limitant une surface S etparcouru soit dans le sens direct (figure 14a) soit dans le sens indirect (figure 14b), on a∮
γ
(Ax dx+Ay dy) =∫∫
S
(∂xAy − ∂yAx) dS avec dS = ±dxdy
(signe + pour le sens direct et − pour le sens indirect).
DEMONSTRATION : pour un rectangle “direct” (figure 15a) la circulation vaut exac-tement∫ x2
x1
(Ax(x, y1) −Ax(x, y2)
)dx+
∫ y2
y1
(Ay(x2, y) −Ax(x1, y)
)dy =∫ x2
x1
∫ y2
y1
(−∂y Ax + ∂xAy)dxdy .
�
�
(a) (b)x
y
x x
y
1 2
1
y2
*
Figure 15
Pour etendre ce resultat au chemin “direct” γ de la figure 15b, il suffit de paver le planavec des rectangles arbitrairement petits permettant d’approcher γ par un chemin enescalier γ∗. La somme des circulations sur les rectangles est egale a celle sur γ∗, quidans la limite tend vers celle sur γ. La generalisation de ce resultat a un circuit ferme
7.2 Calcul integral 221
γ quelconque (figures 14c,d,e) s’obtient en remarquant qu’il est la reunion de circuitsfermes simples, et en ajoutant leurs contributions.
REMARQUE (figure 16). La demonstration demande que−→A et ses derivees soient definies
a l’interieur de γ. Un contre exemple connu est celui du champ−→B cree par un fil infini
(selon z) parcouru par un courant I, pour lequel ∂xBy−∂yBx = 0 mais∮γ
−→B ·−→dl = μ0I si
γ entoure le fil ;−→B n’etant pas defini sur le fil, γ ne peut etre reduit a un point. Un autre
est l’ecoulement irrotationnel d’un fluide autour d’une aile d’avion (cf. section 8.3.3).
�B
x
y
I
Figure 16
��������������������������������������������
����������
����������
�x dy
−y dx
y
xdx
dy
Figure 17
EXEMPLE (figure 17). L’aire algebrique associee a une courbe fermee orientee γ(cf. section 2.2.1) est :
S =∮γ
xdy =∮γ
−y dx =12
∮γ
(xdy − y dx) .
Si x = V (volume) et y = P (pression),∮γ−P dV est le travail recu au cours d’un
cycle (positif si le cycle est direct).
� Formule de Stokes a trois dimensions (figure 18)
������������
������������
�
�
�
�
S
(x,y,0)
y
x
z
M
M1
2
1
2
xy(S)
Figure 18Soit γ une courbe fermee orientee et S une surface ayant γ pour frontiere. On supposede plus que S est une surface orientable, c.a.d. que pour tout point r de S tout circuitelementaire γ�r entourant ce point possede une orientation qui peut etre definie de maniere
222 7 • Fonctions de plusieurs variables ; analyse vectorielle
unique “par continuite” a partir de celle de γ ; (ceci n’est pas toujours possible ; parexemple, en un tour sur la bande de Mobius, γ est change en −γ ; figure 19).
�
Figure 19
On a alors :∮γ
(Ax dx+Ay dy +Az dz) =∫∫
Dyz(S)
(∂yAz − ∂zAy) dSx
+∫∫
Dzx(S)
(∂zAx − ∂xAz) dSy +∫∫
Dxy(S)
(∂xAy − ∂yAx) dSz .
Les domaines d’integration des integrales doubles sont les projections de S sur les plansorientes (y, z), (z, x) et (x, y), et le choix de signe dSx = ±dy dz, dSy = ±dz dx etdSz = ±dxdy en un point r depend du caractere direct ou indirect de la projection deγ�r sur ces plans.
DEMONSTRATION. Le resultat est evident si γ suit les cotes d’un parallelepipede de base (figure 20).
��
��
�
�
�
=
x
z
y3
++
−3
+
1
−
+
dSz = dx dy
2
12
ou
dSx= dy dz dSy= −dx dz
Figure 20
En effet on a∮γ =
∮γ1
+∮γ2
+∮γ3
ou les γi sont les projections de γ sur les plans (y, z), (z, x) et (x, y) et
a chaque γi on peut appliquer la formule de Stokes a deux dimensions (puisque la troisieme variable est
fixee). On etend ce resultat par un pavage de l’espace permettant d’approcher la surface S (figure 18) par
une surface “en escaliers” S∗ constituee par un ensemble de rectangles arbitrairement petits paralleles
aux plans de base (l’orientabilite assurant que les circulations sur ces rectangles se compensent, sauf sur
γ). Pour les rectangles paralleles au plan de base (x, y), par exemple, la somme des circulations donne
l’integrale sur Sz . Il y a en general plusieurs points M de S de coordonnees (x, y) ; pour chacun on calcule
∂xAy − ∂yAx et dSz = ±dxdy suivant l’orientation de la projection de γ�r sur le plan (x, y).
REMARQUE : aucune structure metrique n’a ete utilisee dans la demonstration. Ce-pendant lorsqu’elle existe (cas de l’espace usuel), le choix dSz = ±dxdy correspondsimplement au signe du produit scalaire
−→dS ·z avec
−→dS = dS n, le sens de n etant deduit de
l’orientation de γ�r par la regle du tire-bouchon. On a alors∮γ
−→A · −→dr =
∫∫S
−→rot
−→A · −→dS.
7.2 Calcul integral 223
� Formule d’Ostrogradski (espace a trois dimensions)
Pour un volume V limite par une surface S fermee, orientee vers l’exterieur duvolume, on a :∫∫
S
(Ax dSx +Ay dSy +Az dSz) =∫∫∫
V
[∂Ax∂x
+∂Ay∂y
+∂Az∂z
]dxdy dz .
DEMONSTRATION. Pour le parallelepipede de la figure 21, et les orientations choisiespour ses faces, on ecrit :
∫∫∫(∂zAz) dxdy dz =
∫ x2
x1
∫ y2y1
[Az(x, y, z2) −Az(x, y, z1)] dxdy =∫∫S Az(x, y, z) dSz ; de meme
∫∫∫(∂x (ou y)Ax (ou y) dxdy dz =
∫∫S Ax (ou y)(x, y, z) dSx (ou y).
Le resultat general s’obtient par un pavage de l’espace par des parallelepipedes arbitrai-rement petits.
��������������������
��������������������1x
y1y2
z1
z2
x2
Figure 21 Figure 22
REMARQUE : il existe des surfaces fermees (non orientables) qui ne limitent pas devolume (bouteille de Klein ; figure 22).
� Expressions de−−→gradf , div
−→A ,
−→rot
−→A et Δf en coordonnees curvilignes
Ces formules, d’une utilite limitee puisque le cas de champs symetriques a deja ete traite a la section7.2.1, sont plus faciles a obtenir en considerant plus generalement un systeme de coordonnees curvilignes(x1, x2, x3) �= (x, y, z) tel que les vecteurs e1, e2 et e3 definis par ∂�r
∂xi= ei ei forment une base ortho-
normee directe. Dans cette base, on a (en tout point �r) :−→A = A1e1 +A2e2 +A3e3 ,
−→dr = e1 dx1 e1 + e2 dx2 e2 + e3 dx3 e3 ,−→
dS = e2e3 dx2 dx3 e1 + e3e1 dx3 dx1 e2 + e1e2 dx1 dx2 e3 d3r = e1e2e3 dx1 dx2 dx3 .
Alors des formulesdf =
∑i ∂if dxi =
−−→gradf · −→dr ,∮ −→
A · −→dr =∮(A1e1 dx1 + · · · ) =
∫∫((∂2(e3A3) − ∂3(e2A2)) dx2 dx3 + · · · ) =
∫∫ −→rot
−→A · −→dS (cf. Stokes) ,∫∫
©−→A · −→dS =
∫∫© (A1e2e3 dx2 dx3 + · · · ) =
∫∫∫(∂1(e2e3A1) + · · · ) dx1 dx2 dx3 =
∫∫∫div
−→A d3r
(cf. Ostrogradski), et enfin de Δf = div (−−→gradf), on deduit respectivement les expressions
−−→gradf = 1
e1
∂f∂x1
e1 + 1e2
∂f∂x2
e2 + 1e3
∂f∂x3
e3 ,
−→rot
−→A = 1
e2e3
(∂∂x2
(e3A3) − ∂∂x3
(e2A2))e1 + permutation circulaire ,
div−→A = 1
e1e2e3
(∂∂x1
(e2e3A1) + ∂∂x2
(e3e1A2) + ∂∂x3
(e1e2A3)),
224 7 • Fonctions de plusieurs variables ; analyse vectorielle
Δf = 1e1e2e3
(∂∂x1
(e2e3e1
∂f∂x1
)+ ∂∂x2
(e3e1e2
∂f∂x2
)+ ∂∂x3
(e1e2e3
∂f∂x3
)).
Pour les coordonnees spheriques (r, θ, ϕ) (resp. cylindriques (r, θ, z)), on a (e1, e2, e3) ≡ (1, r, r sin θ)
(resp. (1, r, 1)).
7.2.3 Analyse vectorielle ; frontieres et champs dependant du temps ;loi de Lenz ; hydrodynamique
L’analyse vectorielle repose sur les identites (1-3), ci-dessous et les proprietes de−→∇.
� Identites de base ; vocabulaire et notations associes
f(r2) − f(r1) =∫ 2
1
−−→gradf · dr (1) ,
∮γ
−→A · dr =
∫∫S
−→rot
−→A · −→dS (2) et∫∫
©S
−→A · −→dS =
∫∫∫V
div−→A d3r (3) .
(1) a ete discutee a la section 7.1.2. (2) (Stokes) relie la circulation Cγ(−→A ) du champ−→A le long du contour γ au flux ϕS (
−→rot
−→A ) a travers une surface ouverte S limitee et
orientee par γ ; si γ est infinitesimal Cγ(−→A ) =−→rot
−→A · −→dS. (3) (Ostrogradski) relie le flux
ΦS(−→A ) de
−→A a travers une surface fermee S (orientee vers l’exterieur) a l’integrale,
dans le volume V qu’elle entoure, de div−→A ; si V est infinitesimal ΦS(
−→A ) = div
−→A d3r.
Avec la convention de sommation d’Einstein (cf. section 4.1.3), (2) et (3) s’ecrivent∮γ
Ai dxi =∫∫
S
εijk ∂jAk dSi (2′) et∫∫©S
Ai dSi =∫∫∫
V
(∂iAi) d3r (3′) ,
ou Ai ≡ Ax, Ay, Az peuvent etre trois fonctions arbitraires.
Conditions de nullite. 1) Si−→A =
−−→gradf (resp.
−→A =
−→rot
−→V ), les integrales (2) (resp.
(3)) sont nulles. La reciproque est vraie si le domaine dans lequel les integrales sont nullespeut etre continument reduit a un point. (Remarque : on peut avoir a la fois
−→A =
−→∇fet
−→A =
−→∇ ∧−→V , par exemple f(r) =
−→A · r et
−→V =
12−→A ∧ r). 2) L’integrale (2) (resp. (3))
tend vers 0 si γ (resp. S) s’en va a l’infini et si |−→A (r)| decroit plus vite que r−1 (resp.r−2) lorsque r →∞.
� Autres identites
Celles-ci etant tres nombreuses on se limite a deux exemples.
EXEMPLE 1. Dans un milieu continu la resultante des forces de contraintes a lasurface S d’un volume V et leur puissance s’ecrivent comme des integrales sur V :∫∫©S
[σ]−→dS =
∫∫∫V
fc d3r avec fc,x = ∂x σxx + ∂y σxy + ∂z σxz (idem pour fc,y et fc,z)
et∫∫©S
v · [σ]−→dS =
∫∫∫V
P d3r avec P = div([σ]v) = fc · v + tr([σ][ε]
).
7.2 Calcul integral 225
([σ] = −[P] est la matrice des contraintes ; cf. section 4.3.1). Ceci donne pour desforces de pression :∫∫
©S
− P−→dS =
∫∫∫V
−−−→gradP d3r ; P = −−−→gradP · v − P divv .
Demonstration :∫∫©S
σij dSj =∫∫∫
V
∂j σij d3r et∫∫©S
viσij dSj =∫∫∫
V
∂j (viσij) d3r =∫∫∫V
vi ∂j σij d3r +∫∫∫
V
σij12
(∂ivj + ∂j vi
)d3r car σij est symetrique. (Si [σ] avait
une partie antisymetrique cij , il faudrait rajouter l’integrale de cji12
(∂ivj − ∂j vi
)interpretable comme la puissance
−→C · ω de couples volumiques ; l’hypothese σij = σji
equivaut donc a l’absence de tels couples dans la modelisation habituelle des milieuxcontinus.)
EXEMPLE 2. Dans le calcul du potentiel scalaire (ou vectoriel) du a une repartition volumique de
dipoles electriques (ou magnetiques), on utilise les relations (avec f(�r) ∝ |�r − �r0|−1) :∫∫∫V
(−→P · −→∇f ou
−→M ∧−→∇f)
d3r =∫∫∫
Vf
(−−→∇ · −→P ou−→∇ ∧−→
M)d3r +
∫∫©
S f(−→P · −→dS ou
−→M ∧−→
dS).
Demonstration : on considere les integrales de surface. Dans le cas electrique ΦS(f−→P ) est l’integrale sur
V de div(f−→P ) =
−→P ·−→∇f+f div
−→P . Dans le cas magnetique, quel que soit �u constant, �u
∫∫©
S f−→M ∧−→
dS =
ΦS(f�u ∧ −→M) (�u “passant sous le signe somme”) est l’integrale sur V de :
div(f(�u ∧ −→
M))
= f(−→M · −→rot �u− �u · −→rot−→M)
+−→∇f · (�u ∧ −→
M) = �u · (−→M ∧−→∇f − f−→rot
−→M
).
(Demonstration plus rapide :∫∫©
S εijkfMj dSk =∫∫∫
Vεijk
(Mj ∂kf + f∂kMj
)d3r).
� Frontieres et champs dependant du temps
��
�
Æ
dr
2
1
ld
Figure 23
S1
S2
Æ l
dS
+−
Figure 24
Un deplacement infinitesimal−→δl (r) “continu” des points de γ ou S (fermes) entraıne les
variations :
δ
[∮γ
−→A · −→dl
]=
∮γ
−→rot
−→A · (−→δl ∧ −→
dr)
; δ
[∫∫∫V
f d3r
]=
∫∫©S
f−→δl · −→dS .
DEMONSTRATION : Cγ2(−→A )−Cγ1(
−→A ) = C{γ2−γ1}(
−→A ) ou {γ2−γ1} est le circuit ferme de
la figure 23 qui limite une surface laterale (supposee orientable) de vecteur−→dΣ =
−→δl ∧−→dr.
La variation de l’integrale triple a elle simplement pour origine les volumes hachures(algebriques)
−→dS · −→δl (figure 24).
226 7 • Fonctions de plusieurs variables ; analyse vectorielle
Applications en electromagnetisme. Si le champ−→A et le deplacement
−→δl dependent
du temps (avec−→δl = vγ(r, t) dt), alors :
ddt
[∮γt
−→A · −→dr
]=
∮γt
(∂−→A∂t
+−→rot
−→A ∧ vγ
)· −→dr .
(Ceci resulte de
Cγt+dt
(−→A (r, t+dt)
)−Cγt
(−→A (r, t)
)= Cγt+dt
(−→A (r, t+dt)−−→
A (r, t))+C{γt+dt−γt}
(−→A (r, t)
)et du fait que Cγt+dt
(−→A (r, t + dt) − −→
A (r, t))
= Cγt
(∂−→A∂t
)dt au premier ordre). Une
premiere application est la loi de Lenz e = −dϕdt
, qui relie la circulation du champ
electromoteur−→E em = −∂t−→A +vγ ∧−→B au flux de
−→B =
−→rot
−→A pour des fils conducteurs en
mouvement a la vitesse vγ . Remarque : les contre exemples connus a cette loi sont descas ou, soit vγ est discontinue (dynamo unipolaire ; figure 25a), soit γt balaye une surfacenon orientable (galvanometre a champ radial ; figure 25b).
������������������������������������������
������������������������������������������
������������������������������������������
������������������������������������������
�
(a) (b)
surfacenon orientable
�S
N
de vitessediscontinuité
d
Figure 25
Une seconde application est le bilan energetique (pouvant etre etendu a plusieurs
circuits)∮γ
I∂−→A
∂t· −→dr = I
dϕS(−→B )
dt−
∮γ
I(−→dr ∧ −→
B ) · vγ , qui relie la derivee temporelle
de l’energie magnetique aux puissances fournies par des sources electriques et par dessources mecaniques s’opposant aux forces de Laplace (cf. sections 7.3.1 et 7.5.2).
Applications en hydrodynamique. Si dans l’integrale triple le domaine Vt depend dutemps, chaque point etant entraıne par le champ de vitesse ve) (qui n’est pas necessairementcelui du fluide), on a pour toute fonction f(r, t) :
ddt
[∫∫∫Vt
f(r, t) d3r
]=
∫∫∫Vt
∂f(r, t)∂t
d3r +∫∫©St
f(r, t)ve · −→dS =∫∫∫
Vt
(∂f∂t
+ div(fve))
d3r
=∫∫∫
Vt
(dfdt
+ f divve)
d3r avecddt
=∂
∂t+ ve · −→∇ .
DEMONSTRATION. La premiere egalite resulte de ce que la difference des integrales def(r, t+dt) sur Vt+dt et de f(r, t) sur Vt est la somme de l’integrale de f(r, t+dt)−f(r, t)
7.2 Calcul integral 227
sur Vt+dt, ou Vt au premier ordre, et de l’integrale de f(r, t) sur {Vt+dt−Vt}. Les autres
sont des consequences immediates. La derniere expression se deduit aussi deddt
(f d3r
)avec
ddt
d3r = divve d3r (ou justifie cette egalite si on choisit f = 1).
Si f = ρ (masse volumique) et ve = v (vitesse du fluide), la conservation de la massedans le volume Vt entraıne par un fluide se traduit par :
∂ρ
∂t+ div(ρv) = 0 (ou
dρdt
+ ρ divv = 0) L.C. de la masse .
Plus generalement si G est une grandeur de densite volumique ρG
= ρg (g grandeurmassique, g = 1 pour la masse, g = V = ρ−1 pour le volume, g = v pour la quantite de
mouvement, g =12v2 pour l’energie cinetique et g = e pour l’energie interne), on a :
ddt
[GVt =
∫∫∫Vt
ρg d3r
]=
∫∫∫Vt
(∂(ρg)∂t
+ div(ρgv))
d3r =∫∫∫
Vt
ρdgdt
d3r .
La derniere egalite resulte de la L.C. de la masse et s’obtient aussi directement en ecrivantque dt(ρg d3r) = ρ d3r dtg car dm = ρ d3r est constant.
7.2.4 Bilans de grandeurs ; applications aux milieux continus
� Circulation automobile
Cet exemple simple sert d’introduction aux divers raisonnements sur les bilans. Sur unevoie de circulation, soient n(x, t) la densite lineique de voitures se deplacant a la vitessev(x, t) et j(x, t) = n(x, t) v(x, t) leur flux. La L.C. des voitures se traduit, pour leur
nombre NAB entre deux points A et B, par le bilandNAB
dt= j
A− j
Bsi A et B sont
fixes, et par le bilandNAB
dt= 0 si A et B sont entraınes avec les voitures. Pour A et B
“proches” (xA
= x, xB
= x+ dx) et n et j “continus”, le premier s’ecrit
ddt
(n dx) =∂n
∂tdx = j(x, t) − j(x + dx, t) soit ∂tn+ ∂xj = 0 ,
et le second
ddt
(n(x
B− x
A))
=dndt
dx+ n dv = 0 soit dtn+ n ∂xv = 0
(resultats equivalents).
Si on s’interesse a une grandeur g transportee par chaque voiture (g = m, mv,12mv2 · · · ),
sa densite est ρG
= ng et son flux (ou courant) est jG
= ngv. La quantite
τ = ∂t(ng) + ∂x(ngv) = n ∂tg + nv ∂xg (L.C. des voitures) = n dtg
est l’apport (par unite de longueur) aux voitures de la grandeur consideree (force lineiqueexercee par la route si g = mv).
228 7 • Fonctions de plusieurs variables ; analyse vectorielle
S’il existe une onde de choc (provoquee par des voitures arretees a un feu par exemple),alors pour A et B fixes situes de part et d’autre de la discontinuite qui se deplace a lavitesse V , le bilan est dNAB = (n1 − n2)V dt (car dans l’intervalle de temps dt unedensite lineique n2 est remplacee par n1 sur la longueur V dt ; figure 26).
�
�
�
n vV
vn 2 1 = 0
t
t+N
2 1
t
t
xBA
Figure 26
DedNAB
dt= (n1 − n2)V = j
A− j
B= n1v1 − n2v2 ,
on deduit V =n1v1 − n2v2n1 − n2
. On notera enfin qu’une distribution continue peut induire
une onde de choc si il existe une relation (phenomenologique) j(n) entre densite et courant
(flux) ; en effet la L.C. qui s’ecrit alors ∂tn+ c(n) ∂xn = 0 avec c(n) =djdn
est l’equationd’onde discutee a la section 7.1.1.
� Ecritures generales d’un bilan
Soit GV une grandeur extensive relative a un volume fixe. On peut souvent distinguer
dansdGVdt
ce qui est du a des echanges a travers la frontiere S (notion de flux associe
a une densite de courant jG), de la “production sur place” de grandeur (associee a des
termes de source algebriques τG). Le bilan s’ecrit, sous forme integrale
ddt
[GV =
∫∫∫V
ρG d3r
]=
∫∫∫V
∂ρG
∂td3r = −
∫∫©S
jG · −→dS +∫∫∫
V
τG d3r ,
et sous forme differentielle :∂ρG
∂t+ divj
G= τ
G.
Si Vt est un volume dependant du temps, la comparaison dedGVdt
et dedGVt
dtmontre
qu’il suffit de remplacer jG
par jG
′ = jG− ρ
Gv
Sou v
Sest la vitesse d’un point de la
surface (vS = v si Vt suit le fluide).
� Lois de conservation (L.C.)
La grandeur G est dite conservee localement si τG
= 0 (pas de creation). C’est le casde la masse, de la charge electrique, de la quantite de mouvement en absence de forces adistance... Par contre τS ≥ 0 pour l’entropie (cf. section 8.2.3).
7.2 Calcul integral 229
REMARQUES. 1) Notamment dans le cas de l’energie il est important de bien preciserla “forme” consideree : energie cinetique, ou interne, ou relative a un sous systeme (parexemple a des particules dans un champ electromagnetique), ou a une onde (qui peutetre absorbee par le milieu), etc ; en effet meme si τ
G= 0 pour la grandeur totale, en
general τG�= 0 pour chaque “forme”. 2) Si S est une surface de discontinuite (onde de
choc), la L.C. s’ecrit (egalite des flux de part et d’autre de la discontinuite) :
(jG,2 − ρ
G,2vS) · −→dS = (j
G,1 − ρG,1vS
) · −→dS (vS
=j
G,2 − jG,1
ρG,2 − ρ
G,1
a une dimension) .
� Lois de conservation microscopiques
Les L.C. locales definies ci-dessus concernent des grandeurs macroscopiques. Il existeaussi en physique des L.C. microscopiques : pour des particules ponctuelles i possedantune caracteristique gi constante au cours du temps (nombre gi ≡ 1, masse mi, chargeqi...), et decrivant des trajectoires ri(t) a la vitesse vi(t), on a automatiquement :
∂tρmicroG
+divjmicroG
= 0 avec ρmicroG
=∑i
gi δ(r−ri(t)
)et j micro
G=
∑i
gi vi(t) δ(r−ri(t)
).
Cette loi reste valable si on remplace δ(r) par une fonction “lissante” f(r).DEMONSTRATION : pour tout f on a ∂tf
(r− ri(t)
)= −vi(t) · −→∇f = −div
(fvi(t)
); si
gi dependait du temps on aurait un terme de source τmicroG
=∑
i gi(t) f(r−ri(t)
). C’est
ainsi, par des operations de lissage (moyenne), que beaucoup de bilans macroscopiquespeuvent etre deduits de bilans microscopiques.
� Flux en hydrodynamique et elasticite
Quand on suit dans son mouvement avec le milieu un element de surface−→dS (1 et 2
designant le milieu de part et d’autre), le flux de masse, le flux de quantite de mouvement(force de contact exercee par 1 sur 2) et le flux d’energie (“puissance de la force de contact+ flux thermique”) valent respectivement :
dϕ′m = 0 ; dϕ ′
�p = [P]−→dS (ou − [σ]
−→dS) ; dϕ′
E = v · [P]−→dS +jth · −→dS .
Si−→dS est fixe, comme j
G= j ′
G+ ρ
Gv, il faut ajouter a ces flux ρ
Gv ·−→dS avec ρ
G= ρ ou ρv
ou ρ(12v2 + e). Pour un fluide parfait ([P] ≡ P pression, jth = 0) on obtient (cf. aussi
la section 3.2.4) :
dϕm = ρv · −→dS ; dϕ�p = ρv(v · −→dS) + P−→dS ; dϕE =
(12v2 + e+
P
ρ
)ρv · −→dS .
Application : vitesse d’une onde sonore a une dimension. Les L.C. de la masse et dela quantite de mouvement en presence d’une discontinuite donnent :
vS
=ρ2v2 − ρ1v1ρ2 − ρ1
=(P2 + ρ2v
22) − (P1 + ρ1v
21)
ρ2v2 − ρ1v1.
Si la discontinuite est faible et le fluide proche du repos (ρiv2i � Pi), alors v2
S� dP
dρ.
230 7 • Fonctions de plusieurs variables ; analyse vectorielle
REMARQUE. On peut ajouter a dϕE le terme ρgz �v · −→dS si l’energie potentielle de pesanteur n’est pas
prise en compte par ailleurs (cf. bilans locaux ci-dessous). Les bilans deduits des flux ci-dessus recouvrent
une grande quantite d’applications pratiques. Beaucoup concernent la quantite1
2v2 +e+
P
ρ+gz qui, en
ecoulement permanent, reste constante le long d’une ligne de courant si l’energie du fluide est conservee
(theoreme de Bernouilli), ou varie d’une quantite reliee aux travaux et echanges thermiques effectues
par une masse unite de fluide lors de son ecoulement entre les points consideres. On trouvera des exemples
dans les livres d’hydrodynamique pour ingenieurs.
� Bilans locaux et equations des milieux continus
Pour une masse dm de matiere qui occupe un volume elementaire d3r et se deplace a lavitesse v, les bilans de quantite de mouvement et d’energie s’ecrivent (l’effet des forcesde contraintes ayant ete decrit a la section 7.2.3) :
ddt
(dmv) = fc d3r + dmg + fa d3r = dmdvdt
,
ddt
(dm
(v2
2+ e
))= div
([σ]v
)d3r − divjth d3r + v · (dmg + fa d3r) + τa d3r .
dmg est la force due au champ de pesanteur local ; fa designe des forces volumiquesautres, par exemple de Laplace j ∧−→B en magnetohydrodynamique, de Coriolis −2ρω∧vet“centrifuge” dans un referentiel non inertiel, etc. ; τa designe les sources d’energie autres(effet Joule par exemple). En divisant les deux membres par d3r, le bilan de quantite demouvement s’ecrit :
ρdvdt
= ρ
(∂v
∂t+ (v · −→∇)v
)= fc + ρg + fa .
On en deduit, en faisant le produit scalaire avec v, le bilan d’energie cinetique et poten-tielle :
ρddt
(12v2 + gz
)= (fc + fa) · v car ρg · v = −ρ d(gz)
dt.
Il permet de recrire le bilan d’energie sous la forme, ne faisant intervenir que l’energieinterne (premier principe) :
ρdedt
= tr([σ][ε]
)− divjth + τa ([ε]ij =12
(∂ivj + ∂jvi)) .
Dans la suite jth = 0, fa = 0 et τa = 0. Par exemple pour un fluide parfait (fc =
−−−→gradP ), on obtient l’E.D.P d’Euler ρdvdt
= −−−→gradP + ρg qui, si ρ est constant (ou
si P ne depend que de ρ), fait quedvdt
est un gradient et conduit a tous les theoremes
vus a la section 7.1.3 ; la puissance interne volumique tr([σ][ε]
)= −P divv correspond
au terme −P dVdt
en thermodynamique.
AUTRES EXEMPLES. 1) Fluide visqueux. Il faut alors ajouter la force de composantes fc,i =∑j ∂jσij avec, dans le cas lineaire (cf. section 4.3.1), σij = η(∂ivj + ∂jvi) + δij
(ζ − 2η
3
)div�v ; ceci
donne
ρ d�vdt
= −−−→gradP + ρ�g + ηΔ�v +
(ζ + η
3
) −−→grad (div�v)
7.3 Applications a la mecanique et a l’optique geometrique 231
qui, pour un fluide incompressible (div�v = 0), est l’E.D.P. de Navier-Stokes. On verifie que
tr ([σ][ε]) > 0 (augmentation locale de l’energie interne du fluide). 2) Milieu elastique lineaire. Avec−→ψ designant le champ de deplacement (infinitesimal) et σij = μ (∂iψj +∂jψi)+ δij
(χ−1 − 2μ
3
)div
−→ψ ,
on obtient l’E.D.P. des ondes elastiques :
ρ ∂2−→ψ∂t2
= μΔ−→ψ +
(χ−1 + μ
3
)−−→grad (div
−→ψ ) .
tr ([σ][ε]) est alors la derivee temporelle d’une energie elastique.
7.3 APPLICATIONS A LA MECANIQUE ET A L’OPTIQUEGEOMETRIQUE
7.3.1 Mecanique et fonctions energie potentielle
Dans de nombreux cas importants, les forces (et les couples) peuvent se calculer a partirde la differentielle d’une fonction des positions (et orientations) des corps concernesappelee energie potentielle Ep. Cette fonction depend aussi de parametres decrivant l’etatdes corps ou leur environnement, parametres qui, par definition, restent fixes dans ladifferentiation. Sa determination a partir des energies connues en physique depend defacon cruciale du choix effectue pour les parametres.
� Systeme de points materiels
Pour des points materiels (isotropes) l’energie potentielle est une fonction Ep(r1, r2 · · ·rn)de leurs positions telle que les forces fi sur chacun d’eux s’en deduisent par :
dEpdef= −
∑i
fi · −→dri soit fi = −−→∇iEp avec−→∇i ≡
(∂
∂xi,∂
∂yi,∂
∂zi
).
L’equilibre (fi = 0) correspond a Ep extremum ; il est stable si δ2Ep > 0.
La force resultante−→F α =
∑i∈α
fi sur un sous ensemble α de points s’obtient enremarquant que dEp = −−→F α ·−→drα lorsque
−→dri∈α =
−→drα et
−→dri�∈α = 0 (donc en considerant
par la pensee une translation rigide de l’ensemble α, les autres points restant fixes).Pour le moment resultant des forces
−→Γ α =
∑i∈α ri ∧ fi, on remarque aussi que :
dEp = −−→Γ α · −→dθα lorsque−→dri∈α =
−→dθα ∧ ri et
−→dri�∈α = 0 (rotation rigide de l’ensemble
α, les autres points restant fixes). Si Ep est invariante par translation (resp. rotation) laforce resultante totale (resp. le moment total) est nulle.
REMARQUE. Le travail elementaire des forces fi etant δW =∑i
−→f i ·−→dri la differentielle
dEp = −δW
est le travail δWsm qu’une source mecanique (un “operateur”), exercant les forces −fi,devrait effectuer pour rendre les deplacements quasi-statiques.
EXEMPLE 1. Electrostatique : Ep = (4πε0)−1∑
(i,j) r−1ij qiqj . Divisons les charges
en deux groupes α et β. Comme les interactions ne dependent que de rij = |ri − rj | ilsuffit, pour avoir les actions de β sur α (ou de α sur β), de considerer l’energie poten-
232 7 • Fonctions de plusieurs variables ; analyse vectorielle
tielle d’interaction qui est la restriction de la double somme aux couples (i∈α, j∈β) :
Eintp =∑i∈α
qiVext(ri) avec Vext(ri) = (4πε0)−1∑j∈β
r−1ij qj .
Par exemple si α est un dipole �p =∑i qi�ri (
∑i qi = 0) situe en �rα � �ri, on a Eintp =
∑i qiVext(�ri) =
−�p · −→E (�rα) avec−→E = −−→∇Vext. Dans une translation infinitesimale selon x, dEintp = −(px ∂xEx +
py ∂xEy + pz ∂xEz) dx d’ou Fx = (�p · −→∇)Ex (en utilisant−→rot
−→E = 0) et
−→F = (�p · −→∇)
−→E . Dans une
rotation infinitesimale centree en �rα, on a dEintp = −(−→dθ∧�p) ·−→E d’ou le couple
−→C = �p∧−→
E . (Avec une
rotation de centre O on obtiendrait le moment−→Γ =
−→C + �rα ∧−→
F .) Ces resultats ne dependent pas du
caractere deformable ou indeformable (induit ou pas) du dipole. Si β est aussi un dipole, l’invariance
par translation et par rotation de Ep entraıne−→F β→α +
−→F α→β = 0 et
−→C β→α+
−→C α→β + (�rβ − �rα)∧−→
F α→β = 0 ; en general−→F α→β = −−→
F β→α n’est pas parallele a �rβ−�rα car un dipole, meme ponctuel,
n’est pas isotrope.
Remarque : ci-dessus Ep est une somme de fonctions de �ri − �rj . Ceci n’est pas toujours le cas, par
exemple pour les atomes d’une molecule ou d’un cristal avec des liaisons delocalisees ; il n’y a alors
aucun moyen naturel de decomposer �fi = −−→∇iEp sous la forme traditionnelle �fi =∑j =i �fj→i.
dl
dr
B
dldr
��
�
+ d
I
Figure 27
EXEMPLE 2. Circuit electrique dans un champ exterieur−→B (figure 27).
Dans un deplacement infinitesimal “virtuel”−→dr de chaque point r du circuit, le travail
des forces de Laplace I−→dl ∧ −→
B s’ecrit δW =∮
(I−→dl ∧ −→
B ) · −→dr =∮
(I−→dr ∧ −→
dl) · −→B =I dϕ (conservation du flux de
−→B ). La force et le moment totaux qu’exerce
−→B sur le
circuit s’obtiennent donc a partir de Ep = −Iϕ (ou ϕ depend des 6 coordonnees quideterminent la position et l’orientation dans l’espace du circuit rigide). Pour une petitespire, Ep = −μ · −→B (avec μ = I
−→S ) comme pour un dipole electrique.
� Fonction Ep et energie cinetique
Ep a un lien mathematique simple avec l’energie cinetique Ec (relativiste ou non). Comme
dEpdef= −∑
ifi · −→dri (a parametres fixes) et
dEcdt
=∑i
fi · vi on a, si les parametres
dependent du temps :ddt
(Ep + Ec) =∂Ep∂t
.
La loi Ep + Ec = Cste pour un systeme isole a beaucoup d’applications en mecanique.
7.3 Applications a la mecanique et a l’optique geometrique 233
Theoreme du viriel. Toute fonction homogene Ep d’ordre n verifie :
nEp =∑i �ri ·
−→∇iEp (E.D.P d’Euler) = −∑i �ri · �fi (viriel des forces) = − d
dt(∑i �ri ·mi�vi) + 2Ec .
Si le domaine de variation des positions et des vitesses est limite, la moyenne sur un grand intervalle de
temps < ddt
(∑i �ri ·mi�vi) > est nulle et :
2 < Ec >= n < Ep > .
Les applications principales correspondent a n = −1 (interactions gravitationnelles en astrophysique ou
electrostatiques pour l’atome de Bohr) et n = 2 (oscillateurs harmoniques couples).
� Fonctions Ep en electromagnetisme
Partons d’un exemple elementaire de bilan d’energie ou la connaissance (physique) desenergies impliquees et des puissances fournies par les generateurs electriques permet dededuire les travaux elementaires δWsm des sources mecaniques.
Circuit RLC avec inductance et capacite deformables (figure 28a).
LC−F −F
LV
iq
VCx
x
(a)
x
FI
(b)
Figure 28
De I =dqdt
, VL =dϕdt
(loi de Lenz avec ϕ = LI) et VC =q
C, on deduit les egalites (qui
concernent les energies electromagnetiques12LI2 et
12CV 2
C) :
d(1
2LI2
)= I dϕ− 1
2I2 dL ; d
(12CV 2
C
)= VC dq − 1
2V 2C dC .
Chaque differentielle apparaıt comme la somme dEem = δWse + δWsm de travaux(connus) fournis par des sources electriques (VL dq et VC dq), et de travaux (lies aux
deformations) qu’il est naturel d’attribuer a des sources mecaniques (δWsm = −12I2 dL
et δWsm = −12V 2C dC). On deduit de δWsm = dEp que les fonctions Ep sont, au choix,
−12LI2 et −1
2CV 2
C (c.a.d. −Eem) si I et VC sont les parametres fixes, ou12ϕ2
Let
12q2
C(c.a.d. Eem) si ϕ et q sont les parametres fixes. Pour un solenoıde de longueur x constitue
de N spires de section S (L = μ0N2S
x), la force (“contractante”) est : FL =
12
dLdx
I2 =
234 7 • Fonctions de plusieurs variables ; analyse vectorielle
−12μ0N2S
x2I2. De meme FC = −1
2ε0S
x2V 2C pour un condensateur plan avec C = ε0
S
x.
AUTRES EXEMPLES. Pour un electroaimant (figure 28b) dont l’entrefer x a une section S, on a
dEem = B2
2μ0S dx si ϕ = BS est constant ( B
2
2μ0energie volumique dans l’entrefer) ; la force d’attraction
entre les faces vaut F = − B2
2μ0S. Pour un ensemble de circuits electriques, Eem = 1
2
∑i Iiϕi
et δWse =∑i Ii dϕi (cf. section 7.5.2), ϕi =
∑jMijIj ; on en deduit δWsm = 1
2
∑ij dMij IiIj et
Ep = − 12
∑ijMij IiIj (les courants etant pris comme parametres). Si on s’interesse aux seules actions
sur le circuit 1, on ne garde que les termes i = 1, j �= i et i �= j, j = 1 et on retrouve E(1)p = −I1 ϕ
ou ϕ est le flux du champ exterieur. Le cas des conducteurs metalliques en equilibre se deduit de
l’exemple precedent en faisant les changements Ii → Vi et ϕi → Qi (pour les variables intensives et
extensives) et Mij → Cij .
7.3.2 Optique geometrique : rayons ; surfaces d’onde ; caustiqueset problemes d’extremum
On se place dans l’approximation de l’optique geometrique (ou les ondes sont localementplanes) et on considere des milieux isotropes. Surfaces d’ondes et rayons sont alors deuxconcepts relies par la notion de gradient.
� Des rayons aux ondes
S S0
Mm
Figure 29
Rappelons (cf.section 3.2.3) que le chemin optique L(A,B) ≡ L(rA, rB) calcule le longdu rayon joignant deux points A et B correspond a un extremum de
∫ BA n(r) dl, et qu’il
a pour differentielle
dL = nB uB · −→drB − nA uA · −→drA(u(r) vecteur unitaire porte par le rayon). Les surfaces d’onde L(r) = constante sontune facon de regrouper les rayons par familles de sorte que, en tout point, n(r) u(r) soit legradient de L(r). Par exemple (figure 29) considerons la famille des rayons orthogonauxa une surface S0 et, pour tout point M(r) situe sur un rayon issu de m ∈ S0, po-sons L(r) = L(rm, r). La surface S definie par L(r) = L (constante) est la surface d’onde
deduite de S0 (L(r) = 0) apres le temps de propagationL
c. La surface L(r) = L+dL s’en
7.3 Applications a la mecanique et a l’optique geometrique 235
deduit en portant sur chaque normale une longueurdLn(r)
; on passe ainsi de proche en
proche de S0 a S. Ceci n’est autre que la construction de Huygens des surfaces d’ondecomme enveloppes d’ondelettes spheriques, et des rayons comme trajectoires orthogonalesa ces surfaces. Elle fournit la solution de l’E.D.P. eikonale |−→∇L(r)| = n(r) avec lacondition aux limites L = constante sur une surface donnee.
REMARQUE. La figure 30 montre, sur le cas particulier n = Cste ou les rayons sontdes droites, que les surfaces S, deduites de S0 en portant sur les rayons une longueurL, deviennent en general singulieres lorsque L croıt (cf. surface S2). La singularite seproduit sur les caustiques, surfaces enveloppe des rayons, et est liee au fait que L(r)n’est plus definie univoquement (cf. exemples ci-dessous).
m*2
m1*
O
x
1SS0
R
z
M
S 2
caustique
Figure 30
� Des ondes aux rayons
Soit ψ(t, r) = A(r) exp−i(ωt− ϕ(r))
une onde monochromatique, et soit (par referencea une onde plane A exp− i(ωt− k .r))
k(r) =−−→gradϕ(r)
le vecteur d’onde local. L’onde est localement plane si k(r) et A(r) varient peu, en
valeur relative, sur des distances de l’ordre de λ =2πk
(domaine non grise sur la figure
31).
Figure 31
236 7 • Fonctions de plusieurs variables ; analyse vectorielle
Alors k(r) verifie la relation de dispersion locale k(r) = |−→∇ϕ | = n(r)ω
c. Si on appelle
rayon une courbe γ0 tangente en tout point a k(r), k donnant la direction de propa-gation de l’energie, on en deduit pour γ0 a la fois le principe de Fermat et la loi deDescartes :∫ B
A
k(r) dl ou∫ B
A
n(r) dl minimum local ;dkdl
=−−→gradk(r) ou
ddlnu =
−−→gradn .
DEMONSTRATION : pour Fermat (figure 32) on ecrit∫γ0
|k(r)| dl =∫γ0
−→∇ϕ · −→dl = ϕ(B) − ϕ(A) =∫γ
−→∇ϕ · −→dl <∫γ
|−→∇ϕ| dl
(car−→∇ϕ est parallele a
−→dl sur γ0 mais pas sur toute autre trajectoire γ allant de A a B) ;
pour Descartes on ecrit
dkxdl
= ∂xkxdxdl
+ ∂ykxdydl
+ ∂zkxdzdl
=12k
∂x(k2x + k2
y + k2z) = ∂xk
en utilisantdxdl
=kxk· · · (k parallele a
−→dl sur γ0) et ∂ykx = ∂xky · · · (egalite de Schwarz
pour ϕ).
0
A
B
dl
�
�
Figure 32
M
BA’
A
lentille
O
Figure 33
REMARQUES 1) On a suppose que−→∇ϕ est non singulier. Le rayon γ0 etant donne, ceci peut toujours
etre satisfait localement mais pas globalement ; si tous les rayons issus de A convergent en un point A′
situe avant B sur γ0, le chemin optique de A a B n’est alors plus minimum mais simplement stationnaire ;
sur la figure 33 le chemin optique (AMB) est plus court que (AOA′B) = (AMA′) + (A′B).
2) Si ψ(t, �r) = A(t, �r) expiϕ(t, �r) est localement une onde plane, on pose ω = −∂tϕ et �k =−→∇ϕ. Soit ω =
f(�k, t, �r) la relation de dispersion (milieu lineaire mais non isotrope, non stationnaire et non homogene),
soit �vg = ∂�kω la vitesse de groupe et soit dt = ∂t+�vg .−→∇ une “derivee particulaire” (dt�r = �vg). Un bon
exercice de derivees partielles consiste a montrer que dtω = ∂tf et dt�k = −−→∇f (relations qui generalisent
les lois de Descartes et relient optique geometrique et mecanique ; cf. section 9.1).
� Caustiques et problemes d’extremum
Soient dans l’air (n = 1) une surface d’onde z = f(x, y) (point courant m(x, y, z)) etM(X,Y, Z) un point fixe exterieur. On cherche les rayons m∗M passant par M , c.a.d.les droites qui rendent la distance mM extremale (d(mM) = −um · −→dm = 0 pour m∗).
7.3 Applications a la mecanique et a l’optique geometrique 237
Les caustiques (enveloppes de rayons) correspondent aussi aux lieux geometriques despoints M ou le probleme d’extremum admet une bifurcation (c.a.d. un changement dunombre de solutions pour m∗).
EXEMPLE 1. f(x, y) =x2
2R+ A
x3
6(A > 0 ; figure 30). Pour M pres de la normale
en O a la surface (axe Oz) on a mM =√
(Z − f)2 + (X − x)2 + (Y − y)2 � Z − f +1
2Z((X − x)2 + (Y − y)2
). x∗ et y∗ verifient −A
2x∗2 + x∗(Z−1 −R−1)−Z−1X = 0 et
y∗ = Y , d’ou a priori 0 ou 2 solutions. Le cas limite de la racine double x∗1 = x∗2 definitla caustique (paraboloıde) d’equation (Z − R)2 − 2AR3X = 0. Si A = 0, la caustiqueest la droite Z = R, X = 0 (il y a alors une infinite de solutions pour x∗).
EXEMPLE 2 (figure 34a). f(x, y) = x2
2R1+ y2
2R2(R1 � R2 > 0). Pour M pres de Oz, x∗ et y∗ sont
donnes par x∗(Z−1 −R−11 ) = Z−1X et y∗(Z−1 −R−1
2 ) = Z−1Y ; les caustiques sont les deux droitesde directions perpendiculaires Δ1 (Z = R1, X = 0) et Δ2 (Z = R2, Y = 0) ; elles se reduisent aufoyer de l’onde (0, 0, R) si R1 = R2 = R. En pratique la surface d’onde est limitee par une pupillecirculaire x2 + y2 = r2max. Le calcul precedent montre que les rayons qui en sont issus coupent alors
un plan Z = Cste a l’interieur de l’ellipseX2R2
1(R1−Z)2
+Y 2R2
2(R2−Z)2
= r2max. Cette ellipse est un cercle
de rayon rmax|R2−R1|
2R0dans le plan de convergence “moyen” Z = R1+R2
2= R0, et se reduit a des
segments de longueur 2rmax|R2−R1|R0
sur les caustiques (figure 34b).
��������������
��������������
������������������������������
������������������������������
������������������������������������������������������������
��������������������������������������������������������������������������
����������������������������
������������������������������������������
������������
������������������������������
������������������������������
pupille
(b)
(a)
R2R1 R0
��������������������
��������������������
�
x
y
z
z
1 2�
Figure 34
�������������������������������������������������������������������������������������������
�������������������������������������������������������������������������������������������
M(4 solutions)
2 solutionscaustique
caustique
x
pas de solution
O
y
Figure 35
EXEMPLE 3. f(x, y) = −Bx0x(x2 + y2) + x2+y2
2d(B > 0). Cherchons la trace de la caustique sur
le plan Z = d (plan de convergence de l’onde spherique si B = 0) pres de l’axe Oz. m∗ s’obtient en
extremalisant Bx0x(x2+y2)− xX+yYd
, ce qui donne Xd
= Bx0r∗2(2+cos 2ϕ∗) et Yd
= Bx0r∗2 sin 2ϕ∗
en posant x∗ = r∗ cosϕ∗ et y∗ = r∗ sinϕ∗. Dans le plan Z = d, les cercles r∗ = Cste centres en
(X = 2Bx0r∗2, Y = 0) et de rayon Bx0r∗2 remplissent la region X >√
3|Y | (figure 35). Dans cette
region il y a pour tout point M quatre solutions m∗ (deux valeurs de r∗ et pour chacune les solutions
ϕ∗ et ϕ∗ + π). A l’exterieur de cette region (X <√
3|Y |) il n’y a pas de solution. La caustique est
donc formee des deux demi-droites X =√
3|Y | faisant entre elles un angle de 60o. (En pratique une
pupille r = rmax limite la caustique et introduit une “sous region” ou il y a deux solutions.)
238 7 • Fonctions de plusieurs variables ; analyse vectorielle
� Aberrations geometriques d’un systeme optique centre
La figure 36 rappelle la situation experimentale (cf. cours d’optique pour plus de details).
m0
u
u u
m’0
pupillede sortie
Æ m’
y y
x
0
+
0x
centré
z
imageobjet
r0
système
r
d
m
Figure 36
Si m′0 etait l’image rigoureuse de m0, le chemin optique de m0 a un point m de la pupille de sortie
s’ecrirait L(m0, m) = Cste −mm′0, et le vecteur unitaire u du rayon en m serait parallele a
−−−→mm′
0. Les
corrections a L s’ecrivent a priori
δL = A4
(�r · �r)2 +B(�r · �r) (�r · �r0) + 12
(C(�r · �r0)2 + C′(�r · �r) (�r0 · �r0)
)+D(�r · �r0) (�r0 · �r0)
en vertu de la symetrie de revolution du systeme ; (il n’y a pas de scalaires du troisieme degre et ceux
du second degre ont ete deja pris en compte dans l’approximation de Gauss). On en deduit la correction
d’orientation du rayon sortant :
δu � δu⊥ = ∂�r δL = Ar2�r +B(2(�r · �r0)�r + r2�r0
)+
(C(�r · �r0)�r0 + C′r20�r
)+Dr20�r0 .
Ce rayon coupe le plan image en m′ tel que−−−→m′
0m′ � δu d (aberration). A definit l’aberration de
sphericite (courbure de la surface d’onde plus grande en A2 qu’en A1 sur la figure 37a) ; B definit
celle de coma (analogue de l’exemple 3 ci-dessus avec �r0 ≡ (x0, 0)), C (analogue de 1R1
− 1R2
dans
l’exemple 2) celle d’astigmatisme, C′ + C2
celle de courbure de champ (responsable de l’ecart entre
le point de convergence moyen et le plan image), et enfin D celle de distorsion (correction D r20 d au
grandissement ; la figure 37b represente l’image “distordue” d’un carre).
0D D
S0
x’
y 0
(b)
1FA
2A
(a)
Figure 37
7.4 APPLICATIONS A LA THERMODYNAMIQUE
Changements de variables, definition de grandeurs importantes par des derivees partielles,egalite de Schwarz, relation d’Euler, variations secondes, methode des multiplicateurs deLagrange, etc. figurent parmi les outils frequemment utilises en thermodynamique. Unchoix d’exemples qui reprend quelques grandes problematiques de cette discipline estbrievement presente (cf. aussi les sections 1.1.4, 5.1.4 et 10.2.3).
7.4 Applications a la thermodynamique 239
7.4.1 Role cle de l’entropie ; equations d’etat ; coexistence de phases
� Coefficients elastiques et thermiques
La thermodynamique a commence avec l’etude experimentale des equations d’etat defluides f(P, V, T ) = 0 (PV = RT pour une mole de gaz parfait (G.P.)) et celle desapports thermiques reversibles. Les coefficients elastiques α , β et χ
Tsont definis par
α =1V
∂V
∂T
∣∣∣P
, β =1P
∂P
∂T
∣∣∣V
, χT
= − 1V
∂V
∂P
∣∣∣T,
c’est-a-diredVV
= α dT −χT
dP et dP = β P dT − 1χ
T
dVV
, et les coefficients thermiques
cV, l, c
Pet h ainsi que χ
Ssont definis par (δQrev forme differentielle) :
δQrev = cV
dT + l dV = cP
dT + h dP ; χS
= − 1V
dVdP
a δQrev = 0 .
Tous ces coefficients ne sont pas independants. En ecrivant df = ∂V f dV + ∂P f dP +∂T f dT = 0, on exprime α , β et χ
Ten fonction des trois derivees partielles de f (par
exemple αV = −(∂T f) (∂V f)−1), et on obtient α = P β χT. De meme en portant dV
(resp. dP ) dans la premiere (resp. la seconde) expression de δQrev, il vient cP− c
V=
l α V = −hβ P . Enfin δQrev = 0 entraınedVdP
=c
V
l
h
cP
d’ouχ
T
χS
=c
P
cV
. A ce niveau de
description les trois fonctions P (T, V ) , cV(T, V ) et l(T, V ) sont independantes.
� Equations d’etat et entropie : gaz parfait ; gaz reel ; corps noir
La differentielle de S(U, V ) (U energie interne, V volume)
dS =1T
(dU + P dV )
(equivalent a dU = −P dV +δQrev avec δQrev = T dS) definit la temperature thermo-
dynamique T (U, V ) =∂S
∂U
∣∣∣−1
Vet la pression P (U, V ) = T
∂S
∂V
∣∣∣U
. On deduit donc de S a
la fois l’equation d’etat P (T, V ), l’energie interne U(T, V ) et les coefficients thermiques.Trois exemples explicites sont :
S = R lnV + f(U) ; S = R ln(V − b) + f(U +
a
V
); S = Cste U
34 V
14 .
Pour le premier (une mole de G.P.), R lnV mesure la liberte de position des moleculeset f(U) celle associee a la repartition de l’energie U entre elles. Dans le second (une molede gaz reel), on tient compte de la taille des molecules (restriction du volume “libre”) etde l’energie potentielle (liee aux interactions a distance) − a
V, negative et proportionnelle
a la densite. La troisieme expression (corps noir, c.a.d. gaz de photons) a ete introduiteaux sections 1.1.4. et 1.3.2. Pour le G.P. la relation dS = RV −1 dV + f ′(U) dU donnePV = RT (donc T coıncide bien avec la temperature du gaz parfait) et f ′(U) = T−1
(relation qui definit UGP(T )) ; on a α = β = T−1, χT
= P−1, l = P , cP− c
V= R
et cV
= −T 2f ′′(U) (fonction de T ). Pour le gaz reel un calcul aussi simple donne(P +
a
V 2
)(V − b) = RT (equation de Van der Waals) et U = UGP(T ) − a
V; enfin
240 7 • Fonctions de plusieurs variables ; analyse vectorielle
pour le corps noirdSS
=34
dUU
+14
dVV
donne T =4U3S
et, pour la pression de radiation
P =U
3V∝ T 4 (loi de Stefan).
REMARQUE. La connaissance de P (T, V ) entraıne celles de l(T, V ) et de ∂V cV
∣∣T
;pour obtenir c
V(T, V ) et donc S, il reste a determiner la dependance en T de c
V.
Demonstration : appliquee a l’energie libre F = U−TS et a S(T, V ) dont les differentielless’ecrivent
dF (T, V ) = −S dT − P dV et dS(T, V ) = T−1(cV
dT + l dV ) ,
l’egalite de Schwarz donne l = T ∂TP∣∣V
et ∂V cV
∣∣T
= T ∂T (T−1l)∣∣V
. En considerant ladifferentielle dG(T, P ) = V dP − S dT de l’enthalpie libre G = F + PV et dS(T, P ),on etablit des relations analogues pour h(T, P ) et c
P(T, P ).
� Systemes ouverts ; extensivite de l’entropie ; enthalpie libre
Pour une phase contenant ni moles des especes chimiques i, l’entropie depend des gran-deurs extensives X ≡ (U, V, ni). L’expression dS = T−1 (dU + P dV −∑
i μi dni) definitles potentiels chimiques d’equilibre μi. L’extensivite S(kX) = k S(X) de S entraıneque S est une fonction homogene de degre un et que (relation d’Euler)
S =∑j
Xj ∂jS = T−1(U + PV −
∑i
μini
),
soit, a l’aide de l’enthalpie libre :G = U + PV − TS =
∑i
μini .
Elle entraıne aussi que S(X) = nS(x) avec n =∑
i ni et x = n−1X (grandeurs mo-laires). Les derivees partielles de S(X) satisfont f(kX) = f(X) ; ces fonctions homogenesde degre zero, qui ne dependent que x, sont des grandeurs intensives.
EXEMPLES. Pour une seule espece chimique :
S(U, V, n) = nS(Un,V
n, 1
)= n s(u, v) et G(P, T, n) = nμ(P, T ) .
Pour le corps noir, S est bien extensive (S(kU, kV ) = k S(U, V )), mais comme nn’apparaıt pas, on a μ = 0 et G = 0.
REMARQUE. Si au lieu de U , V et ni on choisit les variables P , T et ni, toutes les grandeurs extensives
(U , V , S, G...) satisfont f(P, T, kni) = k f(P, T, ni), d’ou f =∑i ni fi avec fi = ∂nif |P,T (relation
d’Euler pour les variables ni). On a un melange parfait si chaque fi ne depend que de P , T et ni et
pas des nj =i.
� Concavite de l’entropie ; stabilite thermodynamique
Soient deux parties d’un meme fluide initialement separees et ayant chacune ni (i = 1, 2)moles et des grandeurs molaires xi ≡ (ui, vi). Si n1x1 + n2x2 etant fixe (systeme isole)l’evolution des deux parties se fait vers un meme etat d’equilibre (cas d’une seule phase),le second principe entraıne que :
(n1 + n2) s(n1x1 + n2x2
n1 + n2
)≥ n1 s(x1) + n2 s(x2) .
7.4 Applications a la thermodynamique 241
Ceci implique la concavite de s (donc aussi celle de S pour n fixe) : le segment joignantdeux points de coordonnees (ui, vi, si) de la surface s(x) est situe en dessous d’elle. Onen deduit (cf. section 7.1.1) la condition (dite de stabilite thermodynamique) :
δ2S(U, V ) =12
(d( 1T
)dU + d
(PT
)dV
)=
12T
(dP dV − dT dS) < 0 .
Consequences : en annulant successivement dT , dS, dV et dP dans l’inegalite on obtientque χ
T, χ
S, c
Vet c
Psont positifs. Comme dG = V dP − S dT on a aussi :
δ2G(T, P ) =12
(dP dV − dT dS
)< 0 .
EXEMPLE : fluide de Van der Waals. La consideration des termes du second ordre en dU et dV
dans S(U + dU, V + dV ) = R ln(V + dV − b) + f(U + dU + a(V + dV )−1
)donne :
δ2S =(− 1
2R
(V−b)2 + aTV 3
)dV 2 + 1
2f ′′(ϕ) dϕ2 (ϕ = U + a
V= UGP(T )) .
Le terme en dϕ2 est negatif (en admettant la concavite de S pour le G.P.). Celui en dV 2 s’ecrit12∂V P |T dV 2 (cf. equation d’etat) et a le signe de −χT . Dans le plan (V, P ) la region δ2S < 0 est
celle ou les isothermes (dϕ = 0) ont une pente negative (region physiquement observable, y compris
les zones de retard a la vaporisation et a la liquefaction ; cf. figure 2a du Chapitre 5) ; c’est aussi la
region non grisee sur la surface S(U, V ) (figure 38).
C
c=1
V
isotherme Tc
13
U
0
S
lignes S = Cste=1
V
Figure 38
� Coexistence de phases
Avec les conditions d(n1 + n2) = 0 et d(n1x1 + n2x2) = 0 (x ≡ (u, v)), l’etat d’equilibrecorrespond au maximum de n1s(x1) + n2s(x2) et s’obtient avec la methode des mul-tiplicateurs de Lagrange. En ecrivant d (
∑i ni (s(ui, vi) + λn + λ
uui + λ
vvi)) = 0, on
obtient les six relations (annulation des coefficients de dui, dvi et dni)
λu
= −T−1i , λ
v= −PiT−1
i et s(ui, vi) + λn + λuui + λ
vvi = 0 ,
242 7 • Fonctions de plusieurs variables ; analyse vectorielle
d’ou T1 = T2, P1 = P2 et g1 = g2 (ou μ1 = μ2). Ces trois equations admettent toujoursla solution x1 = x2 mais, suivant le melange initial, elles peuvent avoir une autre solutionx1 �= x2 (coexistence de deux phases) d’entropie plus grande. C’est elle qui conduit pourle fluide de Van der Waals a la construction de Maxwell des paliers d’equilibre gaz-liquide dans le plan (V, P ). Cette construction revient (reflexion laissee au lecteur) aremplacer la surface de la figure 38 par son enveloppe concave (generalisation de lafigure 6 du chapitre 5).
7.4.2 Potentiels thermodynamiques et equilibres
� Contraintes interieures ; equilibre global ; variables associees
Un systeme contraint interieurement peut etre compose de plusieurs parties chacuneen equilibre sans qu’il y ait equilibre global entre elles, par exemple plusieurs phasesavec des parois adaptees permettant le controle des echanges volumiques, thermiques etmoleculaires. Il peut aussi n’y avoir qu’un equilibre partiel au sein des phases (controledes reactions chimiques une par une dans chaque phase avec des catalyseurs adaptes).On peut aussi envisager des contraintes par la pensee si elles ne sont pas contradictoiresavec les lois physiques. Dans tous les cas il faut distinguer dans l’expression de l’entropietotale St du systeme les variables Xt qui ne varient pas lors de l’evolution vers l’equilibreglobal de celles X dont les valeurs changent avec la levee des contraintes. Xt etant fixel’equilibre global est atteint lorsque St, fonction de X , est maximum.
EXEMPLE 1. Equilibres chimiques. (Systeme comportant c especes chimiques i, ϕphases α et siege de r reactions ρ). Pour chaque phase dSα = T−1
α
(dUα + Pα dVα −∑
i μiα dniα). Si le systeme est isole, Ut =
∑α Uα et Vt =
∑α Vα sont fixes. Si il
est ferme, on peut separer dans dniα l’effet des reactions et celui des echanges entrephases : dniα =
∑ρ νiρ dξρα + δniα ; ξρα est l’avancement de la reaction ρ dans
la phase α, νiρ est le coefficient stoechiometrique de l’espece i dans la reaction ρ, eton a les conditions
∑α δniα = 0. L’equilibre global, St =
∑α Sα maximum, s’obtient
en introduisant les 2 + c multiplicateurs de Lagrange λU = −T−1, λV = −T−1P etλni = T−1μi. De
dSt − 1T
∑α
dUα − P
T
∑α
dVα +∑i
μiT
d
[∑α
(niα −
∑ρ
νiρξρα
)]= 0 ,
on deduit (annulation des coefficients de dUα, dVα, dniα et dξρα) :
Tα = T ; Pα = P ; μiα = μi ; −∑i
μiνiρ = Aρ = 0 .
Ceci exprime l’egalite des temperatures, des pressions, des potentiels chimiques dechaque espece et l’annulation des affinites Aρ. Consequence : si on s’interesse aux2 + ϕ(c − 1) variables intensives P , T , et niα/nα decrivant l’ensemble des situationsd’equilibre experimentalement observables, les (ϕ−1)c+r conditions sur les potentielsfont que seules v = c− r + 2 − ϕ d’entre elles sont independantes (regle des phasespour la variance).
EXEMPLE 2. Loi de Boltzmann. La repartition de N constituants microscopiques identiqueset independants (pas necessairement monoparticulaires) a raison de Nα par etat microscopique α
7.4 Applications a la thermodynamique 243
(d’energies εα fixees) peut se faire de Ω = N!Πα Nα!
facons. On en deduit que S(X ≡ {Nα}) �−∑
α kBNα ln NαN
(formule de Stirling), et que dS = −kB∑α ln Nα
NdNα (car
∑α dNα = 0). La
repartition d’equilibre avec U =∑αNαεα et N =
∑αNα fixes s’obtient comme dans l’exemple 1 par :
dS−T−1∑α (εα−μ) dNα = 0. En annulant les coefficients des dNα, il vient Nα
N= exp− 1
kBT(εα−μ).
� Potentiels thermodynamiques
Souvent on s’interesse a des evolutions relatives a des systemes en equilibre de temperatureet de pression avec une source qui fixe P et T (l’atmosphere par exemple), ou a desdeplacements d’equilibre lorsque P et (ou) T varient. Il faut alors considerer l’entropie
St = S + T−1(Us + PVs) = S + Ss
de l’ensemble isole constitue par le systeme (d’entropie S) et la source (indicee par s) :
St = T−1(Ut + PVt −G) avec Ut = U + Us, Vt = V + Vs et G = U + PV − TS .
St depend de Xt ≡ (Ut, Vt, P, T ) et, a travers G, de variables de contraintes internes ausysteme X. Si on ecrit dS = T−1(dU + P dV ) + ∂XS
∣∣U,V
dX , on a :
dG = V dP − S dT −AdX avec A = −∂XG∣∣P,T
= T ∂XS∣∣U,V
.
En tant que fonction de X , G(P, T,X) s’appelle potentiel thermodynamique car touteevolution ΔSt ≥ 0 de l’ensemble isole systeme plus source (Ut et Vt fixes) s’accompagned’une diminution de G (jusqu’a un minimum). A l’equilibre A = 0 et Geq(P, T ) =G
(P, T,X eq(P, T )
).
REMARQUES. 1) Si l’ensemble est thermiquement (mais pas mecaniquement) isole, et si ΔVt = 0, la
condition ΔSt ≥ 0 devient −ΔUt ≤ −ΔG. Elle conduit a la notion de travail utile maximum −ΔG
pouvant etre extrait de l’ensemble lorsque X varie (exemple : travail electrique fourni par une pile). 2)
Si la source ne fixe que la temperature, G doit etre remplace par F = U − TS.
� Deplacements d’equilibres
Une variation de P et (ou) T induit une variation de X eq. En se limitant a une seulecomposante pour X , ce deplacement s’obtient en minimisant (par rapport a X)
G(P + dP, T + dT,X) = G(P, T,X) + V (P, T,X) dP − S(P, T,X) dT ,
dont le developpement pres de Xeq = Xeq(P, T ) est la fonction du second degre en X :
G(P, T,Xeq) − 12∂XA
∣∣P,T
(X −Xeq)2 +[∂XV
∣∣P,T
dP − ∂XS∣∣P,T
dT](X −Xeq) .
(∂XA∣∣P,T
< 0 puisque G(P, T,X) est minimum en Xeq.)
EXEMPLE 1. Une reaction chimique dans une phase (fermee). Dans ce casX = ξ est l’avancement de la reaction (dni = νidξ ), et A = −∑
i μiνi (on rappelleque dS = T−1(dU +P dV −∑
i μi dni)). Pour dT = 0, dξeq a le signe de (−∂XV ) dP :loi de Le Chatelier ; (la figure 39 represente le deplacement d’equilibre pour dP > 0et V (P, T, ξ) fonction croissante de ξ). Pour dP = 0, dξeq a le signe de ∂XS
∣∣P,T
dT(ou encore de ∂XH
∣∣P,T
dT car d(H = U + PV ) = T dS si dP = 0 et si ξ = ξeq) : loide Van’t Hoff.
244 7 • Fonctions de plusieurs variables ; analyse vectorielle
��
�
�
�
�
d eq
eq
V(P,T, ) dP
G(P,T,
G
)G(P+dP,T,
)
Figure 39
� �
G
n 2
Barrière de potentiel
0
n1 1 + n2 2
Figure 40
EXEMPLE 2. Systeme diphase : G = n1μ1 + n2μ2 avec n1 = n− n2. Il y a equivalence avec une
reaction 1 � 2 (ξ = n2 et A = μ1 − μ2), mais les phases etant separees, μ1 et μ2 ne dependent que
de P et T et ∂ξA|P,T = 0. Contrairement au cas U, V fixes (ou ∂ξA|U,V �= 0), on a evolution totale
vers la phase de plus petit μ (par exemple la glace, phase 2, si θ < 0o C). Remarque : l’observation,
en apparence contradictoire, d’eau surfondue (phase 1) tient a ce que si on avait un petit glacon
dans l’eau, il faudrait tenir compte dans l’energie totale U (et donc dans G) de l’energie de tension
superficielle γ × (surface du glacon) ∝ (n2)23 . Alors, pres de n2 = 0, G(P, T, n2) croit au lieu de
decroitre : il y a une barriere de potentiel (figure 40) qui explique la metastabilite de l’eau
surfondue.
EXEMPLE 3 : Bifurcation ; parametre d’ordre. Si le potentiel thermodynamique Φ (F ou G ou...)
est tel que la variation d’un parametre de controle X t (P , T , champ magnetique−→B , etc.) entraıne
pour X, au lieu d’un simple deplacement d’equilibre, une bifurcation de la solution d’equilibre X eq
(correspondant au minimum du potentiel), on dit que X est un parametre d’ordre. La figure 41 donne,
quand T varie, un exemple d’echange de deux solutions, et la figure 42 le passage de une a deux
solutions “symetriques” l’une de l’autre. Comme ddT
G (T, P,Xeq(T )) = ∂TG = −S a P constant, le
premier cas correspond a S2 �= S1 ; un exemple explicite est fourni par le fluide de Van der Waals
(avec T fixe et P variable) : G(T, P,X ≡ V ) =(− a
V+ ϕ(T )
)+ PV − T
(R ln(V − b) + f(ϕ(T ))
). Le
second cas correspond a S2 = S1 ; le ferromagnetisme traite a la section 5.1.4. (figure 10) en est un
exemple (avec Φ ≡ F et X ≡ x taux d’aimantation).
�1
1
1 2
2
2T < T 0
T =T
T > T0
0
X
phase 2 stable
phase 1 stable
Figure 41
� T < T 0
T =T
T > T0
0
X
deux solutions
une solution
Figure 42
7.5 Applications a l’electromagnetisme 245
7.5 APPLICATIONS A L’ELECTROMAGNETISME
7.5.1 Formulation integrale ; champs statiques ; milieux
� Electromagnetisme dans le vide
Rappelons les equations de Maxwell qui relient les champs electrique−→E et magnetique−→
B aux densites volumiques de charge ρ et de courant j :
div−→E =
ρ
ε0; div
−→B = 0 ;
−→rot
−→E = −∂
−→B
∂t;
−→rot
−→B = μ0
(j + ε0
∂−→E
∂t
).
Ces E.D.P. sont la version locale des relations integrales (avec contours et surfaces fixes) :
ΦS(−→E ) =
Q
ε0; ΦS(
−→B ) = 0 ; Cγ(−→E ) = − d
dtϕ
S(−→B ) ; Cγ(−→B ) = μ0
(I+ε0
ddtϕ
S(−→E )
).
Les notations ϕS , ΦS et Cγ sont definies a la section 7.2.3. Q est la charge contenue dansle volume limite par la surface fermee S, et I est l’intensite du courant (flux ϕ
S(j) ou
quantite de charge par unite de temps) a travers la surface ouverte S qui s’appuie sur γ.Pour le circuit {γ−γ} de la figure 43 (sur lequel s’appuie une surface fermee), la derniererelation s’ecrit (puisque alors ϕ ≡ Φ)
0 = I +dQdt
(version integrale de ∂tρ+ divj = 0) ; c’est cette L.C. de la charge que Maxwell a prisen compte pour introduire le courant de deplacement ε0 ∂t
−→E .
−
dS
�
�
Figure 43
dl
n
dln
��1
2
n
2
1
(a) (b)
Figure 44
(Dis)continuites de−→E et
−→B . Soit Σ une surface porteuse de densites surfaciques de
charge σ et de courant js. Si V est un petit volume cylindrique (limite par S fermee) quidecoupe sur Σ la surface elementaire dΣ et dont la hauteur tend vers zero (figure 44a),alors :
ΦS(−→E ) = (En2 − En1) dΣ =
σsε0
dΣ et ΦS(−→B ) = (Bn2 −Bn1) dΣ = 0 ;
246 7 • Fonctions de plusieurs variables ; analyse vectorielle
on en deduit, pour les composantes normales des champs :
En2 − En1 =σsε0
; Bn2 = Bn1 .
De meme si γ est un circuit elementaire ferme dont les cotes qui coupent Σ tendent verszero, et les cotes paralleles a Σ sont
−→dl cote 2 et −−→dl cote 1 (figure 44b), alors :
Cγ(−→E ) = (−→E 2 −−→
E 1) · −→dl = 0 et Cγ(−→B ) = (−→B 2 −−→
B 1) · −→dl = μ0 I = μ0js · (n ∧ −→
dl) .
Ceci entraıne pour les composantes tangentielles des champs :
−→E t2 =
−→E t1 ;
−→B t2 −−→
B t1 = μ0js ∧ n .
La seule hypothese faite est d’avoir suppose les champs bornes.
� Champs statiques ; approximation des regimes quasi-stationnaires(A.R.Q.S)
La formulation integrale permet de determiner ces champs tres simplement en utilisantdes “arguments de symetrie” (cf. section 3.4.3). On se limite a l’etablissement des formulesde base.
Electrostatique. Pour une charge ponctuelle q a l’origine,−→E (r) est dirige selon r.
Donc pour une sphere S de rayon r centree en O, on a ΦS(−→E ) = 4πr2E =
q
ε0, d’ou
−→E (r) =
14πε0
q
r2r.
Magnetostatique. On demontre facilement la formule de Biot et Savart donnant lacontribution d’un element de courant I
−→dl situe en m au champ magnetique en M
−→dB =
μ0
4πI
−→dl ∧ rr2
avec r =−−→mM
�
m+ Q(t)
− Q(t)I(t) = Q(t)
.
dB
M
Figure 45
en remplacant l’element de courant par le dipole (ou l’antenne) de la figure 45. Comme−→dB
est orthoradial, on a Cγ(−→dB) = 2πr sin θ dB = ε0μ0ddtϕ
S(−→dE), avec dans l’approximation
electrostatique ϕS(−→dE) =
14πε0
Q(2π(1− cos θ+)− 2π(1− cos θ−)
)=
12ε0
Q sin θdl sin θ
r,
7.5 Applications a l’electromagnetisme 247
d’ou dB =μ0
4πr2I sin θ dl. Un fil parcouru par un courant I peut etre modelise par une
“suite continue” de tels dipoles. Remarque : si I donc−→B depend du temps, il y a un
champ electrique induit supplementaire proportionnel a Q ; il est negligeable si I varielentement : A.R.Q.S. qui consiste a negliger les derivees secondes par rapport au tempsdes grandeurs impliquees.
� Separation macroscopique des charges et courants dans un milieuneutre (dielectrique et/ou magnetique) (figure 46)
On considere un milieu dans lequel les charges sont regroupees par “paquets neutres”(molecules par exemple) et, par la pensee, un element de surface
−→dS = dS n a l’interieur.
Il va couper de nombreux “paquets” et laisser des deux cotes (1 et 2) de−→dS des charges
proportionnelles a dS et opposees, qu’on peut ecrire ±−→P · −→dS (−→P �= 0 si le milieu est
polarise). Si−→P (r, t) est une fonction reguliere de r, on en deduit qu’un volume elementaire
d3r dans le milieu contient une charge −div−→P d3r (flux de −−→P a travers sa surface), et
que l’intensite du courant associe au mouvement de ces charges a travers−→dS est ∂t
−→P ·−→dS.
+ + + +− − − −
vide
milieu
+P . dS
−P . dS �
dS
pol
r
dS
− div P d3
dS
Figure 46
j mag
dl
dl n
dS
viden
milieu
Figure 47
Le milieu peut donc etre decrit par des densites de charges et de courants dites depolarisation dielectrique :
σpol =−→P · n ; ρpol = −div
−→P ; jpol =
∂−→P
∂t.
(σpol dS est la charge laissee a la frontiere du milieu quand−→dS s’en rapproche.) La L.C.
des charges ∂t ρpol + divjpol = 0 est satisfaite. Mais comme div−→rot (· · · ) = 0, on peut
cependant ajouter a priori a jpol une densite volumique−→rot
−→M (qui devient surfacique a
la frontiere du milieu :−→rot
−→M · −→dS =
∮ −→M · −→dl =
∮(−→M ∧ n) · (−→dl ∧ n) ; figure 47). Cette
contribution, dite magnetique aux courants, est donc :
jmag =−→rot
−→M ; js,mag =
−→M ∧ n .
248 7 • Fonctions de plusieurs variables ; analyse vectorielle
REMARQUE : en premiere approximation−→P est la densite volumique de moments dipo-
laires electriques ; par exemple (figure 48) pour une densite uniforme n de dipoles p = ql
identiques, on a−→P · −→dS = nql · −→dS, car les dipoles coupes en deux par dS ont leurs
centres situes dans un volume l · −→dS. De meme−→M est assimilable a la densite volumique
nμ de moments magnetiques si on considere des “boucles microscopiques de courant” demoment μ = is (figures 49a,b). En effet un element dl traverse n
−→dl ·s boucles auxquelles
est associe le courant ni−→dl · s =
−→M · −→dl, et donc tout circuit ferme γ est traverse par un
courant∮γ
−→M · −→dl =
∫∫−→rot
−→M · −→dS.
−q
+q−q
+q
−q
+q
−q
+q
−q
+q
−q
+q
l
dS
Figure 48
�
(a)
(b)
dl
s
Figure 49
Equations de Maxwell. Les lois pour les champs macroscopiques−→E et
−→B dans les milieux se deduisent
alors de celles dans le vide en remplacant Q par Qext−ΦS(−→P ) et I par Iext+ϕS
(∂−→P∂t
+−→rot
−→M
), ou Qext
et Iext sont les charges et courants exterieurs aux milieux. En posant−→D = ε0
−→E +
−→P et
−→B = μ0 (
−→H +
−→M)
elles s’ecrivent simplement :
ΦS(−→D ) = Qext ; ΦS(
−→B ) = 0 ; Cγ (
−→E ) = − d
dtϕS (
−→B ) ; Cγ(
−→H ) = Iext + d
dtϕS (
−→D) .
Elles impliquent, a la traversee de toute surface S neutre separant deux milieux, la continuite de Dn,
Bn,−→E t et
−→H t et, comme consequence, celle du flux du vecteur de Poynting (
−→E ∧−→
H ) ·−→dS, qui correspond
au flux d’energie electromagnetique. Sous forme differentielle ces lois s’ecrivent :
div−→D = ρext ; div
−→B = 0 ;
−→rot
−→E = −∂t−→B ;
−→rot
−→H = �jext + ∂t
−→D .
7.5.2 Potentiel scalaire et potentiel vecteur ; bilans d’energie et dequantite de mouvement ; A.R.Q.S.
On considere les equations de Maxwell dans le vide.
� Potentiels scalaire et vecteur ; solution generale
Les conditions de nullite vues a la section 7.2.3 entraınent que div−→B = 0 a pour solution−→
B =−→rot
−→A , et que
−→rot
−→E = −∂t (−→rot
−→A ) permet d’ecrire
−→E = −∂t−→A −−−→
gradV . Les deuxautres equations deviennent :
−∂t (div−→A ) − ΔV =
ρ
ε0,
−→rot (
−→rot
−→A ) =
−−→grad (div
−→A )− Δ
−→A = μ0
(j + ε0(−∂t2−→A −−−→
grad∂tV )).
7.5 Applications a l’electromagnetisme 249
Elles se simplifient grandement si on remarque que le changement de jauge sur lespotentiels −→
A → −→A +
−−→gradϕ ; V → V − ∂tϕ
laisse les champs−→E et
−→B inchanges quel que soit ϕ. En choisissant ϕ de sorte que le nou-
veau couple (V,−→A ) verifie div
−→A + ε0μ0 ∂tV = 0 (jauge de Lorentz), elles deviennent :(
Δ − 1c2
∂2
∂t2
)V = − ρ
ε0;
(Δ − 1
c2∂2
∂t2
)−→A = −μ0
j (ε0μ0c2 = 1) .
La solution “physique” de ces equations
V (r0, t0) =∫∫∫
14πε0
ρ(r, t0 − |�r−�r0|
c
)|r − r0| d3r ;
−→A (r0, t0) =
∫∫∫μ0
4π
j(r, t0 − |�r−�r0|
c
)|r − r0| d3r
est etablie a la section 8.2.2. L’A.R.Q.S. (“∂2t negligeable”) equivaut a faire tendre c vers
l’infini dans les E.D.P. ci-dessus et consiste donc a ne pas tenir compte de la propagationdans leur solution. Concretement pour un phenomene de periode T , l’A.R.Q.S. n’estvalable que dans un domaine dont la taille L est telle que L� cT .
� Bilans d’energie et de quantite de mouvement
Des equations de Maxwell dans le vide on deduit les relations∫∫∫V
j · −→E d3r +∫∫∫
V
∂t
(ε0
−→E
2
2+
−→B
2
2μ0
)d3r = −
∫∫©S
(−→E ∧
−→B
μ0
)· −→dS
∫∫∫V
(ρ−→E +j ∧ −→
B)d3r +
∫∫∫V
ε0∂t(−→E ∧ −→
B ) d3r = −∫∫©S
[P]−→dS
avec Pxx = ε0
(−→E 2
2− E2
x
)+
1μ0
(−→B 2
2−B2
x
)· · · et Pxy = −ε0ExEy − 1
μ0BxBy · · · .
DEMONSTRATION : la premiere resulte de div (−→E ∧−→
B ) =−→B
−→rot
−→E −−→
E−→rot
−→B = −−→
B ∂t−→B −μ0
−→E (�j+
ε0∂t−→E ). Pour la deuxieme on deduit des E.D.P. de Maxwell que le membre de gauche n’est autre que
l’integrale triple de [−ε0(−→E ∧ −→rot
−→E − −→
E div−→E ) − μ−1
0 (−→B ∧ −→
rot−→B − −→
B div−→B )], car div
−→B = 0 ; pour
trouver [P] au second membre, il suffit d’ecrire chaque composante de [· · · ] comme une divergence ; par
exemple : (−→E ∧−→
rot−→E −−→
E div−→E )x = Ey(∂xEy−∂yEx)−Ez(∂zEx−∂xEz)−Ex(∂xEx+∂yEy+∂zEz) =
∂x12(E2y +E2
z −E2x)+∂y(−EyEx)+∂z(−EzEx). [P] est la matrice de pression electromagnetique.
Interpretation : comme pour une charge libre q soumise a l’action de−→E et
−→B les variations
de quantite de mouvement et d’energie sontdpdt
= q (−→E +v∧−→B ) et
dEcdt
= v · dpdt
= q−→E ·v,
il est naturel (en considerant le premier terme du membre de gauche) d’interpreter cesdeux relations pour des charges libres comme :
“ddt
[energie ou quantite de mouvement, dans le volume V , des charges et du champ
electromagnetique] =− [flux sortant d’energie ou de quantite de mouvement a travers lasurface S qui limite V ] ”.
250 7 • Fonctions de plusieurs variables ; analyse vectorielle
En particulier ε0−→E
2
2+
−→B
2
2μ0est la densite volumique d’energie electromagnetique du
champ.
Approximation A.R.Q.S.. En ecrivant E2 =−→E · (−∂t−→A −−−→
gradV ) et B2 =−→B · −→rot
−→A ,
et en utilisant les equations de Maxwell, un calcul elementaire conduit a :
ε0E2
2+B2
2μ0=
12
(ρV +j · −→A ) − 12
div(ε0V−→E + μ−1
0
−→B ∧ −→
A ) +ε02
(−→A · ∂t−→E −−→
E · ∂t−→A ) ,
et −j · −→E = j · ∂t−→A + V ∂tρ+ div(Vj) (avec la L.C. de la charge) .
Dans l’A.R.Q.S. les integrales sur R3 des divergences donnent 0 (decroissance a l’infini aumoins en r−2 et r−1 des champs et potentiels), et la derivee temporelle de
−→A ·∂t−→E−−→E ·∂t−→A
est negligeable. Le bilan energetique devient :
ddt
[Eem =
∫∫∫ (12ρV +
12j · −→A
)d3r
]=
∫∫∫(V ∂tρ+j · ∂t−→A ) d3r .
On peut meme separer le bilan electrique du bilan magnetique.
Eem est facile a calculer pour des fils parcourus par des courants (magnetostatique). Comme pour chaque
fil∫∫∫
fil�j · −→A d3r = I
∮fil
−→A · −→dr = I ϕ on obtient :
Eem =∑i
12Iiϕi .
De meme pour chaque fil∫∫∫
fil�j · ∂t−→A d3r = I
∮fil∂t−→A · −→dr. Comme on a vu a la section 7.2.3 que∮
γ I∂t−→A · −→dr = I d
dtϕS(
−→B ) − ∮
γ I(−→dr ∧ −→
B ) · �v, on en deduit le bilan general d’energie
dEem =∑i Ii dϕi − δW
ou −δW , oppose du travail des forces de Laplace, est le travail des sources mecaniques et∑i Ii dϕi est
celui des sources electriques (cf. section 7.3.1). On verifie que −δW = dEp avec pour l’energie potentielle
Ep = Eem ou Ep = −Eem suivant que les parametres choisis sont les flux ou les intensites.
7.5.3 Calculs avec des densites microscopiques ; rayonnement
On rappelle (cf. section 7.2.4) que pour des charges ponctuelles :
ρmicro (r, t) =∑i
qi δ(r − ri(t)
); jmicro (r, t) =
∑i
qivi δ(r − ri(t)
).
Integrees dans un volume V , ces densites donnent∑
i qi et∑i qivi ou la somme porte
sur les charges contenues dans V a l’instant t. Pour un volume elementaire d3r centre enr contenant suffisamment de charges,
∑i qi et
∑i qivi sont assimilables a ρ(r, t) d3r et
j(r, t) d3r (ou I−→dl pour un element de courant) avec ρ et j “continus”. Nous allons voir
quelques applications de ce “double langage” avant de considerer l’effet du lissage de cesdensites (remplacement de δ(r) par f(r)).
� Moments dipolaire et quadrupolaire electriques ; moment magnetique
Certains resultats sont beaucoup plus rapides a obtenir “microscopiquement”. Par exemple
pour un volume V contenant toutes les charges, la relation∑i
qivi =ddt
∑i
qiri =ddtp
7.5 Applications a l’electromagnetisme 251
(p moment dipolaire electrique) est evidente, alors que la demonstration de son
equivalent continu∫∫∫
V
j (r, t) d3r =ddt
∫∫∫V
ρ (r, t)r d3r fait appel a l’egalite
ji = j · −−→gradxi = div (xij)− xi divj
et a la L.C. ∂tρ + divj = 0. De meme on etablit facilement que la quantite∫∫∫
V
j (r, t)
(r · u) d3r s’ecrit∑i
qivi (ri · u) =12
∑i
qi(ri ∧ vi) ∧ u +12
ddt
∑i
qiri (ri · u), ou μ =
12
∑i
qi(ri ∧ vi) est un moment magnetique, et ou∑
i qiri (ri · u) est un terme (de
type) grandeur quadrupolaire.
� Applications
1) Pour une distribution stationnaire (magnetostatique), on a
−→A (r0) =
μ0
4π
∫∫∫V
j(r)|r − r0| d3r =
μ0
4πr0
∫∫∫V
j(r)(1 +
r · u0
r0+ · · ·
)d3r
a grande distance (avec u0 =r0r0
) ; l’integrale de j, egale p, etant nulle (p independant
de t) ainsi que la derivee temporelle du terme quadrupolaire, la distribution de courantsest equivalente a un moment magnetique :
−→A (r0) � μ0
4πr20μ ∧ u0 .
2) De meme pour le potentiel rayonne (termes proportionnels a r−10 ) par une distri-
bution quelconque de charges et de courants, on a
−→A (r0, t0) =
∫∫∫μ0
4π
j(r, t− |�r−�r0|
c
)|r − r0| d3r
� μ0
4πr0
[ ∫∫∫V
j(r, t0 − r0
c
)d3r +
ddt
∫∫∫V
j(r, t0 − r0
c
) r · u0
cd3r + · · ·
](developpement au numerateur de
|r − r0|c
pour r0 grand). Avec les densites microsco-
piques on obtient immediatement le debut du developpement multipolaire
−→A (r0, t0) � μ0
4πr0
(p+
1cμ ∧ u0 +
12c
d2
dt2∑i
qiri (ri · u0) + · · ·),
le second membre etant calcule a l’instant t0 − r0c
. Au premier ordre en r−10 l’action sur
−→A de
−→∇�r0 equivaut a − u0
c∂t0 ; on en deduit que
−→B =
−→∇�r0 ∧−→A = − u0
c∧ ∂t0
−→A et, a
partir de−→∇�r0 ∧
−→B = ε0μ0 ∂t0
−→E , que
−→E = −c u0 ∧ −→
B (comme pour une onde plane). Si∂t0
−→A est selon Oz, alors
−→E = −∂t0Az sin θ θ (figure 50). Si vi � c, ou pour des courants
de periode T confines dans une antenne de dimension l � cT = λ, le premier terme dudeveloppement est dominant : rayonnement dipolaire electrique.
252 7 • Fonctions de plusieurs variables ; analyse vectorielle
0B
t 0� A
u
Eθ
z
r
Figure 50
� Lissage des charges et des courants dans un milieu neutre
Regroupons les charges par paquets neutres α (molecules par exemple), et soient �rα(t) le vecteur positionde leur centre de masse et �ri,α(t) le vecteur joignant le c.d.m. a une charge qi,α d’un paquet ; pour chaque
paquet posons �pα(t) =∑i∈α qi,α�ri,α(t) et �μα(t) =
∑i∈α
12qi,α�ri,α(t) ∧ �vi,α(t). 1) La forme “lissee”∑
α
(∑i qi,α f (�r − (�rα + �ri,α))
)de ρmicro (δ remplace par f) s’ecrit, a l’aide du developpement au
premier ordre f (�r − (�rα + �ri,α)) � f(�r−�rα)−�ri,α ·−→∇f(�r−�rα), et en tenant compte de la neutralite de
chaque paquet : −∑α �pα(t) · −→∇f(�r − �rα(t)) = −div
(∑α �pα(t) f(�r − �rα(t)
)= −div �P (�r, t) = ρpol(�r, t).−→
P (�r, t) represente une densite volumique de moments dipolaires. 2) De meme un developpement dela densite de courant microscopique “lissee”
∑α
(∑i qi,α (�vα + �vi,α) f(�r − (�rα + �ri,α))
) � ∑α (−(�pα ·−→∇f)�vα + �pα f − �μα ∧ −→∇f) (en negligeant le terme quadrupolaire) montre que la densite moyenne de
courant s’ecrit �j(�r, t) = ∂−→P∂t
+−→rot
−→M avec
−→M(�r, t) =
∑α �μα(t) f(�r − �rα(t)) si on peut negliger aussi
|�pα| |�vα| devant |�μα|.REMARQUE. Dans les conducteurs (et pour des charges libres de meme type), on ecrit plus simplement∑
i qi�vi(t) f(�r − �ri(t)) = �v(t)∑i q f(�r − �ri(t)) = ρ(�r, t)�v(�r, t) ,
ou ρ et �v sont la densite de charge et la vitesse moyennes ; en regime variable ρ�v correspond a ∂t−→P dans
la modelisation precedente.
Chapitre 8
Equations aux derivees partielles ;propagation ; diffusion
En physique les equations aux derivees partielles (E.D.P.) relient des champs, dependanten general de l’espace et du temps f(r, t), a leurs derivees partielles. Lorsque la variablet est presente il est naturel, comme le montre l’analogie entre corde vibrante et chaıned’oscillateurs couples, de considerer les E.D.P. comme des systemes dynamiques a unnombre infini (continu) de degres de liberte indices par r. Cependant un aspect nouveautres important est le role joue par les conditions aux limites (C.L.), par exemplela donnee de f a tout instant sur des surfaces, a la place des (ou avec les) conditionsinitiales (C.I.). On etudiera essentiellement le cas particulier, mais non trivial, desE.D.P. lineaires a coefficients constants (sans ou avec second membre), notamment cellesintroduites a propos des cordes vibrantes (d’Alembert 1747), de la conduction thermique(Fourier 1822), de la gravitation et de l’electromagnetisme (Laplace �1780, Poisson 1813,Maxwell 1864, etc.) et de la mecanique quantique (Schrodinger 1925). Quelques exemplesautres (non lineaires en particulier) montreront au lecteur que la richesse du domainedes E.D.P. ne se resume pas a l’etude de ces exemples historiques.
8.1 CHAINES DE SYSTEMES DYNAMIQUES COUPLES ;LIMITE CONTINUE
On etudie, a partir d’exemples, quelques systemes infinis d’E.D. lineaires et stationnaires(pour des grandeurs notees Ψn(t) ≡ Ψ(n, t) ; n = −∞· · · − 1, 0, 1 · · ·∞), presentantune invariance de translation discrete (Ψn → Ψn+1). Dans la limite continue les Ψ(n, t)deviennent une onde Ψ(x, t) et le systeme infini d’E.D. une E.D.P. ; de nombreuses gran-deurs passent ainsi du “discret” au “continu”.
254 8 • Equations aux derivees partielles ; propagation ; diffusion
8.1.1 Chaines d’oscillateurs ; role des conditions aux limites ; phonons
� Petites oscillations longitudinales de pendules simples couples (figure 1)
� � �n−1 n
a
g
n+1
a
Figure 1
Les ecarts aux positions d’equilibre Ψn(t) satisfont les equations :
mΨn = −mω20Ψn−K(Ψn−Ψn−1)−K(Ψn−Ψn+1) (ω0 pulsation d’un pendule isole) .
Comme pour un nombre fini d’oscillateurs, il est naturel de chercher les solutions sousforme de modes (cf. section 6.2.2). En posant Ψn(t) = An e
−iωt, on obtient la relationde recurrence d’ordre 2 :
γAn−1 + (ω2 − ω20 − 2γ)An + γ An+1 = 0
(γ =
K
m
).
(Si on pose Ψn(t) = an cos(ωt+Φ) les an satisfont la meme relation.) Sa solution generaledepend a priori de deux constantes ; on verifie facilement, en essayant des solutions An =αrn, qu’elle s’ecrit α1r
n1 +α2r
n2 ou r1 et r2 sont les racines de l’equation du second degre
γr2 + (ω2 − ω20 − 2γ) r + γ = 0. r1 et r2 sont de la forme r1,2 = e±ϕ si ω2 ∈ [0, ω2
0](solutions qui disparaissent si ω0 = 0), r1,2 = e±iϕ si ω2 ∈ [ω2
0 , ω20 + 4γ] et r1,2 = −e±ϕ
si ω2 > ω20 + 4γ. Ce passage des E.D. a une relation de recurrence puis aux solutions
Ψn(t) = Ψ rn e−iωt, ou r satisfait une equation algebrique, s’applique a de nombreuxautres exemples.
� Role des conditions aux limites (C.L.)
Pour un systeme infini les solutions acceptables sont celles avec |r| = 1 car ellesdoivent rester bornees quand n → ±∞. Bien que la periodicite spatiale “a” du syteme(cf. figure 1) n’apparaisse pas dans les equations, on pose r = e±ika ; k est defini
modulo2πa
et en pratique on choisit k ∈[−πa,π
a
]. La solution generale (complexe)
Ψn(t) = α1 e−i(ωt−nka) + α2 e
−i(ωt+nka) s’interprete alors comme une somme de deuxondes propagatives se propageant en sens inverses le long de la chaıne de pendules. Deγr+ (ω2−ω2
0 − 2γ)+ γr−1 = 0 on deduit la relation ω2 = ω20 + 2γ (1− coska) entre ω et
k appelee relation de dispersion des ondes (figure 2). Cette relation est egalementvalable pour les solutions (reelles) Ψn(t) = a cos(ωt + Φ) cos(nka + ϕ). Ces ondes sta-tionnaires sont l’analogue des modes propres etudies a la section 6.2.2, les frequencespropres (discretes) etant ici remplacees par une bande (continue) de frequences.
8.1 Chaines de systemes dynamiques couples ; limite continue 255
�
� �
� �
�
0− a ak
02 4+
0
( )k
Figure 2
Pour un systeme semi-infini (n = 0, 1 · · ·∞) la racine r telle que |r| < 1 est aussiacceptable. En posant r = e−|k|a (si ω2 < ω2
0) ou r = −e−|k|a (si ω2 > ω20 + 4γ),
on obtient les solutions de la forme e−iωt e−n|k|a ou e−iωt (−1)n e−n|k|a, et les relationsω2 = ω2
0 + 2γ (1 ∓ cosh |k|a). De telles solutions non propagatives sont observees si onimpose au pendule “0” une pulsation ω satisfaisant les conditions ci-dessus.
Le cas d’un systeme fini de N pendules identiques peut etre deduit de celui dusysteme infini en imposant a ce dernier des C.L. particulieres. Par exemple toute solutiondu systeme infini de la figure 1 qui verifie Ψ0 = ΨN+1 = 0 est acceptable pour lesysteme des N pendules de la figure 3a. Appliquees a An ∝ cos(nka + ϕ), on trouvefacilement que ces C.L. conduisent a N modes propres Ψ(p)
n (t) ∝ cos(ωpt + Φ) sinnkpaavec (N + 1) kpa = pπ (p = 1, 2 · · ·N) et ωp = ω(kp). Si le pendule N est libre (figure4a), les C.L. a imposer au systeme infini sont Ψ0 = 0 et ΨN = ΨN+1 (ainsi le pendule N
n’est soumis a aucune force de la part du ressort “de droite”) ; on a alors(N +
12
)kpa =(
p− 12
)π (p = 1, 2 · · ·N). Les figures 3b et 4b montrent les deux premiers modes propres
de ces systemes (pour N = 5).
3 4 5 62
(a)
(b)
0 1
1 N (=5)
Figure 3
1
3 4 52
(b)
0 1
(a)
N (=5)
Figure 4
256 8 • Equations aux derivees partielles ; propagation ; diffusion
AUTRES EXEMPLES. Petites oscillations longitudinales d’une chaıne d’atomes (cristal a
une dimension)
1) Dans le cas ou les atomes sont identiques et les interactions ne se limitent pas aux plus proches
voisins (figure 5a) on a :
m Ψn = −∑∞n′=−∞Kn−n′Ψn′ avec Kq = K−q et
∑∞q=−∞Kq = 0 .
Ces equations se deduisent de l’existence d’une energie potentielle d’interaction quadratique invariante
par translation Ep = 12
∑n,n′ Kn−n′ΨnΨn′ . La relation de dispersion pour des ondes (phonons)
obtenue en posant Ψn = Ψe−i(ωt−nka) est ω2 = m−1∑∞q=−∞Kqeiqka.
� �� �
n+2n+1n−1n−2
(a)
(b)
n
n−+ +
n+1n−n−1
Figure 5
2Km+
�
� �
�
�
0− a a
( )k2K
−2Km
k
= vk
Figure 6
2) Si la chaıne est la repetition d’un motif de deux atomes (figure 5b) et si (pour simplifier) les inter-
actions se font entre plus proches voisins, on a :
m+Ψ+n = −K(Ψ+
n − Ψ−n ) −K(Ψ+
n − Ψ−n−1) et m−Ψ−
n = −K(Ψ−n − Ψ+
n ) −K(Ψ−n − Ψ+
n+1) .
En posant Ψ±n = Ψ± e−i(ωt−nka), il vient :
(m+ω2 − 2K)Ψ+ +K (1 + e−ika)Ψ− = 0 et (m−ω2 − 2K)Ψ− +K (1 + eika)Ψ+ = 0 .
Ce systeme de deux equations a deux inconnues n’a de solutions Ψ± �= 0 que si (petit calcul) :
ω2 = K (m−1+ +m−1
− ) ±K((m−1
+ +m−1− )2 − 4m−1
+ m−1− sin2 ka
2
) 12 .
Dans ce cas le graphe de la relation de dispersion des phonons (figure 6) contient deux branches :
l’une dite “sonore” pour laquelle ω2 � v2k2 et Ψ+ � Ψ− pour k � 0 (avec 2(m+ +m−) v2 = Ka2) ;
l’autre dite “optique” pour laquelle ω2 � 2K μ−1 et m+Ψ+ +m−Ψ− � 0 pour k � 0 (avec μ masse
reduite).
8.1.2 Limite continue ; cordes vibrantes ; lignes electriques ;hydrodynamique ; impedances
Dans cette section on considere les equations (analogues a celles des pendules avec ω0 = 0)
m Ψn = −Ta
(Ψn − Ψn−1) − T
a(Ψn − Ψn+1) = Fn − Fn+1 .
La relation de dispersion associee est ω2 =2Tma
(1 − cos ka). Elles decrivent les oscilla-
8.1 Chaines de systemes dynamiques couples ; limite continue 257
tions transversales d’une chaıne de masses couplees par des ressorts de tensionT (figure 7a) dans l’approximation ou les lignes des ressorts font des petits angles avecl’axe “x” de la chaıne. (Fn est la composante transverse de la force qu’exerce le ressort “degauche” sur la masse n.) Des equations identiques decrivent la chaıne de quadripoles
electriques de la figure 7b, moyennant les correspondancesm↔ L,T
a↔ C−1, Ψn ↔ In
et Fn ↔ Vn.
� �nn−1 n+1
n n+1n−1
aa
nI Vn+1
(a)
(b) x
�
Figure 7
� Limite continue
L’approximation continue (ou “grande echelle”) correspond au cas ou, pour tout n, Ψn(t)et Ψn+1(t) sont proches. Les Ψn(t) sont alors consideres comme les valeurs en x = nad’une fonction reguliere Ψ(x, t) a laquelle on peut appliquer le developpement :
Ψn±1(t) = Ψ(x± a, t) = Ψ(x, t) ± a ∂xΨ(x, t) +a2
2∂2x Ψ(x, t) · · ·
Dans l’exemple de la figure 7a le systeme d’equations pour les Ψn devient (apres divisionpar a) :
ρ∂2Ψ∂t2
= T∂2Ψ∂x2
+ · · · = −∂F∂x
+ · · ·(ρ =
m
a, F (x) = −T ∂Ψ
∂x
).
Les termes oublies (dont le premier esta2
3T ∂4
xΨ) sont negligeables (par rapport a T ∂2xΨ)
si l’echelle de longueur typique L des variations spatiales de Ψ(x, t) verifie L� a, et ilsdeviennent nuls dans la limite continue a → 0, m → 0 avec
m
a= ρ masse lineique finie.
L’equation obtenue est celle d’une corde vibrante qu’on peut aussi obtenir directement
258 8 • Equations aux derivees partielles ; propagation ; diffusion
en ecrivant (figure 8) :
(ρ dx) ∂2tΨ(x, t) = F (x, t) − F (x+ dx, t) avec F (x, t) = −T ∂xΨ(x, t) .
�F(x, t)
(x+dx, t)
x x+dx
Figure 8
La vitesse de propagation des ondes est v =
√T
ρ. (Elle est obtenue aussi a partir de la
limite continue ω2 =2Tma
(1 − cos ka) → T
ρk2.)
REMARQUES. 1) Dans l’exemple de la figure 7b les equations Vn = LdIndt
+ Vn+1 et
CdVndt
= In−1 − In deviennent, dans la limite continue, l ∂tI = −∂xV et γ ∂tV = −∂xI,qui sont celles d’une ligne electrique d’inductance et de capacite lineiques l =
L
aet
γ =C
a. Elles conduisent pour I a l’E.D.P. γl ∂2
t I = ∂2xI qui est aussi celle verifiee par V
ou Q =∫ tI(x, t′) dt′ (analogue electrique de Ψ) ; ici v = (γl)−
12 .
2) Dans l’exemple de la figure 1, la limite continue a→ 0, ma
→ ρ et Ka→ E conduit a l’E.D.P.
∂2t ψ = −ω2
0ψ + v2 ∂2xψ avec v =
√Eρ
;
la relation de dispersion est ω2 = ω20 + v2k2. Pour ω0 = 0 cette E.D.P. decrit les ondes longitudinales
dans une barre dont E est le module d’Young.
� Bilans energetiques
En multipliant l’equation pour Ψn par Ψn, on obtient le bilan energetique pour le systemeouvert constitue par la nieme masse et le ressort “de droite” :
ddt
(12m Ψ2
n +12T
a(Ψn − Ψn+1)2
)= Fn Ψn − Fn+1 Ψn+1 .
(12T
a(Ψn − Ψn+1)2 = T δln est le surcroıt d’energie du ressort lie a son allongement.)
Ce bilan, divise par a, conduit, dans la limite continue a la L.C. de l’energie (qu’on peutaussi obtenir en multipliant l’E.D.P. par ∂tΨ) :
8.1 Chaines de systemes dynamiques couples ; limite continue 259
∂te+ ∂xj = 0 avec e =12ρ (∂tΨ)2 +
12T (∂xΨ)2 et j = −T (∂xΨ)(∂tΨ) .
e est une densite lineique d’energie (cinetique + potentielle liee a l’allongement de lacorde) et j = F ∂tΨ un flux d’energie (ou courant). Le lecteur etablira (et interpretera)un bilan analogue pour la ligne electrique ; on a alors j = V I = −γ−1 (∂xQ)(∂tQ).
Comme pour les oscillateurs, l’E.D.P. ρ ∂2tΨ−T ∂2
xψ = 0 peut se deduire, inversement, dela L.C. de l’energie. Par exemple, pour une corde fixee a ses deux extremites (Ψ(0, t) =Ψ(L, t) = 0), on ecrit
0 =ddt
∫ L
0
[12ρ (∂tΨ)2 +
12T (∂xΨ)2
]dx =
∫ L
0
∂tΨ[ρ ∂2
tΨ − T ∂2xΨ
]dx
(apres integration par parties de T (∂xΨ)(∂x∂tΨ)). L’E.D.P. resulte alors de ce que ∂tΨpeut etre, a un instant donne, une C.I. arbitraire.
REMARQUE : cette methode permet de modeliser simplement une tige “rigide” (cordede piano ; figure 9) en ajoutant a la densite lineique d’energie un terme de courbure12D
(∂2Ψ∂x2
)2
.
M
M
����������
����������
��������
��������
�
x+dxxO
T
V
(x+dx, t)
M
Figure 9
Du terme supplementaire dans la derivee temporelle de l’energie entre 0 et L
ddt
∫ L
0
D
2
(∂2Ψ∂x2
)2
dx =∫ L
0
D (∂2xΨ)(∂2
x∂tΨ)dx =∫ L
0
D (∂tΨ)(∂4xΨ)dx
(en tenant compte des C.L. ∂xΨ(0, t) = ∂xΨ(L, t) = 0), on deduit l’E.D.P. (valable aussipour des oscillations de plaques minces) :
ρ∂2Ψ∂t2
= T∂2Ψ∂x2
−D∂4Ψ∂x4
.
260 8 • Equations aux derivees partielles ; propagation ; diffusion
(Une description en termes de forces et de couples est plus subtile ; il faut ecrire lesequations T (x, t) = T (x + dx, t) et ρ ∂2
tΨ(x, t) = V (x, t) − V (x + dx, t) pour les forces,M(x, t)−M(x+ dx, t) − T ∂xΨ(x, t) dx− V (x, t) dx = 0 pour les couples, et faire appela la relation M = −D∂2
xΨ entre couple et courbure.)
� Impedance (cf. aussi section 6.4.3)
La notion d’impedance pour une onde est importante en physique lorsqu’on s’interesse a des transferts
d’energie de l’onde vers d’autres systemes (en regime sinusoıdal).
Pour une ligne electrique, si
I(x, t) = a (exp i(ωt − kx) + rI exp i(ωt + kx))
(solution generale de l’E.D.P. pour ω fixe), on deduit de γ ∂tV = −∂xI et v = ωk
= (γl)−12 que
V (x, t) = Z0a (exp i(ωt − kx) + rV exp i(ωt + kx))
avec Z0 =√
lγ
et rV = −rI (coefficients de reflexion). Z0 qui represente le rapport VI
lorsqu’il n’y
a pas d’onde reflechie (rV = rI = 0 “adaptation d’impedance”) est l’impedance caracteristique de la
ligne (limite continue de l’impedance iterative des quadripoles). Le rapport
Z(x) =V (x,t)I(x,t)
est l’impedance en x. On deduit de ces definitions que si une impedance Z est branchee au bout de la
ligne (pris comme origine x = 0), on a Z = Z01−r
I1+r
Id’ou rI = Z0−Z
Z0+Z= −rV . Un calcul elementaire
donne alors le flux moyen d’energie sur la ligne : 12�e(V I) = 1
2Z0 |a|2(1 − |rI |2). Ce flux est aussi egal,
pour z = 0, a : 12�eZ |I(0, t)|2 (puissance dissipee dans Z). Un calcul simple montre que l’impedance
vue sur la ligne en z = −L est :
Z(−L) = Z0Z cos kL+iZ0 sin kLZ0 cos kL+iZ sin kL
.
Si pour z > 0 on a une ligne d’impedance Z2, et pour z < −L une ligne d’impedance Z1 �= Z2,
l’adaptation des deux lignes (passage integral de l’energie de 1 a 2) s’obtient lorsque Z(−L) = Z1, c’est
a dire cos kL = 0 (ligne intermediaire quart d’onde) et Z20 = Z1Z2.
Cet exemple classique a son analogue pour la corde vibrante qu’on deduit des correspondances V ↔ F =
−T ∂xΨ, I ↔ ∂tΨ, l ↔ ρ et γ−1 ↔ T ; on a alors Z0 =√ρT . Si on place au bout de la corde (x = 0)
le systeme mecanique de la figure 10 (masse m attachee a un ressort de raideur K et coulissant avec
frottement), l’equation m∂2tΨ = −KΨ− f ∂tΨ− T ∂xΨ montre que l’impedance mecanique −T ∂xΨ
∂tΨ
a ce bout n’est autre que Z = f + i(mω − K
ω
), analogue mecanique de Z = R+ i
(Lω − 1
Cω
).
K
m
(frottement) f
x
corde
Figure 10
8.2 Solutions de quelques E.D.P. dynamiques 261
� Exemples en hydrodynamique
1) Les ondes sonores dans un tuyau a paroi extensible (figure 11) sont regies par les equations :
ρ ∂2tΨ = −∂xP ′ et − χP ′ = δV
V= ∂xΨ +DP ′ (donc P ′ = −(χ+D)−1 ∂xΨ) .
P ′ est la surpression, D le coefficient d’extensibilite defini par dSS
= DP ′ (S section du tuyau) et δVV
la variation relative de volume d’une tranche de fluide de masse volumique ρ et de compressibilite χ ;
on verifie la L.C.
∂te+ ∂xj = 0 avec e = 12ρS(∂tΨ)2 + 1
2(χ+D)SP ′2 et j = P ′S(∂tΨ) .
�
�
(x, t)
(x+dx, t) S+dS
x+dxx x
S
Figure 11
�
�
�
h
(x, t)
x
(x, t)
(x+dx, t)
x x+dx
Figure 12
2) Les ondes de surface dans un canal peu profond de hauteur h et section S (figure 12) sont
regies par les equations analogues (avec χ = 0) :
ρ ∂2tΨ = −∂xP ′ avec P ′ = ρgη et δV
V= ∂xΨ + η
h= 0 (conservation du volume) .
Dans ces exemples le role de F est tenu par P ′ et Ψ est remplace par le volume deplace SΨ; on a
alors Z0 = ρvS
avec v = (ρ(χ +D))−12 ou v = (gh)
12 , et Z = P ′
S(∂tΨ)est l’impedance acoustique.
8.2 SOLUTIONS DE QUELQUES E.D.P. DYNAMIQUES
8.2.1 E.D.P. lineaires a coefficients constants et solutions ondes planes
Ces E.D.P. (sans second membre, c.a.d. en l’absence de sources) concernent des champsdans des milieux dont les proprietes sont les memes en tout point (homogeneite) et a toutinstant (stationnarite), et tels que ces champs peuvent se superposer (linearite). Ellespossedent des solutions onde plane en fonction desquelles toute solution peut s’exprimer.
� Onde plane A e−i(ωt−�k·�r) (notation complexe)
Comme on le verra ω et k peuvent etre complexes : ω = ω1 + iω2 et k = k1 + ik2.Pour l’onde physique (reelle) ω1 et k1 sont lies a la propagation tandis que ω2 et k2
decrivent la (de)croissance de l’amplitude. Par exemple pour une grandeur scalaire�e[Ae−i(ωt−�k·�r)] = a eω2te−�k2·�r cos(ω1t−k1·r1+ϕ) (avec A = a e−iϕ). Pour une grandeurvectorielle (cf. exemple a la section 2.5.3),
−→A decrit les etats de polarisation (rectiligne si−→
A est reel). Sur une onde plane les derivees partielles agissent comme des multiplications :
262 8 • Equations aux derivees partielles ; propagation ; diffusion
∂t ≡ −iω, ∂x ≡ ikx · · · . Par exemple pour−→E (r, t) =
−→E 0 exp−i(ωt− k · r) on a ∂2
t
−→E =
−ω2−→E , div−→E = ik · −→E ,
−→rot
−→E = ik ∧ −→
E , Δ−→E = −k2−→E , etc.
� Relation de dispersion
Lorsqu’on cherche des solutions sous la forme d’ondes planes, le systeme d’E.D.P. devientun systeme d’equations algebriques lineaires sans second membre pour les amplitudes desondes. Comme un tel systeme n’admet de solutions non nulles que si il existe des relationsentre les coefficients, lesquels dependent ici de ω et k, on en deduit que les ondes planessont solutions si il existe une (au moins) relation entre ω et k. Donnons des exemples.Pour l’ E.D.P. de diffusion et l’E.D.P. de propagation on obtient
∂tf = DΔf =⇒ ω = −ik2D , ∂2t f − v2 Δf = 0 =⇒ ω2 = v2k2 ,
et pour un milieu dielectrique conducteur de conductivite γ (cf. cours d’electricite) :
Δ−→E = μ
(ε ∂2
t
−→E + γ ∂t
−→E
)=⇒ k2 = εμω2 + iμγω .
Dans ce dernier exemple, dont les deux premiers sont les cas limites ω � γ
εet ω � γ
ε,
l’“imaginaire pur” i apparaıt dans la relation ; ceci est lie a la presence de processusirreversibles (ici la conduction ohmique j = γ
−→E ) ; comme 2k1 · k2 = �mk2 = μγω > 0,
l’onde s’attenue au cours de sa propagation (on suppose ω reel positif).
REMARQUE : l’E.D.P. de Schrodinger i�∂tψ = − �2
2mΔψ, identique formellement a
l’equation de diffusion avec D =i�
2m, mais reversible (laissee invariante par les change-
ments t → −t et ψ → ψ), conduit a la relation reelle : ω =�k2
2m. (cf. aussi les E.D.P.
relativistes section 4.4.5.)
Pour l’E.D.P. des ondes elastiques en milieu isotrope
ρ ∂2t
−→Ψ = μΔ
−→Ψ +
(χ−1 +
μ
3
)−−→grad(div
−→Ψ) ,
on obtient (ρω2−μk2)−→Ψ =
(χ−1+
μ
3
)(k ·−→Ψ)k ou, en separant les composantes parallele
et perpendiculaire a k :(ρω2 −
(χ−1 +
43μ)k2
)Ψ‖ = 0 et (ρω2 − μk2)
−→Ψ⊥ = 0. Ce
systeme a deux solutions ; soit ρω2 =(χ−1 +
43μ)k2 et
−→Ψ⊥ = 0 (onde sismique longitu-
dinale), soit ρω2 = μk2 et Ψ‖ = 0 (onde sismique transversale) ; a chacune est associeeune polarisation.
Milieux dielectriques anisotropes parfaits. Des equations de Maxwell (cf. section 7.5.1) div−→D = 0,
div−→B = 0,
−→rot
−→E = −∂t−→B et
−→rot
−→H = ∂t
−→D avec
−→B = μ0
−→H et
−→D = [ε]
−→E ([ε] matrice symetrique reelle),
on deduit les relations :
�k · −→D = 0 , �k · −→B = 0 , �k ∧ −→E = ω
−→B et �k ∧−→
H = −ω−→D .
8.2 Solutions de quelques E.D.P. dynamiques 263
Elles permettent immediatement de determiner les directions relatives des vecteurs �k,−→D ,
−→H ,
−→E et−→P =
−→E ∧ −→
H pour une onde plane (figure 13) et, en ecrivant �k ∧ (�k ∧ −→E ), d’obtenir la relation :
k2−→E⊥ = μ0ω2[ε]−→E .
Celle-ci n’est aisement exploitable que dans une base ou [ε] est diagonale (Dx = ε0n2xEx · · · ), et si on
choisit �k dans un plan de symetrie, par exemple �k = (kx, 0, kz). Alors les equations pour Ey et pour le
couple (Ex, Ez) se separent. De celle pour Ey on deduit k2 = k2x + k2
z = ε0μ0ω2n2y et
−→D parallele a y.
De celles pour (Ex, Ez) il resulte (petit calcul) quek2x
n2z
+k2z
n2x
= ε0μ0ω2 et que
−→D est perpendiculaire a �k
et y. Dans le cas particulier d’un cristal uniaxe ou nx = ny = no �= nz = ne, la symetrie de revolution
permet toujours de choisir l’axe “x” de sorte que ky = 0. La surface des vecteurs d’onde (lieu de
l’extremite de �k a ω fixe) est alors constituee, d’une part par la sphere k2 = ε0μ0ω2n2o pour les ondes
“ordinaires” (car analogues a celles d’un milieu isotrope avec en particulier−→D ‖ −→
E et−→P ‖ �k), et
d’autre part par l’ellipsoıdek2z
n2o
+k2x + k2
y
n2e
= ε0μ0ω2 pour les ondes “extraordinaires”. La figure 14
represente ces surfaces en coupe et, pour une direction donnee de �k, les caracteristiques des deux ondes.
Pour l’onde extraordinaire la relation kxDx + kzDz = 0 equivalente akx
n2e
Ex +kz
n2o
Ez = 0 montre que−→Ee est tangent a l’ellipsoıde (car orthogonal a sa normale) et donc que
−→Pe, qui indique la direction
de propagation de l’energie, n’est pas parallele a �k.
DE
k
E H
B ou H
Figure 13
Eo Do
k z
De
�
�
� �
,k
e
o
Ee
Oc
ne no ckx
Figure 14
� Choix des solutions onde plane
Une relation de dispersion peut etre satisfaite d’une infinite de facons. C’est la phy-sique qui determine le choix. Considerons l’exemple ω = −iDk2 de la diffusion a unedimension. Si k est reel, alors
�e[Ae−i(ωt−kx)
]= a e−Dk
2t cos(kx− ϕ)
decrit l’amortissement “sur place” d’une perturbation sinusoıdale (spatialement) presente
a t = 0 dans le milieu. Si ω est reel, k =(iω
D
) 12
= ±1 + i
δ(avec δ =
(2Dω
) 12
) ; la solution
�e[Ae−i(ωt−kx)
]= a e∓
xδ cos
(ωt∓ x
δ+ ϕ
)correspond alors a une perturbation de pulsation ω introduite a l’entree d’un milieu semi-
264 8 • Equations aux derivees partielles ; propagation ; diffusion
infini ([0,∞] pour le signe “−” ou [−∞, 0] pour le signe “+”), et qui, en “progressant”dans le milieu, s’amortit sur une distance δ (longueur de penetration en thermique,epaisseur de peau en electromagnetisme, etc.).
De maniere generale ω est reel si l’onde est generee par une source monochromatique(exterieure a la region consideree). Notons que dans ce cas, meme si la relation de dis-persion est reelle, k peut etre complexe. C’est le cas lors de la reflexion totale d’uneonde a la surface de separation z = 0 de deux milieux (i = 1, 2) isotropes pour lesquelsω2 = v2
i k2 avec v1 < v2 (figure 15) ; pour une onde arrivant sous une incidence θ1 telle que
sin θ1 >v1v2
, la loi de Descartes impose k2x = k1x =ω
v1sin θ1 et alors k2
2z =ω2
v22
−k22x < 0.
L’onde dans le milieu 2 (z < 0) est une onde evanescente qui se propage parallelementau plan z = 0 et dont l’amplitude decroıt comme exp |k2z |z.
k 2
�
�
1
sin 1
1
x
zk1
�
�
k 11
Figure 15
� Solution generale
Toute solution des E.D.P. lineaires a coefficients constants rencontrees en physique,qu’elles concernent un milieu infini ou limite (avec des C.L.), est une somme (continueou discrete) d’ondes planes satisfaisant la relation de dispersion associee a l’E.D.P.consideree. On decrit ci-dessous quelques exemples de combinaisons d’ondes planes sou-vent rencontrees en physique.
EXEMPLE 1. Paquet d’ondes. Pour voir ce qui se rapproche le plus d’une solutiononde plane, sommons des ondes dont les vecteurs d’onde k = k0 +
−→K sont proches de
k0 :
Ψ(r, t) =∫∫∫
a(k0 +−→K) e−i
(ω(�k0+
−→K)t−(�k0+
−→K)·�r+ϕ(�k0+
−→K)
)d3K (|−→K | � 0)) ,
avec ω(k) donnee par la relation de dispersion de l’E.D.P. consideree. En posantω(k0) = ω0 et ϕ(k0) = ϕ0, et en effectuant les developpements au premier ordre
ω(k0 +−→K) = ω0 + vg · −→K et ϕ(k0 +
−→K) = ϕ0 + r0 · −→K (avec vg =
∂ω(k)
∂k
∣∣∣∣�k=�k0
et
r0 =∂ϕ(k)
∂k
∣∣∣∣�k=�k0
) on obtient :
Ψ(r, t) = e−i(ω0t−�k0·�r+ϕ0) f(r−vgt−r0) avec f(r) =∫∫∫
a(k0+−→K) ei
−→K ·�r d3K (|−→K | � 0).
8.2 Solutions de quelques E.D.P. dynamiques 265
Ψ represente une onde plane modulee en amplitude dont l’enveloppe f , lentementvariable, se deplace a la vitesse de groupe vg(k0). (La figure 16a represente unpaquet a une dimension de largeur Δz reliee a la dispersion Δk par ΔzΔk � 1.)
f(z−z0− gv , t)t
�v
f(z−z0
��
(a)
(b)
0
Paquet d’ondes étalé à t > 0
Paquet d’ondes à t = 0
z
z
vg
( k)−1z
, 0)
Figure 16
REMARQUES. 1) Dans un milieu anisotrope �vg egale a−−→grad�k ω, et donc perpendiculaire a la surface
des vecteurs d’onde ω(�k) = Cste, n’est pas parallele a �k ; la figure 17 illustre la refraction “extraordinaire”
sous incidence normale (�k‖ = 0 continu) d’un paquet dans un tel milieu.
������������������
������������������
��������������������
��������������������cristal
anisotrope
air
paquet d’ondes
réfracté
incident
paquet d’ondes
vgk
Figure 17
2) Dans un milieu isotrope (ou a une dimension) on a en general vg = dωdk
�= vϕ = ωk
; par exemple en
optique (k = n(ω) ωc), pour des vagues en haute mer (ω2 = kg) et pour des particules libres quantiques
(ω = � k2
2m), on obtient respectivement v−1
g = v−1ϕ + ω
cdndω
(en pratiquevϕ−vg
vϕ� 10−1), vg = 1
2vϕ et
vg = 2 vϕ.
3) La dependance de �vg vis-a-vis de �k (a une dimension Δvg = ω′′(k) Δk) est la cause de l’etalement
(Δvg t) des paquets et de la separation (dispersion) des frequences en son sein (figure 16b ; cf. aussi
section 5.1.3).
266 8 • Equations aux derivees partielles ; propagation ; diffusion
4) La figure 18 montre l’arrivee a t = 0 en �r0 = 0 d’un paquet d’ondes sur le plan z = 0 dans des
conditions de reflexion totale pour les ondes qui le composent (coefficients de reflexion r(�k) = e−iΦ(�k)). La
formule donnant le paquet reflechi differe de celle du paquet incident par les changements �k(kx, ky, kz) →�k′(kx, ky,−kz) et ϕ → ϕ+ Φ. Sa position (fictive) a t = 0 est donc �r0 ′ =
−−→grad�k′ Φ ; ceci explique que le
paquet reflechi est decale en position (effet Goos Hanchen) et en temps par rapport a ce que donnerait
une reflexion “geometrique instantanee”.
r’0
�
������������
������������
������������
������������
������������
������������ x
0
z
Figure 18
5) Signalons enfin un resultat tres general et non trivial qu’on peut, en considerant la somme de deux
ondes avec ω et−→k voisins, deduire de la L.C. de l’energie ∂te+ div�j = 0 et du caractere quadratique en
ψ de e et �j : dω < e > −d�k· <�j >= 0. Ce resultat entraıne que la vitesse de groupe �vg(�k0) est egale au
rapport des moyennes temporelles <�j><e>
calcule pour l’onde plane (ω0, �k0) (vitesse de l’energie). De
l’inegalite < e >≥ | <�j > | c−1 (equivalente a < e >> 0 dans tous les referentiels), on deduit |�vg| ≤ c.
EXEMPLE 2. Ondes guidees. Si on fixe ω et kz = k cos θ, et qu’on somme sur kxet ky en respectant la relation de dispersion (par exemple ω2 = v2k2), on obtient dessolutions du type f(x, y) e−i(ωt−kzz). Elles concernent des systemes (guides d’ondes)invariants par translation selon z. Un exemple simple est la somme de deux ondesA± e−i(ωt∓kxx−kzz) se propageant dans une region x ∈ [0, a] (figure 19).
�
��
� z0
a
xplans de phase constante
2kz
=kz
v
v
1
2
+
�
k
k
−
Figure 19
Les C.L. sont A+ = r1 A− en x = 0 et A− e−ikxa = r2A+ eikxa en x = a, avec
r1,2 = e−iϕ1,2 coefficients de reflexion totale sur ces plans ; ϕ1,2 dependent en generalde kx et kz et des milieux 1 et 2. Elles conduisent a la relation de quantification 2kxa =ϕ1 +ϕ2
def= ϕ (modulo 2π) pour kx, et a la relation de dispersion ω2 = v2(k2x(kz)+k
2z
).
8.2 Solutions de quelques E.D.P. dynamiques 267
(Par exemple kx = nπ
asi r1,2 = −1.) Pour ces ondes : vϕ =
ω
kz=
v
cos θet (petit
calcul) vg =dωdkz
= v cos θ + v sin θ∂ϕ
∂kz
(2a− ∂ϕ
∂kx
)−1
; vg = v cos θ si r1,2 = −1.
Remarque. Si on somme des ondes planes de vecteurs d’onde (kx = k⊥ cosϕ�k , ky = k⊥ sinϕ�k , kz =
k cos θ), avec ω, k, θ fixes et ϕ�k variable de sommation, chaque onde etant affectee d’un poids
(2π)−1 e−imϕ k , on obtient en coordonnees polaires :
f(r, ϕ) = (2π)−1∫ 2π0 e−imϕ k eik⊥r cos(ϕ−ϕ k
) dϕ�k = e−imϕ Jm(k⊥r) ;
(les fonctions de Bessel sont definies par Jm(u) = (2π)−1∫ 2π0 e−imϕ eiu cosϕ dϕ.) Ces fonctions
f qui verifient (∂2x + ∂2
y + k2⊥) f = 0 (comme les fonctions ei(kxx+kyy)) interviennent naturellement
dans la physique des guides d’ondes cylindriques.
EXEMPLE 3. Ondes spheriques (figure 20). Une somme d’ondes planes monochro-matiques de meme amplitude et dont les vecteurs k (|k| fixe) sont proches de l’axe z((kx, ky) dans un “petit” domaine D autour de (0, 0)) s’ecrit :
Ψ(r, t) =∫∫
De−i(ωt−kxx−kyy−kzz) dkx dky avec kz � k − k2
x + k2y
2k.
x
z0
Figure 20
En utilisant l’approximation de la phase stationnaire (cf. section 5.1.3), le lecteurmontrera que, pour z “grand”, on a Ψ � 0 si
(k∗x =
x
zk, k∗y =
y
zk)�∈ D, et
Ψ ∝ z−1 exp−i(ωt− k
(z +
x2 + y2
2z))
sinon. Pour z > 0 (resp. z < 0) il s’agit d’une onde spherique divergente (resp. conver-gente) en O ; le passage par O entraıne un dephasage de π (lie au signe de z−1).
8.2.2 Equations de diffusion et de propagation ; fonctions de Green ;ondes stationnaires
Pour resoudre ces equations, on utilise la dependance lineaire de la solution vis-a-vis desC.I. (prises a t = 0) lorsqu’il n’y a pas de source. On montre ensuite que la solutioncausale en presence de source se deduit facilement du cas sans source. Cette demarcheest celle suivie pour les E.D. a la section 6.2.1, la notion de fonction de Green generalisantaux E.D.P. celle de reponse impulsionnelle.
268 8 • Equations aux derivees partielles ; propagation ; diffusion
� E.D.P. de diffusion : ∂tf(x, t) −D ∂2xf(x, t) = g(x, t) (a une dimension)
Si g = 0 on verifie facilement que l’E.D.P. admet, pour x ∈ [−∞,∞] et t > 0, la solutionparticuliere :
G(x, t) = (4πDt)−12 exp− x2
4Dt.
t > 0
0 x
G(x,t)
t +0
Figure 21
Il s’agit d’une fonction gaussienne centree en 0, normalisee et d’ecart type√
2Dt quis’etale sans se propager quand t croıt (figure 21). Quand t→ 0+ elle est au contraire deplus en plus piquee et tend vers δ(x). On en deduit que la fonction
f(x, t) =∫ ∞
−∞G(x− x′, t)ϕ0(x′) dx′
est, pour t > 0, la solution satisfaisant la C.I. f(x, 0) = ϕ0(x).
Si g �= 0 (diffusion avec source) la solution causale (“dont les variations ne precedentpas celles de la source”) est alors :
f(x, t) =∫ t
−∞
[∫ ∞
−∞G(x − x′, t− t′) g(x′, t′) dx′
]dt′ .
DEMONSTRATION : comme la fonction entre crochets satisfait (comme G) ∂t[· · · ] =D∂2
x[· · · ], et vaut g(x, t) pour t = t′, on obtient ∂tf = g +∫ t−∞ ∂t[· · · ] dt′ = g +D∂2
xf .Cas particulier : si g(x, t) = δ(t) δ(x), alors f(x, t) = H(t)G(x, t) ; cette reponse a uneimpulsion en x = 0 a t = 0 est appelee fonction de Green du probleme de diffusion aune dimension.
REMARQUE. A n dimensions les resultats precedents restent valables ; il suffit de rem-placer x par x et (4πDt)−
12 par (4πDt)−
n2 . Pour l’E.D.P. de Schrodinger on remplace
D pari�
2m.
8.2 Solutions de quelques E.D.P. dynamiques 269
� E.D.P. de propagation a une dimension : ∂2t f(x.t)−v2 ∂2
xf(x, t) = g(x, t)
Pour g = 0 la solution generale f(x, t) = f1(x − vt) + f2(x + vt), somme d’ondes pro-pagatives vue a la section 7.1.4, s’ecrit aussi en fonction des C.I. f(x, 0) = ϕ0(x) et∂tf(x, t)|t=0 = ϕ1(x) (verification immediate) :
f(x, t) =12
(ϕ0(x− vt) + ϕ0(x+ vt)
)+
12v
∫ x+vt
x−vtϕ1(x′) dx′ .
Pour une corde vibrante le premier terme decrit l’evolution d’une “perturbation de po-sition” (obtenue en ecartant la corde de sa position d’equilibre puis en la lachant ; figure22a), et le second (produit par t de la moyenne de ϕ1(x) sur l’intervalle [x− vt, x+ vt])celle d’une “perturbation de vitesse” (obtenue en soumettant la corde a une percussion ;figure 22b).
�
�
2 v t
2 v tx
x
f(x,t)
f(x,t)
0(x)
1(x)(b)
(a)
Figure 22
Si g �= 0, il resulte de la relation entre f et ϕ1 que la solution causale est :
f(x, t) =∫ t
−∞
[12v
∫ x+v(t−t′)
x−v(t−t′)g(x′, t′) dx′
]dt′ .
DEMONSTRATION : les proprietes de la fonction entre crochets, ∂2t [· · · ] = v2 ∂2
x[· · · ]ainsi que [· · · ] = 0 et ∂t[· · · ] = g(x, t) pour t = t′, entraınent ∂tf =
∫ t−∞ ∂t[· · · ] dt′
puis ∂2t f = g + v2 ∂2
xf . On notera que la solution s’ecrit comme celle de la diffusion, la
fonction de Green etant la porte12v
Π( x
2vt
)au lieu de la gaussienne G(x, t).
� E.D.P. de propagation a trois dimensions : ∂2t f(�r, t)−v2 Δf(�r, t)=g(�r, t)
Tous les resultats decoulent du lemme suivant : soit ϕ(r) une fonction arbitraire de r ;alors la fonction Φ(r, t) = t < ϕ >S(�r,vt), produit par t > 0 de la moyenne de ϕ sur lasphere centree en r et de rayon vt, est telle que :
∂2tΦ(r, t)−v2 ΔΦ(r, t) = 0 ; Φ(r, 0) = 0 ; ∂tΦ(r, t)|t=0 = ϕ(r) ; ∂2
tΦ(r, t)|t=0 = 0 .
270 8 • Equations aux derivees partielles ; propagation ; diffusion
DEMONSTRATION : la relation ϕ→ Φ etant lineaire on peut, en vertu de l’analyse deFourier, se limiter au cas ou ϕ est une onde plane ei�k·�r. Un point arbitraire sur la sphereS(r, vt) etant repere par r + vtu on a (dΩu angle solide elementaire “autour”de u) :
Φ(r, t) def=t
4π
∫∫ei�k·(�r+vtu) dΩu = ei
�k·�r sinωtω
(avec ω = vk) .
Les proprietes annoncees deviennent alors evidentes.- Premiere consequence : si g = 0, la solution f(r, t) s’exprime en fonction des C.I.f(r, 0) = ϕ0(r) et ∂tf(r, t)|t=0 = ϕ1(r) sous la forme (verification immediate) :
f(r, t) = ∂t
(t < ϕ0 >S(�r,vt)
)+ t < ϕ1 >S(�r,vt) .
- Deuxieme consequence : pour g �= 0 la solution causale (causalite illustree sur la figure23), deduite de la relation ci-dessus entre f et ϕ1, s’ecrit (demonstration comme a unedimension) :
f(r, t) =∫ t
−∞
[(t− t′) < g(r ′, t′) >
S(�r,v(t−t′)
)]dt′ .
g( r’, t’)
valeurs de g( r’, t’)
r , t
v(t−
t’)
support de
qui contribuent à f( r , t)
Figure 23
f( r , t)localisation de et� �
t
(a) (b)
r
0
t t1 2
1
21v t
v t
Figure 24
En posant r ′ = r +Ru avec R = v(t− t′), elle devient
f(r, t) =∫ ∞
0
[14π
∫∫g(r +Ru, t− R
v
)dΩu
]R
v
dRv
,
ou encore (forme plus habituelle de la solution causale en physique) :
f(r, t) =∫∫∫
g(r ′, t− |�r−�r ′|
v
)4πv2|r − r ′| d3r′ .
(Par exemple la solution de ΔV − c−2 ∂2t V = − ρ
ε0est ecrite a la section 7.5.2). La fonc-
tion de Green, reponse a δ(r) δ(t), est ici H(t) (4πv2r)−1 δ(t− r
v
)(“pulse” spherique
naissant a t = 0 en r = 0).
REMARQUES (pour g = 0). 1) Il resulte de la premiere consequence que, si ϕ0 et ϕ1 sont localisees
(figure 24a), l’onde n’est presente en tout point �r que pendant un intervalle de temps fini (figure 24b).
8.2 Solutions de quelques E.D.P. dynamiques 271
2) Dans le cas statique (f(�r, t) ≡ ϕ0(�r) et Δϕ0 = 0), elle entraıne aussi que la valeur ϕ0(�r) est la
moyenne de ϕ0 sur toute sphere centree en �r (generalisation du resultat etabli a la section 7.1.2).
3) Les resultats relatifs a la propagation a une (resp. deux) dimension se deduisent du cas a trois
dimensions en considerant des fonctions ϕ0 et ϕ1 ne dependant que de x (resp. x et y), et en integrant
toujours sur les trois variables. On verifie par exemple que la moyenne sur la sphere S(�r, vt) devient la
moyenne sur le segment [x− vt, x+ vt] a une dimension.
� Introduction de conditions aux limites (C.L.) ; ondes stationnaires
Les solutions precedentes supposent un espace infini. Si on impose des C.L. independantesdu temps, les ondes stationnaires f(r, t) = f(r)h(t) (produit d’une fonction de l’es-pace par une fonction du temps), solution des equations en absence de source (g = 0),jouent un role important.
Par exemple l’E.D.P. (∂2t − v2∂2
x)f(x)h(t) = 0 conduit ah
h= v2 f
′′
f= −ω2 = Cste
(en divisant par fh). (0n suppose h borne pour t → ±∞). Les variables t et x etantindependantes on en deduit (si ω �= 0) :
f(x)h(t) = A cos(kx+ ϕ) cos(ωt+ φ) avec k =ω
v.
Pour une corde vibrante attachee en x = 0 et x = L, les C.L. fixent la dependancespatiale en sin knx avec kn = n
π
L(n > 0). La solution generale est alors f(x, t) =∑
n sin knx(an cosωnt+bn sinωnt
); les coefficients an (resp. bn) sont determines par les
developpements en serie de Fourier de f(x, 0) (resp. ∂tf(x, t)|t=0).
De meme, pour l’E.D.P. de diffusion (∂t −D∂2x) f(x)h(t) = 0, on obtient
h
h= D
f ′′
f=
−Dk2 (h bornee a t → ∞), d’ou f(x)h(t) = A cos(kx + ϕ) e−Dk2t (si k �= 0). Pour des
C.L. nulles en x = 0 et x = L la solution generale est f(x, t) =∑
n an sinknx e−Dk2nt et
les C.I. donnent an =2L
∫ L
0
f(x, 0) sin knxdx. (Pour des C.L. constantes non nulles il
faudrait ajouter un terme a0x+ b0 correspondant a k = 0.)
Ce type de solutions s’etend a trois dimensions et a d’autres equations. Par exemple lesE.D.P. de propagation en milieux lineaires inhomogenes ∂2
t f = v2(r)Δf , ou l’E.D.P. de
Schrodinger i� ∂tf = − �2
2mΔf + V (r) f , conduisent aux E.D.P. spatiales(
Δ + k2(r))f(r) = 0
avec respectivement k(r) =ω
v(r)(pour h(t) ∝ cos(ωt + ϕ)) et k2(r) =
2m�2
(E − V (r)
)(pour h(t) ∝ exp−iEt
�).
Fonction de Green avec C.L.. Considerons l’exemple de l’equation de diffusion a une dimensionci-dessus dans [0, L] avec C.L. nulles. L’expression des an ci-dessus permet d’ecrire la relation lineaireentre la solution f(x, t) et la C.I. f(x, 0) sous la forme :
f(x, t) =∫ L0 G(x, x′, t) f(x′, 0) dx′ avec G(x, x′, t) = 2
L
∑n sin knx sinknx′ e−Dk
2nt .
La fonction G(x, x′, t) qui verifie ∂tG = D∂2xG, les C.L., et qui est egale a δ(x − x′) pour t = 0,
272 8 • Equations aux derivees partielles ; propagation ; diffusion
est la fonction de Green du probleme de diffusion dans [0, L]. Elle conduit a la solution f(x, t) =∫ t−∞
[∫ L0G(x, x′, t− t′) g(x′, t′) dx′
]dt′ du meme probleme en presence de source.
8.2.3 Six E.D.P. liees a une loi de conservation
On considere les bilans (sans source)
∂tf + ∂xj = 0 (a une dimension) et ∂tf + divj = 0 (a trois dimensions) .
Ces bilans dans lesquels f est en general une densite (lineaire ou volumique) de grandeuradditive conservee, conduisent a une E.D.P. pour f lorsque l’intensite du courant j, ousa densite volumique j, est liee a f .
EXEMPLE 1. Si j est une fonction j(f) on obtient l’E.D.P. d’onde simple nonlineaire
∂tf + c(f) ∂xf = 0 (avec c(f) = j′(f))
qui peut conduire a une onde de choc (cf. exemple de la section 7.2.4).
EXEMPLE 2. Si j = −D∂xf ou j = −D−−→gradf on obtient l’equation de diffusion. Un
exemple est l’equation de la “chaleur”
ρc ∂tT = KΔT ,
qui correspond a un bilan d’energie interne ∂t(ρe) + divjth = 0 pour un solide, avece =
∫ Tc(T ′) dT ′ et jth = −K −−→
gradT .Remarque. Le lecteur etablira et interpretera le bilan relatif a l’entropie massique s =
∫ T T ′−1c(T ′) dT ′ :
∂t(ρs) + div�jS = τS avec �jS = T−1�jth et τS = KT−2(−−→gradT )2 .
EXEMPLE 3. Si j(x, t) = V (x, t) f(x, t) l’E.D.P. lineaire inhomogene
∂tf + ∂x(V f) = 0
decrit l’entraınement d’une grandeur en tout point x a l’instant t par un ecoulementdont le champ de vitesse est V (x, t). En effet, en suivant le mouvement defini parx = V (x, t), on a dt
(f(x, t) dx
)= (dtf + f ∂xV ) dx =
(∂tf + ∂x(fV )
)dx = 0 (cf.
sections 7.1.3 et 7.2.3).Remarque. La meme notion d’entraınement s’applique a la L.C. ∂tf +∂x (V (x, t) f) = 0 en dimension
arbitraire. Si de plus V est a divergence nulle (∂x · V = 0), alors dtf = 0 ; un exemple est donne
par l’E.D.P. de Liouville satisfaite par toute densite de probabilite f(q, p, t) lorsque les points de
l’espace de phase obeissent a une dynamique hamiltonienne : V ≡ (∂pH,−∂qH
)(cf. section 9.1).
EXEMPLE 4. Citons egalement deux E.D.P. associant l’effet d’entraınement a d’autres effets. L’E.D.P.
de Fokker-Planck introduite a la section 10.3.1 combine entraınement et diffusion. L’E.D.P. de
Boltzmann
∂tf +−→Fm
· ∂�vf + �v · −→∇f = − f−f0τ
,
relative a une densite de probabilite dans l’espace de phase f(�r, �v, t) a une seule particule, combine
entraınement (mouvement d’un point (�r, �v) sous l’action d’une force exterieure : �r = �v et �v =−→Fm
) et
relaxation vers une distribution d’equilibre (en general du type f0(�v), de Maxwell ou Fermi-Dirac).
Sous sa forme linearisee, elle sert a decrire de nombreux phenomenes de transport ; par exemple
si−→F = q
−→E est constante, la conductivite electrique γ, definie par �j = γ
−→E , s’obtient en ecrivant :
f = f0 − τ qm
−→E · ∂�vf0 = f0 + δf et �j =
∫∫∫q �v δf d3v .
8.2 Solutions de quelques E.D.P. dynamiques 273
8.2.4 Trois exemples d’E.D.P. non lineaires ; ondes solitaires
Ces E.D.P. se rencontrent dans tous les domaines (hydrodynamique, optique, plasmas,chimie, biologie...) avec des applications dans la vie courante (ecoulements d’eau, houle,organisation des nuages, propagation des incendies...). En general les nonlinearites sontdues aux proprietes des milieux et, en hydrodynamique, a la presence de la deriveeparticulaire dt = ∂t + v · −→∇ . Si elles sont petites on peut montrer, comme pour lesoscillateurs (cf. section 6.5.1), par une methode de perturbation, que leurs effets sont ladependance ω(k, a) de la relation de dispersion vis-a-vis de l’amplitude a et la presenced’harmoniques.
On considere ci-dessous trois exemples ”classiques” d’E.D.P. non lineaires a une dimen-sion et leurs solutions particulieres du type f(u = x − V t). Ces ondes qui se propagentsans deformation a vitesse constante V , et sont constantes (ou nulles) pour u infini, sontappelees ondes solitaires.
� E.D.P. de Sine Gordon ∂2t f = −ω2
0 sin f + v2 ∂2xf
Elle est la limite continue du systeme d’equations
ml2θn = −mgl sin θn − C(θn − θn−1) − C(θn − θn+1)
decrivant des pendules simples oscillant dans un plan perpendiculaire a l’axe horizontal“x” et couples lineairement par des ressorts de torsion portes par cet axe. Dans la suiteon fera ω0 = v = 1, le lecteur pouvant retablir dimensionnellement ω0 et v dans toutesles formules (cf. chapitre 1). L’equation pour f(u), qui s’ecrit (1 − V 2) f ′′ = sin f , estaussi celle d’un mobile de masse 1−V 2 se deplacant dans le potentiel U(f) = 1+cos f .
f (x,t)+ f (x,t)−
U(f)
A B f
2
txv
0
(a)
(b)
Figure 25
On voit alors sur la figure 25a que f ne tend vers une constante a l’infini que si ce mobile vade A a B ou de B a A (modulo 2π). L’integrale premiere d’“energie” (1−V 2) f
′2
2 +U(f) =2 conduit a (1 − V 2)
12 df = ±2 sin f
2 du et aux solutions (figure 25b) :
f±(x− V t) = 4 Arctg[exp± x− V t√
1 − V 2
].
274 8 • Equations aux derivees partielles ; propagation ; diffusion
En pratique on obtient ces ondes en faisant faire un tour complet “a la main” au pendulesitue a une extremite d’une longue chaıne.
REMARQUE. Si on fait faire un tour complet aux deux bouts de la chaıne on observe que les deuxondes, qui se propagent en sens inverses, reprennent asymptotiquement leur forme initiale apres s’etre“traversees” ; on les nomme “solitons”. Un exemple de solution superposition non lineaire de deux solitons
f+(x±V t) est (verification laissee au lecteur) : f2(x, t) = 4Arctg[V sinh x√
1−V 2cosh−1 V t√
1−V 2
]+2π.
� E.D.P. de Korteweg-De Vries ∂tf + (c0 + c1f) ∂xf + ν ∂3xf = 0
Elle decrit des ondes de surface dans un canal peu profond (c0 = (gh)12 ; cf. section 8.1.2). Dans la suite
on pose c0 = c1 = ν = 1. En procedant par integrations successives, et en supposant que f → 0 pour
u → ±∞, on obtient l’equation 12f ′2 + U(f) = 0 avec U(f) = 1−V
2f2 + 1
6f3, dont on deduit (petit
calcul) :f(x− V t) = a cosh−2
[√a12
(x− V t)]
avec V = 1 + a3.
La non deformation de cette onde solitaire tient au fait qu’elle est un compromis entre d’une part les
paquets d’ondes solutions de l’E.D.P. linearisee qui s’etalent (relation de dispersion ω = k − k3), et
d’autre part l’onde solution de ∂tf + (1 + f) ∂xf = 0, equation qui conduit a une onde de choc (cf.
section 7.1.1).
� E.D.P. de Burgers ∂tf + (c0 + c1f) ∂xf = D∂2xf
Elle ajoute des effets de diffusion a l’equation d’onde simple. La solution onde solitaire (avec c0 = c1 = 1)
f(x− V t) = a(1 + exp x−V t
l
)−1avec V = 1 + a
2et l = 2D
a
montre que la diffusion a pour effet d’etaler l’onde de choc.
8.3 E.D.P. « SPATIALES » IMPLIQUANT L’OPERATEURLAPLACIEN
8.3.1 Exemples et analogies physiques ; conditions aux limites
� E.D.P. de Laplace Δf = 0
Elle concerne des fonctions “potentiel” (f ≡ V, ϕ, n, T, . . . ) et apparaıt chaque fois qu’unchamp a un rotationnel et une divergence nuls, par exemple en electrostatique (
−→E =
−−−→gradV et div−→E = 0), en electrocinetique (idem avec j = γ
−→E ), en gravitation
(g = −−−→gradV ), en hydrodynamique des ecoulements irrotationnels incompressibles(v =
−−→gradϕ et divv = 0), dans des problemes stationnaires de diffusion (jn = −D−−→
gradnet divjn = 0), ou de conduction thermique (jth = −K −−→
gradT et divjth = 0). Enmagnetostatique (
−→rot
−→B = 0 et div
−→B = 0) on a ΔVmag = 0 pour le potentiel scalaire
magnetique defini (localement) par−→B = −−−→gradVmag, et Δ
−→A = 0 pour le potentiel
vecteur defini par−→B =
−→rot
−→A et div
−→A = 0.
Cette identite mathematique entre differents domaines de la physique permet des ana-logies. Ainsi pour un tube de champ limite par deux equipotentielles, les quantites
C−1 =V1 − V2
Q(C capacite d’un condensateur), R =
V1 − V2
I(resistance electrique)
8.3 E.D.P. « spatiales » impliquant l’operateur laplacien 275
et Rth =T1 − T2
Ith(resistance thermique) font appel a un meme calcul, celui du rapport
R de la circulation du champ (respectivement−→E , j et jth) entre les equipotentielles et
de son flux dans le tube : R = ε0C−1, γR et KRth. R ne depend que de la geometrie et
est homogene a [L]−1. Pour des geometries planes (figure 26a), spheriques, cylindriques(deux cas differents correspondant aux figures 26b et 26c), on a respectivement : V ∼ x
et R = ΔxS−1 (S section du tube) ; V ∼ r−1 et R =14π
( 1r1
− 1r2
); enfin V ∼ ln r et
R = (lΔθ)−1 lnr2r1
(l longueur du cylindre) ou V ∼ θ et R = (Δθ)(l ln
r2r1
)−1.
r2r1
r2
r1
�� ��
�
(a) (b) (c)
x
Figure 26
� Autres equations
L’E.D.P. de Poisson Δf = g apparait dans les exemples precedents lorsque dessources statiques sont presentes, par exemple ΔV = − ρ
ε0ou Δ
−→A = −μ0
j. L’equation(Δ + k2(r)
)f = 0 (E.D.P. de Helmholtz si k2 = Cste > 0) apparait quand on re-
cherche des solutions onde stationnaire a une equation de propagation ou de Schrodinger(cf. section 8.2.2). Souvent k2(r) = k2
0 + δk2(r) ou la perturbation δk2(r) decrit des
“inhomogeneites” (par exemple k20 =
2mE�2
et δk2(r) = −2m�2
V (r)).
� Conditions aux limites
En general les domaines dans lesquels les equations precedentes s’appliquent sont limitespar des surfaces. Les conditions aux limites sont dites C.L. de Dirichlet si c’est f quiest donnee sur la surface, et C.L. de Neuman si c’est sa derivee normale n · −−→gradf .En electrostatique c’est souvent le potentiel V qui est fixe (et constant) sur la surface,tandis qu’en hydrodynamique c’est le “courant” n · −−→gradϕ (egal a 0 si la surface limite lefluide). Dans certains domaines les deux types de C.L. (et meme des conditions mixtesfaisant intervenir l’impedance a la surface) peuvent etre rencontrees. Si le domaine n’estpas limite par des surfaces, il faut preciser le comportement a l’infini de f ; par exemple,en quantique, la fonction d’onde est exponentiellement decroissante pour des etats lies,
et du type ei�k0·�r +A(k,k0)eik0r
rpour des etats de diffusion (k0 est le vecteur d’onde
incident et k = |k0| r indique la direction d’observation de l’onde diffusee).
276 8 • Equations aux derivees partielles ; propagation ; diffusion
8.3.2 Unicite des solutions ; identite de Green ; separation desvariables
� Unicite des solutions de Δf = g
Pour des C.L. de Dirichlet ou des C.L. de Neuman il y a unicite (eventuellement moduloune constante) de la solution de l’E.D.P. Δf = g dans un volume V limite par une ouplusieurs surfaces S. Si de plus g = 0, la solution minimise l’integrale
I =12
∫∫∫V
|−→∇f |2 d3r .
I peut representer une energie (electrostatique, cinetique...), une puissance dissipee ouencore, a deux dimensions, l’aire d’une surface z = f(x, y) s’appuyant sur une courbefermee (lame d’eau savonneuse). Ces resultats decoulent de l’identite :∫∫
©S
G−→∇F · −→dS =
∫∫∫V
GΔF d3r +∫∫∫
V
−→∇F · −→∇Gd3r .
DEMONSTRATION de l’unicite : supposons qu’il existe deux solutions f1 et f2 satisfaisant les memes
C.L. et posons F = G = f2 − f1. Alors sur S soit G = 0 (Dirichlet), soit−→∇F · −→dS =
−→∇F · n dS = 0
(Neuman) ; l’integrale de surface est donc nulle et, comme ΔF = 0, on en deduit |−→∇F |2 = 0 soit
F = Cste (= 0 pour Dirichlet). Demonstration du minimum (pour g = 0) : on pose F = f et G = δf
(Dirichlet) ou F = δf et G = f (Neuman). L’integrale de surface est alors nulle et, comme Δf = 0, on
a∫∫∫
V
−→∇f · −→∇(δf) d3r = δI = 0 ; l’extremum est un minimum car I > 0 est bornee inferieurement.
� Methode des images
Elle est basee sur l’unicite de la solution. Si par exemple en electrostatique on veutresoudre ΔV = − ρ
ε0dans une region limitee par une surface S sur laquelle une C.L.
est donnee, cette methode consiste a introduire une repartition ρ∗ de charges situees de
l’autre cote de S qui, avec ρ, realisent la condition sur S puis a resoudre ΔV = −ρ+ ρ∗
ε0(sans plus se preoccuper de la C.L.).
EXEMPLE 1 (figure 27a). Si une charge q1 est a l’exterieur d’une sphere metalliqueS centree en O, de rayon R au potentiel VS = 0, on determine une charge −q2 et saposition de sorte que l’equation
q1r1
− q2r2
= 0 soit celle de la sphere (cf. section 2.2.2).
Le potentiel a l’exterieur de S est celui du a q1 et −q2. Si VS �= 0, on ajoute en O unecharge Q = 4πε0RVS .
EXEMPLE 2. Si la sphere metallique au potentiel V = 0 est en presence d’un champ exterieur
constant−→E 0 (figure 27 b), on remarque qu’en superposant a
−→E 0 le champ d’un dipole de moment
�p ‖ −→E 0 place en O, le potentiel en tout point est :
V (r, θ) = −E0r cos θ + p cos θ4πε0r2
.
L’equipotentielle V = 0 coıncide avec S si �p = 4πε0R3−→E 0. V (r, θ) decrit alors toutes les proprietes
(lignes de champ, repartition de charges et pression a la surface de la sphere) du systeme “sphere plus
8.3 E.D.P. « spatiales » impliquant l’operateur laplacien 277
champ−→E 0” pour r ≥ R. Si sur S (supposee maintenant non metallique) on impose une condition de
Neuman du type Er = −∂rV = 0, on voit qu’on doit prendre �p = −2πε0R3−→E 0. Cette derniere C.L.,
non realiste pour un champ electrostatique, le devient pour la vitesse �v d’un ecoulement autour d’un
obstacle spherique (figure 28), ou pour le champ magnetique−→B a la surface d’un supraconducteur
spherique a l’interieur duquel−→B = 0 en raison de l’effet Meissner (cf. section 9.4).
��������������������������������������������������������������������������������������������������������
��������������������������������������������������������������������������������������������������������
q
(a)
V= 0
(b)
E
V
r
O
1q2− Q
1r2
Figure 27
v
Figure 28
� Identite de Green et applications
Green Pour tout point r0 a l’interieur d’un volume V limite par une surface S on a :
4π f(r0) =∫©∫S
[eik|�r−�r0|
|r − r0|−→∇f(r) −
(−→∇ eik|�r−�r0|
|r − r0|)f(r)
]·−→dS−
∫∫∫V
eik|�r−�r0|
|r − r0|(Δ+k2
)f(r) d3r .
DEMONSTRATION (figure 29) : elle s’appuie sur l’expression integrale de la formule de Green :∫∫©S(F
−→∇G−G−→∇F ) · −→dS =
∫∫∫V (F ΔG−GΔF ) d3r .
�
V
S
S�
�
r0
Figure 29
On pose alors F = f et G = |�r − �r0|−1 eik|�r−�r0|, et on prend pour V le volume Vε limite par S et la
sphere Sε (de rayon ε, centree en �r0 et orientee vers l’exterieur). Dans la limite ε → 0 l’integrale sur Sε
de G−→∇F tend vers zero (G
−→∇F ∼ ε−1 et Sε = 4πε2), celle de F−→∇G tend vers 4π f(�r0) (|−→∇G| ∼ ε−2),
et dans Vε → V on a ΔG = d2Gdr2
+ 2r
dGdr
= −k2G, d’ou l’identite.
278 8 • Equations aux derivees partielles ; propagation ; diffusion
Citons quelques consequences remarquables de cette identite.
1) Si Δf = 0, si k = 0 et si S est une sphere de rayon R centree en �r0, on retrouve facilement (car |�r−�r0|est constant sur S) le resultat de la section 8.2.2 : f(�r0) =< f >S(�r0,R).
2) Si Δf = g (E.D.P. de Poisson), et dans l’hypothese ou l’integrale de surface tend vers zero lorsque
S va a l’infini, elle donne :f(�r) = −(4π)−1
∫∫∫ |�r ′ − �r|−1 g(�r ′) d3r′ .
(On verifie a posteriori que l’hypothese sur l’integrale de surface est justifiee lorsque g est localisee dans
une region finie car f se comporte alors comme r−1 a l’infini.)
3) Diffusion : si f satisfait (Δ + k2) f = g et se comporte comme une “onde spherique sortante” a
l’infini, on obtient :
f(�r) = −(4π)−1∫∫∫ |�r ′ − �r|−1 eik|�r
′−�r| g(�r ′) d3r′ .
Une application interessante concerne les problemes de diffusion regis par l’equation(Δ + k2
0 + δk2(�r))f(�r) = 0
ou δk2(�r) peut etre traite comme une perturbation. La solution non perturbee etant f0(�r) ∝ ei�k0·�r , on
pose g(�r) = −δk2(�r) f(�r) � −δk2(�r) ei�k0·�r (en premiere approximation) ; la solution perturbee pour r
grand (c.a.d. loin du diffuseur suppose localise, ce qui permet de faire un developpement limite au premier
ordre de |�r ′ − �r| dans l’integrale ci-dessus) s’ecrit alors (approximation de Born de la diffusion) :
f(�r) = ei�k0·�r + A(�k,�k0)
eik0r
ravec A(�k,�k0) = 1
4π
∫∫∫e−i(�k−�k0)·�r ′
δk2(�r ′) d3r′ (�k = k0r) ;
l’amplitude de diffusion est proportionnelle a la T.F. de la perturbation.
� Problemes a symetrie spherique ; separation des variables
En coordonnees spheriques le laplacien s’ecrit (cf. section 7.2.2)
Δ =∂2
∂r2+
2r
∂
∂r+
1r2
Δθ,ϕ avec Δθ,ϕ =1
sin2 θ
(sin θ
∂
∂θ
(sin θ
∂
∂θ
)+
∂2
∂ϕ2
),
et les harmoniques spheriques Y ml (θ, ϕ), introduites a la section 4.1.2, forment une basede fonctions propres de Δθ,ϕ satisfaisant (cf. justification ci-dessous) :
Δθ,ϕ Yml (θ, ϕ) = −l (l + 1)Y ml (θ, ϕ) .
On cherche alors des solutions particulieres de la forme f(r, θ, ϕ) = fl(r)Y ml (θ, ϕ). Parexemple pour
(Δ + k2(r)
)f = 0 on obtient :( d2
dr2+
2r
ddr
+ k2(r) − l(l + 1)r2
)fl(r) = 0 .
Si k2 = 0 la solution est fl(r) = Arl + Br−(l+1). Si k2(r) �= 0 n’est pas plus singulierque r−1 (cas de l’E.D.P. de Schrodinger pour l’atome d’hydrogene), cette expressionArl + Br−(l+1) donne le comportement de fl(r) pour r � 0. Lorsque 0 appartient audomaine d’etude de fl, des conditions de normalisation (ou de finitude de l’energie)entraınent B = 0, ce qui equivaut a une C.L. en r = 0. L’ajout d’une C.L. en r = r0(cavite resonnante spherique) ou a l’infini (etat lies en mecanique quantique), conduita la quantification des parametres ω (pulsation) ou E (energie) presents dans k2(r) (cf.section 6.4.2).JUSTIFICATION de Δθ,ϕ Y
ml (θ, ϕ) = −l (l+1) Yml (θ, ϕ). La definition des polynomes de Legendre par
|�r−�r0|−1 =∑∞l=0
(rl0 r
−l−1 ou rl r−l−10
)Pl(cos θ), leur independance et la propriete Δ(|�r−�r0|−1) = 0
pour �r �= �r0, entraınent que rl Pl(cos θ) et r−l−1 Pl(cos θ) sont (pour r �= 0) solutions de Δf = 0. Comme(∂2r + 2r−1 ∂r
)rl = l (l+ 1) rl−2, on en deduit que Δθ,ϕ Pl = −l (l+1)Pl. Cette relation est aussi vraie
pour les Yml car elles se deduisent des Pl par rotation, et l’operateur Δ est invariant par rotation.
8.3 E.D.P. « spatiales » impliquant l’operateur laplacien 279
8.3.3 Equation de Laplace Δf = 0 dans le plan et fonctions d’unevariable complexe ; applications hydrodynamiques
Les fonctions f(z) derivables introduites au chapitre 2 (et associees aux transforma-tions conformes ; cf. section 2.2.2) possedent de nombreuses proprietes mathematiquesremarquables (voir ouvrages specialises). On se contente ici de montrer qu’elles offrentdes exemples simples de solutions (appelees fonctions harmoniques) de l’E.D.P. de La-place (∂2
x+∂2y)V (x, y) = 0, avec des conditions aux bords correspondant a des geometries
variees.
� Fonctions de z f(z) = P (x, y) + iQ(x, y) et equations ΔP = ΔQ = 0
Les parties reelle et imaginaire de f(z) sont des fonctions harmoniques. Ceci est uneconsequence immediate des formules de Cauchy Riemann
∂Q
∂x= −∂P
∂y,
∂Q
∂y=∂P
∂x
qui resultent elles memes de l’existence de la derivee f ′(z) = limdz→0
f(z + dz)− f(z)dz
. En
effet, la limite ne devant pas dependre de la maniere dont dz tend vers zero, en prenantdz = dx et dz = idy on obtient f ′(z) = ∂xP + i∂xQ = −i(∂yP + i∂yQ). On comprendheuristiquement le role des fonctions f(z) dans la resolution de ΔV = 0 en remarquantque le changement de variables (x, y) → (z = x+iy, z = x−iy) transforme cette equation
en ∂z∂zV = 0 et donc, V etant reel, V =12(f(z) + c.c.).
Applications aux ecoulements irrotationnels incompressibles (v =−→∇P ,
divv = ΔP = 0).1) Pour f(z) = zα (= rαeiαθ), ln z (= ln r + iθ) et −i ln z, on a respectivement P =rα cosαθ, ln r et θ. On voit que les fonctions zα decrivent des ecoulements dans desregions “en coin” θ ∈
[0,π
α
]; en effet la vitesse est tangente aux bords car vθ = r−1∂θP =
0 sur les bords (radiaux) (figure 30). Les fonctions ln z et −i ln z decrivent des ecoulementsradiaux (avec source) et circulaires (cf. figures 26b et 26c).
�
�
������������������������������������������������������������������������������������������������������������
������������������������������������������������������������������������������������������������������������
������������������������������������������
������������������������������������������
Figure 30
2) La fonction
f(z) = v0
(z +
r20z
)+
Γ2iπ
ln z = P + iQ
280 8 • Equations aux derivees partielles ; propagation ; diffusion
decrit l’ecoulement autour d’un cylindre de rayon r0 et d’axe Oz. En effet, en explicitantP (r, θ) on obtient
vr = ∂rP = v0 cos θ(1 − r20
r2
)et vθ = r−1∂θP = −v0 sin θ
(1 +
r20r2
)+
Γ2πr
,
et on voit que v est bien tangente au cylindre. On verifie aussi que, si |Γ| < 4πv0r0 on a
v = 0 pour r = r0 et sin θ =Γ
4πv0r0(figure 31a) et que, si |Γ| > 4πv0r0 on a v = 0 pour
θ =π
2et r =
Γ4πv0
±√
Γ2
16π2v20
− r20 (signe + pour Γ > 0 et − pour Γ < 0 ; figure 31b).
(a) (b)
Figure 31
Le calcul de la force lineique−→F due a la pression p exercee par le fluide sur le cylindre
−→F =
∫ 2π
0
−p (cos θ x+ sin θ y) r0 dθ = −ρv0Γy
se fait en remplacant −p par12ρv2θ puisque la quantite p+
12ρv2 est constante (theoreme
de Bernouilli ; section 7.1.3) et que vr(r0) = 0. On a−→F �= 0 si Γ �= 0 (effet Magnus).
� Geometrie des lignes P = constante et Q = constante
Les formules de Cauchy Riemann montrent que, en tout point, le vecteur−−→gradQ se deduit
de−−→gradP par une rotation de
π
2. Les deux reseaux de courbes P (x, y) = constante et
Q(x, y) = constante sont donc orthogonaux. Comme de plus ces gradients ont mememodule (egal a |f ′(z)|), le flux de
−−→gradP a travers toute courbe γ est egal a la circulation
de−−→gradQ le long de γ (et inversement).
APLICATION. Pour un domaine du plan limite par les lignes P (x, y) = P1 et P2 (equipotentielles γ1
et γ2) et les lignes Q(x, y) = Q1 et Q2 (lignes de champ ou de courant), la quantite R introduite a la
section 8.3.1 est donnee (pour une longueur unite perpendiculaire au plan) par la formule tres simple :
R =|P2−P1||Q2−Q1| .
8.3 E.D.P. « spatiales » impliquant l’operateur laplacien 281
EXEMPLE (figure 32) : pour f(z) = ln(zc
+√z2
c2− 1
)= P + iQ, ce qui correspond a z
c= 1
2(ef +
e−f ) = cosQ coshP −i sinQ sinhP , les equipotentielles (P fixe, Q variable) et les lignes de champ (Q
fixe, P variable) forment un reseau d’ellipses et d’hyperboles homofocales dont les foyers sont situes en
z = ±c. Pour les equipotentielles 0 (segment [−c, c]) et P (ellipse) on a R = (2π)−1 ln a+bc
(faire un
tour du segment correspond a une variation de 2π de Q). On remarque aussi que f ′(z) = (z2 − c2)−12
est infini en z = ±c ; si P est un potentiel electrostatique, |f ′(z)| = |−→E | et cette divergence du champ
electrique est associee au “pouvoir des pointes”.
yb
Oa
x−c c
Figure 32
� Proprietes integrales des fonctions f(z)
Les formules de Cauchy Riemann entraınent aussi que les champs de composantes (P,−Q)et (Q,P ) ont un rotationnel nul. Par application de la formule de Stokes aux parties reelleet imaginaire de l’integrale, on obtient :
∮γ
f(z) dz def=∮γ
(P (x, y) + iQ(x, y)) (dx+ idy) = 0 .
Comme on l’a vu a la section 7.2.2. cette formule n’est vraie que si γ entoure un domainea l’interieur duquel les rotationnels, donc f ′(z), sont definis. Si ce n’est pas le cas onen deduit cependant que l’integrale (non nulle) reste inchangee lorsque γ est deformesans qu’aucune singularite ne le traverse ; cette remarque permet souvent son calcul. Parexemple si γ fait un tour (direct) autour de z0, en prenant le cas particulier d’un cerclez = z0 + reiϕ, on obtient :
∮γ
dz(z − z0)n
=∫ 2π
0
ireiϕ
rneinϕdϕ = 0 si n �= 1 et 2iπ si n = 1
(cas particulier du theoreme des residus ; cf. ouvrages specialises).
282 8 • Equations aux derivees partielles ; propagation ; diffusion
Application a l’ecoulement autour d’un obstacle (figure 33). La vitesse est donnee par �v =−→∇P ou
(cf. Cauchy Riemann) f ′(z) = vx − ivy . Si γ est la frontiere orientee de l’obstacle on a :∮γf ′(z) dz =
∮γ�v .
−→dl ;
∮γf ′2(z) dz =
∮γ�v2 (dx− idy) .
�< 0
vn dl
�
Fy
x
0
Figure 33
(DEMONSTRATION : �v etant tangent a γ, on a vx = v dxdl
et vy = v dydl
, et donc f ′(z) dz = (vx −ivy)(dx+ idy) = v dl ou v est la mesure algebrique de �v sur la tangente a γ orientee.)
La premiere integrale donne la circulation Γ du champ de vitesse le long de γ. La seconde permet de
calculer la force lineique−→F exercee par le fluide sur l’obstacle :
−→F =
∮γ −pndl avec ndl = (dy,−dx).
En remplacant −p par 12ρ v2 on obtient :
Fx − iFy =∮γ
12ρv2 (dy + idx) = i ρ
2
∮γf ′2(z) dz .
L’avantage de ces integrales complexes est de rester inchangees si on remplace γ par tout autre circuitentourant l’obstacle. En particulier si la vitesse asymptotique est �v0 (prise parallele a 0x), a grandedistance de l’obstacle on doit avoir a priori
f ′(z) = v0 + a−1 z−1 + a−2 z−2 . . . et a−1 = Γ2iπ
(cf. integrale de f ′(z)). En considerant le terme en z−1 dans f ′2(z) on voit que Fx − iFy = iρv0Γ, soit
Fx = 0 et Fy = −ρv0Γ ou vectoriellement−→F = ρ�v0 ∧ −→
Γ . Ce resultat general montre la necessite de lacirculation de l’air autour d’une aile pour avoir un effet de portance.
REMARQUES. 1) L’interet principal des variables complexes est, partant d’un ecoulement connu, dededuire d’autres ecoulements en deformant l’obstacle a l’aide d’une transformation conforme arbi-traire Z = g(z). Dans le plan (X, Y ) la fonction F (Z) = f(z) correspond alors a un ecoulement dont lesequipotentielles et les lignes de champ sont les transformees de leurs homologues associees a f(z) dansle plan (x, y) (cf. ouvrages specialises).
2) Un ecoulement stationnaire incompressible avec viscosite verifie −−−→gradp + ρ�g + ηΔ�v = 0 (cf. section
7.2.4). En posant vx = ∂yΨ, vy = −∂xΨ et en prenant le rotationnel des deux membres de l’equationon obtient Δ2Ψ = 0 ou ∂2
z ∂2z Ψ = 0. Ceci conduit a des solutions du type Ψ = f(z) + z g(z) + c.c.. Ces
fonctions biharmoniques se rencontrent aussi en elasticite, dans des problemes plans de deformations.
Chapitre 9
Principes variationnels
Les principes d’extremum ont ete introduits de longue date, en optique avec le principede Fermat, et en mecanique avec les principes de moindre action de Maupertuis, La-grange et Hamilton. Ils permettent de caracteriser de maniere elegante les trajectoires ouevolutions reellement observees par rapport a d’autres a priori possibles et satisfaisantles memes conditions aux limites. Ils conduisent egalement a une technique de calcul,les equations d’Euler-Lagrange, tres efficace et permettant n’importe quel choix decoordonnees. Enfin ils constituent un moyen remarquable d’associer les grandes lois deconservation (L.C.) de la physique a des proprietes d’invariance par symetrie.
9.1 EXEMPLES HISTORIQUES ; FORMALISMES DE LAGRANGEET DE HAMILTON
Le tableau ci-dessous presente quatre principes d’extremum que nous commencons parcommenter et relier entre eux en admettant provisoirement les equations d’Euler-Lagrangeetablies a la section 9.1.3 et rappelees dans le tableau.
9.1.1 Principes de Fermat, Maupertuis, Lagrange
En parametrant le chemin de A a B par x(λ), y(λ) et z(λ) le principe de Fermats’ecrit “
∫ 1
0n(x, y, z)
√x′2 + y′2 + z′2 dλ extremum” comme celui de Lagrange. Le signe ′
designe la derivation par rapport a λ qui joue le role du temps et le lagrangien est :
L(x, y, z, x′, y′, z′) = n(x, y, z)√x′2 + y′2 + z′2 .
L’E.D. d’Euler-Lagrange pour la variable qi = x (cf. tableau)
ddλ
∂L
∂x′=∂L
∂xavec
∂L
∂x=∂n
∂x
√x′2 + y′2 + z′2 et
∂L
∂x′= n
x′√x′2 + y′2 + z′2
= nux
284 9 • Principes variationnels
(ou u =drdl
est le vecteur unitaire tangent au rayon) conduit immediatement a la loi de
Descartesddl
(nu) =−−→gradn projetee sur l’axe x.
Mathematiquement identique au principe de Fermat, le principe de Maupertuis s’ap-plique a des particules d’energie totale E fixee et d’energie potentielle U(r), donc enparticulier a l’optique electronique. Le module p(r) de la quantite de mouvement entout point est determine a partir de la L.C. de l’energie E = Ecin + U(r) (par exemple
p(r) =√
2m(E − U(r)) si Ecin =p 2
2m). Comme dEcin = v dp = −dU , relation egalement
vraie en relativite d’Einstein, l’equationdpdl
=−−→grad p multipliee par v =
dldt
donne la loi
de Newtondpdt
= −−−→gradU(r).
REMARQUE. Lien avec les ondes. Comme en optique ondulatoire le module du vecteur d’onde verifie
k(�r) = ωcn(�r) (cf. section 7.3.2), le principe de Fermat s’ecrit aussi
∫ BA k(�r) dl extremum. Il s’etend, sous
cette forme, a d’autres ondes (ultrasons, ondes sismiques, etc.). La relation de de Broglie �p = ��k
unifie les principes de Fermat et de Maupertuis.
Principes Quantites extremum Equations Lois
Fermat∫ BA n(r) dl
ddl
(nu) =−−→gradn Descartes
Maupertuis∫ BAp(r) dl
ddlp =
−−→grad p Newton
(energie fixee)
Lagrange
ex : q = r ; q = v
S =∫ q
2t2
q1t1
L(q, q, t) dt
L =12mv2 − U(r, t)
ddt
( ∂L∂qi
)=∂L
∂qiddtmv = −−−→gradU
Equations d’Euler-Lagrange
Newton
Hamilton
ex : q = r ; p = p
∫ q2p2t2
q1p1t1
(p · q −H(q, p, t)) dt
H =p2
2m+ U(r, t)
qi =∂H
∂pi; pi = −∂H
∂qi
v =p
m;
dpdt
= −−−→gradU
Equationsde Hamilton
Newton
� Principe de Lagrange ; proprietes generales
Ce principe est la forme la plus generale sous laquelle on peut exprimer un problemed’extremum impliquant des fonctions qi(t) et leurs derivees premieres qi(t). q(t) est unchemin dans l’espace de configuration (q1, · · · , qn) dont les extremites q
1et q
2aux
instants t1 et t2 sont fixees. On discute ici ses principales proprietes.
Addition au lagrangien d’une derivee totale. Comme les extremites sont fixees,les equations d’Euler-Lagrange sont inchangees si on ajoute au lagrangien L(q, q, t) une
derivee totale par rapport au tempsddtF (q(t), t). En effet son integrale F (q(t2), t2) −
F (q(t1), t1) a une variation nulle.
9.1 Exemples historiques ; formalismes de Lagrange et de Hamilton 285
Changements de variables. Le formalisme lagrangien est invariant vis a vis des chan-gements de variables. En effet si on pose q = f(Q, t), la quantite a extremaliser devient∫L
(f(Q, t),
ddtf(Q, t), t
)dt =
∫L(Q, Q, t) dt et conduit aux equations :
ddt∂L∂Q
=∂L∂Q
equivalentes addt∂L
∂q=∂L
∂q.
Symetries. Si un probleme de mecanique est invariant par rotation autour d’un axe Oz,il est judicieux d’ecrire le lagrangien en coordonnees cylindriques par exemple :
L =12m(r2 + r2θ2 + z2) − U(r, θ, z) .
Comme U ne doit pas dependre de θ, l’equationddt
∂L∂θ
=∂L∂θ
= 0 conduit a la conserva-
tion de la composante z du moment cinetique mr2θ =∂L∂θ
. Si en plus U ne depend pas de
z, on a conservation de la composante z de la quantite de mouvementmz =∂L∂z
. De facon
generale si Qi n’apparaıt pas dans le lagrangien L (on dit que Qi est une coordonnee
cyclique), la quantite∂L∂Qi
est une constante (integrale premiere) du mouvement.
Contraintes. Si il existe des relations entre les coordonnees qi, n’impliquant pas leursderivees qi, on exprime le lagrangien en fonction de variables independantes et de leursderivees. Par exemple pour un pendule dont le point de fixation oscille verticalement(figure 1),
�
�
m
l
a cosOA = tA
O
z
x
Figure 1
�
�
A
B
C
O
F
F
F
C
A B
l
l l
ln
u
Figure 2
z = a cos γt − l cosϕ et x = l sin ϕ et le lagrangien L =12m(x2 + z2) − mgz s’ecrit
L(ϕ, ϕ, t) =12ml2ϕ2 +ml(g − aγ2 cos γt) cos ϕ (apres elimination de derivees totales).
L’equation d’Euler-Lagrange linearisee ϕ+g
l
(1− aγ2
gcos γt
)ϕ = 0 decrit un oscillateur
parametrique (cf. sections 6.1.2 et 6.4.4).
286 9 • Principes variationnels
Cas des equilibres. Pour un lagrangien du type “(energie cinetique) −(U(�r1, �r2, · · · , �rn) energie poten-
tielle)”, le principe d’extremum pour une position d’equilibre se ramene a δU = 0 puisque toute variation
de l’energie cinetique est du second ordre. Si les �ri sont independants cela donne les conditions connues
∂�riU = 0, mais si ils ne le sont pas on a la un moyen, appele historiquement theoreme des travaux
virtuels, d’obtenir l’equilibre. Ainsi lorsque des forces exterieures constantes �Fi sont appliquees a des
points �ri d’un systeme articule l’equilibre est determine par
δU = δ(−∑
i�Fi · �ri)
)= −∑
i�Fi · δ�ri = 0 ,
les �ri etant exprimes en fonction des variables libres du systeme. Prenons l’exemple d’un losange ar-
ticule (figure 2), avec des branches sans masse et des forces �FA, �FB, �FC appliquees en A, B, C (pre-
nant en compte la pesanteur si A, B et C sont massifs). En fonction des variables libres α et β, on a
δ�rA = (δα−δβ) n∧ �OA, δ�rB = δα n∧ �OB+δ(2l cos β)u et δ�rC = (δα+δβ) n∧ �OC. On verifie qu’annuler
le facteur de δα dans δU revient a exprimer que le moment resultant des forces par rapport a O est nul ;
annuler le facteur de δβ conduit a la relation moins triviale 2l sin β �FB · u = ( �OC ∧ �FC − �OA∧ �FA) · n.
9.1.2 Principe de Hamilton dans l’espace de phase (q ,p)
Dans ce principe les variables qi(t) et pi(t) sont par definition independantes et∑i
piqi −H(q1, q2 · · · qn; p1, p2 · · · pn; t) = LH(q1, q2 · · · qn; p1, p2 · · · pn; q1, q2 · · · qn; t)
est le lagrangien relatif a ces 2n variables ; H(q, p, t) est appele hamiltonien. On verifie
que les E.D. d’Euler-Lagrangeddt
(∂LH∂qi
)=∂LH∂qi
etddt
(∂LH∂pi
)=∂LH∂pi
sont les E.D.
de Hamilton :
pi = −∂H∂qi
et 0 = qi − ∂H
∂pi.
Plus generalement l’evolution de toute fonction g(q, p) s’ecrit aussi g = −{H, g} enintroduisant les crochets de Poisson {f, g} =
∑i
(∂qif ∂pig−∂qig ∂pif
). Une propriete
remarquable du mouvement dans l’espace de phase est de conserver le volume (theoremede Liouville). Ceci resulte de ce que la “divergence” (a 2n dimensions) du champ devitesse (q,p) est nulle :
∑i
(∂qi(∂piH) + ∂pi(−∂qiH)
)= 0.
REMARQUE. Lien avec les ondes. En identifiant �p a ��k et H a �ω le principe de Hamilton devient :
Φ =∫ [�k(�r, t) · d�r − ω(�k, �r, t) dt
]extremum .
L’interpretation physique est la suivante : Φ designe une variation de phase et la fonction ω(�k, �r, t) est
la relation de dispersion satisfaite par l’onde en �r a l’instant t. Les equations de Hamiltond�rdt
= ∂ω
∂�k(= vitesse de groupe locale) et d�k
dt= − ∂ω
∂�r
definissent le mouvement �r(t) et les caracteristiques �k(t) et ω(t) d’un paquet d’ondes. L’invariance du
volume d3�r d3�k (theoreme de Liouville) equivaut a celle de l’etendue optique vue a la section 3.2.5.
� Comparaison des approches lagrangienne et hamiltonienne
De maniere generale on passe de la premiere a la seconde en posant
pi =∂L
∂qi(pi moment conjugue de qi) et H(q, p, t) =
∑i
piqi − L(q, q, t) ,
9.1 Exemples historiques ; formalismes de Lagrange et de Hamilton 287
etant entendu que pour ecrire H il faut exprimer les qi en fonction des qi, pi et t, par
exemple : L =12mv2−U =⇒ p = mv =⇒ H = p ·v−L =
p2
2m+U . Les E.D. de Hamilton
decoulent alors de dH =∑i
(pidqi+ qidpi− ∂L
∂qidqi− ∂L
∂qidqi
)− ∂L
∂tdt. En effet, puisque
pi =∂L
∂qi, on a bien
∂H
∂pi= qi et
∂H
∂qi= − ∂L
∂qi= − d
dt
( ∂L∂qi
)= −pi. On remarque aussi
que au cours du mouvement, c’est a dire lorsque pi =∂L
∂qi, on a
dHdt
= −∂L∂t
; donc H
est une constante du mouvement lorsque L ne depend pas explicitement du temps.
En mecanique classique l’interet du formalisme de Hamilton est d’etre invariant dans deschangements de coordonnees, dits canoniques, pouvant melanger les 2n variables pi et qiet preservant les crochets de Poisson (voir section 9.1.4), ce qui le rend rend encore plussouple que le formalisme de Lagrange. L’autre interet est de permettre un passage duhamiltonien classique au hamiltonien quantique (presque automatique) en remplacantles pi par les operateurs −i�∂qi , et les crochets de Poisson par des commutateurs (cf.section 4.4.1).
9.1.3 Equations d’Euler-Lagrange ; symetries et lois de conservation ;E.D.P. d’Hamilton-Jacobi
� Variation generale de l’action et E.D. d’Euler-Lagrange
On peut ecrire la quantite a extremaliser sous la forme
S =∫ ∞
−∞L(q, q, t)χ(t) dt
en introduisant la fonction caracteristique χ(t) de l’intervalle [t1, t2] (figure 3). Dans unevariation infinitesimale qui concerne a la fois les fonctions qi(t) et l’intervalle [t1, t2] doncχ(t),
qi(t) → qi(t)+δqi(t) =⇒ qi(t) → qi(t)+ddtδqi(t) et χ(t) → χ(t+ε(t)) = χ(t)+ε(t)
dχdt
,
la variation de l’action contient deux contributions, une liee a la variation du lagrangien
δL =∑i
( ∂L∂qi
δqi+∂L
∂qiδqi
)et une a la variation de χ. Apres une integration par parties
on obtient :
δS =∫ ∞
−∞χ(t)
∑i
[∂L
∂qi− d
dt
( ∂L∂qi
)]δqi(t) dt+
∫ ∞
−∞
dχdt
[εL−
∑i
∂L
∂qiδqi
]dt = δS1+δS2 .
Supposons t1 et t2 fixes (ε = 0) ainsi que les extremites des chemins (δqi(t1) = δqi(t2) =
0). Cela entraıne δS2 = 0 puisque le support dedχdt
se limite aux instants t1 et t2(figure 3). Alors le principe d’extremum exprime que pour le mouvement reellementobserve δS1 = 0 quelles que soient les variations δqi(t). On en deduit les E.D. d’Euler-Lagrange :
288 9 • Principes variationnels
∂L
∂qi=
ddt
( ∂L∂qi
)= pi (pi moment conjugue de qi).
�
��
��Æ Æ
t
t
t1
2
1
(t)
= (t−t )1 (t− t )2
Figure 3
�
�
t t
q
q
temps
espace à unedimension
1
1 2
2
s
Figure 4
� Symetries et lois de conservation
On appelle symetrie une operation qui fait passer d’un chemin γ quelconque (a priorinon extremal) a un chemin γs sans modifier l’action (figure 4) :
S(γ) = S(γs) .
Dans la suite on ne considere que des operations infinitesimales.
EXEMPLES : l’operation χ(t) → χ(t + ε) et qi(t) → qi(t + ε) = qi(t) + ε qi(t) avec εconstant est une symetrie si L ne depend pas explicitement du temps (stationnarite
de L) ; en effet :∫ ∞
−∞L
(q(t+ ε), q(t+ ε)
)χ(t+ ε) dt =
∫ ∞
−∞L
(q(t), q(t)
)χ(t) dt. Autres
exemples avec χ inchangee (ε = 0) : si L(ri, vi), lagrangien de n particules, ne depend deleurs positions que par l’intermediaire des differences ri−rj, alors l’operation ri → ri+εest une symetrie de translation car L(ri+ε, vi) = L(ri, vi) ; de meme si L(ri, vi) nefait intervenir que des produits scalaires des ri et vi, l’operation ri → ri+δθ n∧ri , vi →vi + δθ n ∧ vi est une symetrie de rotation.
Considerons l’action ecrite pour le chemin γ correspondant au mouvement reel et effec-tuons une operation de symetrie infinitesimale. Dans cette operation δS = 0 par definitiond’une symetrie, et δS1 = 0 puisque les equations d’Euler-Lagrange sont satisfaites sur γ.Par consequent
δS2 =∫ ∞
−∞
dχdt
[εL−
∑i
∂L
∂qiδqi
]dt = 0 =
∫ ∞
−∞χ
ddt
[∑i
∂L
∂qiδqi − εL
]dt
(integration par parties). Comme le support de χ est arbitraire on en deduit que sur latrajectoire reelle la quantite
∑i
pi δqi−εL est conservee. Pour les trois exemples ci-dessus
on a respectivement δqi = εqi, δri = ε et ε = 0, δri = δθ n∧ri et ε = 0, ce qui conduit a :
9.1 Exemples historiques ; formalismes de Lagrange et de Hamilton 289
- stationnarite de L =⇒ L.C. de l’energie H =∑i
piqi − L ,
- homogeneite de L =⇒ L.C. de la quantite de mouvement p =∑i
∂L
∂vi,
- isotropie de L =⇒ L.C. du moment cinetique J =∑i
ri ∧ ∂L
∂vi.
� Differentielle de l’action ; E.D.P. d’Hamilton-Jacobi
Soit S(q2, t2; q1, t1) la valeur de l’action S pour la trajectoire allant de q
1a q
2dans
l’intervalle de temps [t1, t2]. On considere la trajectoire voisine qui va de q1
+ dq1
aq2+dq
2dans l’intervalle [t1+dt1, t2+dt2]. En reprenant l’expression ci-dessus de δS2 avec
ε(t1,2) = −dt1,2 et (reflexion laissee au lecteur, cf. figure 4) δq(t1,2) = dq1,2
− q1,2
dt1,2,on obtient la differentielle
dS = (p2dq
2−H2 dt2) − (p
1dq
1−H1 dt1)
avec p1,2
= p(t1,2) et H1,2 = H(q1,2, p
1,2, t1,2). On en deduit que, en temps que fonction
de (q2, t2) ≡ (q, t), S verifie l’E.D.P. de Hamilton-Jacobi :
∂S
∂t= −H
(q,∂S
∂q, t
).
Par exemple pour une particule libre galileenne pour laquelle L = 12m
−→v 2 et H = 12mp
2,on a :
S(−→r 2, t2;−→r 1, t1) =12m
(−→r 2 −−→r 1)2
t2 − t1;
∂S
∂t= − 1
2m(−→∇S)2 .
On remarquera que dS ci-dessus generalise la differentielle du chemin optique dL =nBuB · d−→rB − nAuA · d−→rA vue a la section 3.2.3 et que l’E.D.P. de Hamilton-Jacobigeneralise l’E.D.P. eikonale |−→∇L| = n(−→r ) de la section 7.3.2.
9.1.4 Equations de Hamilton et geometrie de l’espace de phase
� Espace de phase ; geometrie symplectique
Rappelons que, a une dimension, un vecteur de l’espace de phase pour une particule est defini par les co-ordonnees (q, p) (q ≡ x position et p ≡ mx quantite de mouvement) et par (−→r 1, · · · ,−→r N ,−→p 1, · · · ,−→p N )pour N particules a trois dimensions. Plus generalement, on note x le vecteur colonne de coordonnees(q1, · · · , qn, p1, · · · , pn). La geometrie symplectique est definie par l’ensemble des transformationslineaires x → x′ = Mx qui laissent invariante la forme antisymetrique (cf. section 4.1.3), dite symplec-tique :
σ(x, y) = xtJy avec J =
(0 In
−In 0
)et In matrice identite n× n .
Les matrices symplectiques M verifient MtJM = J. Par exemple si n = 1, x = (q(1), p(1))t ety = (q(2), p(2))t, on a σ(x, y) = q(1)p(2)−q(2)p(1) et les matrices M sont les matrices 2×2 de determinant
egal a 1. Plus generalement σ(x, y) =∑i(q
(1)i p
(2)i − q
(2)i p
(1)i ) est la somme des aires algebriques des pro-
jections sur les “plans” (qi, pi) du parallelogramme construit sur x et y et les matrices M conserventcette somme.
REMARQUE. A l’aide de la relation Jt = −J, on etablit facilement qu’une matrice symplectiqueinfinitesimale s’ecrit M = I + εJS avec S = St, matrice symetrique.
290 9 • Principes variationnels
� Equations de Hamilton et transformations canoniques
Le lien de la geometrie symplectique avec la physique se fait via les equations de Hamilton
qi = ∂piH et pi = −∂qiH ,
consequences de l’existence d’un principe variationnel (cf. section 9.1.2). On verifie en effet que cesequations s’ecrivent
x = J∂xH avec ∂x ≡ (∂q1 , · · · , ∂qn , ∂p1 , · · · , ∂pn )t ,
et qu’elles sont laissees invariantes par les transformations ci-dessus : x′ = MJ∂xH = MJMt∂x′H(cf. section 7.1.4) = J∂x′H. Plus generalement elles sont laissees invariantes par les transformations
canoniques (q, p) → (q′(q, p), p′(q, p)) caracterisees par une matrice jacobienne∂(q′,p′)∂(q,p)
symplectique.
On verifie aussi que l’evolution d’une perturbation infinitesimale est symplectique. En effet on a
δx = JH′′ δx ou δx(t + dt) =(I + JH′′ dt
)δx(t)
avec H′′ = [H′′]t matrice hessienne (des derivees secondes) du hamiltonien H.
REMARQUE. Les lois de l’optique geometrique, egalement issues d’un principe variationnel (de Fer-
mat), mettent aussi en jeu des transformations symplectiques (cf. les matrices de transfert de determinant
egal a 1 des sections 4.3.2 et 6.4.1).
9.2 PRINCIPES DE MOINDRE ACTION ET GENERALISATION DESMOUVEMENTS INERTIELS
Un eclairage interessant sur les principes d’extremum en mecanique est fourni par unretour sur les mouvements inertiels qui jouent un role essentiel en physique. On rappelle(cf. section 4.3.3) que le mouvement inertiel, c’est-a-dire a vitesse uniforme entre deuxpoints d’espace-temps (A, t1) et (B, t2) maximise le temps propre :
τ =∫ (B,t2)
(A,t1)
√1 − v2
c2dt .
9.2.1 Collisions et introduction de la masse inertielle
Si on considere le choc elastique de deux particules (figure 5a) entre des positions initiales(A et B) et finales (A′ et B′) fixees, on sait que la particule la plus massive (m1 > m2) estcelle dont le mouvement est le plus proche d’un mouvement inertiel (ACA′ plus “proche”de AA′ que BCB′ de BB′). Il est donc naturel d’introduire les masses par le principe“m1τ1 +m2τ2 maximum”, ou chaque temps propre τ est pondere par la masse m. Il estremarquable que, plus generalement, les L.C. de la quantite de mouvement et de l’energiesont une consequence du principe tres simple∑
i
miτi extremum .
DEMONSTRATION : considerons l’exemple “typique” 1 + 2 → 3 + 4 + 5, les particulesfinales pouvant differer des particules initiales (figure 5b). Entre les instants initial oufinal et l’instant du choc, chaque particule i effectue a vitesse uniforme la translationRi dans le temps Ti, avec T1 = T2 avant le choc et T3 = T4 = T5 apres. Pour chaque
particule i on a τi =(T 2i −
R2i
c2
) 12
et
mic2dτi = mic
2(Ti dTi −
Ri · dRic2
)(T 2i −
R2i
c2
)− 12
= Ei dTi − pi · dRi ,
9.2 Principes de moindre action et generalisation des mouvements inertiels 291
ou Ei = mic2(1 − v2
i
c2
)− 12
et pi = mivi
(1 − v2
i
c2
)− 12
sont l’energie et la quantite demouvement de la particule. Effectuons une variation εt = dT1 = dT2 = −dT3 = −dT4 =−dT5 de l’instant du choc et ε = dR1 = dR2 = −dR3 = −dR4 = −dR5 de sa position ;alors : d
(c2
∑i
miτi)
= (E1 +E2−E3−E4−E5)εt− (p1 +p2−p3−p4−p5) ·ε = 0. εt et ε
etant arbitraires ceci conduit a p1 +p2 = p3 +p4 +p5 et E1 +E2 = E3 +E4 +E5. On peutmontrer que l’extremum est un maximum. Ce principe (et des raisons d’homogeneite etde minimum) ont conduit a poser que l’action pour une particule libre est S = −mc2τet le lagrangien L = −mc2
(1 − v2
c2
) 12.
m2
m1
2τ
1τ
m5
m2
m1
m1
m2
4
m4
m3
(R T )11
(R T )3 3
(R T )2 2
5(R T )
5
(R T )4
(a) (b)
B B’
C
A’A
Figure 5
Approximation galileenne. Rappelons (cf. section 4.3.3) que l’energie de liaison, noteeici U , d’une particule composee (atome, noyau...) est la difference entre son energie aurepos mc2 et la somme m∗c2 des energies de masse de ses constituants. En physiquegalileenne |U | � mc2, v � c, et m∗ est conservee. L’approximation
−mc2(1 − v2
c2
) 12 � −m∗c2 +
12mv2 − U
montre que le lagrangien peut etre pris egal a L =12mv2 − U , ou a 1
2mv2 − U(−→r , t) si
U(−→r , t) est l’energie potentielle en presence d’un systeme exterieur. Si on considere des
chocs, le principe devient “∑i
(12mi
R2i
Ti− UiTi
)extremum” et on obtient les L.C. de la
quantite de mouvement mv et de l’energie12mv 2 + U .
9.2.2 Particules chargees et interactions electromagnetiques
� Principe de jauge et interactions electromagnetiques
Le principe d’extremum pour une particule libre s’ecrit aussi
S =∫ (B,t2)
(A,t1)
(−mc2
√1 − v2
c2− U + A · v
)dt extremum
292 9 • Principes variationnels
quels que soient U et A constants puisque les termes additionnels∫ −U dt = U(t1−t2) et∫
A·v dt = A·(rB−rA) ne dependent que des bornes d’integration. U et A constituent desdegres de liberte supplementaires. Le principe de jauge en physique consiste, lorsqu’unesymetrie globale existe (ici la possibilite d’ajouter les termes contenant les constantes Uet A sans modifier les equations du mouvement), a introduire les interactions en imposantla “localite” de la symetrie, c’est-a-dire en faisant dependre de r et de t les degresde liberte lies a la symetrie. Alors que S avec U et A constants (ou nuls) est l’actiond’une particule libre, S avec U(r, t) = qV (r, t) et A(r, t) = q A(r, t) ou V et A sont lespotentiels scalaire et vecteur est l’action pour une particule chargee en interaction avecle champ electromagnetique. Pour cette action il reste une symetrie de jauge associee
au changement de jauge V → V − ∂ϕ
∂tet A → A + ∇ϕ (avec ϕ(r, t) arbitraire),
changement qui revient a ajouter au lagrangien la derivee totale qdϕdt
.
REMARQUE. En mecanique quantique l’equation de Schrodinger i�∂tψ = 12m
( �i
−→∇)2 ψ pour une
particule libre possede la symetrie globale ψ → eiϕ ψ (ϕ constant). Pour rendre cette symetrie locale(ϕ→ ϕ(�r, t)
)il faut effectuer dans l’equation les remplacements
i�∂t → i�∂t − qV et �
i
−→∇ → �
i
−→∇ − q �A ,
qui introduisent l’interaction electromagnetique. L’equation obtenue est laissee invariante par le change-
ment (symetrie de jauge) V → V − ∂tϕ, �A→ �A+−→∇ϕ et ψ → ψ exp
(i�qϕ
).
� Mouvement d’une particule chargee dans un champ electromagnetique
Le lagrangien
L = −mc2√
1 − v2
c2+ q(v · A− V ) ou L =
12mv2 + q(v · A− V ) pour v � c
conduit a l’equation d’une particule soumise a la force de Lorentz :
dpdt
= q( E+v∧ B) avec E = −∂t A−−−→gradV , B =−→rot A , p = mv
(1− v
2
c2)− 1
2 (oumv) .
DEMONSTRATION : on ecrit les equationsddt
( ∂L∂vi
)=∂L
∂xiavec, par exemple pour la
premiere composante,
∂L
∂x= q
(−∂V∂x
+ vx∂Ax∂x
+ vy∂Ay∂x
+ vz∂Az∂x
),
∂L
∂vx= px + qAx et
ddt
( ∂L∂vx
)=
dpxdt
+ q(∂Ax∂t
+ vx∂Ax∂x
+ vy∂Ax∂y
+ vz∂Ax∂z
).
Attention. Il est important de remarquer que le moment conjugue P de r est different
de la quantite de mouvement p puisque P =∂L
∂v= p + q A. Le hamiltonien H(P ,r) =
P .v − L s’ecrit (petit calcul) :
H(P ,r) =√c2 (P − q A)2 +m2c4 + qV ou H(P ,r) =
(P − q A)2
2m+ qV pour v � c .
9.2 Principes de moindre action et generalisation des mouvements inertiels 293
Le fait que H s’exprime en fonction de p, comme si A, donc B, n’existait pas, est trom-peur. H doit etre considere, dans le formalisme de Hamilton, comme une fonction non dep mais de P . Cette remarque, qui explique que les equations du mouvement ne sont pasles memes pour B = 0 et B �= 0, est encore plus importante quand on passe en physiquequantique avec la correspondance P ↔ −i�−→∇. Donnons trois exemples.
- Particule non relativiste dans un champ B constant. En utilisant l’expressionA =
12B ∧ r on obtient
H =(P − q A)2
2m+ qV =
P 2
2m+ qV − μ · B +
q2B2r2⊥8m
,
avec r⊥ composante de r perpendiculaire a B et μ =q
2mr∧ P . ConsiderantH comme un
hamiltonien quantique, on voit qu’il differe du cas B = 0 par deux termes. L’un −μ · Best l’energie d’un dipole magnetique μ ; il est responsable du paramagnetisme. L’autre,present meme si μ = 0, est l’energie associee au diamagnetisme.
- Courant supraconducteur. Dans un supraconducteur les electrons de la surface de Fermi formentdes etats lies (paires de Cooper) pour lesquelles < �P >= 0. Le courant electrique �j = Nq < �v > vaut
donc �jsupra = −N q2
m�A et est lie a l’existence du potentiel vecteur �A. On peut montrer a partir de
l’equation Δ �A = 1δ2
�A consequence de Δ �A = −−→rot �B = −μ0�j (δ = c
ωpavec ω2
p = Nq2
mε0) que le champ
magnetique ne penetre dans le materiau que sur une tres faible epaisseur δ (effet Meissner).
- Effet Aharonov-Bohm (1956) (figure 6). Dans une experience d’interferences de trous d’Young
avec une source S d’electrons, la difference de phase en un point M du champ d’interferences s’ecrit
Δϕ = 1�
∮γm�v · d�r, ou γ est le chemin ferme qui partant de S va a M en passant par un trou et revient
a S en passant par l’autre trou. En presence d’un champ magnetique, Δϕ devient
Δϕ = 1�
∮γ(m�v + q �A) · d�r = 2πΔl
λ+ qΦ
�
ou Δl est la difference des longueurs des deux chemins allant de S a M, λ = hmv
la longueur d’onde de
de Broglie et Φ le flux de �B a travers γ. La presence du champ se traduit donc par un deplacement de
la figure d’interferences d’un nombre qΦh
d’interfranges (effet Aharonov-Bohm). Cet effet a lieu meme si
les electrons ne passent que dans des regions ou �B = 0.
i
Solénoide
SM
Figure 6
294 9 • Principes variationnels
9.2.3 Temps propre et gravitation ; courbure de l’espace-temps
� Gravitation et geometrie ; equation des geodesiques
Dans un potentiel gravitationnel newtonien V (r), dont derive le champ g = −−−→gradV ,l’energie potentielle d’une particule de massem est U(r) = mV (r) (identite des masses
gravitationnelle et inertielle). SiV
c2� 1 et
v2
c2� 1 le lagrangien galileen
12mv2 −U
equivaut a L � −mc2(1−v
2
c2+
2Vc2
) 12. Ceci revient a introduire un temps propre “modifie”
(on suppose V = 0 a l’infini) :
τ =∫ (B,t2)
(A,t1)
dτ avec dτ2 = (1 +2Vc2
) dt2 − dr2
c2.
Les mouvements de chute libre, qui extremalisent τ , apparaissent alors comme des geode-siques de l’espace-temps muni d’une metrique c2dτ2 determinee par la gravitation(analogie avec les geodesiques de l’espace qui minimisent les distances). Ce point devue geometrique sur la gravitation est renforce par le fait que, pour un mouvementquelconque, τ est effectivement ce que mesure toute horloge interne a un systeme physique(par exemple des horloges atomiques).
Dans un systeme arbitraire de coordonnees xμ (μ = 0, 1, 2, 3) le temps propre s’ecrit apriori sous la forme
τ =∫
dτ avec c2dτ2 = gμν(x) dxμ dxν > 0 (gμν = gνμ) .
(Dans toute cette section la sommation sur un indice est sous-entendue si celui-ci figureune fois en position haute et une fois en position basse ; dans le cas newtonien ci-dessus :x0 = ct, {xi} ≡ −→r (i = 1, 2, 3), g00 = 1 + 2V c−2, gii = −1 et gμν = 0 si μ �= ν).Les geodesiques xμ(λ), parametrees par λ, obeissent alors aux E.D. d’Euler-Lagrangerelatives au lagrangien
L =c dτdλ
=[gμν
dxμ
dλdxν
dλ
] 12.
Pour la coordonnee xα on obtient (calcul analogue a celui de la section 9.1.1 pour l’ob-tention de la loi de Descartes a partir du principe de Fermat)
ddλ
[12
dλdτ
2gμαdxμ
dλ
]=
12
dλdτ
(∂α gμν)dxμ
dλdxν
dλ
(∂α ≡ ∂
∂xα
),
ou, en introduisant la quadrivitesse uμ =dxμ
c dτ(analogue du vecteur unitaire u) :
dc dτ
[gμα u
μ]
=12
(∂α gμν)uμ uν .
Dans le cas newtonien (avec V � c2 et v2 � c2), on retrouve la conservation de l’energie12v
2 + V pour α = 0 et la loi de Newton −→a = −−−→gradV pour α = 1, 2, 3.
REMARQUES. 1) En presence d’un champ de gravitation, il n’y a pas de forme “canonique” pour la
metrique. Seules des hypotheses (stationnarite, isotropie, comportement a l’infini... cf. la metrique de
9.2 Principes de moindre action et generalisation des mouvements inertiels 295
Schwarzschild) conduisent a une ecriture plus simple pour un choix de coordonnees. Un changement
de coordonnees arbitraire {xμ} → {x′α} conduisant a recrire l’invariant c2 dτ2 sous la forme
c2 dτ2 = g′αβ(x′) dx′α dx′β avec g′αβ(x′) = gμν(x)∂xμ
∂x′α∂xν
∂x′β ,
il n’existe evidemment pas de choix des quatre fonctions xμ qui permette de rendre par exemple les dix
fonctions g′αβ constantes comme pour un espace-temps plat.
2) En mecanique newtonienne la relation −→a = −→g peut faire penser qu’on peut eliminer la gravitation en se
placant dans un referentiel en chute libre, mais c’est inexact car −→g n’est jamais rigoureusement uniforme.
Dans ce referentiel, un point −→r en chute libre voisin de l’origine verifie −→r = −→g (�r) −−→g (0) = δ�g(�r) �= 0 ;
le champ δ�g(�r), appele champ de maree car ses equipotentielles correspondent a des surfaces de niveau
de masses fluides en chute libre, depend des derivees secondes de V (�r) en −→r = 0 et ne peut etre annule.
De meme, on montre que le changement {xμ} → {x′α} permet, au mieux, de mettre en un point dτ2 sous
une forme diagonale (supposee etre dt2 − c−2d−→r 2 pour garder la symetrie de Lorentz) et d’annuler
en ce point les derivees premieres des g′αβ (mais pas les derivees secondes si l’espace-temps est courbe).
� Tests de la metrique de Schwarzschild
Dans le champ du a une masse M spherique on a exactement (resultat admis ici) :
dτ2 =(1 − 2GM
rc2
)dt2 − r2
c2(dθ2 + sin2 θ dϕ2) − dr2
c2(1 − 2GM
rc2
) .
- Redshift gravitationnel. Si une source emet des “tops” en r1 fixe, a intervalles detemps Δt1 = T reguliers, ils sont recus en r2 fixe, a intervalles de temps reguliers euxaussi Δt2 = T (car la metrique et donc les temps de propagation ne dependent pas de t) ;mais les frequences ν1 = (Δτ1)−1 et ν2 = (Δτ2)−1 mesurees en ces points par des horloges
“physiques” sont differentes : ν2/ν1 =(1 − 2GM
r1c2
) 12 /
(1 − 2GM
r2c2
) 12 (redshift ν2 < ν1 si
r2 > r1).
- Trajectoires d’un point materiel. Si on parametre un mouvement par t(λ) et r(λ),on a dτ = Ldλ avec
L =((
1 − 2αr
)t′2 −
(1 − 2α
r
)−1
r′2 − r2θ′2 − r2 sin2 θ ϕ′2) 1
2
(α = GM et c = 1) ,
f ′ designant la derivee de f par rapport a λ. Un argument simple montrant que latrajectoire est plane consiste a remarquer que θ =
π
2= Cste correspond a un extremum
de l’action, puisqu’en posant θ =π
2+ ε la variation de
∫L dλ est en ε2. De plus comme
les variables t et ϕ n’apparaissent pas dans L, les quantites∂L
∂t′et
∂L
∂ϕ′ sont constantes.
Si on note f la derivee de f par rapport a τ on a(1− 2α
r
)t = A , r2 ϕ = C et
(1− 2α
r
)t2 −
(1− 2α
r
)−1
r2 − r2 ϕ2 =dτ2
dτ2= 1 ,
d’ou A2− r2 −C2r−2(1− 2α
r
)= 1− 2α
r. En posant u =
1r
et en utilisantddτ
= ϕd
dϕ=
C
r2ddϕ
on obtient, apres derivation par rapport a ϕ, l’equation de la trajectoire :
d2u
dϕ2+ u− α
C2− 3αu2 = 0 .
296 9 • Principes variationnels
- Deplacement du perihelie. Dans le probleme de Kepler habituel (cf. section 2.3.3) le terme non
lineaire en u2 est absent et la solution est l’ellipse u0(ϕ) = 1p
(1 + e cos ϕ) avec p = C2
α. Si on considere
ce terme comme une perturbation, en posant u(ϕ) = u0(ϕ) + δu(ϕ) et en ne prenant en compte dans3αu2
0 que le terme resonnant (cf. section 6.5.1), un calcul elementaire conduit a δu(ϕ) = 3αp−2eϕ sin ϕ.
Tout se passe donc comme si dans u0(ϕ) il fallait remplacer cos ϕ par cos (1− 3αp
)ϕ. Ainsi r ne reprend
la meme valeur que lorsque ϕ varie de 2π + Δϕ avec Δϕ = 6παp
= 6παa(1−e2)
.
- Deviation des rayons lumineux. Pour etudier la deviation des rayons lumineux (photons de massenulle) il faut considerer la limite dτ = 0 ce qui correspond a C infini dans l’equation pour u. Si on negligele terme en u2, la solution est la droite u0(ϕ) = 1
Rcos ϕ parallele a l’axe y et passant a une distance
R de O (pas de deviation du photon) ; la prise en compte de ce terme dans un calcul de perturbation
donne δu(ϕ) = 3α2R2
(1 − cos 2ϕ
3
). En ecrivant qu’a l’infini ϕ est tel que u(ϕ) = 0 et sachant qu’alors
ϕ = ±(π2
+ ε), on obtient la deviation des rayons lumineux δϕ = 2ε = 4αR
.
� Transport parallele et courbure
Le premier membre de l’equation des geodesiques s’ecrit aussi
dc dτ
(gμα uμ
)= gμα
duμ
c dτ+
(∂νgμα
)uμuν = gμα
duμ
c dτ+ 1
2
(∂νgμα + ∂μgνα
)uμuν .
En multipliant les deux membres de cette equation par les nombres gβα = gαβ tels que gβαgμα = 1 siβ = μ et egal a 0 si β �= μ (nombres qui constituent les elements de la matrice symetrique inverse decelle ayant pour elements {gμα}) on obtient (apres sommation sur α) :
duβ
c dτ= −Γβμν u
μuν ou Γβμν = gβα 12(∂νgμα + ∂μgνα − ∂αgμν) = Γβνμ (symboles de Christoffel).
Ceci implique que, dans un deplacement infinitesimal le long de la geodesique, les composantes de laquadrivitesse varient comme
duβ = −Γβμνdxμuν .
L’interet de cette relation est qu’elle correspond au transport parallele de la quadrivitesse. En effet,comme pour la sphere (cf. section 3.2.6), le transport de x en x + dx d’un quadrivecteur est defini desorte qu’il conserve sa norme et sa projection sur la geodesique. Or uμ est un quadrivecteur (quantite,qui en x, se transforme comme dxμ dans un changement de coordonnees), il est tangent a la geodesiqueen tout point (car proportionnel a dxμ) et est unitaire (uμ(x) gμν(x)uν(x) = dτ2/dτ2 = 1). On peutverifier que pour un quadrivecteur quelconque Aμ (non necessairement tangent aux geodesiques et nonunitaire) la meme relation
δAβ = −ΓβμνdxμAν
convient pour definir son transport parallele car elle assure la conservation du produit scalaire : (Aμ +δAμ) gμν(x+ dx) (Bν + δBν ) = Aμ gμν(x)Bν . (Pour cela ecrire gμν(x+ dx) = gμν(x) + (∂ρgμν) dxρ etutiliser la definition des Γ.)
La courbure est definie, comme pour la sphere, a partir du transport parallele d’un quadrivecteur lelong d’un circuit ferme oriente. Pour un parallelogramme infinitesimal situe en x de cotes δ1xμ, δ2xμ,−δ1xμ, −δ1xμ, et dont les projections des aires sur les plans (xμ, xν) sont δSμν = δ1xμ δ2xν−δ1xν δ2xμ,la variation d’un quadrivecteur dans le transport s’ecrit (generalisation de la formule de Stokes de lasection 7.2.2)
ΔAβ = − ∮ΓβναA
α dxν = − 12[∂μ(ΓβναA
α) − ∂ν(ΓβμαA
α)] δSμν ,
ou encore (∂μAα au point x etant deduit de δAα, reflexion laissee au lecteur)
ΔAβ = − 12Rβαμν A
α δSμν avec Rβαμν = (∂μΓβαν − ∂νΓβαμ) + (ΓβσμΓσαν − ΓβσνΓ
σαμ) .
Les coefficients Rβαμν , fonctions du premier degre des derivees secondes des gμν , caracterisent la cour-bure de Riemann de l’espace-temps. (Rappelons que pour la sphere la rotation d’un vecteur lors deson transport est aussi proportionnelle a la surface du circuit et a la courbure.) Les grandeurs derivees
Rαμ = Rβαμβ (courbure de Ricci) , R = gαμRαμ (courbure scalaire) ,
qui ont les proprietes remarquables respectivement, de se transformer comme les gαμ (avec Rαμ = Rμα),et d’etre invariante, jouent un role important pour les equations d’Einstein de la gravitation (cf. section9.3.3).
9.3 Champs et principes de moindre action 297
JUSTIFICATION des proprietes de transformation de Rμν et de R dans un changement de coordonnees.
Elles resultent des deux relations (dont la demonstration est donnee ci-apres) :
(a) R′δγρσ =
∂x′δ
∂xβ∂xα
∂x′γ∂xμ
∂x′ρ∂xν
∂x′σRβαμν et (b) g′γδ =
∂x′γ
∂xμ∂x′δ
∂xνgμν .
Pour Rμν , il suffit de faire δ = σ dans (a) en remarquant que ∂xν
∂x′σ∂x′σ∂xβ = 1 si β = ν et 0 si β �= ν. Pour
R, on deduit de (b) l’egalite : g′γδR′γδ = ∂x′γ
∂xμ∂x′δ∂xν gμν ∂xρ
∂x′γ∂xσ
∂x′δ Rρσ = gμν Rμν . La relation (a) s’obtient
a partir de l’expression definissant la courbure de Riemann Rβαμν en exprimant les quadivecteurs ΔAβ ,
Aα, δxμ et δxν en x en fonction des memes quantites primees, par exemple δxν = ∂xν
∂x′σ δx′σ . La relation
(b) se verifie en observant que g′γαg′αβ = 1 si β = γ et 0 si β �= γ. Enfin, la demonstration de Rαμ = Rμα
revient a verifier que ∂μΓββα est symetrique en μ et α ; ceci est vrai car Γββα = 12gμν ∂α gμν (cf. definition
des Γ) s’ecrit aussi 12∂α lnΔ avec Δ = |detgμν |. (En effet, pour tout matrice A : δ(detA) = tr(At δA) =
(detA) tr(A−1 δA) avec A matrice des cofacteurs cf.section 4.2.2.)
9.3 CHAMPS ET PRINCIPES DE MOINDRE ACTION
9.3.1 Equations de Maxwell ; action de Schwarzschild
On obtient les deux equations de Maxwell impliquant les sources en rendant extremum,par rapport aux potentiels
−→A et V , l’action invariante
S =∫∫∫∫ (1
2ε0(
−→E
2 − c2−→B
2) + (
−→j · −→A − ρV )
)d3r dt ,
dans laquelle−→E = −∂t−→A −−−→
gradV ,−→B =
−→rot
−→A et le terme d’interaction avec les charges
generalise le terme q (−→v · −→A − V )introduit a la section 9.2.2.DEMONSTRATION. La variation de
−→A se traduit sur S par :
δS =∫∫∫∫ (
ε0−→E · (−∂tδ A)− c2
−→B · −→rot δ A+
−→j · δ A)
d3r dt .
Apres integration par parties (δ A etant pris nul a l’infini), et utilisation de div(δ A∧−→B ) =−→B · −→rot δ A− δ A · −→rot
−→B (et ε0μ0c
2 = 1), δS s’ecrit :
δS =∫∫∫∫ (
ε0∂t−→E − 1
μ0
−→rot
−→B +
−→j
) · δ Ad3r dt .
La condition δS = 0 quelle que soit la fonction δ A(−→r , t) conduit a−→rot
−→B = μ0 (
−→j +
ε0 ∂t−→E ). On obtient de meme div
−→E = ρ
ε0en faisant varier V (et en utilisant
−→E ·
(−−−→gradδV ) = −div(−→EδV ) + δV div
−→E ). L’invariance de S resulte de ce que dans une
transformation de Lorentz (cf. section 4.3.3)−→E
2 − c2−→B
2est invariant de meme que
ρV −−→j ·−→A (produit scalaire de deux quadrivecteurs) et d3r dt (car le jacobien des trans-
formations vaut a 1). Elle garantit l’invariance relativiste des equations de Maxwell.Le lecteur verifiera que l’autre invariant ε0c
−→E · −→B ne contribue pas a δS.
298 9 • Principes variationnels
9.3.2 Equation de Schrodinger ; theoreme adiabatique
� Equation de Schrodinger
L’equation i�∂tψ = Hψ, qui est une E.D.P. si le vecteur d’etat ψ(t) est une fonctiond’onde ψ(−→r , t), entraıne :
S =∫ t2
t1
(ψ , (i�∂t −H)ψ) dt extremum .
VERIFICATION : δS =∫ t2t1
(δψ , (i�∂t − H)ψ) dt +∫ t2t1
(ψ , (i�∂t − H)δψ) dt. Apresintegration par parties et compte tenu de l’hermiticite de H , le deuxieme terme s’ecritaussi
∫ t2t1
((i�∂t −H)ψ , δψ) dt. La reciproque , facile a montrer, est laissee au lecteur.
Etat stationnaire (H independant du temps, ψ(t) = e−iE�t ψ(0) vecteur propre de H).
Le principe conduit a (ψ , Hψ) extremum (cf. section 4.2.3, calculs de perturbation).
� Theoreme adiabatique quantique
. Soient ψn(t) et En(t) les vecteurs propres (base orthonormee) et valeurs propres “ins-
tantanes” d’un hamiltonien H(t) qui depend lentement du temps, et dont on supposele spectre discret. Si l’echelle de temps de variation TH de H(t) est grande devant
les periodes Tnm =�
Em − En(hypothese adiabatique) on a, pour un etat quelconque
ψ(t) =∑n ρn(t) e
iϕn(t) ψn(t) (avec ρn reel) :
ρn = constante et ϕn = −En(t)�
+ i (ψn(t) , ψ
n(t)) .
DEMONSTRATION : S =∫ ∑
n ρn(i�ρn − �ϕnρn − Enρn +
∑m i�ρmei(ϕm−ϕn)(ψ
n, ψ
m))
dt. En
negligeant les termes en ei(ϕm−ϕn) (n �= m) qui oscillent “rapidement” et contribuent peu a S (approxi-
mation adiabatique), et en oubliant le terme∑n ρnρn (derivee totale), le lagrangien s’ecrit :
L =∑n ρ
2n
(−�ϕn − En + i�(ψ
n(t) , ψ
n(t))
).
Les E.D. d’Euler-Lagrange pour les variables ρn et ϕn donnent le resultat annonce.
Consequence : puisque les ρn sont constants, une evolution adiabatique n’induit pasde transition entre niveaux d’energie ; en particulier si l’etat initial est l’etat propreinstantane ψ
n(0), l’etat a l’instant t sera, a une phase pres, l’etat propre instantane
ψn(t). Cela conduit en physique statistique des systemes en equilibre thermique a une
distinction microscopique entre travail et echanges thermiques reversibles :
d(U =∑
NnEn) =∑n
Nn dEn +∑n
En dNn = δWrev + δQrev .
Dans une transformation adiabatique les populations Nn des niveaux d’energie sontconstantes et on retrouve la definition thermodynamique de l’adiabaticite δQrev = 0. Defacon generale un travail reversible modifie les niveaux d’energie tandis qu’un apportthermique modifie leurs populations. Par exemple pour une particule libre dans une
boite cubique de cote a, on a Enpq =�2
2mπ2
a2(n2 +p2 + q2) et
δEnpqEnpq
= −2daa
= −23
dVV
.
9.3 Champs et principes de moindre action 299
En ecrivant le travail δWrev =∑
Nnpq δEnpq = −23U
dVV
= −P dV , on retrouve l’ex-
pression bien connue P =23U
Vde la pression cinetique d’un gaz parfait monoatomique.
Phase de Berry. On appelle ainsi le dephasage supplementaire ϕB =∫ t2t1i(ψ
n(t) , ψ
n(t)) dt lie au
fait que le systeme evolue dans un environnement lentement variable. Il est mis en evidence dansdes experiences d’interferences ou, sur les deux chemins, les En(t) sont les memes mais les ψn(t) sont
differents (spins 12
se deplacant “lentement” dans un champ magnetique �B(�r) dont seule la directionvarie).
Transport quantique. La phase de Berry correspond a un transport naturel entre deux etats quantiquesvoisins ψ et ψ + δψ. En effet la minimisation de ‖ (ψ + δψ)eiδϕ − ψ ‖2, rendant ces deux etats les plusproches possible, conduit a l’ajustement de phase δϕ = i(ψ, δψ).
9.3.3 Equations d’Einstein de la gravitation ; action de Hilbert
Les equations d’Einstein relient la courbure de Ricci de l’espace-temps a la matiere, decrite de faconcontinue par Tμν (voir interpretation physique ci-dessous) :
Rμν − 12gμνR = − 8πG
c4Tμν (Tμν = Tνμ) .
Ce sont des E.D.P. du second ordre pour les coefficients de la metrique. Elles equivalent dans le vide(Tμν = 0) a Rμν = 0 (car gμν(Rμν − 1
2gμνR) = R− 2R = 0), et dans la matiere a Rμν = − 8πG
c4(Tμν −
12gμνT ) avec T = gαβTαβ . Dans le cas newtonien dτ2 = (1+2V c−2) dt2 − c−2 d�r2 ou les seules derivees
non nulles des gμν sont les ∂ig00 (i = 1, 2, 3) et ou on ne garde que les termes proportionnels a V ou sesderivees, on peut verifier que les Rμν se reduisent a R00 � −ΔV/c2 ; comme dans cette limite ne resteaussi que T00 � ρc2 (ρ masse volumique), on retrouve l’E.D.P. de Poisson
ΔV = 4πGρ .
(Pour une masse ponctuelle a l’origine cette E.D.P a pour solution V = −Gm/r, de meme que pour unecharge electrique ponctuelle V = q/(4πε0r) correspond a ΔV = −ρ/ε0.)
Pour un faisceau monocinetique de particules de masse m et de densite n0 dans le referentiel local ouelles sont au repos : Tμν = gαμgβνT
αβ avec Tαβ = n0mc2uαuβ (uα = dxα/c dτ est la quadrivitesseintroduite a la section 9.2.3 et les coefficients gαμ et gβν assurent que Tμν se transforme comme Rμνet gμν). Dans un espace-temps plat, et dans un referentiel ou �v est la vitesse des particules et n = γn0
(γ = (1 − v2/c2)−12 ) est leur densite on a :
T 00 = nγmc2 , {T 0i} ≡ nγmc�v , T11 = nγmv2x · · · , T12 = nγmvxvy · · · .T 00 est donc la densite d’energie, les cT 0i correspondent a la densite de courant d’energie (et lesc−1T 0i a la densite de quantite de mouvement) et les T ij decrivent un flux de quantite de mouve-ment (cf. l’analogue non relativiste section 3.2.4). Ces interpretations physiques sont pour l’essentiel lesmemes en espace-temps courbe, que les Tμν soient associes a de la matiere ou a des champs (comme lechamp electromagnetique).
On montre aussi (cf. ouvrages specialises) que les equations d’Einstein obeissent a un principe variation-nel, les variations portant ici sur les gμν , dont l’action invariante par changement de coordonnees estde la forme (action d’Hilbert) :
S = Sgeometrie + Smatiere avec Sgeometrie = − c3
16πG
∫R√
Δ d4x .
Dans l’expression de Sgeometrie, partie de l’action qui conduit aux equations d’Einstein dans le vide,√Δ d4x est un volume invariant (propriete qui se deduit de |det g′αβ | = |det gμν |J2 ou J = det (∂xμ/∂x′α)
est le jacobien du changement de coordonnees, et Δ = |det gμν |). Smatiere generalise l’action d’une par-
ticule ponctuelle Sparticule =∫ −mc2 dτ =
∫ −mc√gμν dxμ dxν ; enfin Tμν est defini par
δSmatiere = − 12c
∫Tμν δgμν
√Δd4x ,
relation semblable a δ(∫ −mc2 dτ ) = − 1
2c
∫mc2uμuν δgμν c dτ .
REMARQUE sur les dimensions. Comme en espace-temps plat x0 = ct et {xi} ≡ �r, il est d’usage de
poser [xμ] = [L]. On a alors [gμν ] = [gμν ] = [Δ] = 1 (sans dimension), [Γβμν ] = [L−1], [Rβαμν ] = [Rαμ] =[R] = [L−2] ... . Le lecteur verifiera l’homogeneite des formules des sections 9.2.3 et 9.3.3.
Chapitre 10
Probabilites ;processus aleatoires
Le calcul des probabilites intervient chaque fois que, repetant “ a l’identique” une memeexperience, le resultat trouve pour la mesure d’une grandeur n’est pas unique : chiffresur lequel un de retombe, temps au bout duquel un noyau radioactif se desintegre,deplacement et vitesse d’une particule brownienne, mesure entachee d’erreur... Les rai-sons du caractere aleatoire du resultat sont multiples : sensibilite aux conditions initiales,interventions d’un grand nombre de variables dont la connaissance complete est impos-sible, mesures “classiques” sur des objets quantiques... Quelles que soient ces raisonsle caractere aleatoire des resultats ne signifie pas l’absence d’information. L’approcheprobabiliste qui traite des frequences d’apparition des resultats (idealisees par les proba-bilites) permet le calcul de grandeurs moyennes et la confrontation a l’experience. Ellejoue un role fondamental dans la comprehension de nombreux phenomenes : loi des grandsnombres et caractere gaussien des erreurs, distribution aleatoire d’instants et comptagesobeissant a une loi de Poisson, marche au hasard et bruit blanc, equiprobabilite des etatsmicroscopiques et loi de Boltzmann en thermodynamique... Le calcul des probabilitesjoue egalement un role pratique important pour les problemes d’estimation statistique.
10.1 LANGAGE DES PROBABILITES
Ce langage qui traite en apparence d’evidences (il y est question d’experiences et de leursresultats) s’appuie sur des raisonnements de logique (utilisation de “ou”, “et”, “sachantque”) qui demandent un minimum d’attention. Le concept cle est celui de probabilite d’unresultat. Applique aux grandeurs aleatoires il conduit a la notion de loi de probabilite(pour leurs valeurs), qui permet de definir les grandeurs moyennes.
10.1 Langage des probabilites 301
10.1.1 Grandeurs aleatoires et raisonnements logiques ;conditionnement
� Experiences et grandeurs aleatoires
Le premier point a definir est l’ensemble Ω des experiences physiques ω considerees.Toutes doivent obeir a un meme protocole (definition de l’etat initial d’un echantillonradioactif, des regles d’un jeu de hasard...), et les mesures ou observations effectueesdoivent etre de meme nature.
En general les experiences ω conduisent a des nombres (mesures de grandeurs physiques,gains attaches aux resultats d’un jeu, etc.). Une grandeur mesuree X est aleatoire sisa valeur x = X(ω) depend de l’experience ω ∈ Ω. On parle de variable aleatoire(v.a.) si X(ω) est un nombre, et de vecteur aleatoire (ou v.a. a n dimensions) si Xest une famille (X1, X2 · · ·Xn) de v.a. L’ensemble des valeurs possibles X(ω) (ou X(ω))s’appelle le spectre de X (ou X). Il peut etre discret, continu ou meme les deux ala fois (comme certains spectres d’energie). Une v.a. qui depend du temps est appeleeprocessus aleatoire.
EXEMPLE (figure 1). Dans l’etude d’echantillons radioactifs identiques le nombreN(t)de desintegrations dans l’intervalle [0, t] est, a t = τ fixe, une v.a. discrete tandis queles instants T1, T2... des premiere, seconde... desintegrations sont des v.a. continues.A chaque experience ω correspondent une suite d’instants tn = Tn(ω) differente et uncomptage N(τ, ω) different. On dit aussi que N(t) =
∑nH(t− Tn) est une fonction
aleatoire dont les fonctions ordinaires N(t, ω) =∑
nH(t − tn) sont les realisations(H fonction de Heaviside).
t 2t 1 t 2 t 3 t 3t1�
� �
�
1
2
3
1
2
t t
( t , )1N N ( t , )
2
Figure 1
� Resultats et raisonnements logiques
Pour un protocole donne d’experience on peut faire etat de beaucoup de resultats (ondit aussi d’evenements). Ainsi, si il est vrai que pour deux lancers successifs d’un deles resultats elementaires directement observes sont les 36 couples ordonnes (i, j) avec1 ≤ i, j ≤ 6, on peut en imaginer d’autres, chacun etant defini par une affirmation {· · · } alaquelle une experience repond necessairement par “oui” ou par “non”. Par exemple siX1
et X2 sont les nombres aleatoires du premier et du second lancer, {X1 = 1} est identiquea {(1, 1) ou (1, 2) . . . ou (1, 6)}, {X1 = i et X2 = j} est identique a {(i, j)}, {X1X2 > 1}est identique a {non (1, 1)}, {X1X2 = 7} est impossible tandis que {X1X2 ≥ 1} estcertain.
302 10 • Probabilites ; processus aleatoires
Une representation ensembliste (figure 2) des resultats (et operations logiques) consistea identifier chaque resultat A au sous ensemble de Ω (note aussi A) dont les elementssont les experiences conduisant (“repondant oui”) a A. Alors aux resultats {A ou B},{A et B}, {non A} correspondent les sous ensembles A∪B, A∩B et A (complementairede A). Les resultats certain et impossible correspondent a Ω (= A ∪ A) et ∅ (= A ∩ A).De tres nombreux raisonnements font appel a la notion de resultats exclusifs tels que{A et B} est impossible (A ∩ B = ∅), ainsi qu’a la notion de partition, famille deresultats exclusifs (Ai ∩ Aj = ∅ pour i �= j) dont l’union est certaine (∪iAi = Ω), parexemple A et A. Une partition est elementaire si tout resultat est une union de Ai.C’est le cas des resultats (i, j) ci-dessus, ou pour une v.a. discrete X prenant les valeursxi, des resultats {X = xi} (representes par les sous ensembles X−1(xi) de Ω ; figure 3).Pour une v.a. continue a valeurs dans R, une partition de Ω est induite par une partitionde R avec des intervalles pouvant “a la limite etre infinitesimaux”.
�
�
�
xX
AB
X
=x )(
Figure 2
( )X−1X−1( )
������������������������������������
������������������������������������
�������������������������
�������������������������
X X
x2
x2x1
�
x1x
Figure 3
� Conditionnement
Cette notion logique tres utilisee consiste simplement, si on sait qu’un resultat B estverifie, a ne prendre en compte que les experiences qui conduisent a B et donc a remplacerΩ par ΩB = B. Le resultat {A sachant B} note A/B (A conditionne par B) correspondau sous ensemble A ∩B de B. La connaissance d’un resultat peut changer radicalementles choses. Par exemple si le resultat B implique le resultat A, c.a.d B ⊂ A, le resultatA/B est certain tandis que B/A ne l’est pas, et cela bien que A∩B = B ∩A (exemple :B ≡ {X = 2 ou 4} et A ≡ {X pair} pour le lancer d’un de).
10.1.2 Probabilites ; lois de probabilite
� Probabilites de resultats
Quand on fait N experiences dont NA ont donne le resultat A on observe que, pour N
de plus en plus grand, le rapportNAN
tend vers une limite : la “frequence d’apparitionde A”. L’approche probabiliste postule qu’a tout resultat A on peut associer un nombre,sa probabilite P (A) ∈ [0, 1] ; il doit verifier P (Ω) = 1 (probabilite 1 pour un resultatcertain) et P (AouB) = P (A) + P (B) si {AetB} = ∅ : addition des probabilites
10.1 Langage des probabilites 303
pour des resultats exclusifs (en particulier∑i P (Ai) = 1 pour une partition, d’ou P (A) =
1−P (A)). Dans cette approche la donnee de P est une prediction sur les frequences desresultats ; ceci est necessaire car on ne peut en effet pratiquement pas faire une infinited’experiences.
� Probabilites conditionnelles ; independance
Si A est conditionne par B, la frequence concernee est la limite du rapportNA etB
NBqui est
aussi le quotient deNA etB
Npar
NBN
. C’est pourquoi on appelle probabilite conditionnellela quantite :
P (A/B) =P (AetB)P (B)
(�= P (B/A) =
P (AetB)P (A)
).
En particulier deux resultats sont dits independants si le conditionnement de l’un parl’autre est sans effet sur les probabilites :
P (A/B) = P (A) ou P (B/A) = P (B)⇐⇒P (AetB) = P (A)P (B) .
Plus generalement on parle de resultats independants Ai si P (A1 etA2 et . . . ) = P (A1)P (A2) · · · (multiplication des probabilites). On notera qu’il ne faut pas confondre“exclusifs” (affirmation logique {AetB} = ∅) et “independants” (affirmation sur lesprobabilites).
EXEMPLE. Il est naturel de supposer que les resultats A1 et A2 associes a la nondesintegration d’un noyau radioactif donne dans des intervalles [t1, t1 +Δt1] et [t2, t2 +Δt2] disjoints sont independants. Si on suppose de plus que P (Ai) ne depend que deΔti (et pas de ti), c.a.d. si P (Ai) = f(Δti) on obtient, en prenant t2 = t1 + Δt1,f(Δt1 + Δt2) = f(Δt1) f(Δt2) et donc P (A) = e−λΔt (cf. section 1.1.3). Il est clairque A1 et A2 ne sont pas exclusifs. A l’oppose les desintegrations dans ces memesintervalles sont des resultats A1 et A2 exclusifs et non independants.
Les formules suivantes montrent comment, a partir des probabilites d’une partition Biet des probabilites conditionnees par les Bi, on peut remonter a toutes les probabilitesd’une autre partition Aj ainsi qu’aux probabilites conditionnelles “inverses” :
P (A) =∑i
P (A/Bi)P (Bi) ; P (Bi/Aj) =P (Aj/Bi)P (Bi)∑i P (Aj/Bi)P (Bi)
.
(Il suffit d’appliquer les definitions et de remarquer que A = ∪i (A∩Bi).) La premiere esttres utilisee en physique. La seconde (theoreme de Bayes) sert en analyse statistique.
� Lois de probabilite de v.a.
Si une v.a. X est discrete, a chaque valeur xi est associee une probabilite pidef= P
({X =xi}
)et on a
∑i pi = 1 puisque ces resultats forment une partition. Si la v.a. X est
continue on appelle densite de probabilite la fonction PX(x) (dont la dimension est[X ]−1) telle que PX(x) dx est la probabilite de {X ∈ [x, x + dx]} ; son integrale sur]−∞,∞[ vaut 1.
304 10 • Probabilites ; processus aleatoires
EXEMPLE 1. La loi de Bernouilli correspond a une v.a. qui prend les valeurs 0et 1 avec les probabilites 1 − p et p. On peut aussi lui associer une densite PX(x) =(1 − p) δ(x) + p δ(x − 1) car chaque pi δ(x − xi) est localise en xi et a pour integralepi (figure 4). Exemples : jeu de pile ou face, loi de Boltzmann pour un systeme a deuxniveaux.
x1
p
1−pX
P (x)
0
Figure 4
��
�
�
�
�
H(t) e− t
t0 0 x
q1 ( )
0 x
L (x)
0 x
G (x)a
1/qqx
−q/2 q/2
(c)
(a) (b)
(d)
−1
Figure 5
EXEMPLE 2. La densite de probabilite de l’instant T de desintegration d’un noyauest PT (t) = H(t)λ e−λt (loi exponentielle ; figure 5a). Demonstration : on ecritque la probabilite de {T < t} est
∫ t0 PT (t′) dt′ = 1 − e−λt (car la probabilite de non
desintegration dans l’intervalle [0, t] est e−λt), et on derive par rapport a t. Les densitesd’autres lois continues, loi uniforme, loi lorentzienne (ou de Cauchy) La(x) et loigaussienne Gσ(x), discutees plus loin, sont representees sur les figures 5b,c,d.
La densite PY (y) d’une fonction de v.a. Y = g(X) s’obtient en remarquant que la pro-babilite PY (y) dy de {Y ∈ [y, y + dy]} est celle de {X ∈ [x1, x1 + dx1] ou [x2, x2 +dx2] ou · · · } ou les xi constituent l’image inverse g−1(y). Par exemple (figure 6) pour
Y = a cosX et PX(x) =12π
sur [−π, π] on a |dx1| = |dx2| = |dy| (a2 − y2)−12 et
PY (y) =∑i
PX(xi)∣∣∣∣dxidy
∣∣∣∣ =1π
(a2 − y2)−12 .
dx 2
x1
dx1
x 2
��������������������
��������������������
� �y
dy
−x
y = a cos x
Figure 6
10.1 Langage des probabilites 305
� Lois de probabilite relatives a une famille de v.a.
On appelle densite de probabilite conjointe de n v.a. la fonction PX(x) telle que
PX(x) dx1 · · ·dxnest la probabilite de {X1 ∈ [x1, x1 + dx1] et · · · et Xn ∈ [xn, xn + dxn]}. Si on s’interessea une seule variable, X1 par exemple, sa densite de probabilite marginale PX1(x1)s’obtient (les autres v.a. pouvant prendre n’importe quelle valeur) en integrant PX(x)sur x2 · · ·xn :
PX1(x1) =∫ ∞
−∞· · ·
∫ ∞
−∞PX(x1, x2, · · · , xn) dx2 · · · dxn ;
sa densite de probabilite conditionnelle (conditionnee par les valeurs x2 · · ·xn desautres v.a.) s’obtient en faisant le quotient de la probabilite conjointe PX(x) dx1 dx2 · · · dxnpar la probabilite de la condition dx2 · · ·dxn
∫PX(x) dx1, c.a.d. simplement en norma-
lisant la fonction de x1 obtenue en fixant x2 · · ·xn dans PX(x) :
PX1(x1/x2 · · ·xn) =PX(x1, x2 · · ·xn)∫PX(x1, x2 · · ·xn) dx1
(x2 · · ·xn fixes) .
Pour des v.a. independantes la densite de probabilite conjointe est le produit des densitesmarginales : PX(x) = PX1 (x1) · · ·PXn(xn). Enfin la densite de probabilite PY (y) d’unefonction de plusieurs v.a. Y = g(X) s’obtient en integrant PX(x) sur le domaine desvaleurs de X correspondant a {Y ∈ [y, y + dy]} et en divisant le resultat par dy.
EXEMPLE 1. La figure 7a correspond au cas de deux v.a. X et Y avec une densiteconjointe uniforme sur le disque x2 + y2 ≤ 1. La figure 7b montre la densite marginale
PX(x) =2π
√1 − x2 de X (identique a celle de Y ). Comme PX(x, y) �= PX(x)PY (y),
ces v.a. ne sont pas independantes (elles le seraient dans le cas d’un domaine rectangu-laire de cotes paralleles aux axes x et y). Ceci est confirme par le fait que les densites
conditionnelles PX(x/y) =12
(1 − y2)−12 (pour |x| < (1 − y2)
12 ) de X dependent de y
(figure 7c).
PX
(x)PXY
(x,y)
Oy
x
PX
(x/y)y = 3 / 2
y = 0
�1 /
�2 /
1
1
−1 1
−1 1
1
(a)
(b)
0
0
(c)
x
x
Figure 7
306 10 • Probabilites ; processus aleatoires
EXEMPLE 2 (figure 8). La densite de probabilite du vecteur vitesse−→V ≡ (Vx, Vy , Vz)
d’une molecule dans un fluide a l’equilibre a une temperature fixee (β = (kBT )−1) est
P−→V
(v) = Z−1 exp(−β 1
2mv2
)(distribution de Maxwell), ou Z =
( 2πmβ
) 32
est donne par∫∫∫
P−→V
(v) d3v = 1. Les
trois composantes de−→V sont donc independantes et la densite (marginale) de Vx par
exemple est :
PVx(vx) =( 2πmβ
)− 12
exp(−β 1
2mv2
x
).
Les densites de V = |−→V | > 0 et E =12mV 2 > 0, fonctions de
−→V , sont respectivement
PV (v) = Z−14πv2 exp(−β 1
2mv2
)(obtenue a partir de l’integration de P−→
V(v) sur le domaine |v| ∈ [v, v + dv]) et
PE(ε) = 2π− 12 β
32√ε exp −βε
(obtenue en ecrivant PE(ε) dε = PV (v) dv avec ε =12mv2 soit dv = (2mε)−
12 dε).
Bk T/m2 T/2Bk �
�
v
P ( )
0 0(a) (b)
P (v)V E
xPVx(v )
Figure 8
x
x 2
10 y
y
dy
Figure 9
EXEMPLE 3. Pour une lumiere thermique la densite conjointe des parties reelle Xet imaginaire Y de l’amplitude complexeA = X+iY est PX,Y (x, y) = (2πσ2)−1 exp
(−
12σ2
(x2 + y2)). On en deduit celle de l’intensite I et de la phase Φ (A =
√IeiΦ) enecrivant
PX,Y (x, y) dxdy = PI,Φ(I, ϕ) dI dϕ avec dxdy =12
dI dϕ ;
on obtient PI,Φ(I, ϕ) =12π
12σ2
exp(− I
2σ2
). La densite de I est PI(I) =
12σ2
×exp
(− I
2σ2
)(loi exponentielle), celle de Φ est PΦ(ϕ) =
12π
(loi uniforme sur [0, 2π])et les deux v.a. sont independantes.
10.1 Langage des probabilites 307
EXEMPLE 4. Somme de deux v.a. Y = X1 + X2. L’observation de la figure 9montre que
PY (y) =∫ ∞
−∞PX1,X2(x1, y − x1) dx1 .
Si les v.a. sont independantes PX1,X2(x1, y − x1) = PX1(x1)PX2 (y − x1) ; donc ladensite de probabilite PX1+X2 de la somme de deux v.a. independantes est le produitde convolution PX1 ∗ PX2 des deux densites.
10.1.3 Grandeurs moyennes ; moments ; correlations
� Cas d’une v.a.
Si pour une v.a. X discrete une valeur xi est obtenue Ni fois lors de N experiences,la moyenne “experimentale ” est N−1
∑i xiNi ; la moyenne “theorique” est < X >=∑
i xi pi. (La notation < · · · > pour la moyenne est celle couramment utilisee en phy-sique ; en mathematique on ecrit plutot E(· · · ) et le mot moyenne est remplace par“esperance”, “expectation” en anglais).
De facon generale on appelle moyenne d’une fonction f(X) de la v.a. X continue (oudiscrete) le nombre
< f(X) >=∫ ∞
−∞f(x)PX(x) dx (ou
∑i
f(xi) pi) .
En particulier la moyenne de X est
mX =< X >=∫ ∞
−∞xPX(x) dx (ou
∑i
xi pi )
(mX = 0 pour une v.a. centree), et sa variance est le nombre positif
σ2X =< (X −mX)2 >=
∫ ∞
−∞(x−mX)2 PX(x) dx =< X2 > −m2
X
(σ2X = 1 pour une v.a. reduite). On introduit aussi la fonction caracteristique (reliee
a la T.F. de PX(x)) :
< eiuX >=∫ ∞
−∞eiux PX(x) dx (ou
∑i
eiuxi pi) .
Lorsque cette fonction de u admet un developpement de Taylor en u = 0, on obtient tousles moments d’ordre n par
< eiuX >=∑n
(iu)n
n!< Xn >
(idem pour les moments centres < (X −mX)n > a partir du developpement de< eiu(X−mX ) >).
EXEMPLES (figures 4 et 5b,c,d). Loi de Bernouilli (cf. section 10.1.2) : < X >= p,σ2X = p(1 − p) et < eiuX >= peiu + q (avec q = 1 − p).
Loi uniforme sur[− q
2,q
2
]: PX(x) =
1q
Π(xq
), < X >= 0 et σ2
X =q2
12.
308 10 • Probabilites ; processus aleatoires
Loi gaussienne :
PX(x) =1√
2πσ2exp− (x−m)2
2σ2⇐⇒ < eiuX >= eiume−
u2σ22 ; < X >= m et σ2
X = σ2.
Le developpement de exp−u2σ2
2montre que les seuls moments centres non nuls sont
< (X−m)2p >= 1.3.5 · · · (2p−1)σ2p ; en particulier < (X−m)4 >= 3 < (X−m)2 >2.
REMARQUES. La variance, lorsqu’elle existe, “ mesure” la tendance d’une v.a. a etreplus ou moins “piquee” autour de sa moyenne. En effet on demontre que la probabilitepour que X s’ecarte de sa moyenne de plus de λ fois l’ecart type σX est inferieure aλ−2 ; pour une v.a. gaussienne elle vaut 5 × 10−2 pour λ = 2, et 4 × 10−3 pour λ = 3.Si la variance est nulle la v.a. est certaine (et reciproquement). Il existe cependant des
exemples comme la loi lorentzienne PX(x) =a
π
1a2 + x2
, presentant une “largeur typique
a”, mais n’ayant pas d’ecart type ; (< eiuX >= e−a|u| n’est pas non plus developpableen puissances de u).
� Cas d’une famille de v.a.
La definition des moyennes est une generalisation de celle donnee pour une v.a. :
< f(X) >=∫ ∞
−∞· · ·
∫ ∞
−∞f(x)PX(x) dx1 · · ·dxn .
Donc la moyenne d’une somme de fonctions des v.a. est la somme des moyennes dechaque fonction. En plus des moyennes mi =< Xi > de chaque v.a. et de leurs variancesσ2i =< (Xi −mi)2 >, les quantites les plus utilisees sont les correlations :
Γij =< (Xi −mi)(Xj −mj) >=< XiXj > −mimj (i �= j ; Γii = σ2i ) .
Γij mesure la tendance des v.a. centrees Xi − mi et Xj − mj a varier dans le memesens (Γij > 0) ou en sens inverse (Γij < 0). Les v.a. Xi et Xj sont correlees (resp. noncorrelees) si Γij �= 0 (resp. Γij = 0).
Dans le cas de v.a. independantes PX(x) factorise. Donc si f(X) factorise aussi on a :
< Πifi(Xi) >= Πi < fi(Xi) > .
En particulier < XiXj >=< Xi >< Xj > d’ou Γij = 0 (i �= j). Donc l’independance desXi entraıne leur non correlation. On fera attention que, sauf pour les v.a. gaussiennes,la reciproque est fausse. (cf. exemple 1 de la section 10.1.2. pour lequel il est evident que< X >=< Y >=< XY >= 0 alors que X et Y ne sont pas independantes).
10.2 ORIGINE ET DISCUSSION DE QUELQUES LOISIMPORTANTES EN PHYSIQUE
10.2.1 Theoreme de la limite centrale et lois gaussiennes
Dans de nombreuses situations physiques la v.a. X est la somme d’un grand nombrede v.a. Xi. Ce peut etre une erreur X accumulation de petites erreurs, le deplacement−→R =
−→R 1 +
−→R 2 + · · · +
−→RN d’une marche au hasard constituee de N pas, la somme
10.2 Origine et discussion de quelques lois importantes en physique 309
∑i |Ai| eiΦi de nombres complexes (amplitude complexe d’une lumiere thermique ou
d’une figure de speckles), un signal resultant X(t) =∑
i f(t − Ti) (a t fixe) lorsquebeaucoup de fonctions f(t − ti) se recouvrent (superposition de paquets d’ondes emisa des instants aleatoires), etc. On observe alors generalement que la loi de X est bienapprochee par une gaussienne. On va le justifier dans le cas ou les Xi sont des v.a.independantes et de meme loi, caracterisee par une moyenne m et une variance σ2.Ces conditions peuvent etre “assouplies” ; l’existence des variances et de “pas trop decorrelation” suffit.
� Proprietes de X = X1 + X2 + · · ·+ XN
La linearite de l’operation de moyenne entraıne
< X >=N∑i=1
< Xi > ; < X2 >=N∑
i,j=1
< XiXj > .
Si les Xi sont independantes on a < XiXj >=< Xi >< Xj > pour i �= j. On en deduitque la variance de X est la somme des variances des Xi et que si les Xi ont meme loi :
< X >= Nm et σ2X = Nσ2 .
EXEMPLES. Si les Xi sont des erreurs de moyenne nulle et de valeur “typique” σ,l’erreur X a une valeur “typique”
√Nσ. Dans une marche au hasard sans derive
(<−→R i >= 0), le “deplacement typique” au bout deN pas est
√Nl avec l =
√<−→R
2
i >.
Enfin la v.a.X
Nqui a pour ecart type
σ√N
devient la variable sure egale a m pour
N →∞.
REMARQUE. Si m �= 0 on peut assimiler X a sa valeur moyenne Nm car l’erreurrelative commise
σX< X >
=σ
m√N
tend vers 0 pour N grand ; c’est le cas des grandeurs
extensives de la thermodynamique. Par contre ceci devient faux pour des sommes dev.a. “fortement dependantes”, par exemple σ2
X = N2σ2 pour X = X1 + · · ·+X1 = NX1.On peut aussi verifier explicitement que pour l’intensite d’une figure de speckles I =∣∣∑
i eiΦi
∣∣2 =∑N
i,j=1 ei(Φi−Φj), avec Φi v.a. independantes et uniformes sur [0, 2π], on a
< I >= N et (petit calcul) σ2I = N2 − N ; la figure presente de grandes fluctuations
d’intensite.
� Theoreme de la limite centrale
Lorsque N tend vers l’infini la v.a. Z =X −Nm√
N, qui est centree et de variance σ2, tend
vers une gaussienne. On peut alors approximer la densite de la v.a. X =∑N
i=1Xi, pourN grand, par
PX(x) � 1√2πNσ2
exp− (x−Nm)2
2Nσ2.
JUSTIFICATION : Z est la somme des N v.a. X′i = 1√
N(Xi − m) qui sont centrees et de variance
σ2
N. Sa fonction caracteristique < eiuZ > est le produit Πi < eiuX
′i > (independance des X′
i), egal a
< eiuX′1 >N (X′
i de meme loi), soit(1− σ2
2Nu2 + · · · )N qui tend vers exp−σ2u2
2(si la somme des termes
non ecrits du developpement peut etre negligee).
310 10 • Probabilites ; processus aleatoires
REMARQUES. 1) Si les Xi sont equireparties sur[− 1
2, 12
]leur densite est Π(x), celle de N− 1
2Xi est√N Π(
√Nx) et celle de Z est le produit de convolution
(√NΠ(
√Nx)
)∗N; pour N → ∞ il tend vers
une gaussienne comme annonce a la section 5.2.1.
2) Si lesXi sont des v.a. lorentziennes de densite La(x) la densite deX est LNa(x) (evident en considerant
les fonctions caracteristiques) qui ne tend pas vers une gaussienne pour N grand ; ceci ne contredit pas
le theoreme car alors σ2 n’existe pas.
� Famille de v.a. gaussiennes
On a deja vu, avec les composantes de la vitesse d’une molecule d’un gaz, un exemple detrois v.a. gaussiennes independantes. Dans le cas general une loi gaussienne (en supposantles variables centrees pour simplifier l’ecriture) est definie par la densite (A matricesymetrique positive)
PX(x) = (2π)−n2 (detA)
12 exp−1
2xtAx (xtAx =
n∑i,j=1
xiAijxj) ,
ou de facon equivalente par la fonction caracteristique :
< eiutX >= exp−1
2utΓu avec A = Γ−1 (utX =
n∑i=1
uiXi) .
L’equivalence des deux definitions est facile a demontrer dans la base ou A est diagonale.
La comparaison des developpements au second ordre en u de < eiutX > et e−
12 u
tΓu
montre que Γij =< XiXj >. Si les Xi ne sont pas correlees, Γ et donc aussi A sontdiagonales et la densite factorise ; on en deduit que non correlation et independancesont des notions identiques pour des v.a. gaussiennes. Une autre propriete importanteest que toute combinaison lineaire de v.a. gaussiennes Y =
∑i aiXi est aussi gaussienne ;
en effet < eiuY >= exp− 12u
2∑
i,j aiΓijaj (car ui = uai) est la fonction caracteristiqued’une gaussienne de variance σ2
Y =∑
i,j aiΓijaj . Plus generalement le filtrage lineairepreserve le caractere gaussien d’un processus.
REMARQUE. Pour des v.a. non centrees il suffit de remplacer dans ce qui precede Xpar X −m avec mi =< Xi >.
10.2.2 Loi binomiale et loi de Poisson
� Loi binomiale
C’est la loi de probabilite de la somme X = X1 +X2 + · · ·+XN de N v.a. de Bernouilliindependantes et de meme loi (caracterisee par la probabilite p). Donc :
< X >= N < X1 >= Np et σ2X = Nσ2
X1= Np(1 − p) .
De la fonction caracteristique < eiuX >= (peiu + q)N =∑N
n=0 CnN p
n qN−n eiun =∑Nn=0 pn e
iun, on deduit que X prend les valeurs n = 0, 1 · · ·N avec les probabilites(caracterisees par N et p) :
pn = CnN pn qN−n (q = 1 − p) .
10.2 Origine et discussion de quelques lois importantes en physique 311
On peut aussi obtenir ce resultat en remarquant qu’il y a CnN facons d’avoir n v.a. egalesa 1 et N − n v.a. egales a 0 et que pour chacune la probabilite est le produit pnqN−n.
EXEMPLE. Dans une enceinte de volume V contenant N molecules d’un gaz parfait,X compte le nombre de molecules dans un volume ΔV : Xi = 1 ou 0 selon la presence
ou l’absence de la molecule i dans ΔV et p =ΔVV
. La fluctuation relative de densite
σX< X >
=(V − ΔVNΔV
) 12
est negligeable si ΔV reste macroscopique ; on peut alors direque, a l’echelle ΔV , la repartition des particules dans V est uniforme.
� Loi de Poisson
Elle est la limite de la loi binomiale lorsque N tend vers l’infini, p tend vers zero, leproduit Np = m restant fini. Le spectre d’une v.a. de Poisson est donc constitue par tousles entiers n = 0, 1, 2 · · · et :
< X >= σ2X = m ; pn =
mn e−m
n!; < eiuX >= em(eiu−1) .
DEMONSTRATION : on recrit pour la loi binomiale
pn =N(N − 1) . . . (N − n+ 1)
n!(mN
)n(1 − m
N
)N(1 − m
N
)−n,
< eiuX >=(1 + (eiu − 1)
m
N
)N,
puis on fait tendre N vers l’infini. La loi de Poisson ne depend que du seul parametre m.
REMARQUE. En faisant le produit des fonctions caracteristiques, on voit que la sommede v.a. de Poisson independantes de moyenne mi est une v.a. de Poisson de moyenne∑imi. Une v.a. de Poisson dont la moyenne est grande (m� 1) est quasi-continue ; elle
peut etre vue comme la somme d’un grand nombre de v.a de Poisson et (theoreme de lalimite centrale) elle se comporte donc comme une v.a. gaussienne ; son ecart type n’estpas quelconque mais relie a la moyenne par σ =
√m.
� Evenements aleatoires dans le temps
La loi de Poisson intervient chaque fois que des evenements se produisant de faconaleatoire dans le temps obeissent aux trois hypotheses suivantes (tres souvent satisfaitesexperimentalement) : i) l’occurrence de plus d’un evenement dans un intervalle dt a uneprobabilite negligeable (pas d’evenements simultanes) ; ii) la probabilite d’occurrenced’un evenement dans un intervalle dt est λdt (λ constant independant de t) ; iii) lesoccurrences d’evenements qui se produisent dans des intervalles de temps qui ne se re-couvrent pas sont independantes. En effet en divisant un intervalle de largeur Δt en un
grand nombre N d’intervalles de largeur δt =ΔtN
, on obtient pour la probabilite Pn(Δt)
de l’occurence de n evenements dans Δt (limite N →∞ de CnN(λΔtN
)n(1− λΔt
N
)N−n) :
Pn(Δt) =(λΔt)n
n!e−λΔt .
312 10 • Probabilites ; processus aleatoires
REMARQUES. 1) De l’expression de Pn(Δt) on deduit que la probabilite pour que le nieme evenement,
compte a partir de t = 0, se produise dans l’intervalle [t, t+ dt] est Pn−1(t)P1(dt) = (λt)n−1
(n−1)!e−λt λ dt.
Donc la densite de probabilite de la v.a. Tn introduite a la section 10.1.1 est :
PTn (tn) = (λtn)n−1
(n−1)!e−λtn λ .
Pour n = 1 on retrouve la loi exponentielle, et comme l’origine des temps est arbitraire, cette loi est
aussi valable pour l’intervalle de temps Ti−Ti−1 entre deux desintegrations. De l’independance des v.a.
T1, T2 −T1 · · · Tn−Tn−1, on deduit que la densite de probabilite conjointe des instants T1, T2 · · ·Tn des
n premiers evenements est le produit :
PT1,T2···Tn (t1, t2 · · · tn) = λH(t1)e−λt1 λH(t2 − t1)e−λ(t2−t1) . . . λH(tn − tn−1)e−λ(tn−tn−1) .
2) Si λ depend du temps, la remarque sur l’addition des v.a. de Poisson montre qu’il suffit de remplacer
λΔt par∫ t+Δtt λ(t′) dt′ dans les expressions precedentes (reflexion laissee au lecteur).
Ces resultats s’appliquent par exemple aux emissions de particules par un echantillonradioactif, aux collisions d’un atome dans un gaz, aux appels qui arrivent a un standardtelephonique, etc. ainsi qu’aux signaux aleatoires du type
∑i f(t−Ti) (bruit de grenaille ;
figure 10a), ou plus generalement aux processus qui consistent, aux instants aleatoiresTi, a effectuer une modification (souvent elle aussi aleatoire) du signal.
t 1 t 2
t 1
t 2��
t
tt t43
f(t−
(a)
(b)
x(t)
)it
Figure 10EXEMPLE : elargissement de raie. Le signal lumineux a exp−i(2πν0t+ϕ0) exp−γtemis a t = 0 par un atome non perturbe (γ etant lie a la largeur naturelle de la raie)voit sa phase modifiee d’une quantite aleatoire a chaque collision avec un autre atome(fig.10b avec γ = 0). A un instant t > 0 le signal est X(t) = a exp−i(2πν0t + ϕ0 +Φ(t)
)exp−γt, avec Φ(t) = 0 si il n’y a pas eu de choc entre 0 et t (probabilite e−λt), et
avec Φ(t) equirepartie sur [0, 2π] si il y a eu un ou plusieurs chocs (probabilite 1−e−λt).On voit sur le “signal moyen” e−λt (a exp−i(2πν0t + ϕ0) exp−γt) + (1 − e−λt) × 0que l’effet des collisions est d’elargir la raie en changeant γ en γ + λ (cf. aussi section10.3.3).
10.2.3 Loi de Boltzmann ; generalisations ; statistiques quantiques ;reponse lineaire et fluctuations
On se limite a l’etablissement et a quelques proprietes generales de la loi de Boltzmann(cf. aussi section 7.4.2). Le lecteur est renvoye aux ouvrages de thermodynamique et dephysique statistique pour les applications.
10.2 Origine et discussion de quelques lois importantes en physique 313
� Etablissement de la loi de Boltzmann
On considere pour commencer un systeme macroscopique isole S d’energie U0 fixeeconstitue de N0 particules discernables sans interaction, chacune d’elle etant susceptibled’etre dans des etats α (discrets pour simplifier l’ecriture) bien definis d’energie εα. Onsuppose que les etats microscopiques possibles de S, au nombre de exp
(k−1B S(U0, N0)
)d’apres la definition de l’entropie (cf. section 1.1.4), sont equiprobables (cf. section 10.3.2“distribution microcanonique”). La probabilite pα pour qu’une particule donnee soit dansl’etat α (et donc les N0−1 autres dans des etats quelconques mais avec une energie totaleU0−εα) s’obtient alors en faisant le rapport du “nombre de cas favorables” au “nombre decas possibles”. En utilisant la formule generale de thermodynamique dS = T (dU−μ dN)
(μ =F
N, avec F = U−TS, est le potentiel chimique par particule) et l’inegalite εα � U0,
un developpement au premier ordre donne :
pα =exp
(k−1B S(U0 − εα, N0 − 1)
)exp
(k−1B S(U0, N0)
) = exp− εα − μ
kBT.
Une autre ecriture, pratique pour les calculs, utilise la fonction de partition Z(β) :
pα =e−βεα
Z(β)avec Z(β) =
∑α
e−βεα = e−βμ(β =
1kBT
).
REMARQUE. Si gi est le nombre d’etats d’energie εi (gi facteur de degenerescencedu niveau εi) la probabilite qu’une particule ait l’energie εi est p(εi) = pi = Z−1 gi e
−βεi.
Particules en interaction (interactions supposees a courte portee). Au lieu de considererles particules individuellement, on divise par la pensee le systeme S (de volume V0) en ungrand nombre de sous systemes de volume V (V � V0) comportant chacun un nombresuffisant N de particules (N � N0 mais macroscopique) pour que les interactions entresous systemes (effet de surface) soient negligeables devant les interactions internes (effetde volume). Alors la demonstration precedente, reprise pour les sous systemes et leursetats A, conduit a la loi de Boltzmann pA ∝ e−βEA si on ignore les fluctuations de N . Parexemple dans un gaz reel la densite de probabilite conjointe des vitesses et positions desparticules est P (v1, · · ·vN ;r1, · · ·rN ) ∝ exp−β
(∑i
12 mv
2i +
∑(i,j) V (ri−rj)
); contrai-
rement au cas du gaz parfait, les positions ne sont pas independantes ; par contre lesvitesses le restent.
REMARQUE. Les niveaux d’energie des sous systemes ont une degenerescence “macroscopique” :
g(E) = expS(E,N)kB
et donc p(E) ∝ expS(E,N)kB
e−βE .
Comme S et T−1E (grandeurs extensives proportionnelles a N) sont tres grands devant kB ∼ 10−23, la
probabilite p(E) est tres “piquee” autour de la valeur E = U (energie interne macroscopique des sous
systemes) qui rend S(E,N)− ET
maximum. Donc l’etat d’equilibre observe est celui qui rend le potentiel
thermodynamique F = E − TS minimum. Dans la pratique il est tres rare qu’on puisse determiner
exactement ce minimum. On appelle theorie de champ moyen une approximation qui consiste a
exprimer S et E en fonction d’un parametre d’ordre x (le taux d’aimantation d’un site dans le cas du
ferromagnetisme ; cf. section 5.1.4), puis a calculer la valeur x∗(T ) de x qui minimise F (x) = E(x)−TS(x)
(cf. section 7.4.2).
314 10 • Probabilites ; processus aleatoires
� Generalisations ; statistiques quantiques
Si l’etat A caracterise les particules contenues dans un sous volume V d’un systeme isoleS, il faut preciser a la fois l’energie EA et le nombre de particules NA. En utilisant laformule generale dS = T (dU +P dV −μ dN), on obtient comme precedemment la loi deprobabilite dans le formalisme grand canonique :
pA =exp
(k−1B S(U0 − EA, V0 − V,N0 −NA)
)exp
(k−1B S(U0, V0, N0)
) = e−βPV e−β(EA−μNA) .
Ce formalisme est utile quand on considere des particules quantiques pour lesquelles lesregles d’occupation des etats particulaires α dependent de la statistique (Fermi-Diracou Bose-Einstein). Dans ce cas, si les particules sont sans interaction, un etat A estentierement defini par l’ensemble {nα} des nombres d’occupation des etats α avec lesconditions ∑
α
nα = NA et∑α
nαεα = EA
(nα = 0 ou 1 pour les fermions et 0, 1, 2 · · · pour les bosons). Ceci entraıne que laprobabilite pA factorise : pA ∝ Πα e
−β(εα−μ)nα . De la loi de probabilite marginale relativeau nombre d’occupation nα d’un etat p(nα) ∝ e−β(εα−μ)nα (loi exponentielle pour nα),on deduit que le nombre moyen d’occupation est
< nα >=1 ou ∞∑nα=0
nα p(nα) =1
eβ(εα−μ) ± 1(+1 fermions, −1bosons) ,
et que la variance vaut < n2α > − < nα >
2=< nα >(1∓ < nα >
)(utiliser
∑∞0 npxn =
(x∂x)p(1 − x)−1 pour les bosons). Pour des fermions l’ecart type vaut 0 si < nα >= 1(etat α occupe) ; pour des bosons il vaut < nα > si < nα > est grand. Si l’etat α estpeu occupe (< nα >� 1) l’ecart type vaut < nα >
12 pour les bosons comme pour les
fermions ; on est alors dans les conditions de la physique statistique classique.
REMARQUES. Le potentiel chimique μ est determine par la condition Σα < nα >=< N >� N
ou N est le nombre de particules du systeme etudie (grandeur macroscopique dont les fluctuations sont
negligeables). Dans le cas particulier des photons N n’est pas fixe et μ = 0 ; < n >= (eβhν − 1)−1. Pour
un volume V et une bande de frequences [ν, ν + dν], le nombre d’etats de photons est (compte tenu des
polarisations) 2 V 4πp2 dph3 avec p = hν
c; on en deduit que la densite volumique spectrale d’energie est
u(ν, β) = hν 8πν2
c3(eβhν − 1)−1 (loi de Planck).
� Reponse lineaire et fluctuations (exemples)
Pour un systeme macroscopique paramagnetique, les etats A en presence d’un champmagnetique exterieur B ont une energie EA −MAB. La fonction de partition
Z(β,B) =∑A
exp−β(EA −MAB)
(dont l’expression precise n’importe pas) permet de calculer l’aimantation moyenne
< M >=∑A
pAMA
(pA = Z−1 exp −β (EA −MAB)
)
10.2 Origine et discussion de quelques lois importantes en physique 315
et la variance < (δM)2 >=∑
A pAM2A− < M >2 :
< M >= β−1 ∂B lnZ ; < (δM)2 >= β−2
(∂2BZ
Z−
(∂BZ
Z
)2).
On en deduit la relation ∂B < M >= β < (δM)2 > : la reponse du systeme a unepetite variation de B est une petite variation de M proportionnelle a ses fluctuations.(χ = μ0 ∂B < M > |B=0 est la susceptibilite.)De meme la reponse a une petite variation de temperature ΔT est une petite variationd’energie interne ΔU = cv ΔT du systeme et on verifie que la capacite thermique cv =∂TU est reliee aux fluctuations de l’energie par :
Tcv = T ∂TU = −β ∂βU = β(∂2
βZ
Z− (∂βZ
Z
)2)
= β < (δE)2 >
(car U =< E >= −∂β lnZ).
REMARQUE. A la temperature de la transition entre paramagnetisme et ferromagnetisme, l’experience
montre que χ devient infini (cf. aussi section 5.1.4). Donc < (δM)2 >=∑ij (< μiμj > − < μi >< μj >)
(car M =∑i μi) tend aussi vers l’infini. Ceci implique, reflexion laissee au lecteur, qu’il y a entre les
moments individuels μi des correlations a longue portee (meme si les interactions sont a courte portee).
10.2.4 Estimation et lois de χ2 (khi-deux)
� Estimation
Un probleme frequemment rencontre est celui de l’estimation de la valeur a d’une gran-deur (non aleatoire) a partir des resultats x1, x2 · · ·xn de n mesures (entachees d’erreursnon systematiques) relatives a une grandeur x fonction connue x(a) de a. Ici les nmesuressont independantes et peuvent correspondre a des protocoles experimentaux differents,ne pas avoir le meme degre de precision, etc. Pour prendre en compte les erreurs, l’ideeest de considerer pour chaque i le nombre xi comme l’une des valeurs possibles d’unev.a. Xi, les Xi etant n v.a. independantes. Un estimateur A de a est une v.a. fonctiondes Xi qui, pour etre bon, doit etre sans biais (< A >= a), de variance la plus petitepossible, et convergent (A sur pour n → ∞). Sa determination par la methode dumaximum de vraisemblance consiste a se donner une densite de probabilite
Πi pi(xi − x(a))
“raisonnable” pour les erreurs Xi − x(a), et a retenir la valeur a (fonction des xi) quimaximise cette probabilite. a(x1, x2 · · ·xn) est une realisation experimentale de l’estima-teur A = a(X1, X2 · · ·Xn).
� Estimations conduisant a un χ2
On se limite a deux exemples d’estimation amenant a considerer des realisations χ2exp
d’une v.a. χ2, qui est la somme des carres de v.a. gaussiennes centrees independantes.
EXEMPLE 1. Si la grandeur mesuree est directement celle qu’on veut estimer (x ≡ a)
et si les erreurs sont gaussiennes de variances σ2i , alors Πi pi(xi−x) ∝ Πi exp− (xi − x)2
2σ2i
.
316 10 • Probabilites ; processus aleatoires
Maximiser cette fonction par rapport a x revient a minimiser la quantite
χ2(x) =n∑i=1
(xi − x)2
σ2i
(χ2 a n degres de libertes) .
L’estimateur est X =∑
iwiXi∑i wi
avec wi = σ−2i , et sa realisation est :
x =∑i wixi∑iwi
.
Il donne un poids plus grand aux mesures les plus precises ; ce n’est que si toutessont faites avec la meme precision que l’estimation experimentale est la moyennearithmetique des resultats de mesure. Le χ2 experimental a pour expression χ2
exp =n∑i=1
(xi − x)2
σ2i
.
EXEMPLE 2. Estimation d’une v.a. X. On cherche alors a estimer sa moyenne, sa variance, sa
loi de probabilite, etc. a partir des valeurs x1, x2 · · · xn obtenues lors de n mesures de X (les mesures
independantes etant ici supposees se faire sans erreur). Comme precedemment pour chaque i, mais
parce que X est aleatoire et non a cause d’erreur de mesure, xi est une valeur possible d’une v.a.
Xi ≡ X, les Xi etant independantes. On verifie en calculant explicitement leurs moyennes que
M = X1+X2+···+Xnn
et V = 1n−1
∑ni=1 (Xi − M)2
sont des estimateurs sans biais de la moyenne et de la variance de X. Si on s’interesse a la loi de pro-
babilite de X (supposee discrete pour simplifier), et si lors d’une serie de n mesures la valeur xα du
spectre deX a ete trouvee nα fois, Pα = Nαn
est un estimateur sans biais de la probabilite theorique pα
de cette valeur ; Nα est la v.a. dont les valeurs nα dependent de la serie de nmesures effectuee. On peut
montrer que pour n grand les v.a. Nα−npα√npα
sont proches de gaussiennes centrees, reduites ; on pose
alors χ2exp =
∑sα=1
(nα−npα)2
npα. (Ici le nombre de degres de liberte est r = s−1 car les Nα sont relies
par la contrainte∑αNα = n.)
� Loi et test de χ2
Apres avoir obtenu une estimation se pose toujours le probleme du “degre de confiance”dans cette estimation qui n’est qu’une realisation de l’estimateur. C’est la qu’intervientla loi du χ2 a r degres de liberte : loi de la v.a. Z =
∑ri=1 G
2i ou les v.a. Gi sont des
gaussiennes centrees reduites independantes. Les tables de χ2 donne la valeur χ2p telle que
P ({Z < χ2p}) = p pour p = 0, 5, 0, 90, 0, 95 . . . Le test du χ2 consiste alors a se donner
une valeur de p (proche de 1) a laquelle correspond une valeur χ2p, et a comparer cette
derniere au χ2exp ; le test est negatif si χ2
exp > χ2p (puisque la probabilite 1− p tres petite
de cette eventualite devrait pratiquement l’exclure). Si χ2exp < χ2
p le test est positif, cequi ne constitue pas une preuve de validite. Ce n’est qu’en satisfaisant simultanementplusieurs types de tests qu’une estimation devient de plus en plus plausible ; par exemple,il faut verifier aussi que < X4 > −3 < X2 >2� 0 pour une v.a. gaussienne centree.
REMARQUE. Une autre application importante est l’ajustement de donnees experimen-tales par la methode des moindres carres (cf. section 11.3.3).
10.3 Processus aleatoires 317
10.3 PROCESSUS ALEATOIRES
Considerons une particule brownienne dans un fluide situee en O a t = 0. Lors d’uneexperience ω1 son mouvement, du aux chocs avec les molecules du fluide, est decritpar une fonction “ordinaire” r1(t) ; dans une autre experience ω2 la trajectoire r2(t)est differente. Ces fonctions sont des realisations d’une fonction aleatoire
−→R (t). En
general on ne s’interesse pas a la trajectoire entiere, mais on cherche a savoir si il existedes correlations entre les positions a des instants differents, comment se comporte ledeplacement
−→R (t2)−−→
R (t1), etc. Ce sont donc les v.a.−→R (t1),
−→R (t2) · · · −→R (tn) (t1, t2 . . . tn
etant des parametres) qu’on etudie, et en pratique on se limite aux familles a un etdeux instants qui caracterisent en general assez bien le processus. On commence ici parconsiderer la marche au hasard qui est plus simple que le mouvement brownien et peutservir d’introduction aux autres processus etudies par la suite.
10.3.1 Marche aleatoire ; processus de diffusion ;mouvement brownien
� Modelisations de la diffusion ; bruit blanc
Considerons un marcheur qui, partant de l’origine O a t = 0, se deplace sur une droite eneffectuant aux instants 0, τ, 2τ · · ·nτ · · · des pas independants ±l avec la meme probabi-
lite (de transition)12. Sa position X(t) est une somme de v.a. independantes, centrees et
de variance l2 d’ou :
< X(t) >= 0 ; < (X(t))2 >= nl2 = 2Dt (t = nτ) .
D est le coefficient de diffusion defini par 2D =l2
τ= V l. Ces resultats restent valables
quelle que soit la loi des pas pourvu qu’elle soit de moyenne nulle et de variance l2 ; l etV sont des libre parcours moyen et vitesse typiques.
Un processus de diffusion correspond a la limite continue ou τ et l tendent vers zero,D restant fixe. Il peut aussi etre considere comme une “vision a grande echelle” de la
marche aleatoire. Si τ = ε le nombre de pas n =t
εeffectues dans l’intervalle [0, t] tend
vers l’infini lorsque ε → 0, et (cf. section 10.2.1) X(t) devient une v.a. gaussienne. Savariance etant 2Dt et sa moyenne nulle, sa densite s’ecrit :
PX(x, t) =1√
4πDtexp− x2
4Dt;
elle verifie l’E.D.P. de diffusion (cf. section 8.2.2) ∂tP = D∂2xP pour t > 0. La densite
de probabilite conditionnelle de X(t2) sachant que X(t1) = x1 (t2 > t1 > 0) s’appelleprobabilite de transition du processus notee Pt2,t1(x2 / x1) ; son expression
Pt2,t1(x2 / x1) =(4πD(t2 − t1)
)− 12 exp− (x2 − x1)2
4D(t2 − t1)
se deduit de celle de PX(x, t) en remplacant l’intervalle [0, t] par [t1, t2] et x par (x2−x1).Plus generalement les deplacements X(t2)−X(t1) sont des v.a. gaussiennes centrees, de
318 10 • Probabilites ; processus aleatoires
variance 2D(t2 − t1), et qui sont independantes si les intervalles [t1, t2] ne se recouvrentpas.
REMARQUE. Si t2 − t1 = dt est infinitesimal on peut poser X(t2) − X(t1) = dX(t). Les physiciens
appellent bruit blanc (gaussien) le “processus limite” defini par :
B(t) = limdt→0dX(t)
dt.
Il verifie < B(t) >= 0 et < B(t)B(t′) >= 0 pour t �= t′ (independance des deplacements dX(t) et
dX(t′)). Comme la variance de (t2−t1)−1 (X(t2) −X(t1)) vaut 2D(t2−t1)−1 on voit que < B(t)B(t′) >est singulier pour t = t′. On justifie l’expression < B(t)B(t′) >= 2D δ(t − t′) en remarquant que cela
redonne bien :<
(X(t)
)2>=
∫ t0
∫ t0 < B(t′)B(t′′) > dt′ dt′′ = 2Dt .
Autre modelisation. Considerons une chaıne d’atomes et un electron pouvant sauterd’un atome vers les deux atomes voisins distants de a avec une egale probabilite λdtdans l’intervalle [t, t+ dt]. Alors si P (x, t) est sa probabilite de presence a l’abscisse x al’instant t, on a (cf. p(A) =
∑i p(A/Bi) p(Bi))
P (x, t+ dt) =(P (x+ a, t) + P (x− a, t)
)λdt+ P (x, t) (1 − 2λdt) ,
ce qui donne l’equation maıtresse ∂tP (x, t) =(P (x+a, t)+P (x−a, t)−2P (x, t)
)λ. Dans
la limite continue a→ 0 , λ→∞ et λa2 = D, on retrouve l’equation ∂tP = D∂2xP .
� E.D.P. de Fokker-Planck
Ce modele se generalise en considerant des probabilites de transition par unite de tempsde x vers x±a asymetriques et inhomogenes de la forme λ±ε(x). Ceci conduit aux termessupplementaires −P (x + a, t) ε(x + a) + P (x − a, t) ε(x − a) et, dans la limite continueavec A(x) = 2aε(x) fixe, a l’equation :
∂P (x, t)∂t
= − ∂
∂x(A(x)P (x, t)) +D
∂2P (x, t)∂x2
.
A(x) est la vitesse de derive associee au deplacement moyen
a(λ+ ε(x)) dt− a(λ− ε(x)) dt = A(x) dt
dans le temps dt. Si A = 0 l’equation decrit de la diffusion pure. Si D = 0 l’equation∂tP (x, t) + ∂x (A(x)P (x, t)) = 0 decrit l’evolution temporelle d’une densite de points surune droite lorsque x = A(x) (systeme deterministe ; cf. section 8.2.3).
� Equation de Langevin a une dimension : mV + αV = F (t)
Elle decrit le mouvement brownien d’une particule dans un fluide en supposant que la force due
aux chocs avec les molecules du fluide se separe en un effet moyen de friction αV et une force F (t) de
moyenne nulle, independante de la position X(t) et de la vitesse V (t) de la particule et de type bruit
blanc gaussien. Pour un petit intervalle de temps Δt, la variation de vitesse ΔV contient une partie
“derive” −αm−1 V Δt (qui empeche la vitesse de devenir trop grande) et une partie “diffusion” telle
que < (ΔV )2 >= m−2 <(∫ Δt
0 F (t′) dt′)2
>= 2DV Δt en appelant DV le coefficient de diffusion dans
l’espace des vitesses ; (si α etait nul < V 2(t) > tendrait vers l’infini avec t). La densite P (v, t) obeit donc
a l’equation :∂tP = ∂v
(αmv P
)+DV ∂2
vP .
10.3 Processus aleatoires 319
Sa valeur d’equilibre Peq ∝ exp −αv22mD
V(telle que ∂tPeq = 0) correspond a la loi de Boltzmann si
m2DV = αkBT . Il existe donc une relation entre les fluctuations de F (t) (force due aux chocs pour
V = 0), le coefficient de friction α (caracterisant la reponse lineaire des molecules a un mouvement de
la particule) et la temperature T . On obtient la diffusion en position X en ecrivant :
m−1α< XV >= m−1< XF > − < XV >= − < XV >=< V 2 > − ddt< XV > .
On en deduit que pour t � mα
on a α< XV >� m< V 2 >= kBT et, comme ddt< X2 >= 2 < XV >,
il vient :< X2(t) >� 2Dt avec D =
kBT
α(relation d’Einstein) .
10.3.2 Processus de Markov ; probabilites de transition ; bilan detaille
� Definition
Ce sont des processus aleatoires tels que la connaissance de la valeur de X(t) a un instantt0 resume tout le passe, c.a.d. determine la loi de probabilite de X(t) pour t > t0. Leprocessus de diffusion (pour X(t)), de Langevin (pour V (t)), de meme que la marche auhasard en sont des exemples (avec respectivement t continu et t discret). Si les valeursprises par le processus sont discretes, celui-ci est determine par les probabilites detransition Pt,t0(x/x0) donnant la probabilite (conditionnelle) pour queX(t) = x sachantque X(t0) = x0 ; elles deviennent des densites si les valeurs x sont continues. Comme onpeut passer de x0 a x en transitant par une valeur quelconque y a un instant intermediaireτ , ces probabilites verifient
Pt,t0(x/x0) =∑y
Pt,τ (x/y)Pτ,t0(y/x0)
(relation analogue a celle Ft,t0 = Ft,τ ◦ Fτ,t0 ecrite a la section 6.1.1. pour les systemesdynamiques, mais ici avec τ ∈ [t0, t]).
� Chaınes de Markov ; bilan detaille
Il s’agit de processus a temps discret (tn = nτ) ou le systeme peut transiter d’un etat jvers un etat i avec la probabilite constante Pij (
∑i Pij = 1). Si le nombre d’etats est fini,
la probabilite pi(n+ 1) d’etre dans l’etat i a l’instant (n+ 1)τ est reliee aux probabilitespj(n) d’etre dans un etat j a l’instant precedent nτ par :
pi(n+ 1) =∑j
Pij pj(n) ou sous forme matricielle p (n+ 1) = P p (n) .
L’exemple le plus simple de matrice de transition est P =(
a 1 − b1 − a b
)(avec
a, b ∈ [0, 1]) ; elle correspond a un systeme a deux etats.
Proprietes des matrices P.1) Les valeurs propres verifient |λ| ≤ 1 ; en effet, si v est un vecteur propre on a |λ| |vi| = |∑j Pij vj | ≤∑j Pij |vj |, et en sommant sur i on obtient le resultat.
320 10 • Probabilites ; processus aleatoires
2) Si la matrice est symetrique les valeurs propres sont reelles. La valeur propre -1 est exceptionnelle
(pour la matrice 2 × 2 ci-dessus il faudrait a = b = 0, cas d’une transition certaine). La valeur propre
1 correspond au vecteur propre dont les composantes sont egales ; elle est en general non degeneree. En
effet, de vi =∑j Pij vj =
∑j Pji vi, on deduit
∑j Pij(vj − vi) = 0 pour tout i (car
∑j Pji = 1 et
Pji = Pij) ; ceci implique l’egalite des composantes car si il en existait une, vi, plus petite que les autres,
l’egalite ci-dessus serait violee (en supposant que les Pij ne sont pas nuls).
3) Sauf exception, la matrice P−1 n’est pas une matrice de transition ; (pour la matrice 2×2 ci-dessus il
faudrait soit a = b = 1 soit a = b = 0). Les processus de Markov decrivent en general des phenomenes
irreversibles.
Microreversibilite et distribution microcanonique. En mecanique quantique les probabilites de
transition entre etats sont symetriques (cf. section 4.4.2) : Pij = Pji. Si on considere pour i, j · · · les
etats microscopiques d’un systeme macroscopique isole (point de vue microcanonique), on deduit des
proprietes de la matrice P qu’il y a une seule distribution d’equilibre qui est la distribution uniforme
ou tous les etats sont equiprobables. Toute distribution initiale tend vers elle. En effet en decomposant
l’etat initial p(0) sur les vecteurs propres de P, on voit que, au cours de l’evolution, seule sa composante
sur le vecteur propre peq correspondant a la valeur propre λ = 1 va subsister : p(n) = Pn p(0) → peq
quand n → ∞ (car les autres valeurs propres verifient |λ| < 1).
On dit qu’une distribution d’equilibre (definie par Ppeq = peq) obeit a la relation debilan detaille si il y a autant de transitions de i vers j que de j vers i : Pji p
eqi = Pij p
eqj
(cf. exemple ci-dessous et section 11.5). Cette relation qui correspond a l’absence decourant dans l’espace des etats (figure 11a) n’est pas a priori necessaire pour peq (figure11b).
2
1 1
2 3
(a) (b)3
Figure 11
� Equation maıtresse
Si le temps est continu, on introduit des probabilites de transition par unite de tempswij . L’equation maıtresse satisfaite par les probabilites de presence pi(t) s’obtientintuitivement en faisant le“ bilan des arrivees et des departs” :
pi(t) =∑j
wij pj(t) −∑j
wji pi(t) .
On peut la considerer comme limite continue de l’equation pi(n + 1) =∑
j Pij pj(n)d’une chaıne de Markov. Un etat d’equilibre correspond a peq = 0 et la condition debilan detaille s’ecrit wji p
eqi = wij p
eqj .
10.3 Processus aleatoires 321
EXEMPLE : coefficients d’Einstein. Pour decrire un atome a deux niveaux (leniveau 2 etant le niveau excite) en equilibre avec le rayonnement thermique a latemperature T (β = (kBT )−1), Einstein a pose w12 = A(ν) + B12(ν)u(ν, β) et w21 =B21(ν)u(ν, β) ou u(ν, β) est la densite volumique spectrale d’energie, B12 et A sontrespectivement associes aux emissions induite et spontanee et B21 a l’absorption (cf.cours de physique). En ecrivant la relation de bilan detaille w12 e
−βε2 = w21 e−βε1 (avec
ε2 − ε1 = hν), et en comparant u(ν, β) =A(ν)
B21(ν) eβhν −B12(ν)avec la loi de Planck
(cf. section 10.2.3), il en a deduit l’egalite B12 = B21 et l’expression du rapportA
B12.
Remarque. Le bilan detaille est en fait une consequence de la relation w12w21
= <n>+1<n>
deduite de la
quantification du champ electromagnetique (cf. section 4.4.3), et dans laquelle le nombre n de photons
a ete remplace par sa moyenne < n >= (eβhν − 1)−1 (cf. section 10.2.3).
10.3.3 Processus stationnaires ; theoreme de Wiener-Khintchine ;ergodicite
� Definitions
Un processus est stationnaire si ses proprietes statistiques ne dependent pas du choixde l’origine des temps. Pour le decrire on se limite en general a sa moyenne (constante,prise egale a zero dans la suite) et sa fonction de correlation definie par :
Γ(τ) =< X(t)X(t+ τ) > .
Elle verifie Γ(τ) = Γ(−τ) (changement t → t − τ) et Γ(0) ≥ |Γ(τ)| (consequence de< |X(t+τ)+λX(t)|2 >≥ 0 quel que soit λ). En general Γ(τ) fait intervenir un temps decorrelation (ou de coherence) τc au dela duquel X(t) et X(t+ τ) ne sont quasiment pluscorreles ; τc est nul pour un bruit blanc car alors Γ(τ) ∝ δ(τ) (cf. section 10.3.1). Parmiles processus stationnaires frequemment rencontres figurent les processus gaussienspour lesquels toute famille de v.a. X(t1), X(t2) · · ·X(tn) est gaussienne, et qui sont doncentierement caracterises par Γ(τ), et les processus poissonniens tels que X(t) changede maniere aleatoire aux instants Ti definis a la section 10.2.2 .
EXEMPLE 1. Signal lumineux emis par un atome soumis a des chocs dans un gaz(figure 10b) :
X(t) = a exp−i(2πν0t+ Φ(t))
ou Φ(t), v.a. equirepartie sur [0, 2π], change aux instants Ti. Si entre t1 et t2 aucun chocne s’est produit (evenement A), on a Φ(t2) = Φ(t1) ; si au moins un choc s’est produitdans cet intervalle (evenement A), Φ(t1) et Φ(t2) sont independantes. En ecrivant
< Xt1 Xt2 > =< Xt1 Xt2/A > P (A)+ < Xt1 Xt2/A > P (A)
= |a|2 exp−2iπν0(t2 − t1)P (A) + 0 × P (A)
avec P (A) = exp−λ|t2 − t1| (cf. section 10.1.2), on obtient la fonction de correlation :
Γ(τ) =< Xt1 Xt2 >= |a|2 exp−2iπν0 τ exp−λ|τ | .
322 10 • Probabilites ; processus aleatoires
EXEMPLE 2. La vitesse du mouvement brownien, donnee par V (t) =∫ t−∞ exp− α
m(t−s) F (s)
mds,
est une v.a. gaussienne car somme de v.a. gaussiennes. De < F (s)F (s′) >= 2DVm2 δ(s−s′), on deduit
(petit calcul) < V (t1)V (t2) >= DVmα
exp− αm|τ | = Γ(τ), avec τ = t2 − t1 (cf. aussi section 5.3.3).
� Theoreme de Wiener-Khintchine
La transformee de Fourier (tronquee) XT (ν) =∫ T
2
−T2
e−i2πνtX(t) dt verifie pour T � τc :
1T< XT (ν′) XT (ν) > =
1T
∫ T2
−T2
e−i2πντ Γ(τ) dτ∫ T
2
−T2
e−i2π(ν′−ν)t dt
� Γ(ν) sincπ(ν′ − ν)T .
DEMONSTRATION : on fait le changement de variable t′ = t+ τ dans∫ T
2
−T2
∫ T2
−T2ei2πνt
e−i2πν′t′ < X(t)X(t′) > dt dt′.
Pour ν = ν′ le sinus cardinal vaut 1 et on obtient le theoreme :
Γ(ν) = limT→∞
T−1 < |XT (ν)|2 > .
Ce resultat est semblable a celui etabli a la section 5.3.3 pour la densite spectrale depuissance d’un signal chaotique stationnaire. Pour l’exemple 1 ci-dessus Γ(ν) ∝ (
4π2(ν−ν0)2 + λ2
)−1 : les chocs conduisent a un profil de raie lorentzien.
Pour ν �= ν′ et T grand le sinus cardinal vaut zero ; on interprete ce resultat commel’absence de correlation entre les composantes de Fourier d’un signal stationnaire.
� Ergodicite
Une question importante dans la pratique est de savoir si les moyennes statistiques < · · · > relatives a un
processus stationnaireX(t) peuvent etre remplacees par les moyennes temporelles limT→∞ 1T
∫ T2
− T2
(· · · ) dt
relatives a une realisation “typique” x(t) = X(t, ω) du processus. Un processus pour lequel ceci est pos-
sible est dit ergodique et on doit avoir en particulier :
< X(t) >= limT→∞ 1T
∫ T2
− T2x(t′) dt′ ; < X(t)X(t+ τ) >= limT→∞ 1
T
∫ T2
− T2x(t′)x(t′ + τ) dt′ .
Pour que, par exemple, l’egalite relative a la moyenne soit satisfaite il est necessaire que, dans la limite
T → ∞, la v.a. Y = 1T
∫ T2
− T2X(t) dt devienne sure, c.a.d. que σY tende vers zero ; de σ2
Y = 1T2 ×∫ T
2− T
2
∫ T2
− T2< X(t)X(t′) > dtdt′ = 1
T
∫ T2
− T2
Γ(τ) dτ (calcul identique au precedent), on deduit que ceci
est satisfait notamment si Γ(τ) → 0 quand τ → ∞ (cas des exemples ci-dessus). Plus generalement
les “processus a perte de memoire”, tels que les v.a. X(t) et X(t′) deviennent independantes pour
|t′ − t| fini, sont des exemples de processus ergodiques.
Chapitre 11
Analyse numerique ; physiquediscrete
L’etude numerique d’un probleme physique se deroule schematiquement en trois etapes.La premiere concerne sa formalisation mathematique ; les dix premiers chapitres de celivre y ont ete consacres, l’accent etant mis sur l’importance des concepts mathematiques.La seconde concerne l’elaboration d’un modele numerique “sense mimer au mieux” lemodele mathematique ; elle releve de l’analyse numerique abordee ici en raison de sonimportance de plus en plus grande en physique. Enfin la derniere concerne la mise enœuvre sur l’ordinateur de la methode precedente ; c’est la phase de programmation, situeehors du champ de cet ouvrage.
Une fois formalise, par exemple sous la forme d’une equation differentielle (E.D.), unprobleme physique n’est pas pour autant resolu. Meme si la solution analytique del’equation est connue, le physicien est interesse non seulement par les valeurs prises parcette solution en fonction de la variable, mais aussi en fonction des conditions initiales(C.I.) (ou aux limites (C.L.)), des parametres de l’equation ... Se posent alors de nom-breux problemes numeriques, tel que celui du choix, crucial, du pas de discretisation (dela variable, des parametres ...) qui conditionne la pertinence et la precision d’un calcul,ou tel que l’interpolation pour le trace de graphes.
Mais tres souvent le probleme physique n’a pas de solution explicite, par exemple s’ilconduit a une E.D. lineaire a coefficients variables ou a une E.D. non lineaire. Le recoursau numerique est alors indispensable ; il implique, pour ces exemples, la discretisationdes operations de derivation et donc la transformation d’un systeme dynamique (S.D.)continu en un S.D. discret. La verification que ce dernier constitue une bonne approxi-mation du S.D. continu est un probleme important et non trivial, souvent facilite par laconnaissance prealable (physique et mathematique) des proprietes qualitatives de la so-lution. Sous reserve de cette verification la simulation du probleme physique permet une“experimentation numerique” y compris dans des domaines de parametres non accessiblesa l’experimentation physique. Inversement, l’etude a priori de modeles numeriques peutaider a la comprehension et a la formalisation mathematique de problemes physiques.
324 11 • Analyse numerique ; physique discrete
Les methodes d’analyse numerique ne concernent evidemment pas que les E.D. (ou lesE.D.P.). La physique lineaire, l’analyse des signaux, la formulation de solutions physiquesen terme d’extremum, ainsi que la physique statistique y font largement appel. Inverse-ment, les methodes numeriques peuvent s’inspirer des outils theoriques developpes dansces secteurs (cf. ci-apres, section 11.2.3, la methode de Lax dans laquelle on ajoute destermes diffusifs a certains schemas numeriques pour les rendre stables ou, section 11.5.2,la methode du recuit simule qui utilise la loi de Boltzmann pour trouver le minimumprincipal d’une fonction en evitant de rester “piege” dans un minimum secondaire).
Compte tenu de l’etendue du sujet nous nous contentons dans ce chapitre de decrirequelques methodes numeriques parmi les plus utiles aux physiciens, en precisant leurslimites (stabilite, precision ...) et en donnant une idee de leurs applications.
11.1 DISCRETISATION
11.1.1 Representation des nombres ; erreurs ; stabilite numerique
� Representation des nombres
Dans un ordinateur les nombres sont representes en binaire (suite de 0 et de 1) dans unformat dont la longueur depend du nombre de bits utilises (32 en simple precision et 64en double precision). Dans la representation a point flottant un nombre s’ecrit
±M 2e−q avec12≤M < 1 .
M est la mantisse, e l’exposant et q un nombre fixe (decallage d’exposant).
×︸︷︷︸ ××××××××︸ ︷︷ ︸ (1) ×××××××××××××××××××××××︸ ︷︷ ︸signe exposant e mantisse M
En simple precision le premier des 32 bits specifie le signe (0 pour + et 1 pour -) ; les huitbits suivants codent l’exposant e compris entre 0 et 28 − 1 = 255, l’exposant total e− qvariant de -126 a 129 (q = 126) ; enfin les 23 bits restants (en fait 24 car la condition12 ≤ M entraıne que le premier bit de M est toujours egal a 1 et est sous-entendu danscette representation) codent la mantisse comprise entre 1
2 et 1 − 2−24. Il en resulte quele domaine des nombres x representables est
2−127 � 5, 9 10−39 ≤ x ≤ 2129(1 − 2−24) � 6, 8 1038 .
Mais il est important de remarquer que tous les nombres de ce domaine ne peuventpas etre representes exactement (par exemple 1
3 dont la mantisse devrait etre la suiteperiodique infinie 101010...).
� Nombres en physique (rappel)
De tres grands et de tres petits nombres peuvent apparaıtre en physique. Cependant lesvaleurs des grandeurs physiques sont toujours relatives a un systeme d’unites. Avant derentrer des valeurs dans l’ordinateur il est donc important d’effectuer une analyse dimen-sionnelle et d’ordre de grandeur du probleme afin de mettre en evidence des nombres
11.1 Discretisation 325
sans dimension, d’eventuelles proprietes d’echelle (cf. section 1.3.2)... puis de choisir desunites adaptees. (Par exemple � � 10−34 J.s et m � 10−30 kg disparaissent de l’E.D.P. deSchrodinger pour un electron dans un potentiel V (r), de valeur typique V0, si les unitesde temps et de longueur sont prises egales a �V −1
0 et � (2mV0)−12 .)
� Erreurs d’arrondi et de troncature
Le fait que la mantisse ne comporte qu’un nombre fini de bits entraıne des erreurs d’ar-rondi dans la representation des nombres et lors des operations (additions, multiplica-tions...). En simple precision, les deux plus petits nombres positifs representables 1
22−q et(12 + 2−24
)2−q sont separes de 2δx = 2−242−q. Il en resulte une erreur relative d’arrondi
ε =δx
x= 2−24 = 6 . 10−8 .
(En double precision le plus petit nombre representable est 10−308 et l’erreur relatived’arrondi vaut 10−16.)Une autre source d’erreur, a priori independante de la precedente, est l’erreur de tronca-ture liee a l’utilisation de schemas avec un pas h de discretisation fini. Regardons sur unexemple comment les deux types d’erreurs interviennent sur la precision d’un resultat.
EXEMPLE. Si on calcule la derivee d’une fonction par
f ′(x) = h−1(f(x+ h) − f(x)
)ou f ′(x) = (2h)−1
(f(x+ h) − f(x− h)
),
l’erreur de troncature, estimee par un developpement de Taylor, se comporte commeh |f ′′| (ordre 1) ou h2 |f ′′′| (ordre 2) ; elle diminue avec h. L’ordre de grandeur de l’erreurd’arrondi est dans les deux cas ε×h−1|f | (etant entendu que h est toujours representeexactement) ; elle croit avec h−1. La somme est minimale pour une valeur de h optimale
hopt =[ε |f ||f ′′|
] 12
ou hopt =[ε |f ||f ′′′|
] 13
et vaut√εΔ ou ε
13 Δ, ou Δ � |f |
|f ′| � |f ′||f ′′| � |f ′′|
|f ′′′|est une longueur typique sur laquelle f et ses derivees varient (cf. chap. 5, figure3). Pour cette valeur optimale l’erreur relative sur f ′ se comporte donc comme
√ε
ou ε23 . On remarque qu’elle peut etre nettement plus grande que ε (par exemple de
quatre ordres de grandeur si on compare√ε a ε pour ε = 10−8). On remarque aussi
que cette erreur s’approche de ε quand l’ordre de l’erreur de troncature (puissance enh) augmente. On verra comment augmenter cet ordre tout en partant d’un schemanumerique d’ordre bas (extrapolation de Richardson).
� Stabilite d’un schema numerique
Un autre probleme relatif aux erreurs, auquel il faut veiller, concerne leur evolution dansun schema recurrent. Celui-ci peut les amplifier, auquel cas il est dit instable. Ceci n’estpas grave si le schema numerique est precis et le nombre d’iterations limite, mais est engeneral a eviter. Un exemple elementaire (generalise plus loin aux E.D. et aux E.D.P.)est le calcul des puissances un = xn du nombre x =
√5−12 . Comme x2 + x − 1 = 0 on
peut utiliser la recurrence un+1 = un−1 − un avec u0 = 1 et u1 = 0, 680... = x (a laprecision de la machine). Une erreur se propage alors selon la regle δun+1 = δun−1− δun
326 11 • Analyse numerique ; physique discrete
qui admet pour solution generale δun = αxn + β(−x)−n (cf. section 8.1.1). L’erreur estdonc amplifiee a chaque pas : elle evolue comme x−n avec x < 1. En simple precisionδun devient de l’ordre de un vers n � 16 (alors que x16 � 10−4).
11.1.2 Derivation et integration ; extrapolation de Richardson
� Derivation
On considere des fonctions f(t), une discretisation de pas tn+1 − tn = h constant eton pose f(tn) = fn. Les approximations les plus simples (dites “avant”, “arriere” et“centree”) de la derivee premiere f ′(tn) sont :
f ′n+ =
fn+1 − fnh
, f ′n− =
fn − fn−1
h, f ′
n0 =fn+1 − fn−1
2h.
Elles correspondent aux pentes des segments BC, AB et AC sur la figure 1 et sontrespectivement d’ordre 1, 1 et 2 (erreurs en h, h et h2) ; par exemple |f ′
n+ − f ′(tn)| ≤h
2supt|f ′′(t)|, avec t ∈ [tn, tn+1]. La premiere approximation de la derivee seconde
f ′′(tn) est f ′′n =
fn+1 − 2fn + fn−1
h2(cf. sections 6.3 et 8.1.2).
REMARQUE. En dimension 2, le laplacien(∂2x + ∂2
y
)f(x, y) d’une fonction f(x, y),
discretisee selon f(x0 + jh, y0 + kh) = fj,k, est represente par :
Δfj,k = h−2(fj+1,k + fj−1,k + fj,k+1 + fj,k−1 − 4fj,k
).
tn tn+htn
nf +1
nfnf −1
f ’n0h
h2
2nf"
f ’n+h
f’n−h
C
BA
f(t)
−h
Figure 1
fn+1fn
n+1tt n t n n+1t
f(t)
(b)
t n n+1t
f(t)
(c)n+1tt n
f(t)
(d)
f(t)
(a)
Figure 2
� Integration
L’integrale de f(t) entre tn et tn+1 peut, par exemple, etre approchee par :
h fn , h fn+1 , h f( tn + tn+1
2
), h
fn + fn+1
2.
Ces approximations, qui sont respectivement dites methode du rectangle a gauche, durectangle a droite, du point milieu et du trapeze, sont illustrees sur la figure 2.
11.1 Discretisation 327
Les erreurs correspondantes sont bornees par h2 sup |f ′′| pour (a) et (b),h3
4sup |f ′′′| pour
(c) eth3
12sup |f ′′′| pour (d). Pour un intervalle fini Δt compose de N sous intervalles de
longueur h =ΔtN
, les erreurs dependent donc de N comme N−1 (N−2 × N) pour les
methodes des rectangles et N−2 (N−3 × N) pour celles du point milieu et du trapeze.Par exemple pour le trapeze :
S =∫ t+Δt=tN
t=t0
f(t) dt =ΔtN
(f02
+ f1 + · · · + fN−1 +fN2
)+ O
( 1N2
).
L’interet de cette methode est qu’on peut montrer que l’erreur est une fontion paire deh, donc du type AN−2 + BN−4 + · · · en fonction du nombre de pas. Donc si SN est
la valeur approchee de l’integrale pour N pas (N pair), et SN/2 celle pourN
2pas, on a
SN = S +AN−2 + · · · , SN/2 = S + 4AN−2 + · · · et :
43SN − 1
3SN/2 = S + O
( 1N4
).
Donc, sans diminuer h mais en tenant compte de la valeur approchee pour 2h, on aameliore l’estimation de S de 2 ordres ! Cette technique d’amelioration de la precision,basee sur la dependance en N (donc en h) de SN , est un cas particulier de l’approche deRichardson de la valeur limite ; cette technique, qui peut s’appliquer a de nombreuxproblemes, consiste a utiliser les resultats obtenus pour differents pas (h, 2h,...) pourapprocher, par extrapolation, la valeur exacte associee a la valeur limite h = 0.
11.1.3 Nombres aleatoires ; methode de Monte-Carlo
� Generateurs de nombres aleatoires
Dans les ordinateurs, les entiers aleatoires repartis de facon equiprobable entre 0 et ungrand entier m − 1, sont engendres (pour les generateurs les plus courants) en utilisantla methode de la congruence lineaire. Les entiers I1, I2, · · · sont alors obtenus, a partird’un entier quelconque I0 (le germe), par la recurrence :
In+1 = aIn + c modulo m .
(Il existe des valeurs optimum pour a et c qui dependent de celle de m.) Une telle suiteetant periodique de periodem, on voudrait pouvoir prendre pour m le plus grand nombrerepresentable par la machine mais la multiplication par a conduit a des “overflows”. (Ensimple precision on ne peut pas depasser m � 106, nombre “petit”, mais l’utilisation d’ungenerateur faisant intervenir successivement plusieurs germes differents permet d’allongerla periode.)
On engendre les lois courantes de probabilite en considerant des fonctions des In. Pour
la loi uniforme sur [0, 1], on utilise la suite xn =Inm
. Pour la loi exponentielle, on
utilise la suite yn = −λ−1 ln(xn) ; en effet, de p(y) dy = p(x)∣∣∣dxdy
∣∣∣dy (cf. section 10.1.2)
on deduit p(y) = λ exp[−λy]. Pour la loi gaussienne de moyenne μ et de variance σ2,on utilise la suite yn = μ+
√−2σ2 lnxn cos 2πxn+1.
328 11 • Analyse numerique ; physique discrete
DEMONSTRATION. Soient x et x′ deux v.a. equireparties sur [0, 1] et y =√−2σ2 lnx′ cos 2πx,
y′ =√−2σ2 lnx′ sin 2πx (alors x = 1
2πarctan y
′y
et x′ = exp[− 1
2σ2 (y2 + y′2)]). De p(y, y′) dy dy′ =
p(x, x′)∣∣ ∂(x,x′)∂(y,y′)
∣∣ dy dy′, on deduit p(y, y′) =∣∣ ∂(x,x′)∂(y,y′)
∣∣ = 1√2π
exp[− 1
2σ2 y2]
1√2π
exp[− 1
2σ2 y′2]
. Donc y
et y′ sont deux v.a. gaussiennes independantes de moyenne nulle et de variance σ2 ; il suffit alors de
poser x′ = xn, x = xn+1 et y + μ = yn.
Pour une loi quelconque p(x), une methode generale est la methode de rejet (cf. remarqueci-dessous).
� Integration par la methode de Monte-Carlo
fmax
π/2 π/2
a cos θ
x0a b
f(x)b
0(b)(a)
−
achevauchementlancer avec
chevauchementlancer sans
Figure 3
Le calcul de I =∫ ba f(x) dx (f(x) > 0) par la methode de Monte-Carlo consiste a tirer
N points au hasard a l’interieur d’un rectangle d’aire A = (b − a)fmax qui contient legraphe ; les coordonnees xi et yi des points sont des v.a. equireparties sur [a, b] et [0, fmax](figure 3a). I est alors estimee par l’aire A multipliee par la fraction de points qui sont“tombes” en dessous de la courbe ; l’erreur se comporte comme N− 1
2 .
REMARQUE. Methode de rejet. Si f(x) est une loi de probabilite sur [a, b], les coor-donnees xi des points conserves sont distribuees selon cette loi.
EXEMPLE historique : aiguille de Buffon. La determination “experimentale” de π en jetant N fois
“au hasard” une aiguille de longueur a sur un parquet dont les lames ont une largeur b > a, et en
comptant la proportion des cas ou l’aiguille chevauche deux lames, revient a calculer l’aire sous la
courbe representee sur la figure 3b par la methode de Monte-Carlo (reflexion laissee au lecteur qui
montrera que la probabilite de chevauchement vaut 2aπb
).
La methode d’integration de Monte-Carlo se generalise a d dimensions. En dimension 1 cen’est pas la plus performante, meme dans des versions plus elaborees que celle presenteeci-dessus (Monte-Carlo adaptatif qui utilise des echantillons aleatoires non uniformementrepartis par exemple). Par contre c’est la plus efficace pour le calcul d’integrales multipleslorsque le domaine d’integration a une forme compliquee ou (et) en grande dimension.
11.2 RESOLUTION NUMERIQUE D’E.D. ET D’E.D.P.
11.2.1 Systemes dynamiques ; schemas d’Euler et de Runge Kutta
Rappelons que toute E.D. ou systeme d’E.D. d’ordre quelconque se ramene a un systemed’ordre 1 pour n fonctions (cf. section 6.1). Pour simplifier on considere le cas n = 1 :
x(t) = f(x(t), t) , x(0) = x0 .
11.2 Resolution numerique d’E.D. et d’E.D.P. 329
Le temps etant suppose discretise de facon reguliere dans un certain domaine, on pose :
xn = x(tn) , fn = f(x(tn), tn) avec tn+1 − tn = h .
La resolution numerique du S.D. consiste a exprimer xn+1 en fonction des valeurs connuesxn−k (k ≥ 0).
� Schemas principaux
Les methodes les plus simples sont les schemas d’Euler
xn+1 = xn + hfn ou xn+1 = xn + hfn+1
qui correspondent a l’integration de f(x(t), t) par les methodes du rectangle. Ce sontdes schemas d’ordre 1 (une schema d’integration etant d’ordre n si l’erreur tend vers 0comme hn+1). Le premier est explicite (xn+1 n’apparaıt pas dans le membre de droite).Le second est implicite et demande en general la resolution d’une equation a chaquepas (par la methode de Newton-Raphson par exemple). Les deux ont ete combines pourl’obtention graphique de trajectoires solutions de −→r =
−→F (−→r ) a partir de −→r n+1 = −→r n +
h−→v n, −→v n = −→v n−1+h−→F n (cf. section 6.3, figures 16 ou h = 1). Un autre schema implicite
est celui de Crank-Nicolsonxn+1 = xn +
h
2(fn + fn+1) (ordre 2)
qui correspond a l’integration de f par la methode du trapeze.
Schemas implicites et explicites sont souvent combines dans des methodes dites de predicteur-correc-
teur. Ainsi celui d’Euler explicite xn+1 = xn + hfn peut servir a fournir une valeur de xn+1 pour le
membre de droite de l’equation de Cranck-Nicholson. Si on se limite a la premiere iteration on obtient
la formule de Runge-Kutta d’ordre 2 (R.K.2)
xn+1 = xn + h2
(f(xn, tn) + f(xn + hfn, tn + h)
)equivalente a xn+1 = xn + hf
(xn + 1
2hfn, tn + h
2
). Le schema R.K.2 donne donc xn+1 en estimant x
au point milieu, au lieu des points extremes comme les schemas d’Euler. (On notera que xn+1 obtenu
par le schema R.K.2 s’ecrit aussi xRn+1 = 12(xEn+1 + xEn+2) ou xEn+1 et xEn+2 sont obtenus a partir de xn
par le schema d’Euler explicite ; cf. figure 4 qui correspond a x = −x et h = 12.)
n+1x
xn
t n tn+1 t n+2
n+1x
xn+2
t
x
R
E
E
Figure 4
Crank−NicolsonEuler explicite
Euler implicite
Runge Kutta 2
1
−1
0
A
21 hλ
0.5
Figure 5
Un schema tres utilise parce que tres precis est celui de Runge-Kutta d’ordre 4 (er-
reur en h5) donne par xn+1 = xn +16(k1 + 2k2 + 2k3 + k4) avec k1 = hf(xn, tn),
k2 = hf(xn +
k1
2, tn +
h
2
), k3 = hf
(xn +
k2
2, tn +
h
2
)et k4 = hf(xn + k3, tn + h). Il
330 11 • Analyse numerique ; physique discrete
estime x en tn, tn + h et deux fois en tn + h2 .
Le lecteur verifiera qu’appliques au cas (trivial) x = −λx, les schemas d’Euler explicite,R.K.2 et R.K.4 donnent respectivement x(t + h) = (1 − λh)x(t), x(t + h) =
(1 − λh +
λ2h2
2
)x(t) et x(t+h) =
(1−λh+ λ2h2
2 − λ3h3
6 + λ4h4
24
)x(t) au lieu de x(t+h) = e−λhx(t).
� Stabilite et precision
L’etude de la stabilite de ces schemas consiste a estimer l’effet sur xn+1 d’une pertur-bation sur xn. Un schema est stable si δxn n’est pas amplifie ; cette condition s’ecrit :
|A| ≤ 1 avec A =δxn+1
δxn=∂xn+1
∂xn.
Par exemple pour l’equation x(t) = −λx(t) + g(t) on obtient δxn+1 = (1− λh) δxn pourEuler explicite. Ce schema est donc stable si λh ≤ 2. En calculant de meme A pour Eulerimplicite, Crank-Nicolson et R.K.2 le lecteur verifiera que les schemas implicites sontplus stables que les schemas explicites (figure 5). Un exemple d’instabilite est donneepar le schema leapfrog xn+1 = xn−1 − 2h(λxn + gn) (derivee centree) qui conduit aA2 + 2hλA− 1 = 0, soit a deux valeurs pour A dont une verifie |A| > 1 quel que soit h.
Precision. La condition de stabilite est necessaire au calcul mais elle ne garantit passa precision. Pour cela on sait qu’il faut que h soit nettement plus petit que le tempscaracteristique τ d’evolution de x(t) (l’erreur etant d’ordre (hτ−1)n+1 pour un schemad’ordre n). Par exemple pour x = −λx, τ = λ−1 et il faut λh � 1. Par contre, pourx(t) = −λx(t) + g(t), avec g lentement variable “a l’echelle λ−1” (temps caracteristiqueτg = Kλ−1 avec K � 1), il suffit que λh � K (en dehors du regime transitoire). Dansce dernier cas on a interet a choisir un schema stable pour des valeurs de λh grandesdevant 1 afin d’eviter des temps de calcul trop longs et l’accumulation d’erreurs.
Une facon de determiner h pour obtenir une precision donnee, quand celle-ci ne peut pas etre estimee
a priori, est la suivante. Soit x∗(t + 2h) la solution exacte deduite de x(t) et soient x2h et xh+h les
valeurs correspondantes donnees par le schema numerique pour un pas 2h (en une etape) et pour deux
iterations de pas h. Pour le schema R.K.4 par exemple, les erreurs sont x2h − x∗(t + 2h) = C (2h)5 et
xh+h − x∗(t + 2h) = 2C h5. La difference x2h − xh+h � C (2h)5 permet d’estimer C et donc l’erreur
Δ = C h5 a chaque pas h. On peut alors ajuster le pas h en cours de calcul pour atteindre la precision
requise : si Δ0 est cette precision il faut prendre un nouveau pas h0 = h( Δ0
Δ
) 15 .
11.2.2 E.D. avec conditions aux limites ; methode de tir
Considerons (cf. section 6.4) une E.D. lineaire du second ordre pour une fonction y(x)representant l’amplitude d’une onde stationnaire de pulsation ω. L’onde est definie surun intervalle [a, b] aux extremites duquel sont imposees des C.L. impliquant lineairementy et sa derivee. L’E.D. du second ordre se ramene a deux E.D. du premier ordre
dyi(x)dx
=∑j
aij(x, ω) yj(x) (i, j = 1, 2)
(avec par exemple y1 = y et y2 = y′). Celles-ci peuvent etre discretisees sous la forme
yn+1i − yni =
12(xn+1 − xn)
∑j
(anijynj + an+1
ij yn+1j ) (schema d’ordre 2)
11.2 Resolution numerique d’E.D. et d’E.D.P. 331
avec ynj = yj(xn), anij = aij(xn, ω) (n = 1, 2, · · ·N−1). Ce systeme de 2(N−1) equationslineaires s’ecrit matriciellement yn+1 = Any
n ou yn designe le vecteur colonne de com-posantes (yn1 , y
n2 ) et An une matrice 2× 2 jouant le role de matrice de transfert discrete.
Les C.L. s’ecrivent α1y1(a) + α2y2(a) = 0 et β1y1(b) + β2y2(b) = 0.
Dans une methode de tir (figure 6a ou y(a) = y(b) = 0) le principe consiste a sedonner (a un facteur λ pres) y(a) satisfaisant la C.L. en a puis a calculer, comme dansun probleme de C.I., y(b) par application de la matrice de transfert, la constante λetant determinee par une normalisation sur y(b) (par exemple y2(b) = 1 si la C.L. en b lepermet). On calcule alors la quantite Δ(ω) = β1y1(b)+β2y2(b), fonction de la pulsation ωqui doit etre nulle pour la solution. Avec une discretisation de ω, on repere les intervallesou Δ(ω) change de signe puis on applique dans chacun de ces intervalles une methodede recherche de zero (cf. section 11.3.2) pour obtenir les pulsations propres. Au lieu dea, la methode de tir peut partir de b ou de a et b simultanement (avec recollement desdeux solutions en un point intermediaire).
xxba ba
yy
(a) (b)
solution
0 0
Figure 6
Le choix entre ces diverses possibilites devient determinant si l’E.D. du second ordre est singuliere en un
point de [a, b]. Par exemple si la singularite est en b, il existe pres de x = b deux solutions puissance du
type (b−x)γ+ et (b− x)γ− avec γ+ > 0 et γ− < 0. ω n’etant pas egal a une pulsation propre au depart,
un tir a partir de a va avoir une composante sur la solution divergente et conduire automatiquement a
des valeurs infinies pour y(x) en b (figure 6b). Il faut donc partir de b avec la condition y′(b) = −γ+y(b).(On a vu a la section 8.3.2 qu’en symetrie spherique une E.D.P. faisant intervenir le laplacien conduit,
apres separation des variables, a une E.D. singuliere en r = 0 pour la partie radiale avec des solutions
en rl et r−(l+1).)
11.2.3 E.D.P. avec conditions initiales : propagation, diffusion
� E.D.P. de propagation
Considerons l’equation de propagation la plus simple :
∂tf + c ∂xf = 0 (c constante) .
Soient Δt et Δx les pas de discretisation et fnj la valeur de f pour t = tn et x = xj . Unschema numerique a priori naturel (Euler explicite pour t, derivee centree pour x) est :
(a) fn+1j = fnj − cΔt
fnj+1 − fnj−1
2 Δx= fnj − h
2(fnj+1 − fnj−1
)avec h =
cΔtΔx
.
332 11 • Analyse numerique ; physique discrete
(On observera que Δt et Δx n’apparaıssent qu’a travers h qui est sans dimension.)L’etude de sa stabilite consiste a voir comment evolue une perturbation δfnj . La relation(a) etant lineaire a coefficients constants, il suffit (cf. section 8.2.1) de considerer uneperturbation de type onde plane de vecteur d’onde k. Apres un pas celle-ci est multiplieepar une constante. On verifie en effet que :
δfnj ∝ eik jΔx −→ δfn+1j = (1 − ih sin kΔx) δfnj = Aaf
nj .
On aurait de meme Ab = 1 + h− heikΔx pour le schema (b) fn+1j = fnj − h(fnj+1 − fnj ).
Etonnamment, ces deux schemas sont instables : |Aa,b| > 1. La raison est d’originephysique : l’E.D.P. decrit une propagation a la vitesse c vers les x > 0 et donc fn+1
j nepeut dependre a priori que des fnj , fnj−1, f
nj−2..., mais pas de fnj+1. Les figures 7a et 7b
illustrent la propagation des donnees fnj et la dependance de fn+1j vis a vis des fnj .
xj−1 xj xj+1
Δx
tΔ
xj xj+1xj−1
t nt n
t n+1t n+1
x
tt
x
Δc t
(b)(a)
Figure 7
La figure 7b permet de comprendre qualitativement pourquoi le schema
(c) fn+1j = fnj − h
(fnj − fnj−1
)(pour lequel Ac = 1 − h+ h e−ikΔx)
est stable si h < 1 : les donnees f(tn, x) necessaires a l’obtention de f(tn+1, xj) corres-pondent a des valeurs de x comprises entre xj−1 et xj .
Le lecteur verifiera que les schemas
(d) fn+1j = 1
2
(fnj+1 + fnj−1
) − h2
(fnj+1 − fnj−1
)et (e) fn+1
j = fn−1j − h
(fnj+1 − fnj−1
)sont aussi stables si h < 1 (Ad = cos kΔx − ih sinkΔx et Ae = −ih sinkΔx ± (1 − h2 sin2 kΔx)
12 ,
consequence de A2e = 1− 2ihA(e) sin kΔx). (d) corrige (a) par l’ajout d’un terme de diffusion en fnj+1 −
2fnj + fnj−1 (methode de Lax) et (e) en introduisant fn−1j au lieu de fnj (schema leapfrog) ; dans
les deux cas ces modifications font que les donnees f(tn, x) pour x ∈ [xj , xj+1] deviennent necessaires
pour l’obtention de f(tn+1, xj), ce qui justifie la presence de fnj+1 au second membre des schemas (d)
et (e). L’interet de (e) est que |Ae| ne depend pas de k et que la dependance en k de la phase est la
plus petite. La figure 8 represente les courbes A(k) dans le plan complexe pour ces differents cas (avec
h = cΔtΔx
= 12). Il faut en pratique h ≤ 1
5.
REMARQUES. 1) L’analyse ci-dessus reste valable si c depend de f , la propagation d’une valeur fnj se
faisant alors a la vitesse c(fnj ) ; les difficultes numeriques apparaıssent avec l’onde de choc (cf. chap. 7,
figure 3) car elle met en jeu de grandes frequences spatiales, i.e. k � (Δx)−1.
2) L’E.D.P. de propagation du second ordre se discretise naturellement sous la forme :
∂t2f − c2∂x
2f = 0 −→ fn+1j − 2fnj + fn−1
j = h2(fnj+1 − 2fnj + fnj−1
)avec h = cΔt
Δx.
11.2 Resolution numerique d’E.D. et d’E.D.P. 333
L’etude de stabilite analogue a celle faite ci-dessus conduit a (A− 1)2 = −4Ah2 sin2 k Δx2
, equation qui
admet deux solutions avec A1A2 = 1. Il y a stabilite pour h ≤ 1 (alors |A1,2| = 1). Cette condition peut
se comprendre a partir de figures analogues aux figures 7a et b, la propagation se faisant maintenant
dans les deux sens x > 0 et x < 0. Pour h = 1 l’E.D.P. discretisee s’ecrit fn+1j + fn−1
j = fnj+1 + fnj−1 et
a pour solution exacte fnj = u(j + n) + v(j − n) comme l’equation d’onde.
��
��
1
O
(a)
A
A
(d)
(b)(e)
(c)
Figure 8
� E.D.P. de diffusion
L’E.D.P. de diffusion se discretise naturellement sous la forme :
∂tf = D∂x2f −→ fn+1
j − fnj = h(fnj+1 − 2fnj + fnj−1
)avec h =
DΔt(Δx)2
.
L’etude de stabilite conduit (petit calcul) a A = 1− 4h sin2 kΔx2 et a la condition h ≤ 1
2 .L’interpretation physique de cette condition est illustree sur les figures 9a et 9b quimontrent comment les donnees diffusent et comment fn+1
j depend des fnj .
t n+1
t n
xj
t n+1
t n
xj
tΔ
xj−1 xj+1
Δx
xj+1xj−1
t t
xx
ΔtD2
(a) (b)
Figure 9
Typiquement, une diffusion sur une distance L demande un temps τ tel que DτL2 ∼ 1 (cf. section 10.3.1).
Cependant, comme l’echelle de longueur L des phenomenes etudies doit necessairement verifier L� Δx,
les temps caracteristiques d’evolution L2
Dde ces phenomenes vont impliquer un nombre de pas de temps
intermediaires L2
DΔt= L2
(Δx)2tres grand. Dans la methode de Crank-Nicolson (du second ordre en
temps), le schema numerique et son facteur d’amplification sont :
334 11 • Analyse numerique ; physique discrete
fn+1j − fnj = DΔt
2(Δx)2
[(fn+1j+1 − 2fn+1
j + fn+1j−1
)+
(fnj+1 − 2fnj + fnj−1
)]; A =
1−2h sin2 kΔx2
1+2h sin2 kΔx2
.
On observe que A < 1 pour tout h, ce qui permet de choisir des Δt en fonction de la physique, et non de
la grille Δx. L’obtention de fn+1j a partir des fnj est un probleme lineaire faisant intervenir des matrices
tridiagonales (cf. section 11.4.1).
REMARQUE. L’E.D.P. de Schrodinger i∂tΨ = HΨ (avec H = −∂x2+V (x) pour un choix convenable
d’unites) est analogue a l’E.D.P. de diffusion, mais il faut respecter le caractere unitaire de l’evolution.
Pour la resoudre on approxime e−iH Δt par le produit eiΔt ∂2x e−iΔt V (x). Le passage de Ψnj a Ψn+1
j se
fait alors en deux etapes en utilisant la transformee de Fourier discrete et son inverse (cf. section 5.3.2) :
Ψnj → Ψn+ 1
2q = 1
N
∑N−1j=0 e−ikqj e−iΔt Vj Ψnj → Ψn+1
j =∑N−1q=0 eikqj e−ik
2q Δt Ψ
n+ 12
q avec kq = 2πqN
.
11.3 APPROXIMATION DE FONCTIONS ; INTERPOLATION ;MOINDRES CARRES ; METHODE DE BEZIER
L’approximation de fonctions revet des formes tres variees. Un premier type de problemesconcerne des fonctions definies par des series infinies. L’approximation consiste alors sou-vent a utiliser des “representations vectorielles finies” f(x) =
∑Nn=1 cnφn(x) ou les φn(x)
peuvent etre des polynomes (de Tchebytchev par exemple), des polynomes par morceaux(B-splines par exemple), des fonctions sinusoıdales .... Ces representations servent aussiau trace de graphes, a l’integration numerique (integration de Gauss), a la resolutionnumerique d’E.D. (les cn etant alors les inconnues a determiner)...Dans un autre type de problemes on dispose d’un ensemble de donnees y = yi pourx = xi (i = 1, 2, · · · , N) dont on souhaite une traduction analytique y = f(x). Si les yisont “exacts” il s’agit d’un probleme d’interpolation ; l’approximation par des polynomes(de Lagrange) ou des polynomes par morceaux (“cubic-splines”) passe alors par les points(xi, yi)). Si par contre les yi sont entaches d’erreurs, l’interpolation exacte n’a plus de senset on utilise une methode de moindres carres qui fait passer “au mieux” l’approximationau milieu du nuage de points.
11.3.1 Approximations polynomiales (Tchebytchev, B-splines...)
� Bases de polynomes orthogonaux
Une base {PN , N = 0, 1, 2 · · · } est caracterisee par un intervalle de definition [a, b] et unproduit scalaire :
< P,Q >=∫ b
a
w(x)P (x)Q(x) dx .
Le developpement de f(x) sur cette base est alors donnes par :
f(x) =∑n
cn Pn(x) ; cn =(< Pn, Pn >
)− 12 < Pn, f > .
Par exemple les polynomes de Legendre Ln(x) (cf. section 4.1.2) correspondent a l’in-tervalle [−1, 1] et w(x) = 1, ceux de Tchebytchev Tn(x) a [−1, 1] et w(x) = (1−x2)−
12 ,
ceux de HermiteHn(x) (cf. section 4.4.4) a [−∞,∞] et w(x) = e−x2, ceux de Laguerre
Lαn(x) a [0,∞] et wα(x) = xαe−x... Pour chaque base Pn est de degre n, a n zeros (undans chaque intervalle defini par ceux de Pn−1) et il existe des relations simples entre les
11.3 Approximation de fonctions ; interpolation ; moindres carres ; methode de Bezier 335
polynomes de differents degres (par exemple Tn+1 = 2xTn−Tn−1) et entre les polynomeset leurs derivees (par exemple (1− x2)T ′
n = −nxTn + nTn−1).
Les polynomes de Tchebytchev
Tn(x) = cos(n arc cosx) (= cosnϕ) ,
qui ont leurs n + 1 extrema tous egaux en valeur absolue (figure 10), jouent un roleprivilegie dans l’approximation de fonctions. En effet, ils possedent la propriete remar-quable que, parmi tous les polynomes de degre n (avec un coefficient de xn normalise a1), 2−nTn(x) est celui dont les oscillations ont la plus petite amplitude sur [−1, 1].
T2(x)T1(x) T4(x)T3(x)
−1
−1
0
1
1x
Figure 10
Ces oscillations etant uniformes, l’approximation d’une fonction f(x) par le developpementlimite
f(x) � c02
+n∑k=1
ck Tk(x) avec ck =2π
∫ 1
−1
f(x)Tk(x)√1 − x2
dx( dx√
1 − x2= dϕ
)conduit “pratiquement” au polynome P de degre n qui minimise sup
x∈[−1,1]
|f(x) − P (x)|.Comme de plus ces polynomes verifient la relation d’orthogonalite discrete
N∑i=1
Tk(xi)Tl(xi) =N
2δkl si k ou l �= 0 et
N∑i=1
T0(xi)T0(xi) = N ,
ou les xi = cos( πN
(i− 12))
sont les zeros de TN(x) = cosNϕ (N > k, l), les coefficientsck du developpement limite peuvent etre calcules par la formule exacte
ck =2N
N∑i=1
f(xi)Tk(xi) .
REMARQUES. 1) En analyse on utilise beaucoup les developpements limites de Taylor∑Nk=0
xk
k!f(k)(0).
Pour eux l’erreur ε, d’ordre |x|N+1, croit quand on s’eloigne du point de developpement et n’est donc pas
uniforme sur l’intervalle considere (qu’on peut toujours ramener a [−1, 1] par un changement de variable).
L’interet d’un developpement de Tchebytchev est d’obtenir la meme erreur ε mais uniformement sur
[−1, 1] et avec un polynome de degre inferieur a N .
2) Les polynomes ne constituent pas la seule facon d’approcher une fonction. On peut aussi utiliser des
336 11 • Analyse numerique ; physique discrete
fractions rationnelles. Par exemple l’approximation de Pade d’une serie
f(x) =∑∞k=0 akx
k −→ R(x) =∑p
0 bixi
1+∑q
1 cjxj = P (x)
Q(x),
ou les bi et les cj sont obtenus a partir des ak par identification des developpements formels, est souvent
une approximation “efficace” qui peut meme representer f(x) au dela du rayon de convergence de la
serie initiale (cf. f(x) =∑∞k=0 x
k → R(x) = (1 − x)−1).
Integration de Gauss. De facon generale, l’utilisation de polynomes orthogonauxcomme base pose le probleme du calcul des coefficients du developpement par integration.La methode de Gauss, qui joue sur le choix des points d’interpolation xi, est tres efficace.Si les xi sont les zeros du polynome PN (x) associe au poids w(x) et les wi des constantesadaptees (a ne pas confondre avec w(xi)), on montre que∫ b
a
w(x) g(x) dx �N∑i=1
wi g(xi) ;
cette expression est exacte si g(x) est un polynome de degre inferieur a 2N et constitueune bonne approximation pour g quelconque. Un exemple vient d’etre vu avec PN =TN et wi = 2
N ; dans ce cas, l’erreur∑N
k=1 ck Tk(x) est majoree parπ
22N−1(2N)!×
supx∈[−1,1]
|g(2N)(x)|. Pour PN = LN on a wi = 2((1− x2
i )L′N (xi)
)−1 et l’erreur est d’ordre
((2N)!)−1 sup |g(2N)(x)|.
� B-splinesOn se donne une suite de nombres x1 ≤ x2 ≤ · · · ≤ xN appeles noeuds. Les fonctionsBi,k(x) d’ordre k ≥ 1 sont alors definies par la recurrence (sur k) :
Bi,k(x) =x− xi
xi+k−1 − xiBi,k−1(x) +
xi+k − x
xi+k − xi+1Bi+1,k−1(x) ,
avec Bi,1(x) la fonction porte egale a 1 sur [xi, xi+1]. Les Bi,k(x) sont des polynomes parmorceaux de support [xi, xi+k], positifs, de degre k−1, derivable k−2 fois (pour k ≥ 3) ettels que
∑iBi,k(x) = 1. La figure 11a donne des exemples pour k = 1, 2, 3 et des noeuds
xi regulierement espaces (B-splines uniformes). Notons que plusieurs noeuds peuventcependant etre confondus et il est souvent utile de considerer ce cas (cf. ci-dessous).
x x x x x x x x x x x x x xi i+1 i+2 i+3 0,1 2 3 4,5 −1,0,1 2 3 4 5 6,7,8
(b)
i=3i=0 i=2i=1
B (x)i,2
1
B (x)i,3
i=1i=0
i=−1 1i=4
i=5
(c)
i=3i=2
(a)
i,kk=1
B (x)
1
k=3
k=2
Figure 11
L’approximation d’une fonction f(x) par une combinaison lineaire de B-splines d’ordrefixe k s’adapte au cas ou f(x) est restreinte a un intervalle fini [a, b] (x1 = a, xN = b).Pour cela on garde la recurrence ci-dessus mais, pour que l’approximation puisse prendre les valeurs
11.3 Approximation de fonctions ; interpolation ; moindres carres ; methode de Bezier 337
f(a) et f(b) (differentes de zero en general) en a et b, on ajoute a chaque extremite de l’intervalle
k − 1 noeuds confondus avec x1 et xN . Par exemple pour k = 2 (figure 11b ou N = 4) on ajoute
x0 confondu avec x1 et xN+1 confondu avec xN , ce qui introduit les deux fonctions supplementaires
B0,2(x) = x2−xx2−x1
B1,1(x) �= 0 en x1 et BN−1,2(x) =x−xN−1xN−xN−1
BN−1,1(x) �= 0 en xN (les deux fonctions
porte B0,1(x) et BN,1(x) egalement introduites etant nulles car de supports ]x0, x1[ et ]xN , xN+1[
“vides”). Pour chaque k on construit ainsi au total N + k − 2 fonctions Bi,k(x) avec i allant de 2 − k
a N − 1. (Le lecteur verifiera que N + k − 2 = (N − 1)k − (N − 2)(k − 2) est la dimension de l’espace
vectoriel des polynomes de degre k− 1 et derivables k− 2 fois en x2, x3 · · ·xN−1.) Les fonctions Bi,k(x)
sont alors nulles en dehors de [a, b] et verifient toujours∑iBi,k(x) = 1. Pour i = 2 − k, 3 − k, · · · , 1,
elles partent toutes de x1 et ont pour support [x1, x2], [x1, x3] · · · [x1, xk+1] ; elles sont de plus en plus
regulieres en x1 lorsque i augmente (discontinue pour i = 2− k, continue a derivee premiere discontinue
pour i = 3 − k...) ; les B-splines pour i = N − 1, N − 2, · · ·N − k ont un comportement similaire en xN
(figure 11c ou N = 6 et k = 3).
Un interet de la representation de f(x) par des B-splines d’ordre fixe k
f(x) �N−1∑i=2−k
ciBi,k(x)
est que pour tout x elle n’implique qu’un petit nombre (k au plus) de Bi,k(x). Un autreinteret est qu’elle permet d’ecrire simplement les conditions aux limites susceptibles d’etreimposees a f en x1 et xN ; par exemple, pour k = 3, on a c−1 = f(a) et cN−1 = f(b).Enfin, comme pour les familles de polynomes orthogonaux, il existe des relations remar-quables entre les Bi,k et leurs derivees, par exemple :
B′i,k(x) = (k − 1)
( Bi,k−1(x)xi+k−1 − xi
− Bi+1,k−1(x)xi+k − xi+1
).
L’ensemble de ces proprietes fait que la representation de f par des B-splines est bienadaptee a la resolution d’E.D. avec conditions aux limites.
11.3.2 Interpolation de Lagrange et par “cubic-splines”
� Polynomes de Lagrange
Par N points (xi, yi = f(xi)) du plan (x, y) il ne passe qu’une seule courbe polynomialey = P (x) de degre N − 1. P (x) est donne par la formule explicite de Lagrange
P (x) =N∑i=1
f(xi) li(x) avec li(x) =∏j �=i
x− xjxi − xj
.
P (x) peut aussi etre represente sur la base 1, (x − x1), (x − x1)(x − x2), · · · par
P (x) = f(x1) +N∑k=1
f [x1, x2, · · · , xk] (x− x1)(x − x2) · · · (x− xk)
ou les coefficients f [x1, x2, · · · , xk], appeles differences divisees, sont donnes par larecurrence
f [x1, x2, · · · , xk] =f [x2, x3, · · · , xk] − f [x1, x2, · · · , xk−1]
xk − x1avec f [xi] = f(xi) .
338 11 • Analyse numerique ; physique discrete
Ces expressions generalisent l’interpolation lineaire pour deux points (N = 2) :
P12(x) =(x2 − x)f(x1) + (x − x1)f(x2)
x2 − x1= f(x1) +
f(x2) − f(x1)x2 − x1
(x− x1) .
En pratique P (x) est obtenu en definissant a chaque etape des polynomes qui interpolentceux de l’etape precedente (methode de Neville).
EXEMPLE (N = 3) (figure 12). On part a l’etape 0 des polynomes constants Pi = f(xi) (i = 1, 2, 3).
On construit, a l’etape 1 les interpolations lineaires P12(x) (expression ci-dessus) et P23(x), puis a
l’etape 2 le polynome P123(x) = (x3 − x1)−1((x3 − x)P12(x) + (x − x1)P23(x)
)obtenu a partir de
P12 et P23 comme l’est P13 a partir de P1 et P3).
x1 x3x2
P123
P1
P3
P2
P23
P12
x
Figure 12
(x,y)
x
21
4 3
x(b)(a)
y y
1 2
3
MM
Figure 13
Interpolation en dimension 2 (figure 13). Pour une grille rectangulaire elle est donneepar f(x, y) = λxλyf1 + (1 − λx)λyf2 + λx(1 − λy)f3 + (1 − λx)(1 − λy)f4 (λx = (x2 −x)(x2 − x1)−1, λy = (y3 − y)(y3 − y2)−1 et fi = f(xi, yi)) ; pour une grille triangulaire
f(x, y) = λ1f1 + λ2f2 + λ3f3
ou les λi sont les coordonnees barycentriques (λ1 =aire M23aire 123
· · · , cf. section 2.2.1).
xx xx x xxx2 4 x1 x23 3x1 8 8
0 0
(b)(a)
f(x) f(x)
Figure 14
Interpolation et recherche de zeros. Supposons que x1 et x2 sont proches d’unevaleur x∞ ou f(x) s’annule. En posant P12(x) = 0 dans l’interpolation lineaire ci-dessus
recrite x = x1 +P12(x) − f(x1)f(x2) − f(x1)
(x2 − x1) on trouve une valeur approchee x3 = x1 −
11.3 Approximation de fonctions ; interpolation ; moindres carres ; methode de Bezier 339
f(x1)f(x2) − f(x1)
(x2 − x1) pour laquelle f(x) = 0. On itere cette methode en remplacant
(x1, x2) par (x2, x3) pour obtenir x4 etc. (methode de la secante ; figure 14a). Cette
methode remplace celle de Newton-Raphson (figure 14b) xi+1 = xi − f(xi)f ′(xi)
lorsque
f ′(xi) n’est pas connue avec assez de precision. (Attention, ces methodes peuvent ne pasconverger si on part trop loin de la solution x∞.)
� “Cubic-splines”
Vouloir interpoler entre un tres grand nombre de points avec un seul polynome (neces-sairement de degre eleve) n’est pas raisonnable car les oscillations entre points aug-mentent avec le degre. Il est preferable, notamment pour avoir des graphes “lisses”, deraccorder des interpolations polynomiales “locales” en assurant la continuite jusqu’a laderivee seconde aux points de raccordement.
Construction : deux points x1 et x2 = x1 +h etant donnes, soient λ1 = h−1(x2 −x) et λ2 = h−1(x−x1)les coordonnees barycentriques d’un point intermediaire x et f(xi) = fi. La fonction cubique definie sur[x1, x2] par
S(x) = λ1f1 +a1
6(λ3
1 − λ1)h2 + λ2f2 +a2
6(λ3
2 − λ2)h2
verifie S(xi) = fi et S′′(x) = λ1a1 + λ2a2, d’ou S′′(xi) = ai. L’interpolation obtenue par recollementde ces fonctions, definies chacune sur un intervalle [xi, xi+1], est donc continue ainsi que sa derivee se-conde. Reste a assurer la continuite de la derivee premiere en chaque point xi, ce qui donne un systemed’equations pour les ai. Un petit calcul conduit a la recurrence d’ordre 2 :
xi+1 − xi
6ai+1 +
xi+1 − xi−1
6ai +
xi − xi16
ai−1 =fi+1 − fi
xi+1 − xi− fi − fi−1
xi − xi−1.
Cette relation a une solution unique si on fixe deux conditions, par exemple a1 = aN = 0 (cubic-splines“naturelles”) ou en fixant S′(x1) et S′(xN ). Cette solution est obtenue en pratique par la resolution d’unsysteme lineaire tridiagonal (cf. section 11.4.1).
11.3.3 Methode des moindres carres
� Moindres carres lineaires
Sous cette forme la plus simple il s’agit d’extraire une forme analytique f(x) d’un en-semble de n donnees fi, entachees d’erreur, correspondant aux valeurs xi d’une variable.Pour ce faire on cherche, comme precedemment, f(x) sous la forme d’une combinaisonfinie de p < n fonctions de base φj(x) (des polynomes par exemple)
f(x) =p∑j=1
cj φj(x) ,
les coefficients cj etant ici obtenus en minimisant le carre de l’ecart (norme L2) :
e2 =n∑i=1
wi(fi −
p∑j=1
cj φj(xi))2
wi = σ−2i > 0 .
Si on a une estimation des incertitudes sur les fi, le poids wi accorde a chacun estd’autant plus grand que l’erreur le concernant est petite. Si les erreurs sur les fi peuvent
340 11 • Analyse numerique ; physique discrete
etre assimilees a des variables aleatoires gaussiennes independantes de variance σ2i , e
2 estun χ2 a n degres de liberte (cf. section 10.2.4). En ecrivant
∂e2
∂ck= −2
n∑i=1
1σ2i
(fi −
p∑j=1
cj φj(xi))φk(xi) = 0
on voit que les cj verifient l’equation matricielle :
GtG c = Gtb (ct = (c1, · · · , cp)) .G est la matrice n × p d’elements Gij = σ−1
i φj(xi) et b le vecteur a n composantesbi = σ−1
i fi. Malheureusement la matrice p× p GtG est generalement mal conditionnee(c.a.d. qu’une petite variation dans les donnees (fi, xi) change completement la solution)et son inversion numerique est alors problematique (cf. section 11.4).
EXEMPLE. Pour φj(x) = xj−1 (approximation polynomiale), wi = 1 pour tout i et les xi regulierement
distribues sur [−1, 1] on obtient(GtG
)kj
=∑ni=1 x
j+k−2i � n
∫ 10xj+k−2 dx = n
j+k−1.
GtG est une matrice p× p de type Hilbert connue pour etre mal conditionnee des que p ≥ 10.
REMARQUE. Il n’est souvent pas necessaire de considerer de grandes valeurs de p. Unevaleur convenable de p est atteinte si, apres avoir diminue rapidement quand p augmente,e2 minimum ne diminue que lentement au dela de cette valeur.)
� Moindres carres non lineaires
Si la forme analytique f(x, a) de la fonction qui doit representer les donnees est connuepar la physique, la methode des moindres carres sert a ajuster les valeurs des parametresa ≡ (a1, a2, · · ·ap). On minimise comme precedemment la quantite
e2(a) =n∑i=1
wi(fi − f(xi, a)
)2,
et on obtient un systeme de p equations non lineaires pour les aj
∂e2
∂aj= −2
n∑i=1
wi(fi − f(xi, a)
) ∂f(xi, a)∂aj
= 0 (j = 1, 2, · · · p)
de la formegj(a1, a2, · · ·ap) = 0 (g : gradient de e2) .
La resolution numerique de ce systeme s’effectue par une methode de Newton modifiee.On choisit des valeurs initiales a(0) (supposees pas trop eloignees de la solution) et on
linearise le systeme en ecrivant : gj(a) � gj(a(0)) +p∑k=1
(ak − a(0)k )
∂gj∂ak
.
En notant J la matrice hessienne de e2, dont les elements de matrice sont
Jkj =∂2e2
∂aj ∂ak=∂gj∂ak
= 2n∑i=1
wi∂f(xi, a)∂aj
∂f(xi, a)∂ak
− 2n∑i=1
wi(f(xi, a)− fi
) ∂2f(xi, a)∂aj ∂ak
,
11.3 Approximation de fonctions ; interpolation ; moindres carres ; methode de Bezier 341
le systeme d’equations linearisees pour a s’ecrit (sous forme matricielle) :
g(a(0)) = −J(0) (a− a(0)) (J(0) = J pour a = a(0)) .
Sa solution a(1) est la solution approchee a l’ordre 1. Ensuite on itere le processus enremplacant a(0) par a(1) dans l’equation matricielle pour obtenir a(2) et ainsi de suite :
g(a(i)) = −J(i) (a(i+1) − a(i)) .
REMARQUE. Pres du minimum les differences (f(xi, a)− fi)
sont petites et non correlees de telle sortequ’il est legitime de negliger la deuxieme somme dans l’expression de Jkj . Dans cette approximationla matrice symetrique J est le plus souvent definie positive mais peut dans certains cas etre presquepositive semi-definie ; elle n’est donc pas toujours inversible et pour eviter ce probleme on resoud lesysteme modifie
a(i+1) = a(i) +[J(i) + λ(i)I
]−1g(a(i))
ou la matrice J(i) + λ(i)I est definie positive. On verifie que e2(a(i+1)) < e2(a(i)) (sinon on augmenteλ(i)) et on itere le processus en diminuant la valeur de λ a chaque pas pour le faire tendre vers 0 lorsquele degre de convergence est juge satisfaisant (methode de Levenberg-Marquardt).
11.3.4 Methode de Bezier
A l’inverse des methodes d’interpolation et de moindres carres ou le but est de “faire passer au mieux”une fonction par des points fixes donnes, dans la methode de Bezier, tres utilisee en CAO (comceptionassistee par ordinateur), on deplace les points de controle d’une courbe en parametrique (ou d’une surface)pour obtenir une forme donnee, par exemple celle d’un caractere d’imprimerie (ou d’une carrosseried’automobile).
� Courbes de Bezier
O etant un point fixe quelconque, la courbe de Bezier a n+ 1 points de controle P0, P1, · · · , Pn est celledecrite, lorsque t parcourt l’intervalle [0, 1], par le point mobile P (t) defini par
−−−−→OP (t) =
n∑k=0
Ckn tk (1 − t)n−k
−−→OPk .
P (t) est le barycentre des points Pk affectes des poids Bnk (t) = Ckn tk (1 − t)n−k (polynomes de
Berstein qui verifient∑nk=0 B
nk (t) = 1 ).
- Cas de deux points de controle (degre 1) : en placant 0 en P0 il vient−−−−→P0P (t) = t
−−−→P0P1 ; la courbe de
Bezier est le segment P0P1.
P0
1P
2P
32t=
31t=
12
t=P01
1P 2
t = 1t = 0
P(t)
Figure 15
P0
1P
2P
P3
P12
P23P01
P012P123
21t =
t = 1t = 0
P(t)
Figure 16
- Cas de trois points de controle (degre 2) :−−−−→OP (t) = (1− t)2
−−→OP0 + 2t(1 − t)
−−→OP1 + t2
−−→OP2. Pour tracer
la courbe on utilise l’associativite dans la determination du barycentre : si P01 est le barycentre de P0
(poids 1 − t) et de P1 (poids t) et si P12 est le barycentre de P1 (poids 1 − t) et P2 (poids t) alors P (t)est le barycentre de P01 (poids 1 − t) et P12 (poids t). Lorsque t varie de 0 a 1, P01 decrit le segmentP0P1, P12 le segment P1P2 et P (t) la courbe de Bezier (figure 15).
342 11 • Analyse numerique ; physique discrete
Verification :−−−→OP01 = (1 − t)
−−→OP0 + t
−−→OP1 et
−−−→OP12 = (1 − t)
−−→OP1 + t
−−→OP2 d’ou−−−−→
OP (t) = (1 − t)−−−→OP01 + t
−−−→OP12 = (1 − t)2
−−→OP0 + 2t(1 − t)
−−→OP1 + t2
−−→OP2
- Cas de quatre points de controle (degre 3) :−−−−→OP (t) = (1−t)3 −−→
OP0+3t(1−t)2−−→OP1+3t2(1−t)−−→OP2+t3−−→OP3.
Le trace de la courbe s’obtient comme precedemment, “en prenant le barycentre de deux barycentres depoids 1 − t et t”, mais avec une etape supplementaire (figure 16).
Dans la pratique on ne considere pas de courbes de Bezier de degre superieur. Dans le cas d’un grandnombre de points de controle on prefere raccorder, en certains de ces points, des courbes de degre deuxou trois. La raison principale est la suivante. Une courbe de Bezier a un caractere global : le deplacementd’un point de controle affecte toute la courbe (cf. la figure 17 ou P1 est deplace en P’1 et P(t) transformeeen P’(t)). Sur la figure 18, ou la courbe en pointilles est celle associee aux 7 points de controle, la courbeen trait plein est constituee de deux (sous)courbes P(t) et P’(t) (chacune de degre 3 construite sur les4 points de controle P0P1P2P3 et P’0P’1P’2P’3) raccordees en P3 ≡P’0 ; sur cette courbe fractionneeon peut deplacer P1 ou P0 (et amener ce dernier en P3 par exemple pour transformer P(t) en un lobeferme) sans modifier la partie P’(t). En considerant un courbe fractionnee on acquiert donc la possibilitede corriger localement la forme de la courbe. Une courbe fractionnee sera “lisse” (derivee continue) aupoint de raccord si celui-ci est situe sur le segment defini par le point qui le precede et celui qui lesuit ; si de plus il est au milieu de ce segment, la derivee seconde est aussi continue. Ceci resulte du fait
que pour tout t les vecteurs−−−−→P01P12 (confondu avec
−−−→P0P1 pour t = 0 et
−−−→P1P2 pour t = 1 ; figure 15)
et−−−−−−→P012P123 (confondu avec
−−−→P0P1 pour t = 0 et
−−−→P2P3 pour t = 1 ; figure 16) sont proportionnels au
vecteur tangent d−−−−→OP (t)dt
. (Le lecteur montrera que d−−−−→OP (t)dt
= 2−−−−→P01P12 pour une courbe de degre 2 et que
d−−−−→OP (t)dt
= 3−−−−−−→P012P123 pour le degre 3.)
P0
2P
P3
P’1
1P
t = 1t = 0
P’(t)
P(t)
Figure 17
0P’ 3P P63P’
5P P’2
2P
1P’ 4P
0
1P
P
0 3
6
3
0
6
7
9 10 11 15 16
P(t)P’(t)
Figure 18
REMARQUE. Courbes B-splines. Les B-splines Bi,k(t) forment une base dans l’espace des polynomesde degre k− 1 et satisfont
∑iBi,k(t) = 1 comme les polynomes de Berstein. On peut donc, par analogie
avec les courbes de Bezier, utiliser la relation
−−−−→OP (t) =
N−1∑i=2−k
Bi,k(t)−−→OPi
pour decrire des courbes en parametrique : P (t) est le barycentre des N + k − 2 points de controle Piaffectes des poids Bi,k(t). Ces courbes B-splines ont un caractere local : les Bi,k ayant un support limiteun deplacement de Pi ne modifie la courbe qu’au voisinage de ce point. Elles sont, comme les courbesde Bezier, tres utilisees en CAO.
� Surfaces de BezierPour engendrer une surface, une generalisation naturelle consiste a considerer le point P (u, v) defini parla relation :
−−−−−−→OP (u, v) =
n∑k=0
m∑l=0
Ckn Clm uk (1 − u)n−k uk vl(1 − v)m−l−−−→OPkl ;
11.4 Resolution d’equations, d’E.D. et d’E.D.P. lineaires 343
il decrit la surface de Bezier associee aux (n + 1) × (m + 1) points de controle Pkl lorsque les deux
parametres u et v varient entre 0 et 1. Les deux courbes de Bezier associees aux groupes de points de
contole {P0l} et {Pnl} (l = 0, 1, · · · , m) limitent la surface en “latitude” tandis que celles associees aux
points de controle {Pk0} et {Pkm} (k = 0, 1, · · · , n) la limitent en “longitude” (“latitude” et “longitude”
etant interchangeables).
11.4 RESOLUTION D’EQUATIONS, D’E.D. et D’E.D.P. LINEAIRES
Nous avons vu dans ce chapitre que l’etude numerique de nombreux problemes (interpo-lation par des cubic splines, methode des moindres carres lineaires ou linearises, diversesmethodes aux differences finies appliquees aux E.D. ou E.D.P.) conduit a un systemed’equations algebriques lineaires du type Ax = b. Nous allons voir a la section 11.4.2qu’il en est de meme lors de la resolution d’E.D. ou d’E.D.P. par une methode spectrale.Un tel systeme lineaire, etudie au chapitre 4, se resoud theoriquement en inversant lamatrice A ou en la diagonalisant, mais le probleme n’est pas simple car la dimensionde A peut etre grande (par exemple superieure a 100 × 100). Heureusement dans denombreux cas la matrice A est proche d’une matrice diagonale (souvent tri-diagonale)et des algorithmes d’inversion efficaces peuvent alors lui etre appliques. Cependant il ar-rive que des lignes (ou des colonnes) de A soient presque proportionnelles (lineairementdependantes) ; le probleme est alors dit mal conditionne et sa resolution releve de ladecomposition S.V.D. (singular value decomposition).
11.4.1 Equations lineaires regulieres et singulieres
� Systeme regulier ; “triangularisation”
Soit a resoudre le systeme de n equations (independantes) a n inconnues
n∑j=1
aij xj = bi (i = 1, · · · , n) ou Ax = b .
Puisque x = A−1b on pourrait penser que le probleme numerique consiste a determinerA−1. Cependant cela demande plus d’operations (donc plus de temps de calcul et uneaugmentation des erreurs d’arrondi) que les methodes par “triangularisation”.
Dans la methode du pivot de Gauss, les inconnues sont numerotees de telle sorte quedans les n equations
a11x1 + a12x2 + · · · + a1nxn = b1 , · · · · · · , an1x1 + an2x2 + · · ·+ annxn = bn
le pivot a11 �= 0 soit le plus grand possible (en valeur absolue). On elimine x1 desequations 2, 3, · · · , n en le remplacant par son expression tiree de la premiere pour obtenirle nouveau systeme
a11x1+a12x2+· · ·+a1nxn = b1 et a(1)i2 x2+a(1)
i3 x3+· · ·+a(1)in xn = b
(1)i (i = 2, · · · , n) .
On itere ensuite le processus : renumerotation eventuelle des n − 1 variables restantes(“pivotage”) pour que le pivot a(1)
22 �= 0 soit le plus grand possible (en valeur absolue),
344 11 • Analyse numerique ; physique discrete
elimination de x2 des equations 3, 4, · · · , n en le remplacant par son expression tiree dela seconde etc. On obtient finalement le systeme “triangulaire”
a11x1 + a12x2 + a13x3 + · · · + a1nxn = b1
a(1)22 x2 + a
(1)23 x3 + · · ·+ a
(1)2n xn = b
(1)2
a(2)33 x3 + · · ·+ a
(2)3n xn = b
(2)2
. . ....
a(n−1)nn xn = b
(n−1)n ,
qui permet d’obtenir successivement xn, xn−1 · · · .La decomposition LU d’une matrice A consiste a trouver une matrice L (triangulaireinferieure, d’ou L pour “lower”) et une matrice U triangulaire superieure (U pour“upper”) telles que :
A = LU .
Le lecteur se convaincra, en considerant par exemple la decomposition d’une matrice 3×3⎛⎝a11 a12 a13
a21 a22 a23
a31 a32 a33
⎞⎠ =
⎛⎝ 1 0 0L21 1 0L31 L32 1
⎞⎠⎛⎝U11 U12 U13
0 U22 U23
0 0 U33
⎞⎠ ,
qu’en posant Lii = 1 on obtient successivement et par alternance les colonnes de U etL : U11 = a11, Li1 = U−1
11 ai1, U12 et U22, Li2 · · · (relations a la base de l’algorithmede Crout). La solution de Ax = LUx = b s’obtient alors en resolvant les systemestriangulaires Lc = b puis Ux = c. Du point de vue efficacite (temps de calcul et precision)elle est comparable a la methode du pivot de Gauss mais elle permet en plus, connaissantL et U, d’obtenir de facon “economique” le determinant de A (produit des Uii).
REMARQUES. 1) Si A = T est tridiagonale, L et U sont tres simples (bidiagonales).2) On peut aussi introduire des matrices L et U telles que LA = U en prenant pour Lun produit de transformations de Householder (voir ci-dessous). 3) Si A est symetriquedefinie positive, on utilise aussi la decomposition de Cholevsky A = LLt (L triangulaireinferieure).
� Probleme mal conditionne ; methode T.S.V.D.
EXEMPLE. Considerons la minimisation d’une forme quadratique positive F (x1, x2) =12 (αx2
1 + 2βx1x2 + γx22) − b1x1 − b2x2 (avec α > 0, γ > 0 et αγ − β2 = ε > 0). Elle
conduit au systeme lineaire
αx1 + βx2 = b1βx1 + γx2 = b2
ou Ax = b ,
et peut s’interpreter comme la determination des coordonnees du point M d’intersec-tion de deux droites D1 et D2 dans le plan (x1, x2). Si la forme est presque degeneree(ε � 0), les lignes de A sont quasi proportionnelles et les droites quasi paralleles ; cecientraine que la position du minimum M est mal definie car tres sensible a des petitesvariations des parametres de F . Dit autrement, F varie tres peu dans la direction du
vecteur(β−α
)associe a la valeur propre proche de 0 de A et la minimisation dans
11.4 Resolution d’equations, d’E.D. et d’E.D.P. lineaires 345
cette direction est a priori non pertinente (si on n’a pas d’autres informations surle probleme physique qui a conduit a F ). Cette direction est celle du grand axe desellipses tres allongees d’equations F (x1, x2) = Cste qui dessinent les lignes de niveaud’une vallee plutot que celles d’un puits (figure 19). La methode T.S.V.D. consistea restreindre la minimisation a l’espace orthogonal (direction du petit axe des ellipses)
qui est engendre par le vecteur(αβ
)associe a la valeur propre finie de A (point MR).
x2
D1
D2
x1
MR
����
����
M
βα
αβ
Figure 19
Un systeme lineaire est dit mal conditionne si le rapport K =∣∣∣λmax
λmin
∣∣∣ des valeurs propres
extremes de A est tres superieur a 1 (propriete qui reste vraie, comme la quasi-dependancelineaire de lignes ou de colonnes, si on multiplie A par une constante). De la relation
‖ δx ‖‖ x ‖ =
‖ A−1δb ‖‖ A−1b ‖ ≤ K
‖ δb ‖‖ b ‖
(et d’une relation analogue si A fluctue) on deduit que, pour K � 1, x est tres sensibleaux erreurs experimentales sur b et A, et aux erreurs numeriques en cours de calcul. (A
est dite “numeriquement singuliere” si Kδx
x≥ 1, ou
δx
xest l’erreur relative d’arrondi.)
En grande dimension il est tres important d’identifier ce type de probleme avant de selancer dans la resolution numerique d’un systeme lineaire.
La decomposition S.V.D. (Singular Value Decomposition) d’une matrice n× n reelleA s’ecrit
A =n∑i=1
σiui vit
ou les ui et les vi sont les vecteurs propres orthonormes des matrices (symetriques,definie-positives) AAt et AtA associes aux valeurs propres σ2
1 ≥ σ22 ≥ · · · ≥ σ2
n > 0.Cette decomposition est unique si tous les σi sont distincts. On voit sur l’expression del’inverse de A
A−1 =n∑i=1
σ−1i vi ui
t
(AA−1 = A−1A = I car uit uj = vit vj = δij et
∑i ui ui
t =∑
i vi vit = I) qu’elle per-
met de detecter si un systeme Ax = b est mal conditionne : il correspond a σp+1, · · · , σn
346 11 • Analyse numerique ; physique discrete
proches de 0. La solution x = A−1b contient alors une partie singulierexS =
∑s σ
−1s vs us
tb (s = p+ 1, · · · , n), et une partie reguliere
xR =∑r
σ−1r vr ur
tb (r = 1, · · · , p)
qui est la solution T.S.V.D. du probleme (T pour “truncated” puisque les valeurs σiavec i > p n’apparaissent pas). Si on pose AT =
∑r σrur vr
t on verifie que xR est levecteur de norme minimum qui minimise ‖ ATx− b ‖2 (point MR de la figure 19).
DEMONSTRATION. ATxR =∑r ur ur
tb entraıne ‖ AT (xR + y) − b ‖2=‖ −∑s us us
tb + AT y ‖2=
‖ AT xR − b ‖2 + ‖ AT y ‖2 (car AT y est une combinaison de vecteurs ur) ≥‖ AT xR − b ‖2. L’egalite a
lieu si y ∈ KerAT est une combinaison des vecteurs us et alors ‖ xR + y ‖2=‖ xR ‖2 + ‖ y ‖2≥‖ xR ‖2.
xR est donc, parmi les vecteurs qui minimisent ‖ AT x− b ‖2, celui qui a la norme minimum.
REMARQUES. 1) Problemes surdetermines. Si A est une matrice m×n avec m > nle systeme Ax = b contient plus d’equations (plus de donnees bi) que d’inconnues etn’a pas de solution. La decomposition S.V.D. A =
∑i σiuiv
ti existe encore mais les ui
sont les vecteurs propres orthonormes (a m composantes) de AAt associes aux n valeurspropres non nulles σ2
1 ≥ σ22 ≥ · · · ≥ σ2
n > 0. La solution T.S.V.D. xR est donnee parla meme expression que ci-dessus et minimise ‖ ATx − b ‖2. Si A n’est pas singulier,AT = A et xR = (AtA)−1Atb.2) Il existe des strategies variees basees sur la decomposition S.V.D. et permettant de regulariser un
probleme d’inversion mal conditionne. On peut minimiser ‖ AT x−b ‖2 en profitant de l’indetermination
sur x pour imposer une condition plus adaptee au probleme physique que “‖ x ‖2 minimum”. On peut
aussi remplacer A−1 par∑i p(λ, σi) (σ−1
i vi uit) ou p est une fonction poids qui ne coupe pas brutalement
les σi proches de 0 ; c’est ce que fait en particulier la methode de Tikhonov qui consiste a minimiser
‖ AT x− b ‖2 +λ2 ‖ x ‖2, et donc a remplacer AtA par AtA + λ2I ou σ2i par σ2
i + λ2.
La decomposition S.V.D. requiert la determination des valeurs et vecteurs propres dematrices (AtA et AAt qui sont symetriques positives) ; c’est l’objet de l’algorithme QR.
� Diagonalisation ; algorithme QR
En theorie les valeurs propres λi d’une matrice A sont obtenues en determinant lesracines du polynome caracteristique P (λ) = det(A − λI) (et les vecteurs propres vi enresolvant les equations Avi = λivi). Cependant, du point de vue numerique, il existe desmethodes beaucoup plus efficaces pour trouver les λi. Nous decrivons dans la suite laplus couramment utilisee en nous limitant au cas des matrices reelles symetriques.
Dans un premier temps on transforme A en une matrice tridiagonale T (symetrique)par des transformations successives de Householder. Celles-ci A → A1 = P1AP1 →A2 = P2A1P2 · · · , avec Pi = Pti = Pi
−1, font apparaıtre les zeros de T successivement dansles premieres colonne et ligne, secondes colonne et ligne... Par exemple, apres deux transformations :
A =
⎛⎜⎜⎜⎜⎜⎝∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗ ∗
⎞⎟⎟⎟⎟⎟⎠ −→ A2 =
⎛⎜⎜⎜⎜⎜⎝∗ ∗ 0 0 0 0∗ ∗ ∗ 0 0 00 ∗ ∗ ∗ ∗ ∗0 0 ∗ ∗ ∗ ∗0 0 ∗ ∗ ∗ ∗0 0 ∗ ∗ ∗ ∗
⎞⎟⎟⎟⎟⎟⎠ .
La matrice Pr qui fait passer de Ar−1 a Ar est de la forme Pr = I − 2urutr, ou ur =
wr||wr|| est un
vecteur unitaire dont les r premieres composantes sont nulles ; par exemple P3 doit verifier :
11.4 Resolution d’equations, d’E.D. et d’E.D.P. lineaires 347
A3 = P3A2P3 =
⎛⎜⎜⎜⎜⎜⎝∗ ∗ 0 0 0 0∗ ∗ ∗ 0 0 00 ∗ ∗ ∗ 0 00 0 ∗ ∗ ∗ ∗0 0 0 ∗ ∗ ∗0 0 0 ∗ ∗ ∗
⎞⎟⎟⎟⎟⎟⎠ ou P3 =
⎛⎜⎜⎜⎜⎜⎝1 0 0 0 0 00 1 0 0 0 00 0 1 0 0 00 0 P43 1 0 00 0 P53 0 1 00 0 P63 0 0 1
⎞⎟⎟⎟⎟⎟⎠ .
On montre que les n − r composantes non nulles de wr qui conviennent sont : wr,i = ar r+1 +
signe (ar r+1)(∑n
i=r+1 a2ri
) 12 si i = r + 1 et wr,i = ari pour i = r + 2, · · · , n (aij elements de ma-
trices de A) ; les elements de matrice Pir (i > r) de Pr s’en deduisent. En operant ainsi n − 2 fois on
transforme A en une matrice tridiagonale T.
Dans un deuxieme temps les elements de part et d’autre de la diagonale de T sont rendusde plus en plus petits par une succession de transformations qui constituent l’algorithmeQR. Il consiste a factoriser a chaque etape “s” la matrice Ts en une matrice orthogonaleQs et une matrice triangulaire superieure Rs (R pour triangle “right”) puis a renverserl’ordre du produit pour obtenir Ts+1 :
Ts = QsRs et Ts+1 = RsQs = QtsTsQs (T1 = T) .
On montre que si T a des valeurs propres distinctes, Ts tend vers une matrice diagonaleayant pour elements les valeurs propres de A (rangees par ordre croissant de module),
les elements non diagonaux (Ts)i i+1 = (Ts)i+1 i tendant vers 0 comme( λiλi+1
)s.
11.4.2 E.D. et E.D.P. lineaires ; methodes spectrales ; elements finis
� Principe des methodes spectrales
La resolution numerique par une methode spectrale d’une E.D., par exemple
y′′(x) = F (y, y′, x) ,
consiste a approcher y par un developpement fini sur une base de fonctions connues(fonctions sinusoıdales, polynomes, B-splines...) y(x) � ∑N
p=1 cp φp(x) et a obtenir lescoefficients cp en portant ce developpement dans les deux membres de l’E.D. (avec y′ =∑p cp φ
′p et y′′ =
∑p cp φ
′′p).
Celle-ci ne peut pas etre satisfaite exactement mais peut l’etre de facon approchee- soit par une methode de collocation qui consiste a restreindre l’egalite y′′ = F a unensemble discret de points y′′(xi) = F (y(xi), y′(xi), xi). (Comme dans l’integration deGauss, il peut y avoir des choix des xi plus judicieux que d’autres, selon la base {φp}.)- soit par la methode de Galerkin (ou des elements finis) qui consiste a projeterl’E.D. sur la base a l’aide d’un produit scalaire :
< φq,
N∑p=1
cp φ′′p >=< φq, F > (q = 1, · · · , N) .
Notons que certains coefficients cp peuvent ne plus apparaıtre comme des inconnues siils ont servi a satisfaire des C.L. (ou des conditions de normalisation pour des solutionsondes stationnaires). Inversement d’autres inconnues que les cp peuvent etre presentesdans l’E.D., par exemple ω pour les ondes stationnaires (cf. section 11.2.2). Dans tous
348 11 • Analyse numerique ; physique discrete
les cas on est conduit a resoudre un systeme d’equations lineaires comportant un grandnombre d’inconnues. Ceci est evident si F est lineaire (et si ω n’apparaıt pas commeinconnue). Dans le cas general notons a les inconnues (qui ne se limitent pas forcementaux cp) et gq(a) = 0 les equations a satisfaire. Leur resolution par linearisation estanalogue a celle vue a la section 11.3.3.REMARQUE. La resolution d’une E.D. par des differences finies, ou on remplace par exemple y′′ par
h−2(yi+1 − 2yi + yi−1) et y′ par (2h)−1(yi+1 − yi−1) avec yi = y(xi), conduit aussi a de tels systemes
lineaires pour les yi.
� Elements finis a une dimension
EXEMPLE. Considerons, sur un intervalle [a, b], l’E.D.
−y′′(x) + f(x) y(x) = g(x)
et projetons le membre de gauche sur un E.V. de fonctions test φ suffisammentregulieres (φ continue sur [a, b]) engendre par des fonctions {φq}. Une integration parparties donne :∫ b
a
φ(−y′′ + fy
)dx =
∫ b
a
(φ′y′ + fφy) dx+ φ(a) y′(a) − φ(b) y′(b) .
Le terme φ(a) y′(a) disparait si y′(a) = 0 (C.L. de Neuman en a pour y(x), auquelcas φ(a) est arbitraire) ou si φ(a) = 0 (condition imposee a φ(x) lorsque y(x) obeit ala C.L. de Dirichlet y(a) = 0) ; il en est de meme pour le terme φ(b) y′(b). Avec cesconditions et apres projection, l’E.D. conduit a :∫ b
a
(φ′y′ + fφy) dx =∫ b
a
φg dx .
Si y est cherche sous la forme y � ∑Np=1 cp φp, la resolution (approchee) de l’E.D.
conduit au systeme lineaire :
∑p
Aqp cp = gq ou gq =∫ b
a
φq g dx et Aqp =∫ b
a
(φ′q φ′p + f φq φp) dx .
La matrice A d’elements Aqp a comme proprietes interessantes d’etre symetrique,definie positive si f(x) > 0, et proche d’une matrice diagonale si les fonctions φq et φpne se recouvrent plus des que |q − p| est assez grand. Par exemple si [a, b] est diviseen N + 1 intervalles egaux (x0 = a et xN+1 = b) et si y(a) = y(b) = 0, le choix leplus simple pour φp est la fonction triangle de hauteur 1 et de base [xp, xp+2] avecp = 1, · · · , N (approximation de y par des fonctions lineaires par morceaux). On aalors Ap+1 p = App = Ap p+1 �= 0 et Aqp = 0 sinon (matrice tridiagonale).
Remarque : le caractere symetrique de A est lie mathematiquement a l’absence determe (lineaire) en y′ dans l’E.D. et physiquement au fait que l’E.D. correspond al’extremalisation d’une “energie”
∫ ba
(12y
′2+ 12fy
2−gy)dx dont∑
qp12Aqpcqcp−
∑q cqgq
est une forme discrete approchee.
11.4 Resolution d’equations, d’E.D. et d’E.D.P. lineaires 349
� Elements finis a deux dimensions
EXEMPLE. Considerons, dans un domaine D, l’E.D.P. de Poisson
−Δf(x, y) = g(x, y)
ou g est un terme de source et ou f satisfait sur la frontiere γ de D (figure 20a) soit des C.L. de Diri-
chlet (f = Cste sur la partie γ1 de γ) soit des C.L. de Neuman (−→∇f · n = 0 sur la partie γ2 = γ−γ1).
A l’aide de la formule de Green on obtient, pour une fonction test φ suffisamment reguliere∫∫D −(Δf)φ dxdy =
∫∫D−→∇f · −→∇φ dx dy − ∮
γφ−→∇f · ndl ,
et, comme a une dimension, le terme de bord disparaıt si on impose φ = 0 sur γ1.
�
�
�
n2
1C
n
A
(a) (b)
B
t
Figure 20
Pour appliquer la methode des elements finis on decoupe D en elements simples. Par exemple dans
une triangulation les elements sont des triangles t (disjoints ou ayant en commun soit un sommet soit
un cote entier ; figure 20b). Soient n les nœuds “libres” numerotes du reseau, sommets de triangles
sur lesquels la valeur de f n’est pas fixee par les C.L.. Dans le cas d’une approximation de f par des
fonctions lineaires par morceaux, la valeur f(x, y) de f en un point M interieur d’un triangle t = ABC
direct est approximee par
f(x, y) � f(A)λtA(x, y) + f(B)λtB(x, y) + f(C)λtC(x, y)
ou les λtn sont les coordonnees barycentriques de M relatives aux nœuds n = A,B, C. On a alors :−→∇f = Δ−1
t z ∧ (f(A)
−−→BC + f(B)
−→CA+ f(C)
−→AB
)avec Δt = 2 aire (ABC) .
φ (x,y)p
1λ t Α
C
(a)
xy
z
p
1
A
B(b)
Figure 21
(On obtient cette expression en observant que−→∇λtA est constant car λtA est lineaire, que
−→∇λtA ⊥ −−→BC
car λtA est nulle sur BC et que−→∇λtA ·−→BA = 1 ; λtB et λtC satisfont des relations equivalentes ; figure
21a.) L’espace des fonctions φ sur lequel on projette l’E.D.P. est engendre par des fonctions φp elles
aussi lineaires par morceaux, egales a 1 au nœud p et nulles aux autres nœuds ; elles se confondent
avec λtp sur les triangles t de sommet libre commun p (figure 21b). Les inconnues f(n) ≡ fn, valeurs
350 11 • Analyse numerique ; physique discrete
de f aux nœuds libres, sont alors solutions du systeme lineaire :∑nApnfn = gp avec
∑n Apnfn =
∫∫D−→∇φp · −→∇f dxdy et gp =
∫∫D φp g dxdy .
Remarques. 1) Apn =∑t Δt
−→∇φp · −→∇φn ou la somme porte sur les triangles ayant pour sommets les
nœuds libres n et p (Apn = 0 si les sommets ne sont pas contigus) ; gp =∑t
16Δtgt ou la somme porte
sur les triangles de sommet p et ou g est assimile a une constante gt sur chaque triangle (l’integralede φp sur le triangle t valant 1
6Δt).
2) Le systeme lineaire s’obtient aussi par minimisation de∫∫
D(
12
(−→∇f)2 − fg)dx dy.
� Recherche de valeurs propres par collocation
EXEMPLE. Considerons, dans un domaine D de frontiere γ, l’E.D.P.
−Δf(x, y) = E f(x, y)
avec des C.L. de Dirichlet f = 0 sur γ. On peut choisir pour les fonctions φp des ondes planes
sin(kxx + kyy) et cos(kxx + kyy) avec k2x + k2
y = k2 = E fixe et des directions de−→k isotropes.
Puisque ces fonctions satisfont l’E.D.P., on determine leurs coefficients simplement en exprimant que
f =∑Np=1 cp φp = 0 en M points de γ, et f = 1 en un point interieur fixe. En prenant des points
supplementaires Pi sur γ (environ trois fois plus), on calcule la quantite I(k) =∑i |f(Pi)|2 qui devrait
etre nulle si f etait une fonction propre. Lorsque k (donc E) varie, I(k) presente des minima pour
les valeurs propres cherchees. En pratique, pour que I(k) varie “regulierement”, il faut non seulement
considerer un grand nombre d’ondes planes (N ∼ 100), mais aussi choisir N > M + 1 ce qui implique
de resoudre un systeme lineaire sous determine pour les cp, et donc d’utiliser une methode S.V.D. (cf.
section 11.4.1).
11.5 RECHERCHE DE MINIMA
11.5.1 Methodes utilisant le gradient
� Methodes de la steepest descent et du gradient conjugue
(1)
(0)
x
x
Figure 22
La methode de la steepest descent consiste, a l’etape k a partir de x(k), a chercher leminimum de f(x) dans la direction de −∂f(x(k)) qui est celle dans laquelle f decroit leplus vite. Elle revient donc a determiner la valeur α(k)
m de α(k) qui minimise f(x(k) −
α(k)∂f(x(k))), puis a iterer le processus a partir de x(k+1) = x(k) − α
(k)m ∂f(x(k)). Cette
methode n’est pas tres efficace car si il existe une vallee les plus grandes pentes localesont tendance a y faire descendre le chemin avant d’atteindre le minimum ; par ailleursle chemin de steepest descent decrit une ligne brisee qui tourne a angle droit en chaquepoint x(k) ce qui n’est pas la meilleure orientation a prendre pour “viser” le minimum(figure 22).
11.5 Recherche de minima 351
Ces defauts sont corriges dans la methode du gradient conjugue. Le premier pas dex(0) a x(1) est toujours effectue dans la direction de plus grande pente. Mais au lieu detourner a angle droit aux points x(k), la direction suivie de x(k) a x(k+1) (k ≥ 1) estdonnee par :
s(k) = −∂f(x(k)) +∂f(x(k))t∂f(x(k))
∂f(x(k−1))t∂f(x(k−1))s(k−1) .
Justification (figure 22). Si f(x) = 12xtAx est une forme quadratique, la direction de depart en x(0) est
s(0) = −Ax(0). Le point x(1) = x(0) +α(0)s(0) est determine par la condition s(0)tAx(1) = 0 qui exprime
que s(0) est orthogonal au gradient de f en x(1). La direction ideale de minimisation en x(1) n’est pas
−Ax(1), mais −x(1) (appelee direction conjuguee de s(0) par rapport a A ; fleche sur la figure). On
peut l’obtenir a deux dimensions (ou s’en rapprocher si n > 2) en posant s(1) = −Ax(1) + μ(0)s(0) et
en imposant s(0)tAs(1) = 0. Un rapide calcul donne μ(0) = ‖ Ax(1) ‖2‖ Ax(0) ‖−2.
� Methodes de Newton et quasi-Newton
Nous avons deja decrit a la section 11.3.3 (“moindres carres non lineaires”) la methodede Newton pour la minimisation d’une fonction f(x) (χ2(a) dans cet exemple). Apresavoir linearise au voisinage d’un point x(k) choisi proche du minimum l’equation ∂f = 0,on resoud ce systeme d’equations lineaires par une methode iterative. Lorsque la matricehessienne est definie positive, cette methode est une generalisation directe de la methodede Newton-Raphson de recherche de 0 a une dimension (cf. section 11.3.2) appliquee a laderivee f ′(x) d’une fonction convexe (f ′′(x) > 0) ; le gradient a n dimensions ∂ remplacesimplement la derivee premiere et la matrice hessienne J la derivee seconde :
f ′(x(k)) = −f ′′(x(k)) (x(k+1) − x(k)) −→ ∂f(x(k)) = −J(k) (x(k+1) − x(k)) .
REMARQUE. Lorsque J est seulement semi-definie positive nous avons introduit la methode de Levenberg-
Marquardt qui consiste a remplacer J(k) par J(k)+λ(k)I et a faire tendre λ(k) vers 0 lorsqu’on s’approche
du minimum. Cette methode interpole entre celle de la steepest descent (au depart, pour λ grand) et
celle de Newton (pour λ petit, pres du minimum, lorsque la pente tend vers 0).
La methode de Newton presente des inconvenients : d’abord il faut determiner lesn(n− 1)
2derivees secondes de la matrice hessienne J et calculer J−1 ; ensuite le point x(k+1) ne cor-respond pas au minimum de la fonction f(x) dans la direction s(k) de x(k+1)−x(k) ; pire,si J n’est pas definie positive, ce qui peut arriver loin du minimum, elle peut conduirea s’eloigner de ce minimum (considerer l’exemple n = 1 avec f ′′(x(k)) < 0). Dans lesmethodes quasi-Newton on construit des matrices symetriques definies positives G(k)
jouant le role de [Jk]−1 et ne faisant intervenir que ∂f . Soient x(k) et G(k) le point etla matrice obtenus a l’etape k ; on utilise la methode de Newton pour determiner la di-rection dans laquelle on minimise : s(k) = −G(k) ∂f(x(k)). Soient x(k+1) la position duminimum dans cette direction, δ(k) = x(k+1) − x(k) et γ(k) = ∂f(x(k+1)) − ∂f(x(k)) ; onpose (formule D.F.P. : Davidon, Fletcher, Powell) :
G(k+1) = G(k) +1
δ(k) tγ(k)δ(k) δ(k) t − 1
γ(k) tG(k)γ(k)G(k)γ(k) γ(k) tG(k) .
On itere le processus en partant de x(0) et en prenant par exemple G(0) = I.
352 11 • Analyse numerique ; physique discrete
REMARQUES. La formule D.F.P. conserve les caracteres symetrique et definie positive de G(0) et assure
que x(k+1)−x(k) = G(k+1)(∂f(x(k+1))−∂f(x(k))
)(condition quasi Newton). Une formule plus elaboree
satisfaisant aussi ces conditions est la formule BFGS (de Broyden, Fletcher, Goldfarb et Shanno).
11.5.2 Methodes du simplex et du recuit simule
� Methode du simplex
C’est une methode purement geometrique qui fonctionne en comparant les valeurs dela fonction en differents points qui constituent les vertex d’un simplex. Un simplex estune figure geometrique qui, a n dimensions, est constitue de n+ 1 vertex interconnectespar des segments de droites : a deux dimensions ce sont des triangles, a trois dimensionsdes tetraedres etc. Dans cette methode la fonction f(x) etant evaluee aux n + 1 vertexd’un simplex de l’espace {x} (les sommets du triangle ABC sur la figure 23 ou n = 2
A
D
E
C
BB’
Figure 23
et x ≡ (x1, x2)), le vertex qui correspond a la plus grande valeur de f (sommet A)est remplace par son symetrique (D) par rapport au barycentre des n autres vertex(milieu de BC). On obtient ainsi un nouveau simplex (BCD) sur lequel on recommencel’operation (BCD→CDE) et ainsi de suite. Apres p iterations (2 sur la figure), il peutarriver que le nouveau vertex (E) corresponde, comme son predecesseur (B), a la plusgrande valeur de f ; dans ce cas l’iteration suivante ramene au simplex de l’etape p(BCD) et la minimisation ne progresse plus. Pour eviter ce phenomene, le simplex estalors contracte dans la ou les directions qui conviennent (par exemple B→B’) ; son volumetend donc vers 0 lorsque qu’on se rapproche du minimum.
� Methode du recuit simuleCette methode s’applique a la minimisation d’une quantite f(x) dependant de nom-breuses variables discretes ou continues et presentant un tres grand nombre de minimasecondaires dans lesquels d’autres methodes risquent de rester “piegees” avant d’atteindrele minimum global. L’idee generale est de generer une marche au hasard (processus deMarkov) dans l’espace {x} qui conduit a une loi de probabilite de Boltzmannexp− f(x)
T , puis de faire tendre la “temperature” T lentement vers 0 pour selectionnerla configuration x qui minimise f(x) (figure 24). Si on se trouve dans un minimum se-condaire, l’effet de l’“agitation thermique” (T �= 0) est d’en sortir avec une probabilitefinie pour explorer l’espace de configuration au dela de ce minima (effet analogue au“recuit” d’un solide qui, prealablement “trempe” dans un etat amorphe ou polycristallincorrespondant a un minimum local d’energie, est refondu puis refroidi lentement pouratteindre l’etat (mono)cristallin d’energie minimum).
11.5 Recherche de minima 353
{x}
f({x})
loi de Boltzmann
Figure 24
EXEMPLES. L’energie E({S}) = −∑(ij) JijSiSj de N spins Si = ±1 est une fonction
qui, pour N grand ({S} prend 2N valeurs) et pour des couplages entre paires devoisins Jij de signes varies, presente un grand nombre de minima. Pour obtenir leminimum global de cette fonction l’algorithme de Metropolis consiste, a partird’une configuration donnee, a tirer un spin i au hasard et a le retourner (changer Sien −Si) avec une probabilite egale a 1 si le retournement entraıne une diminution
de E (ΔE < 0) et egale a exp−ΔET
(au lieu de 0) si ΔE > 0. Le lecteur verifiera
que les probabilites de transition ainsi definies entre deux etats α et β (qui different
par le retournement d’un spin) verifient la condition de bilan detaille Pβα exp−EαT
=
Pαβ exp−EβT
(cf. section 10.3.2) ; ceci garantit que l’algorithme genere une distributionde Boltzmann. En pratique l’algorithme de Metropolis est realise en tirant un nombrex au hasard dans [0, 1] (avec une loi uniforme) et en acceptant le retournement six < exp−ΔE
T (quel que soit le signe de ΔE), et en le refusant dans le cas contraire(methode de rejet). D’autres exemples d’application de la methode du recuit simuleconcerne des problemes d’optimisation tel que celui du voyageur de commerce, quiconsiste a trouver le chemin le plus court passant une seule fois par N villes, ou telque l’assemblage optimum de circuits elementaires sur une puce en microelectronique.
Index
aberrations geometriques, 238acceleration, 31, 62, 77action, 17, 283, 287, 291, 297, 299adiabatique (approximation), 195, 298adimensionnee (equation), 20, 172, 182Aharonov-Bohm (effet), 293aire, 26, 61, 69, 93, 208, 221
loi des, 32aleatoire, 301amplitude
complexe, 39, 42de probabilite, 118
analysedimensionnelle, 18de Dirac, 150de Fourier, 151vectorielle, 224
angle, 5, 16de diffusion, 37, 116solide, 72
anisotropedielectrique, 48, 262milieu, 265
antiparticule, 130antisymetrie, 83, 85application lineaire, 89, 95approximation
adiabatique, 195, 298A.R.Q.S., 246, 247, 249, 250de Born, 278du champ moyen, 143, 313dt � ∂t, 212galileenne, 55, 113, 291de Gauss, 45, 108, 163de la methode du col, 140, 219de l’optique geometrique, 141, 234de Pade, 336de la phase stationnaire, 140, 267WKB, 197
Babinet (theoreme de), 163barriere de potentiel, 191, 244base, 88
changement de, 88, 98orthonormee, 90
Bayes (theoreme de), 303Beer (loi de), 7Bernouilli
loi de, 304, 307theoreme de, 71, 213, 230
Berry (phase de), 299Bessel (fonctions de), 267Bethe-Harris (experience de), 119Bezier (courbes, surfaces), 341, 342bifurcation, 180, 197, 202, 237, 244
de Hopf, 202bilan
detaille, 320, 321d’energie, 230, 249, 258, 272de grandeurs, 227de quantite de mouvement, 230, 249
binomiale (loi de probibalite), 310Biot et Savart (formule de), 211, 246Bloch (theoreme de), 194Boltzmann, 8
E.D.P. de, 272loi de, 219, 242, 312, 319, 352
Born, 87approximation de, 278
Bose-Einstein (statistique), 314boson, 18, 101, 314boule de billard (mouvement d’une), 82Bragg (condition de), 85brownien (mouvement), 21, 160, 318, 322bruit
blanc, 159, 318, 321de grenaille, 312
Buffon (aiguille de), 328Burgers (E.D.P. de), 274
Cantor, 1ensemble de, 21
Cauchy, 3loi de, 304suite de, 3, 90
Cauchy Riemann (formules de), 279–281
Index 355
causalite, 112, 155, 270caustique, 235, 236Cayley, 87Cayley-Hamilton (theoreme de), 98cercle, 29, 30
de Mohr, 107osculateur, 62, 137
chaleur, voir thermiquechamp
moyen, 143, 313quantique, 129, 130vectoriel, 60
changementde base, 88, 98de jauge, 249, 292de referentiel, 5, 53, 77d’unite, 2, 15de variable, 139, 214, 217, 285
chemin optique, 67, 111, 236, 289χ2, 315, 340Christoffel (symbole de), 296circuit electrique, 13, 40, 150, 151circulation, 210, 220, 224, 282cisaillement, 105coherence
largeur de, 67temps de, 159
collisions, 115commensurables
frequences, 158grandeurs, 2
commutateur, 95, 97, 120, 124, 127, 287complexe
amplitude, 39, 42nombre, 22notation, 39, 46plan, 26
compressibilite, 19, 107, 239, 261Compton
effet, 116longueur d’onde, 18
concave (fonction), 135, 206concavite (de l’entropie), 142, 240conditionnement, 302conditions initiales (C.I.), 166, 168, 174,
176, 331
conditions aux limites (C.L.), 187, 190, 254,266
de Dirichlet, 275, 276, 348de Neuman, 275, 276, 348
cone, 72de lumiere, 112
configuration (espace de), 284coniques, 32, 37, 99conjugaison
complexe, 23, 130optique, 108, 189de spineurs, 103, 131
contrainte, 9, 242, 285extremum avec, 206matrice des, 106, 225
contraste, 43, 49de phase, 162
conventionde signe, 11, 14de sommation d’Einstein, 94, 224, 294
convolution, 41, 146, 150, 307coordonnees
barycentriques, 27, 338, 339, 349curvilignes, 223cycliques, 285d’espace-temps, 102, 294polaires, 31, 184spheriques, 71, 224, 278
Copernic (referentiel de), 56, 78corde de piano, 259corde vibrante, 256, 269, 271Coriolis
acceleration de, 77force de, 184, 187, 230
corps noir, 9, 19, 239correlation
fonction de, 40, 42, 44, 147, 156, 158, 161,165, 321
en probabilite, 308temps de, 159, 321
courant de probabilite, 125, 192, 320courbure
energie de, 259de l’espace-temps, 294, 296de Gauss, 74rayon de, 62, 92, 137d’une surface, 93
356 Index
cristal, 84, 256uniaxe, 263
crochets de Poisson, 286, 287Curie
principe de, 83temperature de, 144
cycle limite, 197, 201, 202
d’Alembert, 253d’Alembertien, 117deplacement, 55, 57de Broglie (relation de), 17, 115, 118, 284decibel, 6deformations, 105, 106, 213degenerescence (facteur de), 313degres de liberte, 88, 124, 168densite de probabilite, 125, 303
conditionnelle, 305conjointe, 305, 313marginale, 305
derivee, 3, 24, 135, 138dans une direction, 209au sens des distributions, 149logarithmique, 136, 137particulaire, 212, 213, 216partielle, 204, 212totale, 284, 292
Descartes (lois de), 67, 84, 188, 236, 264,284
detection synchrone, 155, 158determinant, 97developpement
limite, 138, 144multipolaire, 91, 104, 251de Taylor, 7, 205, 307, 335
diamagnetisme, 293dielectrique
anisotrope, 262milieu, 197, 247polarisation, 155, 198, 247
differentielle, 66, 205, 215, 219de chemin optique, 67forme, 219
diffractionde Fraunhofer, 46, 162de Fresnel, 45, 162
diffusion, 165
angle de, 37, 116E.D.P. de, 262, 268, 271, 317etat de, 275, 278processus de, 317de Rutherford, 37, 185
dilatation, 105, 145, 164dimension, 15
fractale, 21dioptre, 30, 67, 73, 109dipole, 19, 60, 121, 208, 211, 225, 232, 248,
251Dirac
analyse de, 150E.D.P. de, 131impulsion de, 147
Dirichlet (C.L. de), 275, 276, 348dispersion (relation de), 132, 254, 256, 262,
266divergence, 210, 211, 223, 272, 286domaine d’integration, 216, 218Doppler (effet), 66, 114droite, 27dualite temps frequence, 154
ecart type, 308echantillonnage, 145, 156, 165E.D.
d’amplitude, 195, 199, 200, 202d’Euler, 82d’Euler-Lagrange, 283, 286, 287, 298de Hamilton, 286de Schrodinger, 190, 194
E.D.L. du neme ordre, 176E.D.L.S., 25
du premier ordre, 174du second ordre, 25, 174avec second membre, 176avec second membre sinusoıdal, 40
E.D.P.de Boltzmann, 272de Burgers, 274de diffusion, 262, 268, 271, 317, 333de Dirac, 131eikonale, 235, 289d’Euler
(hydrodynamique), 230(relation), 207, 233, 240
Index 357
de Fokker-Planck, 272, 318de Hamilton-Jacobi, 289de Helmholtz, 275de Klein-Gordon, 130de Korteweg-De Vries, 274de Laplace, 209, 274, 279de Liouville, 272de Naviers-Stokes, 231non lineaire, 273des ondes elastiques, 231, 262d’onde simple, 207, 228, 272, 331de Poisson, 275, 278, 299, 349de propagation, 215, 262, 269, 332de Schrodinger, 125, 262, 268, 271, 278,
334de Sine Gordon, 273de Weyl, 131de Weyl-Majorana, 132
Einstein, 51coefficients d’, 321equations d’, 299relation d’ (diffusion), 160, 319relativite, 111
elasticite, 107, 229, 282electricite, 12electromagnetisme, 85, 226, 233, 245
invariance de l’, 63, 117, 297electrostatique, 31, 151, 209, 231, 246, 274elements finis (methode des), 347ellipse, 33, 38, 47, 99, 281emission
induite, 129, 321spontanee, 129, 321
energie, 17, 32, 229, 291bilan d’, 230, 249, 258cinetique, 79, 81, 115, 227, 232electromagnetique, 130, 233, 250d’un etat stationnaire, 119flux d’, 71, 192, 229, 248, 259interne, 141, 227, 230, 239, 272, 313L.C. de l’, 123, 258, 266, 289de liaison, 19, 115, 291libre, 143, 240potentielle, 32, 125, 170, 181, 231, 291vitesse de l’, 266
ensemblecomplet, 3
dense, 3enthalpie libre, 240entiers algebriques, 2entraınement
d’une grandeur, 226, 272vitesse et acceleration d’, 77
entropie, 8, 140, 141, 239, 272, 313enveloppe concave, 143, 242equation
de la chaleur, 272des cordes vibrantes, 257d’etat, 144, 239de Langevin, 160, 318d’Einstein, 299lineaire, 89, 343maıtresse, 318, 320de Maxwell, 117, 245, 248, 262, 297de Schrodinger, 119, 298
ergodicite, 322erreur, 309, 315
d’arrondi, 325de troncature, 325
espacede configuration, 284de Hilbert, 90de phase, 73, 125, 167, 170, 175, 286, 289vectoriel (E.V.), 87, 169
dual, 91des etats quantiques, 118de fonctions, 90
espace-temps, 53, 102, 112, 294estimateur, 315etat
coherent, 125, 128de diffusion, 275excite, 121fondamental, 121gaussien, 125lie, 190, 194, 275de polarisation, 46, 96, 118quantique (E.V.), 118stationnaire, 120, 188, 298
etendue optique, 73, 109, 190, 286Euclide, 1, 51Euler
E.D. d’, 82E.D.P. d’ (hydrodynamique), 230
358 Index
E.D.P. d’ (relation), 207, 233, 240schema numerique d’, 329, 331
Euler-Lagrange (E.D. d’), 283, 286, 287,298
exponentielle
deddx
, 7fonction, 6, 25imaginaire, 23loi de probabilite, 123, 304, 306, 312de matrice, 96
extremum, 135, 206, 236
Fermat (principe de), 30, 36, 67, 111, 236,283
Fermi (regle d’or de), 123Fermi-Dirac (distribution de), 314fermion, 18, 101, 131, 314ferromagnetisme, 143, 315filtrage, 151, 159
optique, 161Floquet (theoreme de), 193fluide, 108fluide parfait, 107, 229, 230flux, 210, 224
d’un champ de vecteurs, 71de charges, 70d’energie, 71, 192, 229, 248, 259de masse, 70, 229de particules, 70de quantite de mouvement, 70, 229
Fokker-Planck (equation de), 272, 318fonction
aleatoire, 301, 317de Bessel, 267caracteristique, 307, 310, 311cha ou peigne de Dirac, 148, 152concave, 135, 206de correlation, 40, 42, 44, 147, 156, 158,
161, 165, 321delta, 147energie potentielle, 231exponentielle, 6, 25gaussienne, 146, 153, 268de Green, 268, 270, 271harmonique, 279de Heaviside, 148homogene, 207, 233, 240
hyperbolique, 8inverse, 137logarithme, 5lorentzienne, 146d’onde, 124de partition, 313periodique, 145, 152, 153porte, 146, 153, 269, 336propre, 100, 128sinus cardinal, 41sinusoıdale, 23de transfert, 41, 151, 153, 162, 165de v.a., 304de z, 24, 279
force, 62, 116, 149centrale, 32, 36, 38, 80de Coriolis, 184, 187, 230de Laplace, 230, 232, 250de Lorentz, 117, 292de pression, 107, 225
formedifferentielle, 219, 239p-lineaire, 91quadratique, 91, 111, 178
formulede Biot et Savart, 211, 246de Cauchy Riemann, 279–281de Green, 277, 349d’Ostrogradski, 223de Parseval, 163de Poisson, 164de Stirling, 140, 143, 243de Stokes, 220, 221, 224, 281, 296
Foucault (pendule de), 75, 186Fourier
analyse de, 151serie de, 152transformation de, 151transformee de, 41, 46, 153, 163
foyer (d’une conique), 34Fraunhofer (diffraction de), 46, 162frequence spatiale, 64, 162Fresnel (diffraction de), 45, 162
Galerkin (methode de), 347Galilee, 51
transformation de, 55, 216
Index 359
Gauss, 22, 51approximation de, 45, 108, 163courbure de, 74integration numerique de, 336methode du pivot, 343theoreme de, 73
gaussien (processus), 321gaussienne
fonction, 146, 153, 268loi, 304, 308
gaz parfait, 9, 71, 239, 299generateur, 8, 96, 97geodesique, 74, 294geometrie
de l’espace, 55de l’espace-temps, 294de Lobatchevski, 113du plan, 26spherique, 16, 74symplectique, 289
Gibbs (phenomene de), 154Goos-Hanchen (effet), 266gradient, 115, 208, 215, 223, 350grandeur
additive, 1algebrique, 11extensive, 9, 19, 240, 309intensive, 240massique, 141, 227molaire, 240quadrupolaire, 104, 210, 251scalaire, 59, 104vectorielle, 59, 104
grandissement (optique), 110graphe, 134gravitation, 18, 104, 274, 294Green
fonction de, 268, 270, 271formule de, 277, 349
grossissement (optique), 110groupe
de Lie, 97de Lorentz, 102, 103des rotations, 103de symetrie, 52, 53, 84, 102
gyrotrope (milieu), 48
Hall (effet), 89Hamilton, 101
E.D. d’, 286formule de, 102principe de, 286
Hamilton-Jacobi (E.D.P. de), 289hamiltonien, 119, 286, 287, 292harmonique, 153, 198
fonction, 279harmoniques spheriques, 91, 104, 278Heisenberg, 87
inegalite de, 90, 124helicite, 118, 131Helmholtz
E.D.P. de, 275theoreme d’, 214
Hermite (polynomes de), 128, 334hermitien (produit), 90Hilbert, 87
action de, 299espace de, 90
homogeneite, 51, 261, 289homothetie, 20, 28, 80, 105Hopf (bifurcation de), 202Householder (transformation de), 346Huygens (construction d’), 235Huygens-Fresnel (principe de), 45, 141, 150,
163hydrodynamique, 20, 93, 212, 226, 229, 261,
274, 279hyperbole, 33, 281hyperboloıde, 36
imaged’une application lineaire, 89methode des, 276
impedance, 30, 41, 260, 261adaptation d’, 191, 260
impulsion de Dirac, 147incompressible, 213, 279independance
lineaire, 88, 94en probabilites, 303, 308, 310
induction, 12, 226inegalite
de Heisenberg, 90, 124de Schwarz, 50, 90
360 Index
inertiematrice d’, 81referentiel d’, 51
inertiel (mouvement), 113, 290inertielle (masse), 290instabilite, 82, 111, 180, 195, 197, 200integrale premiere, 32, 38, 168, 184, 285interactions
electromagnetiques, 291faibles, 63
interferences, 36, 42, 49, 59, 64, 67, 68, 159,293
interpolationde fonctions, 337lineaire, 337
invariance, 15, 52, 83, 107, 115, 130de l’electromagnetisme, 63, 117, 297
inverse (fonction), 137inversion (geometrie), 28irreversible, 9, 123, 320irrotationnel (ecoulement), 213, 279isocline, 171, 175, 200isotropie, 51, 289
Jacobi (identite de), 95jacobien, 217jauge
changement de, 249, 292de Lorentz, 249symetrie de, 292
Kelvin (theoreme de), 214Kepler (mouvement de), 36, 184, 295Klein, 51, 87Klein-Gordon (E.D.P. de), 130Koenig (theoreme de), 78Korteweg-De Vries (E.D.P. de), 274Kramers-Kronig (relations de), 155Kronecker (symbole de), 90
Lagrangemultiplicateurs de, 207, 241, 242principe de, 284theoreme de, 214
Lagrange-Helmholtz (relation de), 110lagrangien, 284Langevin (equation de), 160, 318Laplace, 253
E.D.P. de, 209, 274, 279force de, 230, 232, 250transformee de, 123, 157
laplacien, 209, 278, 326L.C., 85, 228
de la charge, 245de l’energie, 123, 258, 266, 289de la masse, 227microscopiques, 229du moment cinetique, 80, 289de la quantite de mouvement, 289
Lebesgue, 133, 160mesure de, 3
Le Chatelier (loi de), 243Legendre (polynomes de), 91, 278, 334Lenz (loi de), 226Levenberg-Marquardt (methode de), 341,
351Lie, 87
groupe de, 97Lienart-Wiechert (potentiel de), 218lieux geometriques, 30, 35ligne
de champ, 168electrique, 256
limitecentrale (theoreme de la), 309, 311classique, 128continue, 257, 317, 318, 320
lineaireapplication, 89, 95equation, 89
linearite, 39, 41, 147, 150, 169, 187, 261Liouville
E.D.P. de, 272theoreme de, 286
lissage, 146, 229, 252Lobatchevski, 51, 113localisation (des interferences), 68logique, 300loi
de Descartes, 84, 236de Laplace, 93de Le Chatelier, 243de Lenz, 226de Newton, 168, 284de Planck, 314, 321
Index 361
de Stefan, 19, 240de Van’t Hoff, 243
loi de probabilite, 303de Bernouilli, 304, 307binomiale, 310de Boltzmann, 139, 219, 242, 312, 319,
352de χ2, 315, 340exponentielle, 123, 304, 306, 312, 327gaussienne, 139, 304, 308, 308, 327lorentzienne, 304, 308de Poisson, 129, 311uniforme, 304, 306, 307, 327
Lorentzcondition de, 117force de, 117, 292groupe de, 102, 103, 295jauge de, 249transformations de, 54, 112, 216
lorentziennefonction, 146loi, 304, 308
Lotka-Volterra (oscillateur de), 171
magnetostatique, 31, 89, 246, 251, 274Magnus (effet), 280Malus (theoreme de), 68marche au hasard, 309, 317maree (champ de), 295Markov (processus de), 319masse
defaut de, 115et frequence, 132gravitationnelle, 294inertielle, 132, 290nulle, 115, 131reduite, 79
matrice, 94adjointe, 94colonne, 94des contraintes, 106, 225des deformations, 105densite, 50, 119diagonale, 99, 347exponentielle de, 96hermitienne, 50, 95, 96, 99, 102hessienne, 290, 340
d’inertie, 81inverse, 97de Jones, 49de Jordan, 99orthogonale, 95, 96, 100, 215, 347de Pauli, 101, 102de pression, 106, 249projecteur, 95, 101S, 192spectre d’une, 98symetrique, 95, 99, 105, 178, 262, 310symplectique, 289de transfert, 108, 110, 188, 203de transition (probabilite), 319transposee, 94triangulaire, 344, 347tridiagonale, 334, 344, 346, 348unitaire, 95, 96, 99, 102, 192
Maupertuis (principe de), 284maximum de vraisemblance, 315Maxwell, 253
construction de (palier gaz-liquide), 242distribution de, 137, 272, 306equations de, 117, 245, 248, 262, 297
mecanique du solide, 76Meissner (effet), 293metastabilite, 143, 244methode
du col, 140des isoclines, 200de la phase stationnaire, 140
methode (numerique)de Bezier, 341de collocation, 350des elements finis, 347de Galerkin, 347du gradient conjugue, 350de Householder, 346d’integration de Gauss, 336de Lax, 332de Levenberg-Marquardt, 341, 351LU, 344des moindres carres, 339de Monte-Carlo, 328de Neville, 338de Newton, 340, 351de Newton-Raphson, 339
362 Index
du pivot de Gauss, 343QR, 347quasi Newton, 351du recuit simule, 352de rejet, 328de la secante, 339du simplex, 352spectrale, 347de la steepest descent, 350SVD, 345de Tikhonov, 346de tir, 331du trapeze, 326
metrique, 91de l’espace-temps, 111, 294de la sphere, 72structure, 90
metrologie, 17Metropolis (algorithme de), 353microreversibilite, 123, 320Miller (indices de), 65minima (recherche de), 350miroir, 36, 59, 67, 109, 111Mobius (bande de), 222modes propres, 100, 177, 179, 255modulation, 195
d’amplitude, 42, 155, 160de frequence, 42, 160
module de rigidite, 107moindres carres (methode des), 339moment
cinetique, 69, 79, 81, 118, 185cinetique (L.C. du), 80, 289conjugue, 286, 292de la loi de Gauss, 139magnetique, 69, 185, 209, 248, 251d’une v.a., 307
mouvementd’une boule de billard, 82brownien, 21, 160, 318, 322harmonique, 38, 184inertiel, 113, 290de Kepler, 36, 184d’une particule chargee, 116, 186, 196,
292de precession, 185d’un solide, 58, 80
de translation, 56uniformement accelere, 182
moyenne, 307quantique, 119temporelle, 39, 119, 158, 161, 322
moyennisation, 41, 146multiplicateurs de Lagrange, 207, 241, 242multipolaire (developpement), 91
Naviers-Stokes (E.D.P. de), 231Neuman (C.L. de), 275, 276, 348neutrino, 131Neville (methode d’interpolation), 338Newton
loi de, 168, 284methode de minimisation de, 340, 351relations de (optique), 110
Newton-Raphson (methode de), 339nombres
aleatoires, 327algebriques, 2complexes, 22rationnels, 2reels, 3
notation complexe, 39, 46noyau (d’une application), 89
Ohm (loi d’), 13onde
de choc, 207, 228, 229, 274elastique, 231, 262evanescente, 191, 192, 264guidee, 266et mecanique, 236, 284, 286plane, 64, 161, 235, 261propagative, 191, 254simple (E.D.P. d’), 207, 228, 272sismique, 262solitaire, 273sonore, 19, 86, 188, 212, 229, 261spherique, 67, 150, 267, 270stationnaire, 190, 254, 271de surface, 261, 274surface d’, 141, 234
operateurd’annihilation, 128, 130de creation, 128, 130hamiltonien, 119
Index 363
laplacien, 209, 278nabla, 209, 211de position, 124quantite de mouvement, 124de symetrie, 118, 120, 124
optiquede Fourier, 161geometrique (approximation de l’), 141,
234incoherente, 151, 165matricielle, 108, 111, 127non lineaire, 198
orbitale atomique, 104oscillateur
amorti, 149, 174couples, 92, 100, 178, 200entraıne avec frottement solide, 172harmonique quantique, 126, 127de Lotka-Volterra, 171non lineaire, 197parametrique, 173, 187, 193, 195, 285de Van der Pol, 20, 200, 202
Ostrogradski (formule de), 223
paquet d’ondes, 124, 127, 141, 264, 274,286
parabole, 33paramagnetisme, 143, 293, 315parametrage additif, 4parametre d’ordre, 244, 313parametrique (oscillateur), 173, 174, 187,
193, 195, 198, 285parametrique (oscillateur amorti), 195parite, 55, 145Parseval (formule de), 156, 163partition
de l’ensemble des resultats, 302fonction de, 313
Paulimatrices de, 101, 102principe de, 131
pendule de Foucault, 75, 186percussion, 82, 124, 149, 269periodique (fonction), 145, 152, 153periodisation, 145, 156, 164permutation, 94, 101Perot Fabry, 44
phasede Berry, 299espace de, 125, 167, 286, 289vitesse de, 64
phonon, 19, 256photon, 73, 96, 116, 118, 119, 123, 129,
314plan, 64
complexe, 26reticulaire, 65, 85tangent, 206, 208
Planckechelle de, 18facteur de, 74loi de, 137, 314, 321
Planck-Einstein (relation de), 17, 115, 118point fixe, 171points de vue actif et passif, 53Poisson, 253
coefficient de, 108crochets de, 286, 287E.D.P. de, 275, 278, 299, 349formule de, 152, 154, 164loi de, 129, 311
polarisation, 38, 100, 187dielectrique, 155, 198, 247etats de, 46, 96, 118
polynomede Berstein, 341caracteristique, 98de Hermite, 128, 334de Legendre, 91, 278, 334minimal, 98de Tchebytchev, 335
porte (fonction), 146portrait de phase (definition), 170potentiel
chimique, 240, 242, 313, 314de Lienart-Wiechert, 218scalaire, 248, 292thermodynamique, 243, 313vecteur, 211, 248, 292
Poynting (vecteur de), 248precession (mouvement de), 185pression, 239
cinetique, 71, 196, 299force de, 107, 225
364 Index
de radiation, 71, 196primitive, 136, 138principe
de Curie, 83de Fermat, 30, 36, 67, 111, 236, 283de Hamilton, 286de Huygens-Fresnel, 45, 150, 163de Lagrange, 284de Maupertuis, 284de moindre action, 283de Pauli, 131
probabilite, 302amplitude de, 118courant de, 125, 192, 320densite de, 125, 303lois de, 303de transition, 123, 129, 317, 319
probleme a deux corps, 79processus
aleatoire, 301, 317de diffusion, 317gaussien, 321de Markov, 319poissonnien, 312, 321stationnaire, 321
produithermitien, 90mixte, 60, 93scalaire, 26, 60, 90, 95tensoriel, 88, 104vectoriel, 60
projecteur, 50, 90, 95, 101propagation (E.D.P. de), 215, 262, 269pseudovecteur, 62puits de potentiel, 120, 190, 192, 194Pythagore (theoreme de), 16
QR (algorithme), 346quadrivecteur, 114, 216, 296
energie-quantite de mouvement, 114quadrupole, 19, 104, 251quantification, 190, 194, 266, 278quantite de mouvement, 79, 124, 227, 291
L.C. de la, 289quasi-monochromatique (signal), 42, 123,
159quasi-periodique (signal), 158
racines d’un polynome, 25rang (d’une application lineaire), 89rapidite, 5, 54, 112Rayleigh-Ritz, 100rayon
de courbure, 62, 137optique, 67, 108, 188, 189, 234, 235, 296
rayonnement, 19, 86, 251recuit simule (methode du), 352recurrence (relation de), 254redshift gravitationnel, 295referentiel
du centre de masse, 78, 115changement de, 53, 77de Copernic, 56, 78geocentrique, 56d’inertie, 51local, 78, 183
reflexioncoefficient de, 191, 260, 266totale, 264, 266
regle d’or de Fermi, 123, 129relativite d’Einstein, 17, 111renversement du temps, 55reponse
impulsionnelle, 149, 150lineaire (Boltzmann), 314
representation lineaire (d’un groupe), 52,102–104
reseau, 43, 65, 84, 163, 164reciproque, 65
resonance, 40, 179non lineaire, 199parametrique, 174, 193, 195, 198quantique, 122
resultats (probabilites), 301reversible, 55, 262, 298Reynolds, 15
nombre de, 20Ricci (courbure de), 296Richardson (extrapolation de), 327Riemann, 51
courbure de, 296integrale de, 3, 216
R.M.N., 177rotation, 28, 54, 56, 58, 60, 76, 96, 213, 231
symetrie de, 85, 288
Index 365
rotationnel, 210, 211, 223Runge-Kutta (schema numerique de), 329Rutherford (diffusion de), 37, 185
scalairegrandeur, 59, 104potentiel, 292produit, 60, 90, 95
schema numeriquede Crank-Nicolson, 329, 333d’Euler, 329, 331leapfrog, 330, 332de Runge-Kutta, 329
Schrodinger, 87, 253E.D. de, 188, 190, 194E.D.P. de, 125, 262, 268, 271, 278equation de, 119, 298
Schwarzegalite de, 205, 236, 240inegalite de, 50, 90, 147
Schwarzschildaction de, 297metrique de, 295
separation des variables, 278serie de Fourier, 152Shannon (condition de), 156, 165signal
chaotique, 158, 159complexe (analytique), 39quasi-monochromatique, 42, 123, 159quasi-periodique, 158stationnaire, 158
signal lumineux, 156, 159, 312, 321Sine Gordon (E.D.P. de), 273Smith (abaque de), 30solide, 9
champ des vitesses d’un, 80, 211mecanique du, 76mouvement d’un, 58, 80
somme directe (d’E.V.), 88, 104spectre
de frequences d’un signal, 153d’une matrice, 98d’une v.a., 301
sphere, 72spineur, 103, 104, 131splines
B-splines, 336cubic-splines, 337
stabilitenumerique, 325, 330, 332, 333d’un systeme dynamique, 172, 180thermodynamique, 241
stationnarite, 41, 147, 150, 168, 212, 216,261, 289
statistiques quantiques, 314Stefan (loi de), 19, 240Stirling (formule de), 140, 143, 243Stokes (formule de), 220, 221, 224, 281, 296supraconducteur, 277, 293surface, 206, 208, 212
fermee, 224de niveau, 208d’onde, 141, 234orientable, 221ouverte, 224des vecteurs d’onde, 263
SVD (singular value decomposition), 345symetrie, 52, 288
discrete, 58, 62, 85, 95groupe de, 52, 53, 84de jauge, 292operateur de, 118, 120, 124de rotation, 85, 285, 288de translation, 84, 288
symbole de Kronecker, 90symplectique (geometrie ; matrice), 289systeme dynamique, 167, 170, 207
Taylor (developpement de), 7, 135, 205,307, 335
Tchebytchev (polynomes de), 335temperature, 17, 239temps
de coherence, 159de correlation, 159, 321propre, 113, 290, 294
tension (d’un ressort), 12theoreme
de Bayes, 303de Bernouilli, 71, 213, 230de Bloch, 194de Floquet, 193d’Helmholtz, 214
366 Index
de Kelvin, 214de Lagrange, 214de la limite centrale, 309, 311de Liouville, 286du viriel, 233de Wiener-Khintchine, 158, 322
thermique (echange), 71, 229, 239, 298thermodynamique, 27, 141, 238tire-bouchon (regle du), 13, 57, 222trace, 97transfert
fonction de, 41, 151, 153, 162, 165matrice de, 108, 110, 188, 203
transformationcanonique, 287, 290conforme, 29, 282de Fourier, 151de Galilee, 55, 216de Lorentz, 54, 102, 112, 216
transformeede Fourier, 41, 46, 153, 163de Fourier discrete, 157, 334de Laplace, 123, 157en z, 24, 41
transitionde phase, 142quantique, 122
translation, 28, 56, 60, 145, 164, 231d’espace-temps, 54mouvement de, 56symetrie de, 84, 288
transmission (coefficient de), 191transport
parallele, 74, 296quantique, 299
travail, 231, 233, 250en thermodynamique, 142, 243, 298
travaux virtuels (theoreme des), 286
v.a. independantes, 305, 307, 308, 317valeur propre, 98–101, 106, 111, 121, 177,
319, 346
Van der Pol (oscillateur), 20, 200, 202Van der Waals
equation de, 135, 239fluide de, 241, 244
Van’t Hoff (loi de), 243variance, 307, 309vecteur
axial, 63de Jones, 47de Lenz, 37, 184d’onde (surface des), 263polaire, 62potentiel, 292de Poynting, 71, 248propre, 98–101, 121, 177, 319, 345, 346surface, 69tournant, 38, 76, 185, 187unitaire, 31, 62
vectoriel (produit), 60vectorielle (grandeur), 59viriel (theoreme du), 233viscosite, 108, 282vissage, 57vitesse
areolaire, 27c (de la lumiere), 54de l’energie, 266de groupe, 125, 132, 141, 236, 265, 286de phase, 64
volume, 61, 106, 213forme, 93a tres grand nombre de dimensions, 218
Weyl (E.D.P. de), 131Wiener-Khintchine (theoreme de), 158, 322WKB (approximation), 197wronskien, 189, 192
Young (module d’), 108, 258
Zeeman (effet), 186