1Rappels de Relativité Restreinte¶
Principe de Relativité Restreinte¶
A la fin du XIXe siècle, la théorie de l’électromagnétisme de Maxwell s’impose pour décrire les phénomènes électriques et magnétiques. Mieux, elle prédit l’existence des ondes électromagnétiques qui sont découvertes en 1888 par Heinrich Hertz. Leur étude montre qu’elles ont toutes les propriétés connues des ondes lumineuses (réflexion et réfraction, interférences, polarisation et diffraction) et surtout la même célérité qui surgit des équations de Maxwell. Ondes hertziennes et lumineuses sont donc des ondes électromagnétiques, mais l’électromagnétisme de Maxwell ne dit rien du référentiel dans lequel cette célérité serait définie. Par ailleurs, l’expérience de Michelon et Morley (1887) wiki:Expérience_de_Michelson_et_Morley montre que la vitesse de la lumière ne semble pas se composer avec la vitesse de la Terre autour du Soleil, alors que celle de Fizeau (1849) wiki:Expérience_de_Fizeau montre qu’elle se compose partiellement avec celle d’un fluide en mouvement. On comprend donc que la théorie électromagnétique s’accorde mal avec la mécanique newtonienne et semble avoir besoin d’être rafistolée au gré de résultats expérimentaux contradictoires.
Figure 1:Schéma de l’expérience de Michelson-Morley (1887). La lumière est divisée en deux faisceaux perpendiculaires qui parcourent des distances égales avant de se recombiner au détecteur. L’absence de franges d’interférence démontre l’invariance de la vitesse de la lumière.
Plutôt que d’entreprendre ce chemin hasardeux qui aurait fait perdre la puissance prédictive de la théorie lorsque des corps sont en mouvements, Albert Einstein propose une approche révolutionnaire dans son célèbre article de 1905 Sur l’électrodynamique des corps en mouvement Einstein, 1905. Il postule que la célérité de la lumière est la même en tout référentiel et remet donc en cause la composition galiléenne des vitesses, et même les notions d’espace et de temps. Le principe fondamental de cette nouvelle physique est le principe de relativité restreinte.
Si une loi physique semble vraie dans un référentiel inertiel, aux incertitudes expérimentales près définissant son domaine de validité, alors elle doit rester vraie dans un autre référentiel galiléen. C’est par exemple le cas du principe fondamental de la dynamique de Newton. Cependant, imposer cela à la théorie de l’électromagnétisme pose un sérieux problème, car il faut remettre en cause la composition galiléenne des vitesses pour les ondes électromagnétiques.
Transformations de Lorentz¶
Si la théorie électromagnétique est vérifiée dans un référentiel galiléen, quelles sont les transformations de coordonnées spatio-temporelles pouvant laisser cette célérité invariante? Soit deux évènements de coordonnées spatio-temporelles et dans un référentiel liés entre eux par l’échange d’un signal lumineux, alors :
Imposer la constance de la vitesse implique dans un autre référentiel galiléen on vérifie aussi :
Il apparait donc judicieux de définir l’intervalle espace-temps pour un intervalle entre deux évènements infiniment proches :
Soit un quadri-vecteur de coordonnées , où la composante correspond au temps[1] (avec la fameuse célérité maximale et le temps) et les composantes correspondent aux coordonnées cartésiennes . Dans ce cours, nous emploierons les lettres grecques pour les composantes allant de 0 à 3 et les lettres latines pour les composantes spatiales allant de 1 à 3. On définit la métrique de Minkowski :
de telle sorte qu’en coordonnées cartésiennes on puisse définir l’intervalle espace-temps ainsi entre deux coordonnées spatio-temporelles proches :
Pour passer à un autre système de coordonnées , on introduit la transformation de Lorentz ainsi :
où est une simple translation temporelle et spatiale.
Quelle forme doit prendre cette transformation linéaire[2]? Pour assurer que la vitesse de la lumière est invariante par changement de système de coordonnées , on doit conserver pour la propagation d’un rayon lumineux donc . La transformation de Lorentz doit donc assurer la conservation de l’intervalle espace-temps:
D’où la relation de fermeture:
A partir de la relation constitutive (8), on peut démontrer que les transformations de Lorentz forment un groupe défini par et . Quelques calculs plus tard (voir Raimond (2006) ou Langlois (2013) par exemple), on montre que la transformation des coordonnées entre deux référentiels dont l’un se déplace à la vitesse s’écrit de façon unique :
pour garantir la constance de la célérité de la lumière dans tous les référentiels galiléens.
Si on inclut des rotations de l’espace, avec un référentiel se déplaçant à la vitesse constante par rapport à un autre référentiel, les composantes du tenseur s’écrivent finalement :
Les transformations de Lorentz imposent que non seulement la vitesse de la lumière ne se compose pas avec la vitesse d’un observateur ou d’une source, mais aussi qu’elle est indépassable. Or la force de gravitation se propage instantanément à distance infinie dans la théorie newtonienne. Le déplacement d’une masse est instantanément ressenti gravitationnellement dans tout l’Univers. Après avoir dû réécrire les équations de la cinématique pour préserver les équations de Maxwell, Einstein s’attelle pendant les 10 années suivantes à reformuler la théorie de la gravitation newtonienne pour qu’elle rentre dans ce nouveau cadre. L’ingrédient principal de sa démarche est le constat que masse gravitationnelle et masse inertielle sont identiques, ce qui est indice du fait que la gravitation pourrait être décrite par un effet cinématique.
2De Newton à la Relativité Générale¶
La Relativité Générale est la théorie de la gravitation à la base de la cosmologie moderne. Elle donne une explication géométrique à la force gravitationnelle introduite par Newton trois siècles auparavant. Dans cette théorie, tomber par terre n’est plus dû à un vecteur force malheureusement orienté vers le sol, mais à la déformation de l’espace-temps provoquée par la Terre. Formulée ainsi, la Relativité Générale semble bien compliquée pour peu de choses. Mais les principes généraux à la base de cette théorie et la richesse de ses implications (dont la théorie newtonienne) en font la théorie phare pour décrire la gravitation. Au long de cette section, nous allons introduire pas à pas plusieurs concepts de la Relativité Générale tels que l’équation des géodésiques, la métrique et la dérivée covariante, pour aboutir à l’équation d’Einstein de la Relativité Générale, base de la cosmologie moderne. Cette introduction est largement inspirée de Weinberg (1972) et Gourgoulhon (2013).
Le Principe d’Équivalence¶
Dans le principe fondamental de la dynamique énoncé par Newton, pourquoi la masse intervenant dans le terme d’inertie est-elle rigoureusement la même que celle intervenant dans la gravitation newtonienne ? Cette égalité troublante entre masse inertielle et masse gravitationnelle, validée par des siècles d’expérimentations (pendules de Newton, balance d’Eötvös, etc.) singularise la gravitation par rapport aux autres interactions telles la force de Coulomb qui dépend de la charge électrique donc des corps considérés. Cela suggère que la gravitation n’est pas une propriété des corps eux-mêmes mais de l’espace dans lequel ils se meuvent.
Expériences d’Eötvös (1889)
Dans cette expérience réalisée en 1889, Eötvös montre qu’une masse de bois et une masse de platine subissent la même force gravitationnelle à 10-9 près, en observant la torsion d’une balance Von Eötvös, 1890. Cette dernière compare le couple exercé par la force gravitationnelle (dépendante de la masse gravitationnelle) et le couple exercé par la force centrifugre due à la rotation de la Terre (dépendande de la masse intertielle). Voir une description de l’expérience ici wiki:Eötvös_experiment.
Considérons une masse ponctuelle soumise à un champ gravitationnel externe uniforme et constant et à des forces non gravitationnelles . Alors le principe fondamental de la dynamique appliqué dans un référentiel galiléen à cet objet nous permet de prédire sa position à un instant par la résolution de l’équation différentielle :
avec la masse gravitationnelle et la masse intertielle. Plaçons nous dans un référentiel (non galiléen) accéléré par rapport au référentiel galiléen initial avec une accélération d’entrainement . Dans muni des coordonnées , le principe fondamental de la dynamique s’écrit avec une force intertielle (aussi appelée force fictive car venant d’un effet cinématique) due à l’accélération d’entrainement :
Grâce à l’égalité entre masse intertielle et masse gravitationnelle , on remarque qu’on peut faire un choix particulier de référentiel tel que , tel que le principe fondamental de la dynamique s’écrit comme s’il n’y avait ni accélération et ni gravitation :
Les lois de la physique apparaissent donc identiques pour un observateur lié à un référentiel galiléen considérant que l’objet subit une force de gravité et pour un observateur lié à un référentiel en chute libre et considérant que l’objet ne subit pas de force gravitationnelle. L’effet gravitationnel a été inscrit dans un changement de coordonnées . Et si cette démarche était possible pour tout champ gravitionnel, au moins localement dans une région où est quasi-constant et pendant une durée d’expérience où est quasi-stationnaire ? Le Principe d’Équivalence formulé par Einstein prend acte de l’équivalence entre gravitation et accélération due à l’égalité des masses inertielle et gravitationnelle, du moins pour des champs gravitationnels qui varient faiblement dans le temps et l’espace, et l’élève en principe de construction pour les lois physiques.
C’est donc une généralisation du principe de relativité restreinte à tous les référentiels, en présence de gravitation ou non. Ce principe est vérifié expérimentalement avec une très bonne précision, notamment par le Lunar Laser Ranging Williams et al., 2004 et par le satellite MICROSCOPE avec une précision de Touboul et al., 2022.
Équations du mouvement¶
Appliquons le Principe d’Équivalence au problème d’un objet massif en chute libre. Pour cet objet, il existe donc localement un système de coordonnées particulier tel que l’équation de sa trajectoire s’écrive de la même manière que si le référentiel était non accéléré et sans gravitation :
avec le temps propre[3] :
Le paramètre va nous permettre de paramétrer la courbe , tel une abscisse curviligne. Dans cette équation il ne joue que le rôle d’une étiquette pour paramétrer les positions successives de l’objet, mais il a l’immense avantage d’être invariant de Lorentz et d’être le temps mesuré par l’observateur dans le référentiel de la particule.
D’après le Principe d’Équivalence, cette équation est aussi valable dans un certain voisinage de l’objet en question avec un autre choix de coordonnées spatio-temporelles. Il existe donc un autre système de coordonnées arbitraire dans lequel on a le droit de réécrire l’équation de sa trajectoire . Cherchons la forme qu’elle prendrait pour ces coordonnées :
Après multiplication par , on obtient[4] la nouvelle équation du mouvement :
où est la connexion affine définie par:
Le temps propre se réécrit:
ce qui définit ainsi le tenseur métrique :
Le tenseur décrit la géométrie de l’espace-temps dans le nouveau système de coordonnées et remplace la métrique cartésienne . C’est l’objet fondamental de la Relativité Générale car il permet de décrire les distances parcourues dans un espace-temps non euclidien (courbe).
Le tenseur métrique dans des cas simples
Soit un espace euclidien 2D de métrique de coordonnées . On réalise une rotation de l’espace d’un angle , passant aux coordonnées par :
Calculons pour l’exemple :
Après avoir calculer les autres termes, on a :
donc l’espace reste euclidien après rotation. De façon équivalente on aurait pu obtenir la métrique en étudiant la conservation d’un élément de longueur par rotation :
Soit un espace sphérique 2D de rayon . Une position sur la sphère est donnée par deux angles . Un vecteur élémentaire sur la sphère a pour longueur :
D’où la métrique sur cet espace courbe :
dont la courbure est la moitié du scalaire de Ricci (voir Scalar curvature) et vaut comme attendu pour une sphère.
Soit un espace-temps euclidien 2D de métrique de coordonnées . On réalise une translation galiléenne de l’espace par une vitesse constante , passant aux coordonnées par :
Métrique inverse
On pourrait par la suite montrer que peut ne s’écrire qu’à l’aide d’un seul système de coordonnées et du tenseur métrique :
Si elles sont présentes, les forces autres que la gravitation s’appliquant à la particule test peuvent s’ajouter au membre de droite de l’équation (25) :
avec la masse de l’objet et le vecteur contravariant des forces non gravitationnelles s’appliquant à une particule massive[5]. La bonne écriture du principe fondamental de la dynamique selon le Principe d’Equivalence est donc l’équation (24), car on peut montrer que cette dernière est bien invariante par une transformation locale de système de coordonnées (démonstration Weinberg (1972)[p. 102]) et se réduit au principe fondamental de la dynamique en l’absence de gravitation (connexion affine nulle) .
Equation du mouvement pour les particules de masse nulle
Pour une particule sans masse, comme le photon ou le neutrino, le temps propre défini par l’équation (15) est nul. A la place de on peut alors utiliser une autre abscisse curviligne, telle la coordonnée pour paramétrer la trajectoire de la courbe. Par un raisonnement similaire on aboutit à cette équation du mouvement :
Dérivée covariante¶
De manière générale, on veut dorénavant que les écritures des équations de la physique soit invariantes par changement de coordonnées et en présence ou non de gravitation. On définit ainsi une version alternative du Principe d’Equivalence pour guider la construction des équations physiques en Relativité Générale.
Comment se transforment les différents objets en physique lors d’un changement de coordonnées ? Tout d’abord, les nombres scalaires ne changent pas : ils sont invariants par changement de coordonnées (comme une température, une densité, , etc.). Les vecteurs (contravariants) se transforment selon l’équation :
car la projection des coordonnées du vecteur selon les vecteurs de base des deux systèmes sont différentes.
Transformation d’un vecteur
Soit le vecteur accélération de pesanteur , et un référentiel cartésien tel que . Dans un référentiel tourné d’un angle par rapport au référentiel , ses nouvelles coordonnées se trouvent facilement par rotation des vecteurs de base:
Si on applique la formule (26), on retrouve bien la même chose :
Le facteur est appelé le Jacobien de la transformation.
De manière plus générale, on définit les tenseurs comme les objets qui se transforment selon une généralisation de l’équation (26). Voici une écriture avec deux indices contravariant et un indice covariant :
Si une équation physique est homogène en ces indices d’Einstein et est formée de tenseurs, alors elle remplit la première condition du Principe de Covariance Générale.
En physique, beaucoup d’équations sont locales et donc invoquent des dérivées. Le soucis qui se présentent alors est que la dérivée d’un vecteur ne se transforme hélas pas comme un tenseur. En effet, en dérivant (26) on obtient :
Le premier terme semble respecter les transformationes tensorielles mais pas le second. Ce dernier ressemble par contre beaucoup à la définition du la connexion affine. Ceci amène à définir la dérivée covariante d’un vecteur par rapport à la coordonnée :
Le premier terme correspond à la variation ordinaire d’un vecteur si on le déplace dans son voisinage. Le second terme prend en compte les changements du systèmes de coordonnées lui aussi déplacé, car le symbole de Christoffel décrit les changements des vecteurs de base du référentiel. Cette définition de la dérivée se réduit à la simple dérivée partielle dans un référentiel sans gravitation i.e. de Minkowski (connexion affine nulle).
Illustration de la variation d’un vecteur (cyan) dans le voisinage d’une base d’un espace courbe. Suite à un déplacement dans son voisinage (ici le long de ), le vecteur change de taille (premier terme de la dérivée covariante) et la base qui définit ses projections donc ces coordonnées change également. La dérivée covariante calcule la variation des composantes du vecteur due à ces deux changements.
Cette définition de la dérivée en Relativité Générale exprime correctement la variation d’un vecteur le long d’une coordonnée dans un espace courbe. Ce vecteur variation se transforme bien comme un tenseur contravariant par un changement de coordonnées (contrairement à la dérivée usuelle): le vecteur variation est donc correctement défini pour tout système de coordonnées.
Pour illustrer toute sa profondeur, voici la définition de la dérivée covariante non pas par rapport à une coordonnée, mais le long d’une courbe quelconque paramétrée par le temps propre (invariant par changement de coordonnées) :
Posons la quadri-vitesse . L’équation du mouvement (24) s’écrit alors très simplement
Cette équation ainsi écrite rappelle fortement le principe fondamentale de la dynamique, mais place la mécanique dans un cadre relativiste, invariant par tout changement de systèmes de coordonnées et en présence de gravitation. La notion de dérivée covariante est donc bien appropriée aux calculs de Relativité Générale et remplace bien la dérivée usuelle dans ce cadre.
De manière générale, remplacer les dérivées usuelles d’une théorie physique par les dérivées covariantes permet d’aboutir à une écriture des lois physique respectant le principe d’équivalence, donc une invariance par changement de référentiel et en présence de gravitation. Si celle-ci est vraie sans gravitation et localement dans un espace de Minkowski, alors elle reste vraie dans un référentiel quelconque avec gravitation. Par exemple, en l’absence de champ gravitationnel les équation de Maxwell s’écrivent :
où est le quadri-vecteur courant électrique et le tenseur électromagnétique. Si on introduit les tenseurs et tels que ces derniers se réduisent à et dans un référentiel inertiel de Minkowski, alors la théorie électromagnétique respecte le principe d’équivalence si on utilise la dérivée covariante :
et cette écriture est valide dans tout système de coordonnées puisque vraie dans Minkowski.
Vers l’équation d’Einstein¶
Armés de ces outils, allons maintenant vers une dérivation simple de l’équation d’Einstein qui résume la gravitation à une déformation de l’espace-temps par la matière. Commençons par nous intéresser à une particule massive se déplaçant lentement dans un champ gravitationnel faible, constant mais quelconque cette fois. D’après le Principe d’Équivalence, on a vu qu’il existe un système de coordonnées inertielles tel que l’équation du mouvement (14) soit encore valable dans un autre référentiel mais avec champ gravitationnel. L’hypothèse de vitesse faible nous permet de négliger devant . On a alors au premier ordre dans un champ de gravité faible et quasi-stationnaire :
Dans l’hypothèse d’un champ gravitationnel faible, on peut adopter une métrique presque cartésienne :
et on obtient au premier ordre :
D’après la deuxième équation on en déduit que est une constante. Donc on peut diviser la première équation par et on obtient :
Or on sait que dans la limite newtonienne on a :
avec le potentiel gravitationnel (i.e. s’il est engendré par une masse à une distance , étant la constante de Newton). En comparant avec (35), on a . Or la métrique doit être de Minkowski à l’infini (hypothèse de faible perturbation), donc et :
Par conséquent, la métrique de l’espace-temps va pouvoir contenir les effets gravitationnels. L’élément correspondant à la composante temporelle de la métrique, le battement des horloges dépend par conséquent de l’intensité du champ gravitationnel. Ceci correspond à l’effet Einstein, la seule conséquence de la Relativité Générale aujourd’hui utilisée technologiquement (dans le GPS, voir Figure 4).
Figure 4:Illustration de l’effet Einstein. Un photon tombant dans un puits gravitationnel gagne de l’énergie donc sa fréquence augmente. De façon équivalente, on peut dire que les horloges dans un champ gravitationnel retardent par rapport à des horloges identiques situées en dehors. Les récepteurs GPS doivent prendre en compte cet effet pour en déduire leur position par rapport aux satellites.
Cet exercice sur une particule ponctuelle nous apprend que le champ gravitationnel est finalement contenu dans la métrique, et que cette métrique dépend donc de la présence de matière. Il est donc possible d’imaginer une généralisation de ce constat. Le potentiel newtonien est déterminé par l’équation de Poisson :
où est la densité volumique de masse et la constante de Newton. Cette dernière est associée à la densité d’énergie du tenseur énergie-impulsion de la matière (voir chapitre L’Univers en expansion), donc avec l’équation (37) on peut obtenir :
Cette équation n’est pas invariante par transformation de Lorentz, d’où la nécessité de modifier la théorie de la gravitation newtonienne si on admet le principe de relativité restreinte. Les tenseurs sont les bons objets qui peuvent permettre d’atteindre cet objectif. On peut alors imaginer qu’il existe un tenseur combinant des dérivées premières et secondes de la métrique généralisant cette dernière équation à toutes les coordonnées tel que
Cette dernière équation correspond à une première version de l’équation d’Einstein. Ce raisonnement ne nous a permis que d’intuiter sa forme, mais une autre démonstration plus rigoureuse permet d’obtenir l’expression du tenseur d’Einstein :
avec le tenseur de Ricci et la courbure scalaire (trace du tenseur de Ricci ), eux-mêmes obtenus par le tenseur de Riemann :
Comme le tenseur d’Einstein contient des dérivées secondes de la métrique, l’équation d’Einstein lie la courbure de l’espace-temps (donc les trajectoires des corps) à son contenu en énergie et matière.
De plus, apparaît être de divergence nulle. C’est l’identité de Bianchi :
Par l’identité de Bianchi, on voit aussi que l’équation d’Einstein peut être définie à une constante près[6] tout en gardant la conservation de l’énergie. Cette constante est aujourd’hui appelée constante cosmologique. Voici l’équation d’Einstein sous sa forme définitive Einstein, 1917 :
Par la suite, l’indice 0 des tenseurs correspondra donc à la coordonnée temporelle, tandis que les indices suivants correspondront aux coordonnées spatiales.
La linéarité est imposée par l’invariance de la physique par translation dans l’espace et le temps Raimond, 2006.
A travers cette définition, on a choisi une métrique de signature que nous garderons par la suite.
Sachant que , car est la Jacobien de la transformation de coordonnées et le second facteur est son inverse.
Si étudie une particule de masse nulle, il suffit de remplacer par le modèle de l’interaction s’appliquant à cette particule.
Car on a aussi .
- Einstein, A. (1905). Zur Elektrodynamik bewegter Körper. Annalen Der Physik, 322(10), 891–921. https://doi.org/10.1002/andp.19053221004
- Raimond, J.-M. (2006). Electromagnétisme et relativité. https://cel.hal.science/cel-00092954
- Langlois, D. (2013). Relativité générale. Des fondements géométriques aux applications astrophysiques. De Boeck. https://www.deboecksuperieur.com/livre/9782311007190-relativite-generale
- Landau, L. D., & Lifshits, E. M. (1989). Théorie des champs. Editions Mir. https://books.google.bi/books?id=99z7QQAACAAJ
- Weinberg, S. (1972). Gravitation and cosmology: principles and applications of the general theory of relativity. http://www.lavoisier.fr/livre/notice.asp?ouvrage=1382255
- Gourgoulhon, E. (2013). Relativité générale (cours M2 “Astronomie et Astrophysique”).
- Von Eötvös, R. (1890). über die Anziehung der Erde auf verschiedene Substanzen. Math. Naturwissenschaft. Ber. Ungarn, 8, S65-68. https://mek.oszk.hu/03200/03286/html/eotvos1/eotv7.html
- Williams, J., Turyshev, S., & Boggs, D. (2004). Progress in lunar laser ranging tests of relativistic gravity. Physical Review Letters. http://prl.aps.org/abstract/PRL/v93/i26/e261101
- Touboul, P., Métris, G., Rodrigues, M., Bergé, J., Robert, A., Baghi, Q., André, Y., Bedouet, J., Boulanger, D., Bremer, S., Carle, P., Chhun, R., Christophe, B., Cipolla, V., Damour, T., Danto, P., Demange, L., Dittus, H., Dhuicque, O., … Visser, P. (2022). MICROSCOPE Mission: Final Results of the Test of the Equivalence Principle. Phys. Rev. Lett., 129(12), 121102. 10.1103/PhysRevLett.129.121102
- Einstein, A. (1917). Kosmologische Betrachtungen zur allgemeinen Relativitätstheorie. Sitzungsberichte Der Königlich Preussischen Akademie Der Wissenschaften, 142–152. https://adsabs.harvard.edu/pdf/1917SPAW.......142E
- Lévy-Leblond, J.-M. (1976). One more derivation of the Lorentz transformation. American Journal of Physics, 44(3), 271–277. 10.1119/1.10490