Математическая формулировка общей теории относительности

Материал из свободной русской энциклопедии «Традиция»
Перейти к: навигация, поиск

В этой статье рассматривается математический базис общей теории относительности.

Исходные положения[править]

Наше интуитивное восприятие указывает нам, что пространство-время является регулярным и непрерывным, то есть не имеет «дыр». Математически эти свойства обозначают, что пространство-время будет моделироваться гладким дифференцируемым многообразием 4 измерений \( M_4 \), то есть пространством размерности 4, для которого окрестность каждой точки походит локально на четырёхмерное псевдоевклидово пространство. Гладкость здесь означает достаточную дифференцируемость, пока без уточнения её степени.

Геометрия пространства-времени[править]

NB Эта статья следует классическим соглашениям знаков Мизнера, Торна и Уилера[1]

В этой статье принимается также соглашение Эйнштейна для суммирования по повторяющимся индексам.

Метрический тензор[править]

Дифференцируемое многообразие [2] M, снабжённое лоренцевым метрическим тензором g, и представляет собой таким образом Лоренцево многообразие, которое составляет частный случай псевдориманова многообразия (определение «лоренцев» будет уточнено дальше в тексте; см. ниже раздел "Лоренцева метрика").

Возьмём какую-нибудь систему координат \( x^{\mu} \) в окрестности точки \( P \), и пусть \({\mathbf e}_{\mu}(x) \) — локальный базис в касательном пространстве \( T_xM \) к многообразию \( M \) в точке \(x\in M \). Касательный вектор \( \mathbf w \in T_xM\) запишется тогда как линейная комбинация базисных векторов:

\( \mathbf{w} \ = \ w^{\mu} \ \mathbf{e}_{\mu}.\)

При этом величины \( w^{\mu} \) называются контравариантными компонентами вектора w. Метрический тензор \( \mathbf g \) тогда — симметричная билинейная форма:

\(\mathbf g \ = \ g_{\mu\nu}(x)\ dx^{\mu}\ \otimes \ dx^{\nu},\)

где через \( dx^{\mu} \) обозначен дуальный по отношению к \({\mathbf e}_{\mu}(x)\) базис в кокасательном пространстве \(T_x^*M\), то есть такие линейные формы на \(T_xM\), что:

\( dx^{\nu} ({\mathbf e}_{mu}) \ =\ \delta_{\mu}^{\nu}. \)

Далее будем предполагать, что компоненты \( g_{\mu\nu}(x) \) метрического тензора меняются в пространстве-времени непрерывно[3].

Метрический тензор, таким образом, может быть представлен действительной симметричной матрицей 4x4:

\( g_{\mu\nu} \ = \ g_{\nu\mu}. \)

Вообще любая действительная матрица 4x4 имеет априори 4 x 4 = 16 независимых элементов. Условие симметрии уменьшает это число до 10: на самом деле, остаётся 4 диагональных элемента, к которым надо добавить (16 — 4)/2 = 6 недиагональных элементов. Тензор \(g_{\mu\nu}\) обладает, таким образом, только 10 независимыми компонентами.

Скалярное произведение[править]

Метрический тензор определяет для каждой точки \( x \in M \) многообразия псевдо-скалярное произведение («псевдо-» в том смысле, что отсутствует положительная определённость ассоциированной квадратичной формы (квадрата вектора); см. Лоренцева метрика) в касательном к многообразию \(M^{}\) в точке \(x\) псевдоевклидовом пространстве \(T_xM\). Если \(\mathbf u\) и \(\mathbf v\) — два вектора \(T_xM\), их скалярное произведение запишется как:

\(\mathbf u \cdot \mathbf v \ = \ \mathbf g (\mathbf u, \mathbf v) \ = \ g_{\mu \nu} \ u^{\mu} \ v^{\nu}\)

В частности, взяв два базисных вектора, получаем компоненты:

\(g_{\mu \nu} \ = \ \mathbf g ({\mathbf e}_{\mu}, {\mathbf e}_{\nu}) \ = \ {\mathbf e}_{\mu} \cdot {\mathbf e}_{\nu} \)

Замечание: если величины \(w^{\mu}\) обозначают контравариантные компоненты вектора w, то можно определить также его ковариантные компоненты как:

\( w_{\mu} \ = \ \mathbf w \ \cdot \mathbf e_{\mu}.\)

Элементарное расстояние — интервал[править]

Рассмотрим вектор элементарного перемещения \( d\mathbf P \ = \ \epsilon^{\mu} \mathbf e_{\mu}\) между точкой \(P^{}\) и бесконечно близкой точкой: \( | \epsilon^{\mu} | \ll 1 \). Инвариантной инфинитезимальной нормой этого вектора будет действительное число, обозначаемое \( ds^2 \), называемое квадратом интервала, и равное:

\( ds^2 \ = \ g_{\mu\nu}(x)\ \epsilon^{\mu} \ \epsilon^{\nu}\).

Если обозначить компоненты вектора элементарного перемещения «по-физически» \( \epsilon^{\mu} = dx^{\mu} \), инфинитезимальный квадрат длины (интервала) запишется формально как:

\(ds^2 \ = \ g_{\mu\nu}(x) \ dx^{\mu} \ dx^{\nu}\)

Внимание: в этой формуле, а также и далее, \(dx^{\mu}\) представляет собой действительное число, которое интерпретируется физически как «инфинитезимальное изменение» координаты \(x^{\mu}\), а не как дифференциальная форма!

Лоренцева метрика[править]

Уточним теперь выражение «Лоренцев», которое означает, что метрический тензор имеет сигнатуру (1,3,0). Принцип эквивалентности утвердает, что можно «стереть» локально поле гравитации, выбирая локально инерциальную систему координат. С математической точки зрения такой выбор является переформулировкой известной теоремы о возможности приведения квадратичной формы к главным осям.

В такой локально инерциальной системе координат \( X^{\alpha} \) вокруг точки \( P \), инвариант \( ds^2 \) запишется как:

\(ds^2 \ = \ (\eta_{\alpha \beta}+\delta_{\alpha \beta}) \ dX^{\alpha} \ d X^{\beta} \ = \ - \ c^2 \, dT^2 \, + \, dX^2 \, + \, dY^2 \, + \, dZ^2,\)

где \(\eta_{\alpha\beta}\) является метрикой плоского пространства-времени Минковского, а \(\delta_{\alpha\beta}\) имеет второй порядок малости по координатам \( X^{\alpha} \). Принимая соглашение знаков Мизнера, Торна и Уилера, имеем [1]:

\(\eta_{\alpha \beta} \ = \ \mathrm{diag} \ ( -1, \, +1, \, +1, \, +1 \, )\)


Далее используются следующие обычные соглашения:

  • греческие индексы меняются от 0 до 3. Они соответствуют величинам в пространстве-времени.
  • латинские индексы меняются от 1 до 3. Они соответствуют пространственным составляющим величин в пространстве-времени.

Например, 4-вектор положения запишется в локально инерциальной системе координат как:

\( X^{\alpha} \ = \ \left( \begin{matrix} X^{0} \\ X^{i} \end{matrix} \right) \ = \ \left( \begin{matrix} X^{0} \\ X^{1} \\ X^{2} \\ X^{3} \end{matrix} \right) \ = \ \left( \begin{matrix} c \, T \\ X \\ Y \\ Z \end{matrix} \right). \)

Внимание: на самом деле конечные, а не инфинитезимальные приращения координат не образуют вектора. Вектор из них возникает лишь в однородном пространстве нулевой кривизны и тривиальной топологии.

Лоренцев характер многообразия \(M^{}\) обеспечивает, таким образом, то, что касательные к \(M^{}\) в каждой точке псевдоевклидовы пространства будут обладать псевдоскалярными произведениями («псевдо-» в том смысле, что отсутствует положительная определённость ассоциированной квадратичной формы (квадрата вектора)) с тремя строго положительными собственными значениями (соответствующими пространству) и одним строго отрицательным собственным значением (соответствующем времени). В частности, элементарный интервал «собственного времени», отделяющий два последовательных события, всегда:

\( d \tau^2 \ = \ - \frac{ds^2}{c^2} \ > \ 0. \)

Общие понятия аффинной связности и ковариантной производной[править]

Обобщенно, аффинной связностью называется оператор \( \nabla \), который приводит в соответствие векторному полю \( \mathbf V \) из касательного пучка \( TM \) поле эндоморфизмов \( \nabla \mathbf V \) этого пучка. Если \( {\mathbf w} \in T_xM \) — касательный вектор в точке \( x \in M \), обычно обозначают

\( \nabla_{\mathbf w} \ \mathbf V(x) \ = \ \nabla \mathbf V(x,\mathbf w).\)

Говорят, что \( \nabla_{\mathbf w} \mathbf V \) является «ковариантной производной» вектора \(\mathbf V \) в направлении \( {\mathbf w} \). Предположим к тому же, что \( \nabla \mathbf V \) удовлетворяет дополнительному условию: для любой функции f справедливо

\(\nabla_{\mathbf w} (f \mathbf V) \ = \ f \ \nabla_{\mathbf w} \mathbf V \ + \ df(\mathbf w) \ \mathbf V \)

Ковариантная производная удовлетворяет следующим двум свойствам линейности:

  • линейность по w, то есть, какими бы ни были поля векторов w и u и действительные числа a и b, мы имеем:
\(\nabla_{(a \mathbf w + b \mathbf u)} \mathbf V \ = \ a \ \nabla_{\mathbf w} \mathbf V \ + \ b \ \nabla_{\mathbf u} \mathbf V.\)
  • линейность по V, то есть, какими бы ни были поля векторов X и действительные числа a и b, мы имеем:
\(\nabla_{\mathbf w} (a\mathbf X + b\mathbf Y) \ = \ a \ \nabla_{\mathbf w} \mathbf X \ + b \ \nabla_{\mathbf w} \mathbf Y.\)

Как только ковариантная производная определена для полей векторов, она может быть распространена на тензорные поля с использованием правила Лейбница: если \( \mathbf T \) и \( \mathbf S \) — два любых тензора, то по определению:

\(\nabla_{\mathbf w}(\mathbf T \otimes \mathbf S) \ = \ (\nabla_{\mathbf w} \mathbf T )\otimes \mathbf S \ + \ \mathbf T \otimes(\nabla_{\mathbf w} \mathbf S)\)

Ковариантная производная поля тензора вдоль вектора w есть снова поле тензора того же типа.

Связность, ассоциированная с метрикой[править]

Можно доказать, что связность, ассоциированная с метрикой — связность Леви-Чивита [1], является единственной связностью, помимо предыдущих условий дополнительно обеспечивающей то, что для любых полей векторов X, Y, Z из TM

  • \(\nabla_{\mathbf X}(\mathbf g(\mathbf Y,\mathbf Z)) \ = \ \mathbf g(\nabla_{\mathbf X} \mathbf Y,\mathbf Z) \ + \ \mathbf g(\mathbf Y,\nabla_{\mathbf X} \mathbf Z)\) (метричностьтензор неметричности равен нулю).

Описание в координатах[править]

Ковариантная производная вектора есть вектор, и, таким образом, она может быть выражена как линейная комбинация всех базисных векторов:

\(\nabla_{\mathbf w} V \ = \ \left[ \, \nabla_{\mathbf w} V \, \right]^\rho \ \mathbf e_\rho \ = \ \Gamma^\rho \ \mathbf e_\rho,\)

где \( \Gamma^\rho \) представляют собой компоненты вектора ковариантной производной в направлении \( \mathbf e_\rho \) (эта составляющая зависит от выбранного вектора w).

Чтобы описать ковариантную производную, достаточно описать её для каждого из базисных векторов \( \mathbf e_\nu \) вдоль направления \( \mathbf e_\mu \). Определим тогда символы Кристоффеля (или просто кристоффели) \( \Gamma^\rho {}_{\mu \nu}, \) зависящие от 3 индексов [4]

\( \nabla_{\mu} {\mathbf e}_{\nu} \ = \ \nabla_{{\mathbf e}_{\mu}} {\mathbf e}_{\nu} \ = \ \Gamma^\rho {}_{\mu \nu} \ {\mathbf e}_\rho\)

Связность Леви-Чивита полностью характеризуется своими символами Кристоффеля. Согласно общей формуле

\(\nabla_{\mathbf w} (f \mathbf V) \ = \ f \ \nabla_{\mathbf w} \mathbf V \ + \ df(\mathbf w) \ \mathbf V \)

для вектора V:

\(\nabla_{\mu} \mathbf V \ = \ \nabla_{\mu} (V^\nu \mathbf e_\nu) \ = \ V^\nu \ (\nabla_{\mu} \mathbf e_\nu ) \ + \ dV^\nu(\mathbf e_\mu) \ \mathbf e_\nu. \)

Зная, что \( dV \nu (\mathbf e_\mu) = \partial_\mu V^\nu \), получаем:

\(\nabla_{\mu} \mathbf V \ = \ V^\nu \ \Gamma^\rho {}_{\mu \nu} \ {\mathbf e}_\rho \ + \ \partial_\mu V^\nu \ \mathbf e_\nu \)

Первый член этой формулы описывает «деформацию» системы координат по отношению к ковариантной производной, а второй — изменения координат вектора V. При суммировании по немым индексам мы можем переписать это соотношение в форме

\(\nabla_{\mu} \mathbf V \ = \ \left[ \, V^\rho \ \Gamma^\nu {}_{\mu \rho} \ + \ \partial_\mu V^\nu \, \right] \ \mathbf e_\nu \)

Из этого получаем важную формулу для компонент:

\(\nabla_{\mu} \mathbf{V}^{\nu} \ = \ \left[ \, \nabla_{\mu} \mathbf{V} \, \right]^{\nu} \ = \ \partial_{\mu} V^{\nu} \ + \ \Gamma_{~ \mu \rho}^{\nu} \ V^{\rho} \)

Используя формулу Лейбница, таким же образом можно продемонстрировать, что:

\( \nabla_{\mu} \mathbf{V}_{\nu} \ = \ \partial_{\mu} V_{\nu} \ - \ \Gamma_{~ \mu \nu}^{\rho} \ V_{\rho}. \)

Чтобы вычислить эти составляющие в явной форме, выражения для символов Кристоффеля должны быть определены, исходя из метрики. Их легко получить, написав следующие условия:

\( \nabla_{\mu} \ \mathbf{g}_{\nu \rho} \ = \ 0. \)

Расчёт этой ковариантной производной приводит к

\(\Gamma^\mu {}_{\rho \sigma} \ = \ \frac{1}{2} \ g^{\mu \nu} \ \left(\partial_\sigma g_{\nu \rho } \ + \ \partial_\rho g_{\nu \sigma} \ - \ \partial_\nu g_{\rho \sigma} \right), \)

где \(g^{\mu \nu}\ \) — компоненты «обратного» метрического тензора, определенные уравнениями

\(g^{\mu \nu} \ g_{\nu \rho} \ = \ \delta^\mu{}_\rho \)

Символы Кристоффеля «симметричны»[5] по отношению к нижним индексам: \(\Gamma^\mu {}_{\rho \sigma}=\Gamma^\mu {}_{\sigma \rho}.\ \)

Замечание: иногда определяются также следующие символы:

\(\Gamma_{\nu \rho \sigma} \ = \ \frac{1}{2} \ \left(\partial_\sigma g_{\nu \rho } \ + \ \partial_\rho g_{\nu \sigma} \ - \ \partial_\nu g_{\rho \sigma} \right) \)

получаемые как:

\(\Gamma^\mu {}_{\rho \sigma} \ = \ g^{\mu \nu} \ \Gamma_{\nu \rho \sigma}\)

Тензор кривизны Римана[править]

Тензор кривизны Римана R — тензор 4-ой валентности, определёный для любых векторных полей X, Y, Z из M как

\(\mathbf R(\mathbf X,\mathbf Y)\mathbf Z \ = \ \nabla_{\mathbf X} \, (\nabla_{\mathbf Y} \mathbf Z) \ - \ \nabla_{\mathbf Y} \, (\nabla_{\mathbf X} \mathbf Z) \ - \ \nabla_{[\mathbf X,\mathbf Y]} \mathbf Z\; .\)

Его компоненты в явной форме выражаются из метрических коэффициентов:

\( R_{ \mu \nu \rho \sigma } \ = \ \frac{1}{2}\left( \partial^2_{ \nu \rho } g_{ \mu \sigma } \ + \ \partial^2_{ \mu \sigma } g_{ \nu \rho } \ - \ \partial^2_{ \nu \sigma } g_{ \mu \rho } \ - \ \partial^2_{ \mu \rho } g_{ \nu \sigma } \right) \ +\)
\( + \ g_{ \lambda \tau } \left( \Gamma^\lambda {}_{ \nu \rho } \Gamma^\tau {}_{ \mu \sigma } \ - \ \Gamma^\lambda {}_{ \nu \sigma } \Gamma^\tau {}_{ \mu \rho } \right)\;.\)

Симметрии этого тензора:

\(R_{ \mu \nu \rho \sigma } \ = \ R_{ \rho \sigma \mu \nu }\;, \)
\(R_{ \mu \nu \rho \sigma } \ = \ - \ R_{ \nu \mu \rho \sigma } \ = \ - \ R_{\mu \nu \sigma \rho }\;. \)

Он удовлетворяет также следующему соотношению:

\(R_{ \mu \nu \rho \sigma } \ + \ R_{ \mu \sigma \nu \rho } \ + \ R_{ \mu \rho \sigma \nu } \ = \ 0. \)

Тензор кривизны Риччи[править]

Тензор Риччи — тензор валентности 2, определенный свёрткой тензора кривизны Римана

\(R_{\mu \nu} \ = \ g^{\rho \sigma} \ R_{\rho \mu \sigma \nu} \ = \ R^\sigma_{~ \mu \sigma \nu} \; .\)

Его компоненты в явном виде через символы Кристоффеля:

\(R_{\mu \nu} \ = \ \partial_{\rho} \Gamma^{\rho} {}_{\mu \nu} \ - \ \partial_{\nu} \Gamma^{\rho} {}_{\mu \rho} \ + \ \Gamma^{\rho} {}_{\mu \nu} \Gamma^{\sigma} {}_{\rho \sigma} \ - \ \Gamma^{\sigma} {}_{\mu \rho}\Gamma^{\rho} {}_{\nu \sigma} \; .\)

Этот тензор симметричен: \( R_{\mu\nu} \ = \ R_{\nu \mu} \ \).

Скалярная кривизна[править]

Скалярная кривизна является инвариантом, определяемым свёрткой тензора Риччи с метрикой

\(R \ = \ g^{\mu \nu} \ R_{\mu \nu} \ = \ R^\nu_{~ \nu}. \)

Уравнения Эйнштейна[править]

Уравнения гравитационного поля, которое называются уравнениями Эйнштейна, записываются так

\( R_{\mu \nu} \ - \ \frac{1}{2} \, g_{\mu \nu} \, R \ - \ \Lambda \ g_{\mu \nu} \ = \ \frac{8 \pi G}{c^4} \ T_{\mu \nu}, \)

где \( \Lambda \) — космологическая константа, \( c \) — скорость света в пустоте, \( G \) — гравитационная постоянная, которая появляется также в законе всемирного тяготения Ньютона, а \( T_{\mu\nu} \) — тензор энергии-импульса.

Симметричный тензор \( g_{\mu\nu} \) имеет только 10 независимых составляющих, тензорное уравнение Эйнштейна эквивалентно системе 10 независимых скалярных уравнений. Эта система 10 связанных нелинейных уравнений в частных производных в большинстве случаев очень трудна для изучения.

Тензор энергии-импульса[править]

Тензор энергии-импульса может быть записан в виде действительной симметричной матрицы 4x4:

\( T_{\mu \nu} \ = \ \left( \begin{matrix} T_{00} & T_{01} & T_{02} & T_{03} \\ T_{10} & T_{11} & T_{12} & T_{13} \\ T_{20} & T_{21} & T_{22} & T_{23} \\ T_{30} & T_{31} & T_{32} & T_{33} \end{matrix} \right). \)

В нём обнаруживаются следующие физические величины:

  • T00объёмная плотность энергии. Она должна быть положительной.
  • T10, T20, T30плотности компонент импульса.
  • T01, T02, T03компоненты потока энергии.
  • Под-матрица 3 x 3 из чисто пространственных компонент:
\( T_{ik} \ = \ \left( \begin{matrix} T_{11} & T_{12} & T_{13} \\ T_{21} & T_{22} & T_{23} \\ T_{31} & T_{32} & T_{33} \end{matrix} \right) \)

— матрица потоков импульсов. В механике жидкости диагональные компоненты соответствуют давлению, а прочие составляющие — тангенциальным усилиям (напряжениям или в старой терминологии — натяжениям), вызванным вязкостью.

Для жидкости в покое тензор энергии-импульса сводится к диагональной матрице diag (ρc², p, p, p), где ρ есть плотность массы, а p — гидростатическое давление.

Сноски[править]

  1. а б C. W. Misner, Kip S. Thorne & John A. Wheeler ; Gravitation, Freeman & Co. (San Francisco-1973), ISBN 0-7167-0344-0. или Ч. МИЗНЕР, К. ТОРН, Дж. УИЛЕР. ГРАВИТАЦИЯ. том I—III. М. Мир, 1977.
  2. Далее мы везде не пишем индекс 4, уточняющий размерность многообразия «M».
  3. Более точно, они должны быть по крайней мере класса C2.
  4. Внимание, символы Кристоффеля не являются тензорами.
  5. Слово «симметричны» взято в кавычки, так как эти индексы в силу своего происхождения — не тензорные.