문서:아인슈타인 합 규약

분류

상대성 이론

1. 개요2. 규칙3. 기타4. 예시

1. 개요

아인슈타인 합 규약(Einstein notation/Einstein summation convention)은 주로 상대성 이론에서 사용되는 선형대수학의 표기를 쉽게 하기 위해 알베르트 아인슈타인이 1916년에 고안해낸 표기법이다.

2. 규칙

예를 들어, 다음과 같은 [math( 3 times 3 )] 행렬 [math( mathrm{A} )]와 [math( 3 times 1 )] 행벡터 [math( mathbf{x}, mathbf{y} )]를 생각하자.

[math( mathrm{A} = begin{pmatrix} a_{11} & a_{12} & a_{13} \ a_{21} & a_{22} & a_{23} \ a_{31} & a_{32} & a_{33} end{pmatrix} , mathbf{x} = begin{pmatrix} x^1 \ x^2 \ x^3 end{pmatrix}, mathbf{y} = begin{pmatrix} y_1 \ y_2 \ y_3 end{pmatrix} )]

(단, [math( x^i )]는 x의 i제곱이라는 뜻이 아니고 그냥 첨자를 위에 붙인 것이다.)

이때 행렬 곱을 이용한 식 [math( mathbf{y} = mathrm{A} mathbf{x} )]를 성분별로 표시하고 싶다면, 다음과 같은 식으로 표현하면 된다.

[math( displaystyle y_i = sum_{j=1}^3 a_{ij} x^j quad (i = 1,2,3))]

예를 들어, [math( i = 2 )]일 때 [math( y_2 = a_{21} x^1 + a_{22} x^2 + a_{23} x^3 )]이다. 여기서 아인슈타인 합 규약의 핵심은 시그마 기호와 [math( (i=1,2,3) )]를 생략하는 것이다. 상대성 이론의 수식들은 이러한 합 기호가 너무 많이 등장해서 일일히 다 쓰기에는 시간낭비이기 때문이다. 따라서 아인슈타인 합 규약을 이용하여 위 식을 쓰면 다음과 같다.

[math( displaystyle y_i = a_{ij} x^j )]

이렇게 하면 행렬의 곱을 문자 단 3개와 첨자로 짧게 나타낼 수 있으며, 시그마 기호는 생략되어 있다. 구체적으로 아인슈타인 합 규약의 규칙은 다음과 같다.

1. 하나의 항 안에 같은 문자로 된 위 첨자와 아래 첨자가 존재한다면(예: [math( a_i b^i )]), 합 기호 [math( displaystyle sum_{i=1}^3 )]가 생략된 것으로 본다. 이러한 문자 [math( i )]를 dummy index라고 한다.
2. 하나의 항 안에 위 첨자와 아래 첨자가 짝을 이루지 않고 하나만 존재한다면(예: [math( x_i = y_i )]), 이는 [math( i=1,2,3 )]을 대입해서 만들 수 있는 3개의 등식을 한번에 쓴 것이다. 이러한 문자 [math( i )]는 free index라고 한다.

또한 규칙에 따르면 [math( y_k = a_{ij} x^j )]와 같은 식은 좌변의 k와 우변의 i의 문자가 서로 다르므로 의미가 없다. 따라서 free index는 양변에 같이 존재해야만 한다.

3. 기타

상대성 이론에서는 보통 첨자를 알파벳으로 쓰면 1~3까지 더하고, 그리스 문자 첨자는 0~3까지 더하는 것을 의미한다. 따라서 [math( a_i b^i = a_1 b^1 + a_2 b^2 + a_3 b^3 )]이지만 [math( x_mu^mu = x_0^0 + x_1^1 + x_2^2 + x_3^3 )]이다.
미분연산자의 분모에는 위 첨자가 들어가더라도 아래 첨자로 간주한다. 예를 들어 [math( displaystyle a^i frac{partial}{partial x^i} )]는 분모에 [math(i)]가 위 첨자로 들어가 있지만 [math( i )]에 대한 합을 계산해야 한다. [2]

반변벡터는 주로 위첨자, 공변벡터는 주로 아래첨자를 사용한다.

4. 예시

내적 [math( mathbf{a cdot b } = a^i b_i )]
[math( displaystyle {df over dt} = {df over dx^i} {dx^i over dt} )]

[1] 이는 contravariant(위 첨자)에 대한 미분 그 자체는 covariant(아래 첨자)로 볼 수 있기 때문이다.[2] 이는 contravariant(위 첨자)에 대한 미분 그 자체는 covariant(아래 첨자)로 볼 수 있기 때문이다.