분류
1. 개요
맥스웰 - 볼츠만 분포는 일원자 분자 이상기체의 속력에 대한 확률분포이며, 분자의 질량과 기체의 온도를 매개변수로 가진다. 이 분포를 통해 최빈속도, 평균속도, 제곱평균제곱근 속도([math( v_{rms} )])[1]등을 계산할 수 있다. 이는 제임스 클러크 맥스웰[2]이 처음 제안하였고, 이 업적을 접한 루트비히 볼츠만이 맥스웰의 가정을 바꾸어 다른 방식으로 증명였는데, 분자의 존재를 가정하고 있기 때문에 에른스트 마흐등을 포함해 물질의 공간상에 연속적이라고 생각하는 당대 주류의 학파에 의해 인정받지 못했다. 그렇지만, 시간이 흐르면서 업적을 인정받게 되었고[3], 통계역학의 발전에도 큰 기여를 하였다. 또한, 후에 보스 - 아인슈타인 분포 와 페르미 - 디렉 분포의 발견에도 영향을 주었다.
2. 내용
맥스웰 볼츠만 분포식은 속도(3차원)를 변수로 가지는지, 아니면 속력, 에너지, 운동량 등을 변수로 가지는지에 따라서, 혹은 좌변을 무엇으로 두는지에 따라서 많은 형태로 표현되지만, 여기에는 속력([math( v )])을 변수로 가지는 경우만 기술하였다. 분야 등에 따라서 자주 사용하는 형태가 다를 수 있으니, 이 식은 이해를 돕는 용도로 사용하자.
[math(n_{v}(v) , dv=displaystyle{ 4pi N left({m over {2pi kT}}right)^{3over 2} v^2e^{-{mv^2 over 2kT}} , dv} )]
|
- [math( T )] : 기체의 온도
- [math( m )] : 분자의 질량
- [math( N )] : 전체 기체분자의 수
- [math( k )] : 볼츠만 상수
- [math( n_{v}(v), dv )] : [math( v )]와 [math( v+dv)] 사이의 속력을 가지는 기체분자의 수.
[math(displaystyle{ v_{p}, =, sqrt{{2kT over m}} , , , v_{avg}, =, sqrt{{8kT over pi m}} , , , v_{rms}, =, sqrt{{3kT over m}}} )]
|
각각 최빈속력, 평균속력, 제곱평균제곱근 속력이다.
3. 맥스웰의 접근 방법
이 분포의 형태를 처음 제안한 맥스웰은 통계역학이나 물리학을 거의 사용하지 않고 타당한 휴리스틱으로 유도하였다. 나중에 통계역학을 사용해 이 분포의 물리학적 유래를 정리한 건 볼츠만. 맥스웰의 휴리스틱과 기체 분자 모델, 이상 기체 법칙 등으로 처음부터 이 분포를 상수들 까지 포함해서 완전히 이끌어내보자.
3.1. 맥스웰의 휴리스틱
1860년, 맥스웰은 놀랍도록 간단한 방법을 사용해 분포의 함수꼴을 유추해냈다. 삼차원에서 기체 분자는 [math(v_x,v_y,v_z)]의 속도를 가지고 있다. 이 세개의 성분은 서로 직각이니 완전히 독립적이라 가정한다. 그렇다면 열적 평행을 이루었을 때 이들의 확률 분포 함수는 모두 동일하다. 이를 [math(g(v_x), g(v_y), g(v_z))]라 한다. 이 때, 어느 분자가 특정 [math(v_x,v_y,v_z)]를 가질 확률은 이 세 함수의 곱, 즉 [math(g(v_x)g(v_y)g(v_z))]에 비례한다. 3개의 성분들은 모두 완전히 독립적이니까. 여기서부터가 핵심인데, [math(v_x,v_y,v_z)]는 완전 독립이므로, [math(g(v_x)g(v_y)g(v_z))]는 구형으로 대칭이다. 즉, [math(g(v_x)g(v_y)g(v_z) = h(v_x^2+v_y^2+v_z^2))]. 이 조건을 만족하는 함수는 지수함수밖에 없다! [math(g)]와 [math(h)] 둘 다 지수 함수란 얘기. 그러므로 [math(v_x)]의 확률 분포는
[math(g(v_x) = Ae^{-Bv_x^2} )]
|
당연히 [math(v_y, v_z)]의 분포도 이와 똑같다.
셋을 곱하면
셋을 곱하면
[math(l(v_x,v_y,v_z) = A^3e^{-B(v_x^2+v_y^2+v_z^2)} = A^3e^{-Bv^2} )]
|
이제 3차원인 [math(v_x,v_y,v_z)]에서 1차원인 [math(v = sqrt{v_x^2+v_y^2+v_z^2})]로 변환하자.
[math(d(v_x)d(v_y)d(v_z) = v^2 sintheta dv dtheta dphi)] 이니까 속력의 분포는
[math(d(v_x)d(v_y)d(v_z) = v^2 sintheta dv dtheta dphi)] 이니까 속력의 분포는
[math(displaystyle f(v) = v^2 l(v_x,v_y,v_z) int_0^{2pi} int_0^pi sin theta dtheta dphi = 4pi A^3 v^2 e^{-Bv^2})]
|
여기까지가 1860년에 맥스웰이 쓴 논문의 내용이고, 이제 이 문단에서 계속해서 [math(A)]와 [math(B)]의 값을 구해내보자. 이 두 상수의 값을 도출해내려면 두 개의 방정식이 필요하다. 편의상 [math(C=4pi A^3)]도 쓰자.
3.2. 방정식 1: 확률 분포의 규격화
가장 먼저 떠오르는 방정식. 확률 분포를 -무한대에서 +무한대까지 적분하면 반드시 1이 되어야 한다. [math(v^2e^{-Bv^2})]는 적분하기 약간 까다로우니 상대적으로 더 간단한 [math(v_x)]의 확률 분포를 적분하자.
[math(displaystyle int_{-infty}^{+infty} Ae^{-Bv_x^2} dv_x = 1)]
|
다음의 가우스 적분 값을 사용해 정리하면
[math(displaystyle int_{-infty}^{+infty} e^{-x^2} dx= sqrtpi)]
|
[math(displaystyle rightarrow int_{-infty}^{+infty} Ae^{-Bv_x^2} dv_x = Asqrt{frac{pi}{B}} =1 )]
|
[math(displaystyle rightarrow A = sqrt{frac{B}{pi}} rightarrow C = 4sqrt{frac{B^3}{pi}} )]
|
3.3. 방정식 2: 평균 제곱 속력
잠깐 확률 분포를 손에서 놓고 이상 기체 법칙과 기체 분자 모델을 들여다 보자. 길이가 [math(L)]인 작은 정육면체 안에서 질량이 [math(m)]인 여러 이상 기체 분자들이 운동한다고 가정한다. 오른쪽으로 [math(v_x)]만큼의 속력으로 면에 부딪히면, 그 뒤 똑같은 속력으로 왼쪽으로 튕겨나갈 것이다. 그렇다면 충격량은
[math(displaystyle Delta p_x = p_f - p_i = 2mv_x)]
|
반면 평균적으로 한 면에 부딪히는 시간은
[math(displaystyle Delta t = frac{2L}{v_x})]
|
따라서 분자 하나가 한 면에 가하는 힘은
[math(displaystyle F = frac{Delta p_x}{Delta t} = frac{m v_x^2}{L})]
|
평균 [math(v_x^2)]를 [math(overline{v_x^2})]이라 하고, 정육면체 안에 있는 총 분자 갯수가 [math(N)], 면의 면적은 [math(L^2)], 정육면체의 부피는 [math(V=L^3)]이니, 압력은
[math(displaystyle P = frac{sum F}{A} = frac{Nmoverline{v_x^2}}{V} rightarrow PV = Nmoverline{v_x^2})]
|
이제 [math(v_y)]와 [math(v_z)]도 도입하자. 대칭성 때문에 [math(overline{v_x^2}=overline{v_y^2}=overline{v_z^2})]이고, 총 평균 제곱 속력은 [math(overline{v^2} = overline{v_x^2}+overline{v_y^2}+overline{v_z^2})]이니,
[math(displaystyle overline{v_x^2} = frac{1}{3} overline{v^2})]
|
이걸 위에 있는 압력에 대입하면
[math(displaystyle PV = frac{Nmoverline{v^2}}{3})]
|
마지막으로 (1800년대 당시 실험적으로 도출한) 이상 기체 법칙을 사용하자.
[math(displaystyle PV = NkT)]
|
[math(k)]는 볼츠만 상수, [math(T)]는 계의 절대온도.
[math(displaystyle rightarrow frac{moverline{v^2}}{3} = kT rightarrow overline{v^2} = frac{3kT}{m})]
|
3.4. 완성
이제 다시 확률 분포로 돌아와서 [math(overline{v^2})]를 계산하자.
[math(displaystyle overline{v^2} = int_0^{infty} v^2 f(v) dv = Cint_0^{infty} v^4 e^{-Bv^2} dv = C frac{3}{8} sqrt{frac{pi}{B^5}} = 4 sqrt{frac{B^3}{pi}} frac{3}{8} sqrt{frac{pi}{B^5}} )]
|
[5]를 B에 대해서 2번 미분하면 구할 수 있다.]
[math(displaystyle = frac{3}{2B} = frac{3kT}{m} )]
|
[math(displaystyle rightarrow B = frac{m}{2kT} )]
|
[math(displaystyle rightarrow A = sqrt{frac{B}{pi}} = Big( frac{m}{2pi kT} Big)^{1/2} )]
|
따라서 맥스웰-볼츠만 분포는
[math(displaystyle f(v) = 4pi Big( frac{m}{2pi kT} Big)^{3/2} v^2 e^{-frac{mv^2}{2kT}})]
|
4. 맥스웰 볼츠만 분포 법칙의 유도
아래의 첫 번째 소문단인 "에너지에 따른 확률분포"는 통계역학의 Canonical Ensemble 문단과 내용이 겹치지만, 링크에는 상태수에 대한 언급이 없어 새로 작성되었습니다.
4.1. 에너지에 따른 확률분포
[math( i )]개의 이산적인(discrete) 에너지 상태 [math( U_k (1le kle i) )]를 생각하고 [math( k )]번째 에너지 상태를 가지는 입자의 수를 [math( N_k )]라고 하자. 계가 [math( k )]번째 에너지 상태에 각각, [math( N_k )]개의 입자를 가지고 있는 경우의 수를 W라 하면,
[math( W=displaystyle {{N!over{N_1!N_2!cdot cdot cdot N_i!}}} )]
|
가 된다. 그런데, 임의의 입자가 각각의 에너지 상태에 존재할 확률은 실제로는 같지 않기 때문에 경우의 수가 확률과 직접 연관되지는 않고, 따라서 상태수라 불리는 [math( g_k )]를 도입해야 한다. [math( U_k )]라는 하나의 에너지 상태에도 다시 [math( g_k )]개의 상태가 존재한다고 생각해 경우의 수가 확률과 직접적으로 연관되도록 보정하자.[6] 그러면[7],
[math( W=displaystyle {{N!over{N_1!N_2!cdot cdot cdot N_i!}}{g_1}^{N_1}{g_2}^{N_2}cdot cdot cdot {g_i}^{N_i}} )]
|
이 때 가장 자연스러운 상태는 확률에 비례하는 [math( W )]가 최대가 되는 상태이다. 계산을 편리하게 하기 위해 [math( W )]에 로그를 씌우고 스털링 근사 [math( lnN! approx NlnN-N )]을 적용하면,
[math( lnW=lnN!-sum_{k=1}^{i}lnN_k!+sum_{k=1}^{i}N_klng_k = NlnN-N-sum_{k=1}^{i}(N_klnN_k-N_k)+sum_{k=1}^{i}N_klng_k )]
|
그런데 입자가 어떻게 행동하든 당연히 총입자수와 에너지인
[math(begin{aligned} &f_1 = sum_{k=1}^{i}N_k \ &f_2 = sum_{k=1}^{i}N_k U_k end{aligned} )]
|
는 일정해야 한다. 실제로는 미분이 불가능하지만, [math( 10^{23} )]개가 넘는 분자들에 대해서 다루고 있으므로 [math( N_k )]의 작은 변화를 그냥 미분이라고 생각해도 무방하고, 제한조건을 만족하면서 최댓값을 찾는 문제이므로 라그랑주 승수법을 사용하자.
[math( displaystyle{{partial over partial N_j}(lnW + alpha f_1-beta f_2)=0},, (1le jle i) )]
|
위에서 구한 [math( W,, f_1,, f_2 )]를 대입하면,
[math( -displaystyle{left( lnN_j + {N_j over N_j} - 1 right)} + lng_j +alpha -beta U_j=0,,, therefore ,,N_j = displaystyle{g_j e^{alpha -beta U_j}} )]
|
분자들의 수는 유한하므로 이산적인 것이 맞지만, 그 수가 매우 많아서 연속적이라고 볼 수 있다. 따라서 [math(N_j)]를 [math(U_j)]와 [math(U_{j+1})]사이의 에너지를 가지는 분자의 수, 즉 [math(U+dU)]이하의 에너지를 가진 기체분자의 수 [math(n+dn)]과 [math(U)]이하의 에너지를 가진 기체분자의 수 [math(n)]간의 차이 [math(dn)]으로 이해할 수 있다.
[math( dn=e^{alpha }e^{-beta U}g_U(U), dU )]
|
[math(dn)]은 [math({dn over dU},dU)]와 같으므로,
[math( n_U(U),dU=g_U(U)e^{alpha }e^{-beta U},dU )]
|
또, 맥스웰 - 볼츠만 분포에서는 분자들의 위치 에너지는 무시하므로 운동에너지만을 고려한 속도에 대한 함수를 구하면 아래와 같다.
[math( n_p(p), dp=displaystyle {g_p(p) e^{alpha } e^{-{beta p^2 over {2m}}}, dp} )]
|
4.2. 상태수 g 란?
운동량을 성분으로 가지는 위상공간 [math( (p_x,p_y,p_z) )]를 생각해보자. 운동량의 크기가 p인 것인 이 위상공간에서는 구가 된다.
따라서 운동량의 크기가 [math( p )]와 [math( p+dp )] 사이인 위상공간의 부피는 [math( 4pi p^2 , dp )]가 된다.
이 때, 어떤 입자가 이 위상공간의 임의의 공간에 존재할 때 운동량의 크기가 [math( p )]와 [math( p+dp )] 사이인 위상공간에 존재할 확률은 [math( p^2 , dp )]에 비례하고 따라서 [math( g_p(p) , dp=Ap^2 , dp )]처럼 쓸 수 있다.
이를 3.1에서의 식에 대입하고, 상수를 합치면 다음과 같은 식을 얻을 수 있다.
따라서 운동량의 크기가 [math( p )]와 [math( p+dp )] 사이인 위상공간의 부피는 [math( 4pi p^2 , dp )]가 된다.
이 때, 어떤 입자가 이 위상공간의 임의의 공간에 존재할 때 운동량의 크기가 [math( p )]와 [math( p+dp )] 사이인 위상공간에 존재할 확률은 [math( p^2 , dp )]에 비례하고 따라서 [math( g_p(p) , dp=Ap^2 , dp )]처럼 쓸 수 있다.
이를 3.1에서의 식에 대입하고, 상수를 합치면 다음과 같은 식을 얻을 수 있다.
[math( n_p(p)dp=Cp^2e^{-{beta p^2over 2m}}dp )]
|
사실 위에서는 대충 구했지만, 상태수를 정확히 이해하기 위해서는 양자역학이 필요하다. 상태수에 관해 좀 더 알아보고 싶다면 https://en.m.wikipedia.org/wiki/Gas_in_a_box를 참고하자.
4.3. 규격화
이제 상수들을 구하기 위해 규격화 과정을 거치자. 모든 속력(운동량의 크기)에 대해 적분하면 총 입자의 개수가 나와야 하므로[8],
[math( N=displaystyle {int_{0}^{infty }Cp^2e^{-{beta p^2 over 2m}} , dp} )]
|
[math( displaystyle {int_{0}^{infty } x^{2n}e^{-ax^2} , dx}=displaystyle {{1*3*5*cdot cdot cdot *(2n-1)over 2^{n+1}a^n}sqrt {{pi}over {a}}} )]
|
에 따라 계산하여 정리하면 [math( C=displaystyle {Nsqrt {2 over pi}{left({{beta }over {m}}right)}^{3/2}} )]이다.
다른 상수 [math(beta)]를 구하기 위해 총 에너지가 [math( 3NkT/2 )] 임을 이용하자.[10] (단, [math( k )]는 슈테판 - 볼츠만 상수이다.)
[math( U=displaystyle {int_{0}^{infty}{p^2 over 2m} N sqrt {2 over pi}left({{beta }over {m}}right)^{3over 2}p^2e^
\beta p^2}\over {2m , dp} )] |
다시 가우스 적분하면 [math( U=3N/2beta )]이고 [math( 3NkT/2 )]와 비교하면, [math( beta=1/ kT )]이다.
따라서 식을 열심히 정리하면
따라서 식을 열심히 정리하면
[math( n_p(p) , dp=displaystyle
4\pi N} \over {{(2\pi mkT)}^{3\over 2p^2e^{-{p^2 over 2mkT}} , dp} )] |
이고,[11] 운동량과 속도의 관계를 이용하면
[math( n_v(v) , dv=displaystyle {4pi N left({m over {2pi kT}}right)^{3over 2} v^2e^{-{mv^2 over 2kT}} , dv} )]
|
5. 관련 문서
[1] (root mean square)[2] 멕스웰이 접근한 방식은 다음과 같다. 어느 입자가 특정 vx, vy, vz를 가질 확률 밀도를 f(vx, vy, vz)라 가정한다음, vx, vy, vz들은 서로 완벽히 독립적이니 구형 대칭을 적용해 f(vx, vy, vz) = g(vx^2 + vy^2 + vz^2)임을 이용. 이 방정식을 만족하는 함수는 e^-x^2 꼴의 가우스 분포인데, 여기에 속력벡터 vx, vy, vz 대신 속도인 v=sqrt(vx^2+vy^2+vz^2)를 사용하면 멕스웰-볼츠만 분포의 형태가 나온다.[3] 안타깝게도 볼츠만은 자살하였다.(우울증에 걸렸었지만 자살의 원인은 정확히 밝혀지지는 않음)[4] 각각 미분, v를 곱하여 적분, v2을 곱하여 적분 후 루트[5] 저 무시무시한 정적분은 라이프니츠의 적분 규칙을 사용해서 통상적인 가우스 적분인 [math(int_0^{infty} e^{-Bv^2} dv)[6] 상태수 g에 대해서는 3.2참고[7] 왜 상태수에 넣을 때에는 입자를 구분하는지 의아할 수 있는데, 원래는 구분을 안 하는 것이 맞다. 그렇지만, 여기서는 g_k >> N_k 이기 때문에 차이가 없다. 자세한 내용은 https://en.m.wikipedia.org/wiki/Maxwell%E2%80%93Boltzmann_statistics를 참고하자.[8] 라그랑주 승수법에서 사용한 첫 번째 제한조건이다[9] 어리둥절 하는 사람도 실제로는 이 함수를 본 적이 있다. 표준정규분포 함수의 적분이 가우스 적분이다. 부정적분은 초등함수가 아니며, 무한대까지의 적분값만이 알려져 알려져있다. 물론 컴퓨터가 점찍어서 하면 다른 값도 구할 수는 있다.[10] 라그랑주 승수법에서 사용한 두 번째 제한조건이다.[11] pi와 2를 근호 안으로 넣어주면서 하나 밖으로 빼내는 게 포인트이다. 밖에 나온 4pi*p^2은 구와의 연관성을 보여준다.