문서:중심극한정리

분류

확률론

1. 본문2. 증명3. 관련 문서

1. 본문

中心極限定理
Central Limit Theorem(CLT)

표본의 크기가 커질수록 표본 평균의 분포는 모집단의 분포 모양과는 관계없이 정규 분포에 가까워진다. 이때 표본 평균의 평균은 모집단의 모 평균과 같고, 표본 평균의 표준 편차는 모집단의 모 표준 편차를 표본 크기의 제곱근으로 나눈 것과 같다.

서로 독립이며 동일한 분포를 따르는(i.i.d.[2]) 확률변수 [math(X_1, X_2, cdots , X_n)]에 대해, 각각의 평균은 [math(E(X_i) = mu)]이고 각각의 표준편차는 [math(sigma)]라 하자. [math(xi_n = displaystyle frac{sum_{i=1}^{n}X_i - nmu}{sqrt{n}sigma})] 라 둘 때, [math(xi_n)]은 표준정규분포로 분포수렴한다.

더 복잡한 버전으로는 i.i.d. 가정을 적절히 약화시킨 Lindberg CLT나 Lyapunov CLT가 있으나, 학부 수업 수준에서는 상기한 결과만 알아도 충분하다. 중심극한정리는 큰 수의 법칙과 함께 통계학의 뼈대를 이룬다고 할 수 있으며, 왜 정규분포가 중요하게 다뤄지는지 하나의 근거를 제시한다.

이 정리의 놀라운 점은, i.i.d. 가정이 성립하고 평균, 표준편차만 알고 있다면 [math(X_i)]의 분포 자체에 대한 어떤 정보도 없더라도[3]가 어떠한 분포를 따라야 한다는 제약이 없다.] [math(xi_n)]의 분포를 점근적으로 알 수 있다는 점이다. 대부분의 점근적인 검정들은 CLT를 기반으로 한다.

큰 수의 법칙과는 상보적인 관계에 가까운데, 확률수렴이 분포수렴보다 더 강력한 개념이기 때문에[4] 큰 수의 법칙이 더 강력한 결과라고 오해할 수도 있으나, 중심극한정리는 점근적인 분포가 정규확률분포라는 추가적인 정보까지 제시해주기 때문에 두 법칙 간에 상하관계가 존재한다고 할 수는 없다. 큰 수의 법칙은 표본평균이 모평균으로 확률수렴한다는 이야기이며, 중심극한정리는 표본평균의 분포가 "어떤 모양"을 가지고 수렴하는지에 관해 이야기하는 것이 그 핵심이다. 표본평균이 모평균에 얼마나 빠르게 수렴하는지, 그 수렴 속도에 관해 이야기하는 법칙은 반복된 로그의 법칙 (Law of iterated logarithm)이라고 불린다.

기초통계학만 배워도 제시되는 법칙이나, 증명은 상당히 까다롭고 대개 학부 3학년 정도에 수리통계학 수업에서 더 강한 조건[5]이 주어졌을 때의 증명을 배우게 된다. 일반적인 경우의 완전한 증명은 대학원 수준의 확률론에서 다룬다.

예를 들어 모집단의 분포가 일자형이라고 하자. "주사위를 한 번 던져서 나오는 수" 라는 변수가 있다고 하면 이 변수의 분포는 평평할 것이다. 어떤 특정한 수가 더 자주 나오는 게 아니라 1부터 6까지의 수가 모두 똑같은 확률로 나오니까. 자 이제 표본을 채집해 보자. "주사위 한 번 던져서 나오는 수" 를 50번 (n=50) 채집해서 표본 하나를 구성한다고 하자. 그리고 각 표본에서 평균값을 구한다. 그러면 예를들어 표본1 의 평균값은 3.21, 표본2 의 평균값은 3.56, 표본3 의 평균값은 3.40, 뭐 이런 식으로 나올 것이다. 표본을 한 5000개 정도 뽑아서 표본 평균의 분포를 그래프로 그려보면 n이 너무 작지 않은 한 (보통 30 미만은 너무 작다고 친다) 그 형태가 정규분포와 비슷하다는 거다.

수학적으로 이야기하면 독립인 확률변수들의 평균의 분포가 정규분포에 수렴한다는 이야기로[6], 이를 중심극한정리(Central Limit Theorem)라 부른다. 이항분포 B(n,p)가 정규분포 N(np, npq)로 수렴한다는 내용은 이보다 이전에 라플라스(Laplace, Pierre-Simon)가 증명하였고, 이 버전을 "라플라스의 정리"라 부르는 경우도 있다. 물론 이를 일반화하여 현재의 중심극한정리를 정립한 것은 가우스이다.

이 중심극한정리가 통계적 유의성 검정을 위한 이론적 토대가 된다. 예를 들어 채집한 표본의 평균값이 어떤 특정한 값에 비해 통계적으로 유의한 정도로 더 큰지 혹은 더 작은지를 검토한다고 할 때, 표본평균의 분포가 대략 정규분포를 이룬다는 전제 (=중심극한정리) 가 있기 때문에 채집한 표본의 값이 이론적으로 전개된 표본평균 분포상대에 비추어 봤을 때 나올 확률이 5% (통상적으로 상정되는 유의기준) 미만인지를 검토할 수 있는 것이다.

2. 증명

[math(mathrm E(bar X)=mathrm Eleft(dfrac1n(X_1+X_2+X_3+cdots+X_n)right)\=dfrac1n{mathrm E(X_1)+mathrm E(X_2)+mathrm E(X_3)+cdots+mathrm E(X_n)}\=dfrac1n×nmathrm E(X)=m)]

[math(mathrm V(bar X)=mathrm Vleft(dfrac1n(X_1+X_2+X_3+cdots+X_n)right)\=dfrac1{n^2}{mathrm V(X_1)+mathrm V(X_2)+mathrm V(X_3)+cdots+mathrm V(X_n)}\=dfrac1{n^2}×nmathrm V(X)=dfrac{sigma^2}n)][A]
[math(thereforesigma(bar X)=dfracsigma{sqrt n})]

[math(M_{frac{sqrt n(bar X-m)}sigma}(t)=mathrm Eleft(expleft(dfrac{(X_1-m)+(X_2-m)+cdots+(X_n-m)}{sigmasqrt n}tright)right)=mathrm Eleft(expleft(dfrac{X_1-m}{sigmasqrt n}tright)right)mathrm Eleft(expleft(dfrac{X_2-m}{sigmasqrt n}tright)right)cdotsmathrm Eleft(expleft(dfrac{X_n-m}{sigmasqrt n}tright)right))][A]
[math(=left{mathrm Eleft(expleft(dfrac{X-m}{sigmasqrt n}tright)right)right}^n\=left{M_{frac{X-m}sigma}left(dfrac t{sqrt n}right)right}^n)]

[math(thereforedisplaystylelim_{ntoinfty}M_{frac{sqrt n(bar X-m)}sigma}(t)\=expleft(displaystylelim_{ntoinfty}nln M_{frac{X-m}sigma}left(dfrac t{sqrt n}right)right))]
여기서 [math(h=dfrac1{sqrt n})]이라 하면 [math(ntoinfty)]일 때 [math(hto0)]이므로
[math(=expleft(displaystylelim_{hto0}dfrac{ln M_{frac{X-m}sigma}(th)}{h^2}right))]
여기서 [math(displaystylelim_{hto0}M_{frac{X-m}sigma}(th)=1)]이므로 로피탈 정리에 의해
[math(=expleft(displaystylelim_{hto0}dfrac{tM_{frac{X-m}sigma}'(th)}{2hM_{frac{X-m}sigma}(th)}right)\=expleft(dfrac t2displaystylelim_{hto0}dfrac{M_{frac{X-m}sigma}'(th)-0}{h}right))]
여기서 [math(displaystylelim_{hto0}M_{frac{X-m}sigma}'(th)=0)]이므로 미분계수의 정의에 의해[9]
[math(=expleft(dfrac t2displaystylelim_{hto0}dfrac{M_{frac{X-m}sigma}'(t×h)-M_{frac{X-m}sigma}'(t×0)}{h}right)\=expleft(dfrac t2×tM_{frac{X-m}sigma}(t×0)right))]
여기서 [math(M_{frac{X-m}sigma}(0)=mathrm Eleft(left(dfrac{X-m}sigmaright)^2right)\=mathrm Vleft(dfrac{X-m}sigmaright)+left{mathrm Eleft(dfrac{X-m}sigmaright)right}^2\=1+0^2=1\thereforedisplaystylelim_{ntoinfty}M_{frac{sqrt n(bar X-m)}sigma}(t)=e^{frac{t^2}2})]로 표준정규분포의 적률생성함수와 같은 형태이다. 즉, [math(ntoinfty)]일 때 [math(dfrac{sqrt n(bar X-m)}sigmasimmathrm N(0,1))]이므로 [math(bar Xsimmathrm N(m,dfrac{sigma^2}n))]이다.

[자료출처]

3. 관련 문서

[1] independent and identically distributed[2] independent and identically distributed[3] 위를 보면 알 수 있겠지만 [math(X_i)[4] 미분가능하면 연속적이듯이, 확률수렴하면 분포수렴한다.[5] 주로 적률생성함수가 존재함을 가정한다. 그 이유는 아래 증명에서 볼 수 있듯이 증명에 적률생성함수를 사용하기 때문.[6] 엄밀히 말하면: 같은 분포를 따르고 서로 독립인 확률변수 X₁ , X₂ , ..., X_n 에 대해 이들의 평균 X = (X₁ + X₂ + ... + X_n)/n 을 평균이 0, 분산이 1이 되게 표준화한 Z=(X-μ)/σ√n의 분포는 n이 무한대로 갈 때 정규분포에 수렴한다.[A] ^7.1 ^7.2 각각의 X_k는 독립(복원추출)이므로 분리할 수 있다[9] 로피탈 정리를 또 써도 된다.[자료출처] https://m.blog.naver.com/mykepzzang/220851280035