1. 개요
2. 표본평균
[math(X_1,,X_2,,cdots,X_n)]이 평균이 [math(mu)]이고 분산이 [math(sigma^2)]인 모집단에서 추출하는 표본이라고 하면 표본평균 [math(bar X)]의 분포는 다음과 같이 구한다.
[math(E(bar X)=E!left(displaystylefrac{sum X_i}{N}right)=dfrac{E(X_1)+E(X_2)+cdots+E(X_n)}n=mu)]
[math({rm Var}(bar X)={rm Var}!left(displaystylefrac{sum X_i}{N}right)=dfrac{{rm Var}(X_1)+{rm Var}(X_2)+cdots+{rm Var}(X_n)}{n^2}=dfrac{sigma^2}n)] |
따라서 표본평균의 평균은 모평균이며, 표본평균의 분산은 모분산을 표본의 개수로 나눈 값이다. 이에 따라 [math(bar X)]는 기댓값이 [math(mu)]이고 분산이 [math(sigma^2/n)]인 분포를 따른다.
나아가, 표본분산은 [math(sigma^2/n)]이므로 표본의 개수 [math(n)]이 커질수록 0에 접근한다.
2.1. 성질
3. 표본분산
[math(X_1,,X_2,,cdots,X_n)]이 평균이 [math(mu)]이고 분산이 [math(sigma^2)]인 모집단에서 추출하는 표본이라고 하면 다음이 성립한다. 카이제곱분포에 관한 배경지식이 필요하다.
여기에서 표본분산을 구할 때 표본의 개수 [math(n)]이 아니라 [math(n-1)]로 나누는 이유가 나온다. [math(n-1)]로 나눈 값을 표본분산으로 정의하면 표본분산의 평균이 정확히 모분산이 된다. 표본평균의 평균이 모평균이 된다면, 표본분산의 평균 역시 모분산이 되도록 함이 타당하므로, [math(n)]이 아닌 [math(n-1)]로 나누는 것이다. 혹은 다음과 같이 볼 수도 있다.
[math(E(s^2)=Eleft[dfrac{sum(X_i-bar X)^2}{n-1}right]=dfrac{E[sum(X_i-bar X)^2]}{n-1})]이고, 마지막 식의 분자는 다음과 같이 계산된다.
여기에서 [math(Eleft[sum(bar X-mu)^2right]=nEleft[(bar X-mu)^2right])]이고
[math(begin{aligned}E(s^2)&=Eleft(dfrac{sigma^2}{n-1}chi^2right),left(becausedfrac{(n-1)s^2}{sigma^2}simchi^2_{n-1}right)\&=dfrac{sigma^2}{n-1}E(chi^2)=sigma^2,(because E(chi^2_{n-1})=v=n-1)end{aligned})]
[math(begin{aligned}{rm Var}(s^2)&={rm Var}left(dfrac{sigma^2}{n-1}chi^2right)=dfrac{sigma^4}{(n-1)^2}{rm Var}(chi^2)\&=dfrac{2sigma^4}{n-1},(because {rm Var}(chi^2)=2v=2(n-1))end{aligned})]
[math(begin{aligned}{rm Var}(s^2)&={rm Var}left(dfrac{sigma^2}{n-1}chi^2right)=dfrac{sigma^4}{(n-1)^2}{rm Var}(chi^2)\&=dfrac{2sigma^4}{n-1},(because {rm Var}(chi^2)=2v=2(n-1))end{aligned})]
여기에서 표본분산을 구할 때 표본의 개수 [math(n)]이 아니라 [math(n-1)]로 나누는 이유가 나온다. [math(n-1)]로 나눈 값을 표본분산으로 정의하면 표본분산의 평균이 정확히 모분산이 된다. 표본평균의 평균이 모평균이 된다면, 표본분산의 평균 역시 모분산이 되도록 함이 타당하므로, [math(n)]이 아닌 [math(n-1)]로 나누는 것이다. 혹은 다음과 같이 볼 수도 있다.
[math(E(s^2)=Eleft[dfrac{sum(X_i-bar X)^2}{n-1}right]=dfrac{E[sum(X_i-bar X)^2]}{n-1})]이고, 마지막 식의 분자는 다음과 같이 계산된다.
[math(begin{aligned}Eleft[sum(X_i-bar X)^2right]&=Eleft[sum{(X_i-mu)-(bar X-mu)}^2right]\&=Eleft[sum(X_i-mu)^2right]+Eleft[sum(bar X-mu)^2right]-2Eleft[sum(X_i-mu)(bar X-mu)right]end{aligned})]
여기에서 [math(Eleft[sum(bar X-mu)^2right]=nEleft[(bar X-mu)^2right])]이고
[math(begin{aligned}-2Eleft[sum(X_i-mu)(bar X-mu)right]&=-2Eleft[(bar X-mu)sum(X_i-mu)right]\&=-2Eleft[(bar X-mu)(nbar X-nmu)right]\&=-2nEleft[(bar X-mu)^2right]end{aligned})]
[math(begin{aligned}&therefore Eleft[sum(X_i-mu)^2right]+Eleft[sum(bar X-mu)^2right]-2Eleft[sum(X_i-mu)(bar X-mu)right]\&=Eleft[sum(X_i-mu)^2right]+nEleft[(bar X-mu)^2right]-2nEleft[(bar X-mu)^2right]\&=Eleft[sum(X_i-mu)^2right]-nEleft[(bar X-mu)^2right]\&=E[(X_1-mu)^2]+E[(X_2-mu)^2]+cdots+E[(X_n-mu)^2]-n{rm Var}(X)\&={rm Var}(X_1)+{rm Var}(X_2)+cdots+{rm Var}(X_n)-sigma^2\&=(n-1)sigma^2end{aligned}\therefore E(s^2)=dfrac{E[sum(X_i-bar X)^2]}{n-1}=dfrac{(n-1)sigma^2}{n-1}=sigma^2)]
4. 표본비율
표본비율은 어떤 모집단에서 추출한 표본 중에서 특정 범주에 속하는 표본의 비율을 말한다. 예를 들어 모집단 학생 100명 중에서 10명을 표본으로 추출하였을 때, 남학생이 3명이라면 남학생의 표본비율은 [math(0.3)]이다. 모집단의 비율인 모비율을 [math(p)]로 표기하는데, 이에 대응하여 표본비율은 [math(hat p)]으로 표기하고 '피 햇'으로 읽는다.
4.1. 이항 모집단
모집단이 이항분포를 따를 경우, 표본비율의 분포는 다음과 같이 구한다.
먼저 어떤 이항분포에서 이루어지는 시행의 성공 확률(비율)을 [math(p)], 실패 확률(비율)을 [math(1-p)]라 하자. 그러면 이 이항분포는 평균이 [math(np)]이고 분산이 [math(np(1-p))]이다. 또한, 표본 [math(n)]개를 추출하여 실시한 시행의 성공 횟수를 [math(X)]라 하면 [math(hat p=dfrac Xn)]이다. 그러면 다음이 성립한다.
또한 표본비율의 분포는 정규분포에 근사한다.
먼저 어떤 이항분포에서 이루어지는 시행의 성공 확률(비율)을 [math(p)], 실패 확률(비율)을 [math(1-p)]라 하자. 그러면 이 이항분포는 평균이 [math(np)]이고 분산이 [math(np(1-p))]이다. 또한, 표본 [math(n)]개를 추출하여 실시한 시행의 성공 횟수를 [math(X)]라 하면 [math(hat p=dfrac Xn)]이다. 그러면 다음이 성립한다.
[math(E(hat p)=Eleft(dfrac Xnright)=dfrac{np}n=p)]
[math({rm Var}(hat p)={rm Var}left(dfrac Xnright)=dfrac{np(1-p)}{n^2}=dfrac{p(1-p)}n)]
[math({rm Var}(hat p)={rm Var}left(dfrac Xnright)=dfrac{np(1-p)}{n^2}=dfrac{p(1-p)}n)]
또한 표본비율의 분포는 정규분포에 근사한다.
[math(hat psim Nbiggr[p,,dfrac{p(1-p)}n)][math(biggr])]
[math(Z=dfrac{hat p-p}{sqrt{dfrac{p(1-p)}n}}sim(0,,1))]
[math(Z=dfrac{hat p-p}{sqrt{dfrac{p(1-p)}n}}sim(0,,1))]