분류
1. 개요
f분포(F-distribution 또는 Snedecor's F-distribution 또는 Fisher–Snedecor distribution)는 통계학에서 사용하는 연속 확률 분포(continuous probability distribution)로 분산 분석에 많이 사용한다.
독립적인 두 카이제곱분포에 관한 비로써 정의된다. 자유도는 분자에 해당하는 카이제곱분포의 자유도와 분모에 해당하는 카이제곱분포의 자유도에 의해 결정된다. 분산 비 검정, 분산 분석, 회귀 분석 등에 사용한다.
F-분포로 하는 검정(test)을 F-검정(F-test)이라고 한다.
독립적인 두 카이제곱분포에 관한 비로써 정의된다. 자유도는 분자에 해당하는 카이제곱분포의 자유도와 분모에 해당하는 카이제곱분포의 자유도에 의해 결정된다. 분산 비 검정, 분산 분석, 회귀 분석 등에 사용한다.
F-분포로 하는 검정(test)을 F-검정(F-test)이라고 한다.
2. 정의
[math(U_1simchi^2_{v_1},,U_2simchi^2_{v_2})]이고 [math(U_1)]과 [math(U_2)]가 독립일 때 f분포를 다음과 같이 정의한다.
[math(v_1)]은 [math(U_1)](분자)의 자유도이고, [math(v_2)]는 [math(U_2)](분모)의 자유도이다.
한편, [math(Large{F_{v_1,;v_2,;alpha}})]는 [math(Large Xsim{F_{v_1,;v_2}})]에 대하여 [math(P[Xgeq a]=alpha)]가 되도록 하는 [math(a)]의 값을 일컫는다.
[math(F=dfrac{U_1/v_1}{U_2/v_2}sim F_{v_1,,v_2})]
[math(v_1)]은 [math(U_1)](분자)의 자유도이고, [math(v_2)]는 [math(U_2)](분모)의 자유도이다.
한편, [math(Large{F_{v_1,;v_2,;alpha}})]는 [math(Large Xsim{F_{v_1,;v_2}})]에 대하여 [math(P[Xgeq a]=alpha)]가 되도록 하는 [math(a)]의 값을 일컫는다.
3. 분산비검정
분산비검정(variance ratio test)이란 다음과 같이 두 분산을 비교할 때 사용하는 방법이다.
두 카이제곱분포 [math(U_1=dfrac{(n_1-1){s_1}^2}{{sigma_1}^2}simlarge{chi^2_{n_1-1}})]과 [math(U_1=dfrac{(n_2-1){s_1}^2}{{sigma_2}^2}simlarge{chi^2_{n_2-1}})]에 대하여
두 카이제곱분포 [math(U_1=dfrac{(n_1-1){s_1}^2}{{sigma_1}^2}simlarge{chi^2_{n_1-1}})]과 [math(U_1=dfrac{(n_2-1){s_1}^2}{{sigma_2}^2}simlarge{chi^2_{n_2-1}})]에 대하여
[math(begin{aligned}F&=dfrac{U_1/v_1}{U_2/v_2}=dfrac{cfrac{cancel{(n_1-1)}{s_1}^2}{{sigma_1}^2cdotcancel{{v_1}} }}{dfrac{cancel{(n_2-1)}{s_1}^2}{{sigma_2}^2cdotcancel{{v_2}} }}\ \&=dfrac{{s_1}^2/{sigma_1}^2}{{s_2}^2/{sigma_2}^2}=dfrac{{s_1}^2/{s_2}^2}{{sigma_1}^2/{sigma_2}^2}sim large{F_{n_1-1,;n_2-1}}end{aligned})]
[math((because v_1=n_1-1,;v_2=n_2-1))]
[math((because v_1=n_1-1,;v_2=n_2-1))]
4. 성질
분모와 분자의 자유도가 서로 바뀌어 있는 두 [math(F)]분포에 대하여 다음과 같은 중요한 성질이 성립한다.
또한, [math(boldsymbol t)]분포를 제곱하면 분자와 분모의 자유도가 각각 1, [math(boldsymbol v)]인 [math(boldsymbol F)]분포가 된다.
[math(Large{F_{v_1,;v_2,;alpha}}=dfrac1{Large{F_{v_2,;v_1,;1-alpha} }})]
[증명]
두 [math(F)]분포 [math(XsimLarge{F_{v_1,;v_2}})]이고 [math(Y=dfrac1XsimLarge{F_{v_2,;v_1}})]이 있을 때
두 번째 식을 변형하면
빨간색 식끼리는 값이 [math(alpha)]로 같으면서, [math(Y=dfrac1X)]이므로 결국 다음 양변이 같을 수밖에 없다.
[math(begin{aligned}{color{red}Large Pleft[Xgeq{F_{v_1,;v_2,;alpha}}right]}&=alpha\Large Pleft[Ygeq{F_{v_2,;v_1,;1-alpha}}right]&=1-alphaend{aligned})]
두 번째 식을 변형하면
[math(begin{aligned}{Large Pleft[dfrac1Yleqdfrac1{{F_{v_2,;v_1,;1-alpha} }}right]}&=1-alpha\rightarrow{color{red}{Large Pleft[dfrac1Ygeqdfrac1{{F_{v_2,;v_1,;1-alpha} }}right]}}&=alphaend{aligned})]
빨간색 식끼리는 값이 [math(alpha)]로 같으면서, [math(Y=dfrac1X)]이므로 결국 다음 양변이 같을 수밖에 없다.
[math(Large{F_{v_1,;v_2,;alpha}}=dfrac1{Large{F_{v_2,;v_1,;1-alpha} }})]
또한, [math(boldsymbol t)]분포를 제곱하면 분자와 분모의 자유도가 각각 1, [math(boldsymbol v)]인 [math(boldsymbol F)]분포가 된다.
[math(begin{aligned}t&=dfrac{Z}{sqrt{U/v}}sim t_v\rightarrow t^2&=dfrac{Z^2/1}{U/v}sim F_{1,;v}end{aligned})]