분류
1. 개요
2. 역사
3. 기본 정보
[math(Zsim N(0,,1))]이고 [math(Usimchi^2_v)]이며 [math(Z)]와 [math(U)]가 독립일 때 t분포를 다음과 같이 정의한다.
평균은 [math(E(t)=0)]이고 분산은 [math({rm Var}(t)=dfrac{v}{v-2};(v>2))]이다. 표준정규분포와 평균은 같으나 [math(dfrac{v}{v-2}>1)]이므로 분산은 t분포가 더 크다. 만약 [math(v)]의 값이 커지면 분산은 갈수록 작아져 1에 근접하며, 표준정규분포와 비슷한 분포를 이루게 된다.
[math(t=dfrac{Z}{sqrt {U/v}}sim t_v)]
평균은 [math(E(t)=0)]이고 분산은 [math({rm Var}(t)=dfrac{v}{v-2};(v>2))]이다. 표준정규분포와 평균은 같으나 [math(dfrac{v}{v-2}>1)]이므로 분산은 t분포가 더 크다. 만약 [math(v)]의 값이 커지면 분산은 갈수록 작아져 1에 근접하며, 표준정규분포와 비슷한 분포를 이루게 된다.
4. 공식 및 쓰임새
[math(Z=dfrac{bar X-mu}{sigma/{sqrt n}}sim N(0,,1))]이고 [math(U=dfrac{(n-1)s^2}{sigma^2}sim chi^2_{n-1})]이면
곧, [math(t)]분포는 표본평균 [math(bar X)]의 표준화 식에서 모표준편차 [math(sigma)]를 표본표준편차 [math(s)]로 대체한 것이다.
만약 모표준편차를 안다면 표본평균을 표준화한 표준정규분포로 모평균을 추측하는 것이 더욱 정확하다. 그러나 일반적으로 모표준편차를 잘 알지 못한다. 왜냐하면 모평균을 정확히 모르는데 모표준편차는 안다는 것 자체도 이상하거니와 모집단 전부를 조사하기란 현실적으로 어렵기 때문이다. 따라서 모표준편차 대신 표본표준편차의 값을 이용한 [math(t)]분포로 모평균을 추측하는 것이다.
[math(begin{aligned}t&=dfrac{Z}{sqrt{U/v}}sim t_v\&=dfrac{cfrac{bar X-mu}{sigma/sqrt{n} }}{sqrt{cfrac{(n-1)s^2}{sigma^2}/(n-1)}}\&=dfrac{bar X-mu}{s/sqrt{n}}sim t_{n-1}end{aligned})]
곧, [math(t)]분포는 표본평균 [math(bar X)]의 표준화 식에서 모표준편차 [math(sigma)]를 표본표준편차 [math(s)]로 대체한 것이다.
만약 모표준편차를 안다면 표본평균을 표준화한 표준정규분포로 모평균을 추측하는 것이 더욱 정확하다. 그러나 일반적으로 모표준편차를 잘 알지 못한다. 왜냐하면 모평균을 정확히 모르는데 모표준편차는 안다는 것 자체도 이상하거니와 모집단 전부를 조사하기란 현실적으로 어렵기 때문이다. 따라서 모표준편차 대신 표본표준편차의 값을 이용한 [math(t)]분포로 모평균을 추측하는 것이다.
5. 그래프
6. 종류
- 독립 표본 t-검정(independent samples t-test)과
- 대응 표본(짝지은 표본) t- 검정(paired samples t-test, 종속 표본 t-검정, dependent samples t-test)이 있다.
6.1. 독립표본 t검정
독립 표본 t-검정은 두 개의 집단이 동일한 분산을 가진 경우(등분산, equal variance)와 두 개의 집단이 다른 분산을 가지고 있는 경우(이분산, unequal variance)가 있다.
독립 표본 t-검정은 두 반의 성적 평균 차이가 통계적으로 유의한 차이가 있나 등을 검증할 때 쓴다. F-검정으로 등분산인지 이분산인지 검증해봐서 F-검정의 p-값이 0.05보다 작으면 이분산, 크면 등분산이다. t-검정의 p-값이 0.05보다 작으면 두 반의 성적 차이는 통계적으로 유의미하게 차이가 난다는 의미이다.
SPSS를 활용하여(만만한게 spss)검정을 수행할 수 있다.
독립 표본 t-검정은 두 반의 성적 평균 차이가 통계적으로 유의한 차이가 있나 등을 검증할 때 쓴다. F-검정으로 등분산인지 이분산인지 검증해봐서 F-검정의 p-값이 0.05보다 작으면 이분산, 크면 등분산이다. t-검정의 p-값이 0.05보다 작으면 두 반의 성적 차이는 통계적으로 유의미하게 차이가 난다는 의미이다.
SPSS를 활용하여
6.2. 대응표본 t검정
두 집단 간의 차이를 비교하는 독립 표본 t-test와는 달리, paired t-test는 같은 집단의 전후 차이를 비교한다. 특정 수업을 들은 전후의 성적 차이나, 약물 복용 후 효과 차이와 같은 것이 있을 수 있다. p-값이 0.05보다 작으면 수업 또는 약물이 효과가 있다는 의미이다.
7. 엑셀로 t-검정 하기
8. 기타
9. 관련 문서
[1] 즉 x ~ N(0, 1)이고 y ~ χ2(k)