1. 개요
분산 분석(analysis of variance; ANOVA) 또는 변량 분석은 종속 변수의 분산(variance, 변량)을 설명하는 독립 변수의 유의성을 알아보는 방법 중 하나이다. 영국의 통계학자 Fisher가 농업 생산성 관련 연구를 하려고 만들었다. 3개 이상의 처리 효과 또는 모평균을 비교하는 경우에는 일반적으로 실험을 계획하고 실험을 실시한 후에 얻은 자료를 기초로 하여 분석한다. 통계학 쪽에서는 통칭 아노바라고 부른다.
분산분석이란 명목척도로 측정된 독립변수와 등간척도 또는 비율척도로 측정된 종속변수 사이의 관계를 연구하는 통계 기법이다.
분산 분석의 귀무 가설 H0는 "μ1=μ2=μ3"같은 것이고, 대립 가설 H1은 "H0가 아니다"와 같은 것이다. 구체적인 예를 들자면, H0는 "약품 세 가지가 효과 차이가 없다"와 같은 것이고, H1은 "적어도 한 가지는[1] 효과 차이가 있다"와 같은 것이다.
세 개 이상의 집단의 평균 차이가 있는가를 검증할 때 쓴다. 예를 들어, 약물 3종류를 투여하고, 약물의 효과에 차이가 있는지 검증할 때 쓸 수 있다. p-값이 0.05보다 작으면 통계적으로 유의미한 차이가 있다고 볼 수 있다. 즉, 약물이 효과가 있다고 볼 수 있다.
크게 연구방법론 측면에서 보면, 회귀분석에 비해 집단비교가 그나마(?) 직관적인 부분이 있다(
2. 전제 조건
- 각 모집단들은 정규 분포를 이루고 있어야 한다.
3. 요인의 수에 따른 구분
요인의 수에 따라 다음으로 구분할 수 있다.
3.1. 일원 배치법
일원 배치법(one-way layout), 일원 분산 분석(one-way ANOVA)
일원 배치법은 특성값에 대한 한 종류의 변수의 영향을 조사할 때 사용하는 분산 분석법이다. 변수의 각 수준이 처리가 되며 2개의 처리 효과를 비교할 때는 t-검정을, 3개 이상의 처리 효과를 비교할 때는 ANOVA를 사용한다. 처리(treatment)는 각 실험 단위에서 특정한 실험 환경 또는 실험 조건을 가하는 것을 말한다.
일원 배치법은 특성값에 대한 한 종류의 변수의 영향을 조사할 때 사용하는 분산 분석법이다. 변수의 각 수준이 처리가 되며 2개의 처리 효과를 비교할 때는 t-검정을, 3개 이상의 처리 효과를 비교할 때는 ANOVA를 사용한다. 처리(treatment)는 각 실험 단위에서 특정한 실험 환경 또는 실험 조건을 가하는 것을 말한다.
- 반복이 일정한 모수 모형인 경우
- 반복이 일정하지 않은 모수 모형인 경우
- 반복이 일정한 변량 모형인 경우
- 반복이 일정하지 않은 변량 모형인 경우
3.2. 이원 배치법
3.3. 삼원 배치법
3.4. 다변량 분산 분석
다변량 분산 분석 (Multivariate analysis of variance)
4. 분석 모형
- 고정 효과(fixed-effects)
- 확률 효과, 무선 효과(random-effects)
- 혼합 효과(mixed-effects)
5. 자유도
6. 엑셀로 분산 분석 하기
7. 기타
- 에타 제곱
- 본페로니 방법
8. 관련 문서
[1] 굉장히 중요하다. 분산분석을 할 때 여러개의 변수 중에서 보통 1~2개만 차이가 있는 경우가 많다.