본문 바로가기
Data Analysis/Basic statistics

[기초통계] 분산분석(ANOVA)

by Dlearner 2019. 9. 12.
반응형

 

우선, 집단간의 평균 차이를 검정하는 방법에 대해 나름대로 표로 정리해보았다. 

분산분석에 대해 한 눈에 볼 표를 찾는 사람이라면, 아래의 표를 참고하도록 하자.

 

집단간의 평균 차이를 검정하는 방법

두 모집단 간의 평균 차이를 검정하는 방법

3개 이상의 집단에서 평균 차이를 검정하는 방법

분산분석(ANOVA)

 

모집단의 분산을 알 때

 

모집단의 분산을 모를 때

단일변량 분산분석

(종속변수 : 1개)

다변량 분산분석

(종속변수 2개 이상)

한 가지 요인을 기준으로 집단간의 차이를 조사할 때

두 가지 요인을 기준으로 집단간의 차이를 조사할 때

세 가지 이상의 요인을 기준으로 집단간의 차이를 조사할 때

한 가지 이상의 요인을 기준으로 두 가지 이상의 종속변수에 대해 조사할 때

z 분포 사용

(z-test)

t 분포 사용

(t-test)

일원 분산분석

(one-way ANOVA)

이원 분산분석

(two-way ANOVA)

다원 분산분석

(multi-way ANOVA)

다변량 분산분석

(multi-variate ANOVA)

F 분포 사용

 

 

 

 

 

- 분산분석의 필요성

집단 간의 평균 차이를 검정할 때는 기본적으로 t 검정을 활용한다. 모집단의 분산을 알 때는 z 검정을 사용하지만, 현실적인 조사 상황에서 모집단의 분산을 알 수있는 상황이 매우 드물기 때문에 일반적으로 t 검정을 활용한다고 알려져 있다.

 

하지만, 3개 이상의 집단에 대해서 t 검정을 활용하는 경우 모든 집단간의 조합에 대해 여러 번의 분석을 시행하고 결합해야 하므로 그 과정이 복잡해진다. 이와 같이, 3개 이상의 집단에 대해 한 번에 분석을 할 수 있는 방법이 분산분석이다.

 

 

 

 

 

- 분산분석(ANalysis Of VAriance, ANOVA)

분삭분석(ANOVA)은 3개 이상의 집단에 대한 평균 차이를 검증하는 분석 방법으로, 특성에 대한 산포의 제곱합을 요인별 제곱합으로 분해한 후 영향 요인을 찾아낸다. 이 때, 가설검정은 F분포를 이용한다.

 

 

 

 

 

- 분산분석의 구분

분산분석은 변수의 개수와 특성에 따라 일원 분산분석, 이원 분산분석, 다원 분산분석, 다변량 분산분석으로 구분할 수 있다.

 

1. 일원 분산분석(one-way ANOVA)

일원 분산분석(One-way ANOVA)은 한 가지 요인을 기준으로 집단간의 차이를 조사할 때 사용한다.

 

2. 이원 분산분석 (two-way ANOVA)

이원 분산분석 (two-way ANOVA)은 두 가지 요인을 기준으로 집단간의 차이를 조사할 때 사용한다.

 

3. 다원 분산분석(multi-way ANOVA)

다원 분산분석(multi-way ANOVA)은 세 가지 이상의 요인을 기준으로 집단간의 차이를 조사할 때 사용한다.

 

4. 다변량 분산분석(multi-variate ANOVA)

다변량 분산분석(multi-variate ANOVA)은 한 가지 이상의 요인을 기준으로 두 가지 이상의 종속변수에 대해 조사할 때 사용한다.

 

 

 

 

 

- 분산분석의 가정

 

1. 각 모집단은 정규분포여야 하며, 집단 간 분산은 동일해야 한다.

모집단을 서로 비교하기 위해서는 각 모집단이 좌우대칭인 정규분포여야 한다. 여기서 중요한 것은 3개 이상의 모집단의평균을 비교하기 위한 분석이기 때문에, 모집단끼리 분산이 동일하지 않으면 평균 차이를 구별하기 쉽지 않다는 것이다. 때문에 분산분석에서는 위와 같은 가정을 필요로 하게 된다.

 

2. 각 표본들은 독립적으로 추출되어야 한다.

표본을 구성하는 과정에서 어느 집단이 다른 집단에 영향을 주지 않는 독립성을 지녀야 한다.

 

3. 각 표본의 크기는 적절해야 한다

분석을 진행하기 위해서는 표본의 크기가 충분해야 표본의 개수와 상관없이 분석을 진행할 수 있다.

 

 

 

 

 

반응형

댓글