본문 바로가기
C++ 200제/코딩 IT 정보

분산분석과 다중비교란, 영향력 유무의 판정 시도

by vicddory 2018. 3. 10.

분산분석과 다중비교란, 영향력 유무의 판정 시도


분산분석이란?

모집단의 수가 셋 이상인 경우에 tㅡ검정을 이용하여 모평균을 비교해 보도록 합시다. (분산분석 시작)


2개씩 짝을 지어 5개의 표본평균 들을 대상으로 유의수준이 5%인 tㅡ 검정을 10번 실시한다고 가정합시다. 실제로 이 평균들 간에 차이가 없을 때, 옳은 결론에 도달할 수 있는 확률은 한 쌍에서 0.95씩이므로 10번의 tㅡ 검정이 올바른 결론에 도달할 수 있는 확률은 0.95의 10승이 됩니다.


바꾸어 말하면 이 중 적어도 어느 하나의 검정이 잘못된 결론을 내리게 될 확률 즉, 유의수준이 이나 되는 셈입니다. 그러므로 이처럼 모집단의 수가 셋 이상이면 tㅡ 검정이 아닌 여러 모집단을 총괄적으로 분석할 수 있는 분산분석(Analysis of Variance, ANOVA)이라는 일반화된 분석기법을 사용합니다.


분산분석 다중비교 영향력[Analysis of variance, ANOVA, 변량분석과 다중비교]


일반적으로 모든 실험은 여러 가지 요인에 의해 영향을 받습니다. 자연과학 실험이라 하더라도 온도 습도 기압 등과 같은 실험환경에 따라 서로 다른 결과가 나올 수 있습니다. 이러한 실험환경은 의도되어 있는 경우도 있고 통제할 수 없는 경우도 있습니다.


분산분석은 이러한 실험에서 관측된 변동량을 분산의 개념으로 파악한 다음, 이러한 분산을 설명할 수 있는 요인에 기인하는 부분과 우연히 발생하여 설명할 수 없는 요인에 기인하는 부분으로 구분하여 비교함으로써 각 요인의 영향력 유무에 대한 판정을 시도하는 것이라고 할 수 있습니다.


분석방법에 따라 인자(Factor)가 한 개일 때 일원분산분석(One-way Analysis of Variance), 인자가 두 개일 때 이원분산분석(Two-way Analysis of Variance), 관측하는 변수가 한 개일 때 단변량 분산분석(Analysis of Variance, ANOVA), 두 개 이상일 때 다변량 분산분석(Multivariate Analysis of Variance, MANOVA)이라 합니다.


<분산분석과 회귀분석의 차이점>

회귀분석은 독립변수와 종속변수 모두가 등간, 비율 척도로 측정된 양적 변수여야 하지만 분산분석은 독립변수가 양적 변수가 아닌 명목, 순서척도로 측정된 질적 변수여야 합니다.


다중비교 회귀분석[Analysis of variance, ANOVA, 변량분석과 다중비교]


다중비교(Multiple Comparison)

검정결과 귀무가설이 기각된 경우 적어도 두 그룹의 모평균이, 다시 말하여 두 개의 처리 효과가 같지 않다는 결론을 내리는 경우가 있습니다.


하지만 분산분석에서는 모평균들이 어떻게 다른지에 대해서는 구체적으로 설명하지 못합니다. 따라서 이러면 이 모평균 사이의 크고 작음을 구체적으로 설명하는 개별 비교의 분석이 요구됩니다.


(1) Scheffe의 검정

Scheffe는 여러 개의 대비를 동시에 비교하거나 혹은 표본이 서로 다를 때 유용한 검정법입니다. 가장 보수적으로 검정이 이루어지므로 비교적 높은 신뢰도를 인정받고 있습니다.


(2) Tukey의 검정

Tukey는 집단의 크기가 같은 경우에 사용하는 것이 바람직하며 모든 가능한 두 평균 간의 비교에 유용합니다. 대체로 보수적인 검정이 이루어진다는 특성이 있습니다.


(3) Duncan (Duncan's Multiple Range Test)의 다중범위 검정

Duncan은 보수적으로 검정이 이루어지는 Scheffe 혹은 Tukey에 비해 비교적 귀무가설을 잘 기각시키는 것으로 평가되고 있습니다. 그러나 Duncan의 다중 비교법이 모평균의 차이가 있다는 귀무가설을 잘 기각하기는 하나, 그런 만큼 옳지 않은 결론을 내릴 오류의 확률 또한 커진다는 점을 인식해야 합니다.


분산분석과 다중비교란, 영향력 유무의 판정 시도

댓글