귀무가설과 대립가설로 보는 통계 데이터 분석 (가설, 검정)

귀무가설과 대립가설로 보는 통계 데이터 분석 (가설, 검정)

가설검정이란 조사하고자 하는 현상을 구체적인 가설(수학적 표현)로 만들고, 가설을 입증할 수 있도록 실험이나 관찰을 수행한 후(통계 데이터 분석 이후), 그 결과를 효과적인 값(요약할 수 있는)으로 구하는 일련의 과정이다. 이렇게 구해진 값을 귀무가설이 사실이라고 가정한다. (대립가설은 더 아래에서 설명)

그리고 기대되는 값들과 비교하여,

- 귀무가설 하에서 얻어지기 힘든 값이라면, 귀무가설을 기각

- 충분히 얻어질 수 있는 값이라면 귀무가설을 기각하지 못한다.

데이터 분석 알고리즘 [가설검정 - 귀무가설과 대립가설]

가설검정의 절차는 다음과 같다. (통계 데이터 분석 순서는 비슷하다)

1. 귀무가설, 대립가설 설정

2. 실험이나 관찰을 계획, 수행

3. 실험이나 관찰을 효과적으로 요약

4. 요약된 값이 귀무가설 하에서 쉽게 발생할 수 있는 값인지 조사

5-1. 귀무가설 하에서 발생하기 힘든 값이라면 귀무가설을 기각

5-2 충분히 발생할 수 있는 값이라면 귀무가설을 기각하지 못한다.

가설 설정

귀무가설(Ho)은 실험이나 관찰을 통해서 기각하고 싶은 기존의 (통계 데이터 분석) 가설이고, 대립가설(Ha)은 실험이나 관찰을 통해서 주장하고 싶은 새로운 이론이다. 이해를 돕기 위해 몇 가지 예를 들어보자.

예 1) 2000년에 조사한 중학생들의 평균 키는 170cm였다. 10년이 지난 2010년, 식생활 패턴의 변화로 중학생들의 키가 커졌다고 생각된다.

귀무가설 : 2010년 중학생 평균 키는 170cm이다.

대립가설 : 2010년 중학생 평균 키는 170cm보다 크다.

예 2) 기존에는 A 약이 고혈압에 가장 효과가 있는 치료제였다. 유전공학을 이용해 새로이 개발된 B 약이 고혈압에 더 효과가 있다고 생각된다.

귀무가설 : A 약과 B 약은 고혈압 치료 효과에 차이가 없다.

대립가설 : A 약과 B 약은 고혈압 치료 효과에 차이가 있다.

예3) Zyrtec의 특허가 끝난 후 Walgreens가 Wal-Zyr를 만들었는데 Zyrtec과 같은 성분인 Cetirizine을 사용하여 제조하였으므로 효과가 같다고 생각된다.

귀무가설 : Wal-Zyr와 Zyrtec는 인체에 생물학적으로 동등하지 않다.

대립가설 : Wal-Zyr와 Zyrtec는 인체에 생물학적으로 동등하다.

데이터 분석 알고리즘 [통계적 가설검정 예]

단측 검정

예 1)에서 Ha는 "크다"로 표현되어 있다. 이를 수식으로 표현하면 μ > 170이다. 2010년 평균 키가 10년 전보다 작아질(μ < 170) 가능성이 없다고 생각되면, 한쪽만 고려하여 검정을 시행하는 것이 양측을 모두 고려하는 양측검정에 비해 귀무가설을 기각할 가능성이 커진다. 즉, 검정력이 높아진다. (통계 데이터 분석의 핵심)

양측검정

예 2)에서 Ha는 "차이가 있다". 즉 수식으로 표현하면 μa != μb이다. μa > μb와 μa < μb를 모두 고려한다. μ가 약의 바람직한 효과를 측정한 값의 모수라고 하면 μa > μb로 단측검정을 하면 검정력이 높아지지만 신약 허가를 위한 연구에서는 보통 양측검정을 요구하여 귀무가설을 기각하기 힘들게 만들어 신약 허가를 까다롭게 통제하고 있다.

예3) 생동분석(bioquivalence test)의 예는 양측검정이나 귀무가설이 "같지 않다"이고, 대립가설이 "같다"이다.

주의할 점 - 표본이 모집단을 대표하는가?

대부분의 연구에서 조사대상인 모집단이 너무 크므로 전수조사할 수 있지 않다. 그래서 보통 표본을 뽑아 표본에서 나온 결과로 모집단의 성질을 추론한다. (통계 데이터 분석 과정) 그러나 표본이 모집단을 제대로 대표하지 못하면 표본에서 나온 결과를 전체 모집단으로 확대하여 해석할 수 없다.

좀 극단적인 예를 들어보자. 남성의 키가 여성보다 크다는 것은 누구도 부인할 수 없는 사실이다. 그러나 표본을 뽑을 때 남성은 피그미족에서 많이 뽑고 여성을 게르만족에서 많이 뽑았다면 반대의 결과가 나올 수 있다. 실제로 많은 연구가 실수로 또는 의도적으로 모집단을 대표하지 못하는 표본을 선택하여 왜곡된 연구 결과를 발표한다.

선거 때마다 여러 기관에서 등록된 집 전화를 이용하여(응답률마저 현저히 낮았다), 여론조사를 발표한다. 이런 여론조사에 의한 특정 후보에 대한 지지율은 어김없이 실제 득표율과 큰 차이를 보여줬다. (통계 데이터 분석이 필요한 이유) 등록된 집 전화에서 일차적으로 뽑히고 이중 여론 조사에 응한 사람들만을 조사하여 지지율을 계산하는데, 이렇게 뽑힌 표본이 실제로 득표율이 측정되는 모집단인 "투표에 실제로 참여할 유권자들"을 제대로 대표하지 못하기에 생기는 현상이다. 반면 잘 디자인된 출구 조사는 놀라울 정도로 정확했다.

귀무가설과 대립가설로 보는 통계 데이터 분석 (가설, 검정) 데이터 분석 알고리즘 [R 프로그래밍 기초]