본문 바로가기

Statistics

통계적 가설검정 쉽게 이해하기

우리는 일반적으로 어떠한 집단 전체에 대한 정보를 알고 싶지만, 전수조사를 하기 힘든 경우가 많다. 

예를 들어, 전국 대학생의 토익 영어 평균, 30대 한국 남성의 비만율 등.. 이런 정보를 일일이 조사하기는 사실 상 불가능 하다. 이런 전체 집단을 모집단이라고 한다.

그래서, 연구자는 모수에 대한 주장을 세우고(대립가설) 모집단에서 표본(샘플)을 추출하여 모집단을 추정한다. 그리고, 세웠던 가설이 맞는지 확인한다. 이러한 단계가 통계적 가설 검정에 해당한다.

 

같은 내용을 딱딱하게 써보면...

통계적 가설 검정(Hypothesis testing) 이란?

모집단에 대한 분포의 모양이나 *모수(parameter)에 대한 *가설을 새우고, 모집단으로부터 추출한 표본을 기초로 가설을 기각하거나 채택하는 통계적 추론 방법을 말한다.

 

* 가설: 모수에 대한 주장이나 단순한 추론

* 모수: 모집단의 특성치(ex. 모 평균, 모 분산, 모 표준편차 등)

 

가설(Hypothesis)

- 귀무가설(Null hypothesis): 돌아간다( ) 아무것도 없다( )  즉, 주장이 아무것도 아닌 일로 돌아가는 가설을 말한다. 

- 대립가설(Alternative hypothesis): 연구자가 새롭게 주장하고 싶은 가설

 

처음에는 귀무가설이 맞다는 전제로 연구를 시작한다.

통계학에서는 귀무가설을 기각한다 or 채택한다 라는 용어를 쓴다. (대립가설을 채택한다. 이런 말은 쓰지 않는다!)

 

오류의 종류(Type of errors)

 

Type of errors

그렇다면, 통계적 가설 검정을 할 때에는 두 가지의 오류가 생길 수 있겠다.

귀무가설이 참인데도 불구하고, 기각하는 오류 (type 1 error) 와 귀무가설이 거짓인데도 불구하고 채택하는 오류 (type 2 error) 두 타입의 오류는 trade-off 관계이다. type 1 error 을 줄이려고 귀무가설 채택을 많이하면, 결국 type 2 error 가 늘어나기 때문에! (역도 마찬가지..) 

이 두 오류를 함께 줄이는 방법은 한 가지. 표본의 크기를 늘리는 것이다. 표본의 크기가 고정된 상태에서 type 1, 2 error를 모두 줄이는 것은 불가능하다.

 

type 1 error를 α(유의수준) type 2 error를 β라고 하는데, 1-β를 검정력이라고 한다.(귀무가설이 틀렸는데 기각할 확률이니깐) αβ를 함께 낮출 수는 없기 때문에, α를 미리 정한 후, 그 상태에서 β를 최소화하는 검정법을 찾는다.

통계적 가설 검정 용어

유의수준(level of significance)

유의수준은 type 1 오류의 최대 허용한계로 α로 표기한다. 주로, 0.1 이하에서 결정하고, 주로 0.05가 통상적인 한계치이다.

α가 0.05라고 한다면, '100번의 가설 검정을 했을 때, 가설검정이 참인데도 기각하는 오류를 5번 까지는 허용한다' 는 뜻이다. (필자는 처음에 어려워서 5% 정도까지는 type 1 error 오류를 봐준다라고 이해했다... 사실, 횟수의 개념이 정확하다..)

 

p-value(p 값) 

귀무가설이 맞다는 가정 하에 표본의 값이 극단적일 확률이다. 

*** p-value < 유의수준 일 때, 귀무가설이 기각된다. (반드시 알고 있어야 함!)

p 값이 작을수록 주장한 대립가설이 맞다는 것이 된다. 

 

예를 들어, 유의수준을 0.05로 하고, p값이 0.01로 나왔다고 해보자.

p값은 귀무가설이 맞다는 가정 하에 표본의 값이 극단적일 확률인데, 0.01이라고 하면 표본의 값이 극단적일 확률이 매우 희박한 경우라고 볼 수 있다. 그렇다면, 우리는 귀무가설을 틀렸다고 해야한다. 이 것이 p값<유의수준 일 때, 귀무가설을 기각하게 되는 이유이다.

 

검정통계량

가설을 검정하기 위해 사용한 통계량을 말한다. 

예) 표본평균, F-통계량, T-통계량...

 

예시

무슨 말인지 이해가 안될 것이다.. 예시를 통해 알아보자..!

 

H0: 대한민국 대학생의 몸무게와 일반인 몸무게는 같다.

H1: 대한민국 대학생의 몸무게가  일반인 몸무게보다 낮다.

 

먼저, 내가 뽑은 대학생 표본의 평균 몸무게가 60kg(검정통계량) 였을 때, 이 60kg가 일반인 몸무게의 분포에서 몇 %만큼의 확률로 존재할 지 본다. 이 때 일반인 몸무게에서 존재할 확률(p-value)이 희박하면, 모집단의 몸무게가 다르다는 대립 가설이 맞는 것으로 볼 수 있다! 

이 때, '희박하다'의 기준이 유의수준(α)이 된다. 만약 유의수준(α)을 5%(0.05) 라고 정해보자. 면, 6%, 7%는 표본에서 일어난 샘플링 오차 정도로 볼 수 있다는 의미이고 5% 미만이 되어야 '아~ 이 정도로 희박한 확률이면 대학생의 평균 몸무게가 일반인 몸무게와 같다는 귀무가설을 기각해야겠구나' 가 되는 것이다. 그렇게 5% 미만의 확률이 나올 때 귀무가설을 기각하게 되는데, 이 때 귀무가설이 참일 수도 있을 것이다. (운이 나쁘게도.. 표본이 굉장한 특이값이어서..) 그래서 type 1 error의 최대허용 한계가 5%가 되는 것이다! (type 1 error가 일어날 수 있는 경우를 무릅쓰고 유의수준만큼 귀무가설을 기각한 경우라고 보면 됨) 

가설검정의 절차

마지막으로, 여태까지 배운 내용을 단계 별로 정리해보자.

 

1. 귀무가설과 대립가설을 설정한다.

2. 유의수준(α)를 설정한다. (주로 0.05)

3. 검정통계량을 계산한다. (검정통계량으로부터 p값 계산)

4. p값과 유의수준을 비교하여 통계적 결정을 한다. - 귀무가설을 기각할 지, 안 할 지?

'Statistics' 카테고리의 다른 글

시계열 데이터  (0) 2024.05.26
ANOVA 란?  (1) 2023.12.11
t-test 쉽게 이해하기  (1) 2023.12.11