본문 바로가기

R_statistics/Rs_basic

[통계] 중심극한정리, Central Limit Theorem (CLT) 의 정의

중심극한정리. 

Central Limit Theorem.

CLT.


통계를 분석을 시행하는 사람이라면 적어도 한 번 이상은 들어보았을 정리입니다.

하지만... 이 부분을 제대로 이해하지 못하고 통계를 수행하는 경우가 상당히 많습니다.


심지어 어떠한 통계책! 에는 

'중심극한정리를 표본의 수가 많아지면 그 분포가 정규분포에 근접한다'

는 황당한 소리를 적어놓는 경우도 있고,

'대수의 법칙, Law of Large Numbers'

과 구분을 제대로 못하는 경우도 있습니다.


증명과정까지야 잘 기억은 못하더라도,

부끄럽지 않으려면 최소한 어떠한 내용인지는 머리 속에 제대로 남아있어야겠죠?


중심극한정리의 정의는,

'표본의 수가 늘어날 수록, 그 표본들의 (표본)평균의 분포가 정규분포에 점점 근사한다.'

입니다.


위의 황당한 소리와 다른 부분이 보이시죠?

표본의 실제 분포가 정규분포에 근사하는 것이 아니고, 

그 표본들의 표본평균의 분포가 정규분포에 근사하게 되는 것입니다.


이 내용을 이용하며, (증명은 생략)

어느 정도 수준의 표본수만 확보되면 

ordinary least squares (OLS) 의 기본 가정 중의 하나인, 

'오차가 정규분포를 이룬다' 를 증명할 수 있습니다.


즉, 회귀분석에서 중심극한정리는 

OLS 의 오차항이 정규분포를 갖는다는 가정을 만족시켜주는 정리라고 생각하시면 큰 문제는 없으실 것 같습니다.


도움이 되셨다면, '공감' 버튼 부탁드립니다^^