중심극한정리.
Central Limit Theorem.
CLT.
통계를 분석을 시행하는 사람이라면 적어도 한 번 이상은 들어보았을 정리입니다.
하지만... 이 부분을 제대로 이해하지 못하고 통계를 수행하는 경우가 상당히 많습니다.
심지어 어떠한 통계책! 에는
'중심극한정리를 표본의 수가 많아지면 그 분포가 정규분포에 근접한다'
는 황당한 소리를 적어놓는 경우도 있고,
'대수의 법칙, Law of Large Numbers'
과 구분을 제대로 못하는 경우도 있습니다.
증명과정까지야 잘 기억은 못하더라도,
부끄럽지 않으려면 최소한 어떠한 내용인지는 머리 속에 제대로 남아있어야겠죠?
중심극한정리의 정의는,
'표본의 수가 늘어날 수록, 그 표본들의 (표본)평균의 분포가 정규분포에 점점 근사한다.'
입니다.
위의 황당한 소리와 다른 부분이 보이시죠?
표본의 실제 분포가 정규분포에 근사하는 것이 아니고,
그 표본들의 표본평균의 분포가 정규분포에 근사하게 되는 것입니다.
이 내용을 이용하며, (증명은 생략)
어느 정도 수준의 표본수만 확보되면
ordinary least squares (OLS) 의 기본 가정 중의 하나인,
'오차가 정규분포를 이룬다' 를 증명할 수 있습니다.
즉, 회귀분석에서 중심극한정리는
OLS 의 오차항이 정규분포를 갖는다는 가정을 만족시켜주는 정리라고 생각하시면 큰 문제는 없으실 것 같습니다.
도움이 되셨다면, '공감' 버튼 부탁드립니다^^
'R_statistics > Rs_basic' 카테고리의 다른 글
[통계] 회귀 (regression) 분석에서 설명변수의 고정 (0) | 2019.09.18 |
---|---|
[통계] 회귀 (regression) 분석에서 비편향 (불편, unbiased) 의 의미와 증명 (0) | 2019.04.08 |
[통계] 제곱합, SST, SSE, SSR, 최소제곱법 (0) | 2019.02.26 |
[생존분석] 중도절단, censoring 의 이해 (1) (0) | 2019.01.30 |
[생존분석] Cox proportional hazard model, Cox 비례가정위험모형 (1) (0) | 2019.01.26 |