바쁘다는 핑계로 너무 오랜만의 포스팅이 되었네요.
이번 포스팅의 주제는 바로 회귀분석의 가장 기초적인 부분이라고 할 수 있는 내용입니다.
바로 비편향 혹은 불편. 영어로는 unbiased 라고 하죠.
여기서 비편향 혹은 불편, unbiased 가 의미하는 것이 무엇일까요?
의학 통계를 하시는 분들은 아마 이 말 자체를 처음 들어본 분들도 많이 있으실 겁니다.
이 말을 처음 들어보았다면, 반성의 시간을 갖도록 합시다. ^^;
일단 증명은 추후에 하도록 하고, unbiased 의 의미부터 살펴보기 위해 수식으로 살펴보면
$ E(\hat{\beta}_{1}) = \beta_{1} $ 를 나타냅니다.
즉, 표본에서 구한 $ \hat{\beta}_{1} $ 이라는 추정량은
우리가 구하고자 하는 모수들의 $ \beta_{1} $ 값과 평균적으로 맞다는 뜻이 됩니다.
공부를 해보시면 아시겠지만, $ \hat{\beta}_{1} $ 은 다음과 같습니다.
$$ \hat{\beta}_{1} = \beta_{1} + \frac{ \sum_{i=1}^{n} (x_{i} - \bar{x})u_{i} } {\sum_{i=1}^{n}(x_{i} - \bar{x})^2 } $$
여기에서 $ E(\hat{\beta}_{1}) $ 을 구하기 위하여 위의 식을 정리해보면
$$ E(\hat{\beta}_{1}) = \beta_{1} + \frac{ \sum_{i=1}^{n} (x_{i} - \bar{x})E(u_{i}) } {\sum_{i=n}^{n}(x_{i} - \bar{x})^2 } = \beta_{1} + 0 = \beta_{1} $$
이 만족하게 됩니다.
회귀분석의 기본가정 중의 하나인 오차항의 평균 0 ( $ E(u_{i}) = 0 $ ) 이기에 위의 식이 성립하게 되겠죠.
즉, 설명변수의 값들의 비특이성이 만족되고,
설명변수들이 고정되고, 오차평균이 0 이 되면 비편향된 값을 구할 수 있게 됩니다.
추가적으로 설명변수들이 고정된다는 것이 무슨 말인지 모르실 수도 있습니다.
이 부분은 추후 다시 포스팅 해보도록 하겠습니다.
## 2019.09.17 설명변수의 고정 포스팅 추가 https://bpapa.tistory.com/52
** 도움이 되셨다면, '공감' 버튼 부탁드립니다^^
'R_statistics > Rs_basic' 카테고리의 다른 글
[통계] 가우스 마코프 정리, Gauss-Markov Theorem 의 정의와 의미 (0) | 2019.09.19 |
---|---|
[통계] 회귀 (regression) 분석에서 설명변수의 고정 (0) | 2019.09.18 |
[통계] 중심극한정리, Central Limit Theorem (CLT) 의 정의 (0) | 2019.03.12 |
[통계] 제곱합, SST, SSE, SSR, 최소제곱법 (0) | 2019.02.26 |
[생존분석] 중도절단, censoring 의 이해 (1) (0) | 2019.01.30 |