Residual, 잔차 와 Error, 오차
처음에 많이들 헷갈려 하는 개념이죠.
저도 처음에 공부할 때 대충 넘기고, 정확하게 개념을 안잡고 공부하다가...
나중에서야 개념을 잡았던 기억이 있네요.
회귀식을 바탕으로 설명을 해보겠습니다.
회귀식은 대표성을 의미합니다.
즉 모집단을 대표하는 어떠한 직선을 의미하는 것인데...
저희가 모집단을 가지고 있는 경우는 거의 없죠.
그렇기에 모집단을 대표할 수 있는 표본집단을 이용하여, 모집단의 회귀식을 추론하게 됩니다.
여기서 오차와 잔차의 개념이 나옵니다.
즉,
오차 = 모집단의 회귀식에서 예측된 값 - 실제 관측값
잔차 = 표본집단의 회귀식에서 예측된 값 - 실제 관측값
이렇게 이해하시면 됩니다.
여기서 개념을 조금더 확장을 하면, SST = SSR + SSE 의 개념이 나오게 되죠.
이 부분은 다른 포스팅에서 간단하게 설명드릴께요^^
## 2019.02.26 제곱합 (SST) 내용 추가 ##
https://bpapa.tistory.com/30 을 참고하시면 됩니다^^
'R_statistics > Rs_basic' 카테고리의 다른 글
[통계] 중심극한정리, Central Limit Theorem (CLT) 의 정의 (0) | 2019.03.12 |
---|---|
[통계] 제곱합, SST, SSE, SSR, 최소제곱법 (0) | 2019.02.26 |
[생존분석] 중도절단, censoring 의 이해 (1) (0) | 2019.01.30 |
[생존분석] Cox proportional hazard model, Cox 비례가정위험모형 (1) (0) | 2019.01.26 |
Quantile, 분위수 와 Quartile, 4분위수 의 차이 (0) | 2019.01.24 |