의학논문을 쓰는 분들이라면,
한번쯤은 사용해보았을 Cox proportional hazard model 에 대한 이야기입니다.
사실 부끄러운 이야기지만... 많은 의사들은 사실 Cox model 의 적절한 이해가 없이 Cox model 분석 적용합니다.
그에 대한 회의감으로 공부를 시작했었던 기억이 납니다.
Cox model 분석은 하고싶은 말이 많기 때문에 몇 개의 포스팅으로 나누어질 예정입니다.
그럼 시작해볼까요? ^^
1. Cumulative Distribution Function (CDF)
$ F(t) = Pr (t \leqq T) $ 특정시점에 이르기까지 사망률의 총합
즉,
$ S(t) = 1-F(t) $ 는 특정시점까지 생존확률의 총합을 의미합니다.
2. Probability Density Function (PDF)
위의 CDF 를 미분한 것
즉,
$\operatorname{d}\!F(t)/\operatorname{d}\!t$ 라면 특정 시점에서 사망확률을 의미하며,
$\operatorname{d}\!S(t)/\operatorname{d}\!t$ 라면 특정 시점에서 생존확률을 의미합니다.
3. Hazrd Function
conditional density 이라고도 불립니다.
어떠한 개인의 생존확률을 구하기 위해서는 그 사람이 $ t $ 라는 시점까지 살아있어야 한다는 조건이 붙습니다.
즉, $ t $ 시점에 살아있는 상태에서 사건 발생이 일어날 가능성을 의미합니다.
이를 수식으로 표현하면,
$$ h(t) = {\operatorname{d}\!F(t)\over\operatorname{d}\!t} / S(t) $$
$$= {\operatorname{d}\!(1-S(t))\over\operatorname{d}\!t} / S(t) $$
$$= -\operatorname{d}\log[S(t)] $$
이 수식은 아래의 3가지를 의미합니다.
위험함수의 값은 0 이상의 값이다.
위험함수는 확률로 표현되므로, 관측이 불가능한 값이다.
위험률은 표본 전체의 특성이 아니라 개인에 대한 특성. 즉, 개개인의 위험함수를 추정가능이다.
4. Cumulative Hazard Function
$$ H(t) = \int_0^t {\operatorname{d}\!(1-S(t))\over\operatorname{d}\!t}/S(t) dx $$
$$ = - \log S(t) $$
시간에 따른 위험률의 증가를 보기 위한 누적위험함수입니다.
일단 위의 개념을 이해를 하셔야...
Cox model 의 아주 기초를 이해하신거라 할 수가 있겠습니다.
다음 포스팅에서 이어집니다...
'R_statistics > Rs_basic' 카테고리의 다른 글
[통계] 중심극한정리, Central Limit Theorem (CLT) 의 정의 (0) | 2019.03.12 |
---|---|
[통계] 제곱합, SST, SSE, SSR, 최소제곱법 (0) | 2019.02.26 |
[생존분석] 중도절단, censoring 의 이해 (1) (0) | 2019.01.30 |
Residual, 잔차 와 Error, 오차 의 차이 (0) | 2019.01.25 |
Quantile, 분위수 와 Quartile, 4분위수 의 차이 (0) | 2019.01.24 |