본문 바로가기

R_statistics/Rs_basic

[생존분석] Cox proportional hazard model, Cox 비례가정위험모형 (1)

의학논문을 쓰는 분들이라면,

한번쯤은 사용해보았을 Cox proportional hazard model 에 대한 이야기입니다.


사실 부끄러운 이야기지만... 많은 의사들은 사실 Cox model 의 적절한 이해가 없이 Cox model 분석 적용합니다.

그에 대한 회의감으로 공부를 시작했었던 기억이 납니다. 


Cox model 분석은 하고싶은 말이 많기 때문에 몇 개의 포스팅으로 나누어질 예정입니다.

그럼 시작해볼까요? ^^


1. Cumulative Distribution Function (CDF)

$ F(t) = Pr (t \leqq T) $ 특정시점에 이르기까지 사망률의 총합


즉,

$ S(t) = 1-F(t) $ 는 특정시점까지 생존확률의 총합을 의미합니다.


2. Probability Density Function (PDF)

위의 CDF 를 미분한 것


즉, 

$\operatorname{d}\!F(t)/\operatorname{d}\!t$ 라면 특정 시점에서 사망확률을 의미하며,

$\operatorname{d}\!S(t)/\operatorname{d}\!t$ 라면 특정 시점에서 생존확률을 의미합니다.


3. Hazrd Function

conditional density 이라고도 불립니다.

어떠한 개인의 생존확률을 구하기 위해서는 그 사람이 $ t $ 라는 시점까지 살아있어야 한다는 조건이 붙습니다.

즉, $ t $ 시점에 살아있는 상태에서 사건 발생이 일어날 가능성을 의미합니다.

이를 수식으로 표현하면, 

$$ h(t) = {\operatorname{d}\!F(t)\over\operatorname{d}\!t} / S(t)  $$

$$=  {\operatorname{d}\!(1-S(t))\over\operatorname{d}\!t} / S(t) $$

$$= -\operatorname{d}\log[S(t)] $$


이 수식은 아래의 3가지를 의미합니다.

위험함수의 값은 0 이상의 값이다.

위험함수는 확률로 표현되므로, 관측이 불가능한 값이다.

위험률은 표본 전체의 특성이 아니라 개인에 대한 특성. 즉, 개개인의 위험함수를 추정가능이다.


4. Cumulative Hazard Function

$$ H(t) = \int_0^t  {\operatorname{d}\!(1-S(t))\over\operatorname{d}\!t}/S(t) dx $$ 

$$ = - \log S(t) $$


시간에 따른 위험률의 증가를 보기 위한 누적위험함수입니다.


일단 위의 개념을 이해를 하셔야...

Cox model 의 아주 기초를 이해하신거라 할 수가 있겠습니다.


다음 포스팅에서 이어집니다...