본문 바로가기

R_statistics/Rs_basic

[생존분석] 중도절단, censoring 의 이해 (1)

생존분석에 대한 더 깊은 공부를 들어가기 전에 우선적으로 이해해야하는 개념이 있습니다. 

바로 중도절단입니다.이 개념은 Cox 분석과도 이어지기 때문에 꼭 이해를 하셔야합니다.


우선, 이번 포스팅에서는 중도 절단의 종류에 대하여 알아보겠습니다. 


 1-1. 제1형 우중도절단

   정해진 시간, $ C $ 까지 관측되었을 때 사건이 발생하지 않는 경우를 의미합니다.

   즉, 정해진 기간동안 관측되었지만 event 를 경험하지 않는 경우입니다.

   모든 대상에 대한 우중도절단시간이 동일합니다.



 1-2. 제2형 우중도절단

   미리 결정해놓은 사건발생률에 도달되었을 때, 관측을 중단하는 경우입니다.

   예를 들어 30% 발생률을 정해놓고, 전체 대상에서 30% 에서 event 가 발생하면 관측을 중단하는 경우입니다. 



 1-3. 임의 우중도절단

   의학 논문에서 가장 문제가 되는 부분 중 하나로, 연구가 종료되기 전에 임의로 환자가 drop 되어버리는 경우가 해당됩니다.

   생존데이터에 대한 랜덤표본을 가정  $ { (T_{i}, \delta_{i}), i = 1,2,3 ... n } $ 하였을 때, 

   중도절단된 대상에 대한 관측중단시점을 $ C_{i} $ 로 표기하겠습니다.


   위의 가정에서 모든 개체는 $ C_{i} $ 까지는 관측이 되게됩니다. 

   중도절단시점 이전에 사건이 발생하면 사건이 발생한 시점은 $ T_{i} $ 로 정의됩니다.

   중도절단시점 이후에 사건이 발생하게 되면 $ T_{i} = C_{i} $ 입니다.


   이를 요약해서 수식으로 표현하면, 

  $ T_{i} = min (\tilde{T}_{i}, C_{i}) $,        $ \delta_{i} = \mathit{I} (\tilde{H}_{i} < C_{i}) $

  $T_{i} =\begin{cases} \tilde{T}_{i}, & \tilde{T}_{i} < C_{i}, &  \delta_{i} = 1,\mbox{uncensored} \\ C_{i}, & \tilde{T}_{i} \geqslant C_{i}, & \delta_{i} = 0, \mbox{censored} \end{cases} $

  로 요약할 수 있습니다.



 1-4. 구간 중도절단

   임상시험에서 주기적인 방문시간을 정해놓고, 검사를 할때 발생하게 되는 경우에 해당합니다.

   환자의 사건 발생 시간은 $ (L_{i}, R_{t}], i < t $ 에 포함되게 됩니다. 

  


 1-5. 좌중도절단

   연구 시작이전에 event 가 발생하는 경우입니다.