본문 바로가기

R_statistics/Rs_basic

[통계] 제곱합, SST, SSE, SSR, 최소제곱법 지난번 포스팅, 잔차와 오차 (Residual and Error) 와 이어지는 내용으로, 최소제곱법 (최소자승법) 과도 연관이 되는 부분이고, 잘 알아두시면 좋은 내용입니다. https://bpapa.tistory.com/8 혹시 오차와 잔차의 내용이 잘 기억이 안나거나 헷갈린다면, 위의 포스팅을 한번 읽어보시는 게 도움이 되십니다. # SST, total sum of squares $ SST = \sum_{i=1}^{n} (y_{i} - \bar{y})^2 $ 위의 공식에서 알 수 있듯이, SST는 종속변수의 관측값( $yi$) 과 표본의 평균 ($\bar{y}$) 의 차이 (편차) 를 제곱하여 합한 값입니다. # SSE, explained sum of squareds $ SST = \sum_{i=1}..
[생존분석] 중도절단, censoring 의 이해 (1) 생존분석에 대한 더 깊은 공부를 들어가기 전에 우선적으로 이해해야하는 개념이 있습니다. 바로 중도절단입니다.이 개념은 Cox 분석과도 이어지기 때문에 꼭 이해를 하셔야합니다. 우선, 이번 포스팅에서는 중도 절단의 종류에 대하여 알아보겠습니다. 1-1. 제1형 우중도절단 정해진 시간, $ C $ 까지 관측되었을 때 사건이 발생하지 않는 경우를 의미합니다. 즉, 정해진 기간동안 관측되었지만 event 를 경험하지 않는 경우입니다. 모든 대상에 대한 우중도절단시간이 동일합니다. 1-2. 제2형 우중도절단 미리 결정해놓은 사건발생률에 도달되었을 때, 관측을 중단하는 경우입니다. 예를 들어 30% 발생률을 정해놓고, 전체 대상에서 30% 에서 event 가 발생하면 관측을 중단하는 경우입니다. 1-3. 임의 우중..
[생존분석] Cox proportional hazard model, Cox 비례가정위험모형 (1) 의학논문을 쓰는 분들이라면,한번쯤은 사용해보았을 Cox proportional hazard model 에 대한 이야기입니다. 사실 부끄러운 이야기지만... 많은 의사들은 사실 Cox model 의 적절한 이해가 없이 Cox model 분석 적용합니다.그에 대한 회의감으로 공부를 시작했었던 기억이 납니다. Cox model 분석은 하고싶은 말이 많기 때문에 몇 개의 포스팅으로 나누어질 예정입니다.그럼 시작해볼까요? ^^ 1. Cumulative Distribution Function (CDF)$ F(t) = Pr (t \leqq T) $ 특정시점에 이르기까지 사망률의 총합 즉,$ S(t) = 1-F(t) $ 는 특정시점까지 생존확률의 총합을 의미합니다. 2. Probability Density Functi..
Residual, 잔차 와 Error, 오차 의 차이 Residual, 잔차 와 Error, 오차 처음에 많이들 헷갈려 하는 개념이죠. 저도 처음에 공부할 때 대충 넘기고, 정확하게 개념을 안잡고 공부하다가... 나중에서야 개념을 잡았던 기억이 있네요. 회귀식을 바탕으로 설명을 해보겠습니다. 회귀식은 대표성을 의미합니다. 즉 모집단을 대표하는 어떠한 직선을 의미하는 것인데... 저희가 모집단을 가지고 있는 경우는 거의 없죠. 그렇기에 모집단을 대표할 수 있는 표본집단을 이용하여, 모집단의 회귀식을 추론하게 됩니다. 여기서 오차와 잔차의 개념이 나옵니다. 즉, 오차 = 모집단의 회귀식에서 예측된 값 - 실제 관측값 잔차 = 표본집단의 회귀식에서 예측된 값 - 실제 관측값 이렇게 이해하시면 됩니다. 여기서 개념을 조금더 확장을 하면, SST = SSR + SS..
Quantile, 분위수 와 Quartile, 4분위수 의 차이 Quantile 이란 random variable X의 분포를 확률적으로 균등하게 (n개로) 자른 개념입니다.* k-th, n-quantile이란 표현은?X의 분포를 확률적으로 n개의 균등한 조각으로 잘랐을때 앞에서부터 k번째 조각까지의 위치를 말하는 것입니다. 즉, 2 quantile = median 4 quantile = quartile에 해당합니다. 처음에는 헷갈릴 수 있는 내용입니다. 저도 한동안은 구분을 잘 못했던 기억이 있네요^^;