R_statistics 썸네일형 리스트형 [R프로그래밍] 데이터시각화 with ggplot2::facet, 각각의 facet 에 annotation, text 넣기 늘 포스팅 주제는 바로 R graphics 의 꽃. ggplot2 와 관련된 내용입니다. 그 중에서도 ggplot 에서 자주 쓰는 기능 중의 하나인 facet_grid 혹은 facet_wrap 을 사용하였을 때, 각각의 facet 에 annotation 혹은 text 를 넣는 방법을 알아보겠습니다. sample data 는 iris 를 사용할 예정이며, iris 의 data 의 Sepal.Length 와 Petal.Length 의 correlation 를 Species 로 구분하여 plotting 해보겠습니다. 일단 코드부터 살펴보겠습니다. library(ggplot2) r1 [R프로그래밍] 조건에 맞는 행 개수 세기 R 데이터 프레임에서 조건에 맞는 행의 갯수를 세는 방법입니다. length(which(DF$c > condition)) length(which(is.na(DF$c))) 위의 코드를 보시면 아시겠지만...간단합니다. which 를 통해서 조건에 맞는 녀석들의 위치를 벡터로 뽑아내고, 그 벡터의 개수를 확인하여 조건에 맞는 행이 몇개 있는지를 확인하는 방법입니다. 1번째 줄의 코드처럼 직접 조건을 걸 수도 있고, 2번째 줄의 코드처럼 결측값이 들어간 녀석들을 추려낼 수도 있습니다. 전체 데이터 프레임에서 우리가 원하는 변수값들이 어느 정도의 결측치를 가지고 있는지 확인할때 사용하시면 편합니다. 도움이 되셨다면, '공감' 버튼 부탁드립니다^^ [R프로그래밍] 변수이름 (변수명) 을 이용하여 열 (변수) 제거 R 데이터프레임에서 변수 이름을 이용하여 변수를 제거 하는 방법입니다. 보통 데이터프레임이 크기 때문에 정확히 몇번째 열이 어떠한 변수인지 기억이 잘안나죠. 그럴때 사용하면 좋은 방법입니다. 코딩은 아래와 같습니다. DF [R프로그래밍] 변수이름 소문자로 바꾸기 굉장히 간단한 내용이면서, 처음에 R 을 접할 때 고통을 받는 부분이기도 합니다. 보통 raw data 를 받았을 때 변수 이름이 대소문자가 섞여 있으면... 나중에 변수 처리할때 대소문자 때문에 오류가 나오면 짜증이 날 때가 있죠. 그러한 부분을 예방하고자, 모든 변수를 대문자나, 소문자로 바꿀 수가 있습니다. 아래는 모두 소문자로 바꾸는 방법입니다. colnames(DF) [R프로그래밍] 조건을 만족하는 행 제거 데이터 프레임에서 일정조건을 만족하는 행을 제거 하는 명령어 입니다. df 13df$colum == "male" 이런식으로 말이죠 ! 정말 간단하죠? [생존분석] 중도절단, censoring 의 이해 (1) 생존분석에 대한 더 깊은 공부를 들어가기 전에 우선적으로 이해해야하는 개념이 있습니다. 바로 중도절단입니다.이 개념은 Cox 분석과도 이어지기 때문에 꼭 이해를 하셔야합니다. 우선, 이번 포스팅에서는 중도 절단의 종류에 대하여 알아보겠습니다. 1-1. 제1형 우중도절단 정해진 시간, $ C $ 까지 관측되었을 때 사건이 발생하지 않는 경우를 의미합니다. 즉, 정해진 기간동안 관측되었지만 event 를 경험하지 않는 경우입니다. 모든 대상에 대한 우중도절단시간이 동일합니다. 1-2. 제2형 우중도절단 미리 결정해놓은 사건발생률에 도달되었을 때, 관측을 중단하는 경우입니다. 예를 들어 30% 발생률을 정해놓고, 전체 대상에서 30% 에서 event 가 발생하면 관측을 중단하는 경우입니다. 1-3. 임의 우중.. [R프로그래밍] 특정열의 이름 (변수 이름) 변경, column name R 에서 데이터처리를 하다보면, 가끔 특정열의 변수이름을 바꾸고 싶을 때가 있습니다.이때 R 에서는 직관적으로 특정열의 변수이름 (특정열의 이름) 을 바꿀 수 있는 옵션이 없습니다. 아래의 코드는 'sample' 이라는 데이터프레임안에 'city' 라는 이름을 가지고 있는 변수의 이름을 'C_NAME' 으로 변경하는 코드입니다.혹시, 전처리 과정에서 놓쳐버려서 R 안에서 변수이름을 변경하고 싶으시다면 아래의 코드를 응용하시면 됩니다. names(sample)[names(sample) == "city"] [생존분석] Cox proportional hazard model, Cox 비례가정위험모형 (1) 의학논문을 쓰는 분들이라면,한번쯤은 사용해보았을 Cox proportional hazard model 에 대한 이야기입니다. 사실 부끄러운 이야기지만... 많은 의사들은 사실 Cox model 의 적절한 이해가 없이 Cox model 분석 적용합니다.그에 대한 회의감으로 공부를 시작했었던 기억이 납니다. Cox model 분석은 하고싶은 말이 많기 때문에 몇 개의 포스팅으로 나누어질 예정입니다.그럼 시작해볼까요? ^^ 1. Cumulative Distribution Function (CDF)$ F(t) = Pr (t \leqq T) $ 특정시점에 이르기까지 사망률의 총합 즉,$ S(t) = 1-F(t) $ 는 특정시점까지 생존확률의 총합을 의미합니다. 2. Probability Density Functi.. 이전 1 2 3 4 5 6 다음