R 에서 Text 를 처리하는 간단한 코드입니다.
일단 이 정도는 하셔야 더 복잡한 처리가 가능해지니...
이런게 있다는 것은 머리속에 두셔야 나중에 필요할 때 찾아볼 수 있겠죠?^^
stringr package::str_sub(df$col, start, end)
stringr 패키지의 str_sub 은 우리가 지정한 범위의 글자만 남기고 나머지는 날리는 명령어입니다.
덧붙여서, 음수를 넣으면 뒤에서부터 글자를 자릅니다.
reshape2::colsplit(df$col, split="character", names=c("newvar1", "newvar2")
reshape2 의 colsplit 명령어는 특정단어 (알파벳) 을 기준으로 변수를 나누는 명령어 입니다.
예를 들어 "visit_1", "visit_2", "visit_3" 등등의 단어가 있을 때,
위의 명령어의 character 에 "_" 이걸 넣으면 visit 과 숫자로 구분되게 됩니다.
주로 우리가 long-form data 에서 follow-up 시점으로 구분할때 사용하게 됩니다.
'R_statistics > Rs_preparation' 카테고리의 다른 글
[R프로그래밍] 4분위 그룹 만들기, quartile grouping (0) | 2019.03.18 |
---|---|
[R프로그래밍] factor, 범주형 변수들의 level 설정하기 (0) | 2019.02.27 |
[R프로그래밍] 변수이름을 이용하여 여러열의 변수 종류 class 변경하기 (0) | 2019.02.18 |
[R프로그래밍] 조건에 맞는 행 개수 세기 (0) | 2019.02.15 |
[R프로그래밍] 변수이름 (변수명) 을 이용하여 열 (변수) 제거 (0) | 2019.02.12 |