대규모 데이터들을 처리 하다보면, 여러개의 데이터프레임들을 병합해야하는 경우가 많습니다.
특히나, 의학쪽에서는 혈액검사 관련된 부분들의 항목들의 이름들이 겹치는 부분이 있다보니,
각각의 데이터프레임들을 병합하다보면 중복되는 값들이 생겨버리는 경우가 있습니다.
이럴 경우 변수명들이 겹치는지 확인하기 위해 사용하는 방법이 있습니다.
바로 basic::intersect 함수입니다.
우선 변수명들을 unique 함수로 각각의 함수에서 추출하고,
각각을 독립된 벡터로 지정을 해줍니다.
예를 들어, a 와 b 벡터로 지정을 해주었다면,
intersect(a,b)
이렇게 해주시면 중복된 값을 바로 찾아줍니다.
그러면 그 항목만 review 를 해주시면 되겠죠?
* 도움이 되셨다면, '공감' 버튼 부탁드립니다^^
'R_statistics > Rs_preparation' 카테고리의 다른 글
[R프로그래밍] 데이터전처리:: R 에서 package 불러올때 tip (0) | 2019.12.12 |
---|---|
[R프로그래밍] 데이터전처리 unique:: 중복값처리 (0) | 2019.11.12 |
[R프로그래밍] 데이터전처리 stringr:: 문자, 텍스트, str_split, 변수 이름 나누기, (1) | 2019.03.22 |
[R프로그래밍] 4분위 그룹 만들기, quartile grouping (0) | 2019.03.18 |
[R프로그래밍] factor, 범주형 변수들의 level 설정하기 (0) | 2019.02.27 |