본문 바로가기

분류 전체보기

[R프로그래밍] 변수이름을 이용하여 여러열의 변수 종류 class 변경하기 R 로 데이터 프레임을 다루다보면대부분 class 가 잘 맞춰져 있는데 몇몇 변수들만 class 가 맞지 않는 경우가 있습니다. 이러한 경우.즉, 변수이름만을 아는 상태에서 쉽게 그 변수들의 class 를 변경하는 방법을 알아보겠습니다. DF 라는 데이터프레임안에서 A, B, C, D 라는 이름을 갖는 변수 (열) 의 class 를 numeric 으로 변경을 해보도록 하겠습니다.코드는 아래와 같습니다. cname
[R프로그래밍] 데이터시각화 with ggplot2::facet, 각각의 facet 에 annotation, text 넣기 늘 포스팅 주제는 바로 R graphics 의 꽃. ggplot2 와 관련된 내용입니다. 그 중에서도 ggplot 에서 자주 쓰는 기능 중의 하나인 facet_grid 혹은 facet_wrap 을 사용하였을 때, 각각의 facet 에 annotation 혹은 text 를 넣는 방법을 알아보겠습니다. sample data 는 iris 를 사용할 예정이며, iris 의 data 의 Sepal.Length 와 Petal.Length 의 correlation 를 Species 로 구분하여 plotting 해보겠습니다. 일단 코드부터 살펴보겠습니다. library(ggplot2) r1
[R프로그래밍] 조건에 맞는 행 개수 세기 R 데이터 프레임에서 조건에 맞는 행의 갯수를 세는 방법입니다. length(which(DF$c > condition)) length(which(is.na(DF$c))) 위의 코드를 보시면 아시겠지만...간단합니다. which 를 통해서 조건에 맞는 녀석들의 위치를 벡터로 뽑아내고, 그 벡터의 개수를 확인하여 조건에 맞는 행이 몇개 있는지를 확인하는 방법입니다. 1번째 줄의 코드처럼 직접 조건을 걸 수도 있고, 2번째 줄의 코드처럼 결측값이 들어간 녀석들을 추려낼 수도 있습니다. 전체 데이터 프레임에서 우리가 원하는 변수값들이 어느 정도의 결측치를 가지고 있는지 확인할때 사용하시면 편합니다. 도움이 되셨다면, '공감' 버튼 부탁드립니다^^
[R프로그래밍] 변수이름 (변수명) 을 이용하여 열 (변수) 제거 R 데이터프레임에서 변수 이름을 이용하여 변수를 제거 하는 방법입니다. 보통 데이터프레임이 크기 때문에 정확히 몇번째 열이 어떠한 변수인지 기억이 잘안나죠. 그럴때 사용하면 좋은 방법입니다. 코딩은 아래와 같습니다. DF
[R프로그래밍] 변수이름 소문자로 바꾸기 굉장히 간단한 내용이면서, 처음에 R 을 접할 때 고통을 받는 부분이기도 합니다. 보통 raw data 를 받았을 때 변수 이름이 대소문자가 섞여 있으면... 나중에 변수 처리할때 대소문자 때문에 오류가 나오면 짜증이 날 때가 있죠. 그러한 부분을 예방하고자, 모든 변수를 대문자나, 소문자로 바꿀 수가 있습니다. 아래는 모두 소문자로 바꾸는 방법입니다. colnames(DF)
PostgreSQL 와 R 연동하기 오늘 포스팅할 내용은 R 과 PostgreSQL 을 연동하는 방법입니다. postgreSQL 은 오라클사의 SQL, MS-SQL 등 SQL 의 여러가지 종류 중 하나라고 생각하시면 됩니다. 여타 SQL 들과 마찬가지로 Database 에 접근 및 관리 하기 위한 수단을 제공합니다. Database 관리프로그램인 postgresSQL 을 R 과 연동할 수 있는 방법은 다음과 같습니다. library(sqldf) library(RPostgreSQL) drv
[R프로그래밍] 조건을 만족하는 행 제거 데이터 프레임에서 일정조건을 만족하는 행을 제거 하는 명령어 입니다. df 13df$colum == "male" 이런식으로 말이죠 ! 정말 간단하죠?
정말 인생은 모르겠다... 심각하게 배워야할 것들이 늘어나는 중이네요.어쩌면 이 모든게 나비효과일지도 모르겠다는 생각이 드는 요즘입니다. 이 모든 것의 시작은, 바로 아래 그림같은Restricted Cubic Spline (RCS) curve 였습니다. 이 그래프는 직관적이며, 매우 예쁩니다.Hazard Ratio 를 표현하는 방법을 Forest plot 이외에는 잘 몰랐던 저에게 RCS curve 는 너무나 충격이었습니다. 저 그래프를 그릴 수 있는 방법을 찾던 중...R 이라는 오픈소스 프로그램을 알게 되고,저와 R 의 만남은 시작되었습니다. 그렇게 시작된 R 을 통해서 RCS curve 를 공부하던 중, R 에서는 Propensity Score Matching (PSM) 을 SPSS 보다 쉽게 구현할 수 있다는 사실을 알게 ..