myimpute <- function(x) {
for (i in 2:ncol(x)) {
if ( sum(is.na(x[,i])) > 0 ){
x[,i] <- impute(x[,i], fun=median)
}
else {x[,i] <- x[,i]
}
}
return (x)
}
myimpute(data)
print(data)
오랜만에 만들어본 사용자 지정함수.
데이터프레임의 결측값을 각각의 변수별 median 값으로 대체하여 준다.
물론 median 값을 계산할 수 있도록 모든변수를 numeric 으로 변경해줘야한다.
categorical 변수가 섞여있다면, 어떻게 처리할지 고민해야함.
'R_statistics > Rs_preparation' 카테고리의 다른 글
[R프로그래밍] 데이터전처리:: log-transformation in R (R에서 로그 변환) (0) | 2019.12.25 |
---|---|
[R프로그래밍] 데이터전처리:: R 에서 package 불러올때 tip (0) | 2019.12.12 |
[R프로그래밍] 데이터전처리 unique:: 중복값처리 (0) | 2019.11.12 |
[R프로그래밍] 데이터전처리 intersect:: 벡터에서 중복되는 값 찾기 (0) | 2019.11.06 |
[R프로그래밍] 데이터전처리 stringr:: 문자, 텍스트, str_split, 변수 이름 나누기, (1) | 2019.03.22 |