본문 바로가기

R_statistics/Rs_preparation

[자동화함수] imputation 함수

myimpute <- function(x) {
for (i in 2:ncol(x)) {
  if ( sum(is.na(x[,i])) > 0 ){
    x[,i] <- impute(x[,i], fun=median)
  }
  else {x[,i] <- x[,i]
  }
 }
  return (x)
}

myimpute(data)
print(data)

오랜만에 만들어본 사용자 지정함수.

데이터프레임의 결측값을 각각의 변수별 median 값으로 대체하여 준다.

물론 median 값을 계산할 수 있도록 모든변수를 numeric 으로 변경해줘야한다. 

categorical 변수가 섞여있다면, 어떻게 처리할지 고민해야함.