본문 바로가기

R_statistics/Rs_basic

[통계] 데이터 분석 시 로그 변환, log transformation 이 꼭 필요할까 ?

통계 공부를 하다보면 어느 순간 드는 의문 중의 하나입니다. 

논문을 읽다보면 데이터 전처리 관련하여 '변수가 정규분포를 하지 않아서 log-transformation (로그변환) 을 했다.' 
는 구절을 종종 찾아볼 수가 있습니다. 

저도 공부하다가 궁금해서 몇번 찾아본 적이 있었습니다만, 
명쾌한 답은 얻지 못하였었습니다. 

아직까지도 정확한 답은 찾지 못하였지만...
회귀를 포함한 여러가지 통계에 대한 공부를 하다보니까, 
지금까지의 제 지식으로는 특별한 경우를 제외하고는 굳이 할 필요가 없다고 느껴집니다. 

여러 articles 도 있지만, 그중 citation 도 좀 많이 되어 있는 흥미로운 논문이 있어서 소개해드리고자 합니다.
시간이 없으시다면, summary 부분만 읽어보셔도 충분할 것 같습니다.

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4120293/

 

Log-transformation and its implications for data analysis

The log-transformation is widely used in biomedical and psychosocial research to deal with skewed data. This paper highlights serious problems in this classic approach for dealing with skewed data. Despite the common belief that the log transformation ...

www.ncbi.nlm.nih.gov

즐거운 통계 분석시간 되시길 바랍니다.