통계 공부를 하다보면 어느 순간 드는 의문 중의 하나입니다.
논문을 읽다보면 데이터 전처리 관련하여 '변수가 정규분포를 하지 않아서 log-transformation (로그변환) 을 했다.'
는 구절을 종종 찾아볼 수가 있습니다.
저도 공부하다가 궁금해서 몇번 찾아본 적이 있었습니다만,
명쾌한 답은 얻지 못하였었습니다.
아직까지도 정확한 답은 찾지 못하였지만...
회귀를 포함한 여러가지 통계에 대한 공부를 하다보니까,
지금까지의 제 지식으로는 특별한 경우를 제외하고는 굳이 할 필요가 없다고 느껴집니다.
여러 articles 도 있지만, 그중 citation 도 좀 많이 되어 있는 흥미로운 논문이 있어서 소개해드리고자 합니다.
시간이 없으시다면, summary 부분만 읽어보셔도 충분할 것 같습니다.
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4120293/
Log-transformation and its implications for data analysis
The log-transformation is widely used in biomedical and psychosocial research to deal with skewed data. This paper highlights serious problems in this classic approach for dealing with skewed data. Despite the common belief that the log transformation ...
www.ncbi.nlm.nih.gov
즐거운 통계 분석시간 되시길 바랍니다.
'R_statistics > Rs_basic' 카테고리의 다른 글
[R프로그래밍] 데이터전처리:: multiple imputation 에 대하여 (1) | 2020.03.28 |
---|---|
[통계] 결측값의 종류와 처리 방법 (0) | 2019.12.05 |
[통계] 생존분석:: Stratified Cox proportional hazard model, 층화Cox 비례가정위험모형 (0) | 2019.09.30 |
[통계] 가우스 마코프 정리, Gauss-Markov Theorem 의 정의와 의미 (0) | 2019.09.19 |
[통계] 회귀 (regression) 분석에서 설명변수의 고정 (0) | 2019.09.18 |