본문 바로가기

R_knitr

[R마크다운] knitnr:: reproducible research, 재현가능한 연구 with R studio (데이터연동형문서, dynamic document)

재현가능한 연구란 무엇일까요?

아주 간단하게 설명하면, 연구의 결과물을 오픈소스로 공개하여 누구라도 검증을 할 수 있도록 하는 것입니다.


이를 위한 조건이 있다면, 바로 데이터 연동형 문서 (dynamic document) 입니다. 


구체적으로 적어보자면, 

1. 공개한 자료에는 설명문, 코딩, 데이터가 모두 포함되어야 합니다.

2. 코딩과 데이터포맷은 무료 소프트웨어를 권장합니다. (비용문제)

3. 다른 사람이 코드를 실행하였을 때, 

   기존의 저자가 작성한대로 동일하게 작동되며, 배포한 문서의 내용과 동일한 결과를 확인할 수 있어야 합니다.

4. 데이터는 사용된 데이터 전체가 모두 제공되어야 합니다.


결국, 문서안에 데이터와 분석 방식에 대한 정보 (코드) 와 결과물이 포함되어 누구라도 검증을 할 수 있도록 하는 것이 목표입니다.

이러한 개념이 나온 것은, 기존의 논문들 중에서 재현이 되지 않는 결과물들이 생각보다 많았기 때문입니다.


Rstudio 와 Knitr 을 사용하면 재현가능한연구 (reproducible research) 혹은 데이터 연동형 문서 (dynamic document ) 를 

쉽게 만들어낼 수가 있습니다.

물론 문법을 익히는데 조금의 시간은 걸리지만 말이죠!


사실 논문 작성을 위해서 R 과 knitr만을 사용하기는 어렵습니다.

왜냐하면 endnote 도 써야하고, 여러가지로 불편한 점이 많죠.


하지만, 데이터 연동형 문서를 만들어놓는다면, raw data 의 변화가 생겼을 때 쉽게 수정할 수가 있으며,

사람의 실수로 인한 오류를 최대한 줄일 수 있습니다.

또, 오래전에 분석하거나 작성한 자료에 대한 검토도 쉽게 할 수 있는 장점도 있죠.


이 section 에서는 R 과 knitr 를 이용하며, 

데이터 연동형 문서를 만드는 방법에 대하여 차근차근 정리해보도록 하겠습니다.^^