본문 바로가기

R_statistics/Rs_graphics

[R프로그래밍] 데이터시각화 with ggplot2:: geom_histogram, 히스토그램 in R

이리저리 논문작업에 치어살다보니... 포스팅 할 시간은 점점 줄어드네요.

최근엔  manuscript 작성에 신경을 쓰다보니 사실 R graphics 쪽은 거의 손을 놓고 있었습니다.

덕분에 간단하게 하던 작업들도 기억이 안나서 reference 들을 찾아보게 되네요.

 

그래서 오늘 포스팅 내용은 아주 간단하지만 데이터 분포를 확인하는데 아주 유용한,

히스토그램, histogram 을 ggplot2 를 이용하여 작성하는 방법을 알아보겠습니다. 

ggplot2(dataframe, aes(x= ooo ))+
	geom_histogram()

위의 coding 이 가장 기본적인 coding 입니다.

ggplot2 에서 dataframe 을 지정하여 주고, aes 를 이용하여 x 축을 원하는 변수로 mapping 시켜 줍니다.

그리고 geom_histogram() 을 입력하면 끝.

 

여기에 추가적으로 density plot 을 추가하고 싶다면, 아래에 한줄만 더 작성하여 주시면 됩니다. 

ggplot2(dataframe, aes(x= ooo ))+
	geom_histogram()+
	geom_density()

굉장히 쉽죠 ? geom_density() 이 한줄이면 끝입니다.

 

여기서 한발 더 나아가보면...

하나의 plot 에서 group 별로 histogram 과 density plot 을 함께 그린 후,

그룹별 mean 혹은 median 값을 표시해줄 수도 있습니다. 

아마 이 작업이 익숙하지 않으신 분들은 mean 혹은 median 값을 표시하실 때

'Aesthetics Error' 를 경험하셨을 가능성이 높을 것이라 생각됩니다.  

 

간단히 해결할 수 있는 방법이 있는데요.

이 부분은 시간이 된다면 나중에 다시 포스팅 해드리도록 하겠습니다. 

 

도움이 되셨다면, '공감버튼 부탁드립니다^^