본문 바로가기

[SQL문법] Case 조건문, when then else end # CASE 조건문의 구조 CASE WHEN 조건문 THEN 반환값 ELSE 위의 조건이 아닐때 반환값 END 위와 같은 구조를 보입니다. 아래의 ifelse 구문 (R 등에서 쓰이는) 과 비슷하네요. ifelse (조건문, 참일 때 반환값, 거짓일 때 반환값) # 중복 조건문 R 에서도 중복 조건을 걸어줄 수 있는 것처럼... (아래 코드) ifelse (A > 60, ifelse (B
[R프로그래밍] 데이터시각화 with ggplot2:: annotate 에서 bold 체 사용하기 ggplot 으로 figure 를 그리다보면 그래프 안에 text 를 집어넣을 때가 종종 있습니다. 이럴때 figure 1의 A , B 등으로 구분을 해줘야할 때가 대표적인 예인데요... 이러한 경우에는 text를 bold 로 넣어주면 가독성이 좋아지겠죠? 그래서 오늘 포스팅할 내용은 ggplot::annotate 로 bold 체 글씨를 쓰는 방법입니다. ggplot (df, aes(...))+ annotate("text", ~~~~ , fontface=2) 위의 2번째 코드에서 fontface 보이시죠? 이 값을 2로 지정해주면 bold 체로 지정되게 됩니다. 참 쉽죠 ? * 이 포스팅이 도움이 되셨다면 '공감' 버튼 부탁드립니다.
R 에서 SQL 사용하기 SQL section 에 첫 포스팅을 남기고 약 8개월만에 다시 돌아왔네요. 당시 건드리던 데이터가 너무 방대하기도 하고, 처리하는데 엄두가 안나서 덮어두다가... 뜻이 맞는 동료와 함께 다시 작업을 시작하기로 하였습니다. 그래서 기억에서 지워져버린 SQL 관련된 내용의 포스팅을 시작할까 합니다. 글머리로 내용을 조금 구분하고자 합니다. [SQL문법] 은 기본적인 SQL 문법관련 내용으로 작성할 예정이며, [SQLDF] 는 R 패키지에서 이름을 따와서, R 에서 실제 사용하는 내용 관련 포스팅으로 만들어볼 예정입니다. 결국 아마도 [SQL문법] 으로 대부분 포스팅 되지 않을까 싶긴합니다^^ 다음주부터 포스팅이 시작합니다^^
[통계] 생존분석:: Stratified Cox proportional hazard model, 층화Cox 비례가정위험모형 제가 관심있는 주제 위주로 포스팅을 하다보니, 내용이 너무 파편화가 되어버리는 듯합니다만... 요새 일이 너무 많다보니 차분하게 정리하기가 어렵습니다. 이해부탁드립니다 ! 오늘의 내용은 간단하지만 꼭 짚고넘어가야할 내용입니다. 바로 생존분석에서 비례위험가정모형이 위반되었을때 많이들 사용하는 층화 Cox (stratified Cox) 관련된 내용입니다. Startified cox 에서는 층화변수 (strata variable) 과 관심변수 (independent variable) 의 interaction term 을 확인을 해줘야합니다. 즉, p > 0.005 에 적합한지 확인을 해줘야하는데요. 만일 interaction 이 유의하게 나온다면, 그렇지 않으면 교호작용 (interaction) 으로 인하여 ..
[R마크다운] knitr:: code 만 남기고 실행시키지 않기 R markdown 으로 문서를 남기다 보면... data preparation 관련된 내용을 남기긴 해야하겠는데... markdown 문서를 수정할때마다 매번 반복실행시키기는 너무나 시간이 아깝죠. 그런 경우에 code만 남기고 실제 실행은 시키지 않는 방법이 있습니다. 바로 chunk option 에서 eval = F 포함시켜주면 됩니다. 아래와 같이 말이죠. ```{r eval=F} code 내용입력 ``` 엄청 간단하죠 ? 추가로 코드를 숨기시려면, echo=F 를 option 으로 넣어주시면 됩니다. ** 도움이 되셨다면, '공감 & 댓글' 부탁드립니다^^
[R프로그래밍] 데이터시각화 with ggplot2:: 그래프 예쁘게 그리기, 경계선 지우기 오늘 포스팅은 간단하면서도 상당히 유용한 포스팅입니다. figure 작성을 할때 보통 예쁘다는 figure 들은 x축과 y축은 조금 두껍게 표시되고, 나머지 line 은 제거해버리는 경우가 많죠. 개인적으로는 NEJM 에 실리는 figure 들이 예쁜 녀석들이 많다고 생각하는데 그녀석들처럼 ggplot 에서 그렇게 margin 과 grid 를 제거해버리는 코드는 다음과 같습니다. 참 쉽죠? library(ggplot2) ggplot(aes(...))+ theme_bw()+ theme(axis.line = element_line(size=1), axis.ticks = element_line(size=1), panel.border = element_blank(), panel.grid.major = eleme..
[통계] 가우스 마코프 정리, Gauss-Markov Theorem 의 정의와 의미 일이 바쁘다보니 포스팅 하기가 상대적으로 간단한 기초 통계를 주로 포스팅 하게 되네요. 오늘의 주제는 통계를 조금이라도 공부를 해보았다면 누구나 들어보았을 가우스 마코프 정리 (Gauss-Markov Theorem) 입니다. 혹시라도 의학통계를 돌리면서도 이 용어를 처음 듣는다면 정말 반성의 시간을 갖도록 합시다. 제 블로그 특성상, 증명 과정을 궁금해하시는 분은 많지 않을 것으로 생각을 하여서 이게 어떤 정리인지.. 또 무슨 의미를 갖는지에 대하여 간단히 적어보겠습니다. 우선, 이 정리의 요점을 말해보자면 ' (어떠한 조건을 만족하는 상황에서는) 최소제곱 추정량이 가장 좋은 비편향(불편) 추정량이다.' 로 정리 할 수 있습니다. 가장 좋은 비편향(불편) 추정량은 영어로 BLUE (Best Linear ..
[통계] 회귀 (regression) 분석에서 설명변수의 고정 미루고 미루었던 .... 너무나 오랜만에 돌아온 기초 통계 포스팅이네요 ㅎㅎ 반성하겠습니다. https://bpapa.tistory.com/49 [통계] 회귀 (regression) 분석에서 비편향 (불편, unbiased) 의 의미와 증명 바쁘다는 핑계로 너무 오랜만의 포스팅이 되었네요. 이번 포스팅의 주제는 바로 회귀분석의 가장 기초적인 부분이라고 할 수 있는 내용입니다. 바로 비편향 혹은 불편. 영어로는 unbiased 라고 하죠. 여기서 비편.. bpapa.tistory.com 오늘은 지난번 포스팅 (비편향, unbiased) 의 말미에 다루었던 내용을 포스팅해보겠습니다. 회귀분석의 기본 가정 중에 하나이죠. '설명변수를 고정한다.' 이 말의 뜻은 표본추출을 할때, $x_1$, $x_2$, $x_..