본문 바로가기
반응형

R Programming34

[R] Cox 분석을 위한 생존 시간 데이터 생성 (시뮬레이션 코드) 본 게시글을 Cox PH 모형 분석을 위한 특정 분포를 따르는 Survival Time 데이터를 생성하는 방법에 대한 내용이다. 참고에 Stackoveflow와 해당 게시글에서 언급된 Bender et al. (2005)를 참고하여 작성하였다. 데이터 생성하는 법 정규분포, 이항분포, 포아송분포 등의 분포를 따르는 시뮬레이션 데이터는 R의 기본 내장함수를 통해 쉽게 사용할 수 있다. 하지만 어떠한 Cox 모형의 확장된 분석방법이 시뮬레이션 데이터에서 잘 작동하는지 확인하고자 할 때, Cox 모형은 관찰된 생존 시간에 대한 어떠한 가정을 하는 것이 아닌, Hazard Function에 대한 가정을 하고 있기 때문에 어떻게 생성할지 막막해진다. 2005년도에 Stat Med에서 Cox 모형을 위한 생존시간 .. 2023. 12. 22.
[R] Error invalid graphics state 이 전 게시글에서 소개한 plot을 자동으로 저장하는 옵션을 사용하다 보면, 위와 같은 에러가 발생할 때가 있다. 이 전까지만 해도 잘 그려지던 그래프가 어떠한 코드 수정도 없었는데 갑자기 그려지지 않기 때문에 많이 당황스럽다. Error 메시지 나의 경우엔 ggplot을 특정 객체 g에 저장하였고, 다시 g를 출력하려고 했을 때 다음과 같은 에러 메시지를 확인할 수 있었다. Error in .Call.graphics(C_palette2, .Call(C_palette2, NULL)) : invalid graphics state 해결방법 1. dev.off() 현재 그래프를 옆에 출력하는 것이 아닌, 특정 이름으로 저장되는 코드(ggsave, png 같은..)가 실행되고 있었기 때문에, 그동안은 객체에도 .. 2023. 12. 20.
[R] ggplot 색 변경 color & palette 설정 ggplot으로 그래프를 그릴 때, 특정 요인에 따라 같은 색을 지정해 줄 수 있다. 물론, ggplot 기본 그래프의 색상도 예쁜 편이지만, 더 다양한 색을 지정하고 꾸밀 수도 있다. 본 게시글은 ggplot에서 색상을 설정하는 함수에 대해 먼저 소개하고, 그다음에 산점도(point)와 막대그래프(bar)를 예시로 하여 상세 예시를 나타내고자 한다. 0. 준비 두 함수는 각각 colour와 fill로 설정된 값에 대한 색상을 변경하는 기능을 제공한다. 색상을 변경하기 위해서 palette 옵션을 사용할 수 있다. scale_colour_brewer() scale_fill_brewer() palette 설정은 직접 원하는 색삭을 설정할 수도 있으며, RColorBrewer 패키지에 내장된 색상을 사용할 .. 2023. 12. 10.
[R] ggplot legend 범례 설정 (제목, 위치, 글씨) R 프로그램으로 데이터를 시각화할 때, ggplot을 많이 사용한다. 이때 범례 (legend) 설정은 그래프의 이해를 돕는데 필수적인 요소이기 때문에, 내가 원하는 대로 설정할 수 있어야 한다. 특히, 지면(paper)을 아끼는 것이 상당히 중요한 순간도 있기 때문에, 범례를 간단하고 효과적으로 표현해야 하는데, 항상 기본 옵션만을 고집할 순 없다. 본 게시글은 R의 ggplot2 패키지를 사용한 그래프의 범례 수정하는 방법에 대해 쉬운 예제와 함께 간략히 소개한다. 예시로 사용하고자 하는 데이터와 그래프는 다음과 같다. head(mtcars[, c("mpg", "wt", "gear", "carb")]) theme_set(theme_bw()) gg 2023.11.02 - [R Programming/시각.. 2023. 12. 10.
[R] 부트스트랩 신뢰 구간 (Bootstrap Confidence Intervals) 계산 전통적인 통계 검정은 주어진 데이터가 특정 분포를 독립적으로 따른다는 가정에서 시작된다. 하지만, 해당 가정이 어려운 경우는 항상 존재하며, Standard Error를 직접적으로 계산할 수 없는 상황이 존재한다. (예를 들어, EM 알고리즘은 Standard Error를 제공하지 않는다.) 이러한 상황에서 우리는 주어진 데이터를 사용하여, 부트스트랩 (Bootstrap) 방법을 통해 Standard Error를 추론하고, 신뢰 구간을 계산할 수 있다. 일반적으로 주어진 데이터를 Population이라고 생각하고, 직접 1,000번 반복하여 주어진 데이터에서 해당 데이터 크기만큼의 무작위 복원 추출을 진행한다. 1,000개의 데이터에서 얻어진 추정량의 분포를 사용하여, 경험적으로 Standard Erro.. 2023. 11. 27.
반응형