본문 바로가기
반응형

R Programming27

Rdata 확장자 저장/불러오기 R을 통해 큰 csv파일을 읽고 분석해야 할 때, 전처리 끝난 데이터 전체를 Rdata로 저장해 두면 매번 새롭게 파일을 읽을 필요 없다. 필요한 파일만 Rdata로 저장하고 이를 불러오면 된다. Rdata 저장: save(), save.image() 아래와 같은 가상의 데이터가 있다. a 2024. 4. 2.
Rcpp에서 R내장 함수를 불러와서 써도 빠를까? 속도 문제르 R코드를 Rcpp로 옮기면서 가장 많이 했던 고민은 이거다. R에서 이미 구현되어 있는 내장함수를 Cpp로 새로 구현하였을 때, 그 함수가 이미 구현되어 있는 R함수보다 안정적이게 작성하기란 어렵다.... (특히, Optimize 함수 같은 거..) Rcpp에선 R의 특정 패키지에 구현되어 있는 함수를 불러와서 쓸 수 있는 기능이 있어 그 기능을 애용하게 되었다. R내장함수 Rcpp에서 불러오기: Optimize 예시 2023.09.17 - [R Programming/Rcpp] - [Rcpp] Rcpp에서 R함수 사용하기 (Optimize 함수 예시) [Rcpp] Rcpp에서 R함수 사용하기 (Optimize 함수 예시) (현재 코드는 RcppArmadillo & Rcpp 을 사용하였다.) .. 2024. 1. 8.
[R] Auto Correlation 데이터 생성과 Durbin-Watson 검정 본 게시글은 R에서 Auto Correlation (혹은 자기상관성; Serial Correlation, 대체로 시계열 데이터에서 나타나는 특성임)이 존재하는 데이터를 생성하는 방법에 대해 소개한다. Auto Correlation (자기상관성) Auto Correlation은 이 전 시점의 결과 $y_{t-1}$가 현재 시점의 $y_{t}$에 영향을 주는 관계를 의미한다. 보통 시계열 데이터와 같이, 시간의 순서에 따라 결과 변수들이 관찰되었을 때, Auto Correlation이 존재할 가능성이 크다. 결과 사이의 자기상관성이 존재한다는 것은 다른 말로 잔차 $\epsilon_{t}$가 이 전 시점의 잔차 $\epsilon_{t-1}$에 영향을 받는다고도 표현할 수 있다. 일반적으로 선형 회귀분석 시,.. 2023. 12. 28.
[R] Cox 분석을 위한 생존 시간 데이터 생성 (시뮬레이션 코드) 본 게시글을 Cox PH 모형 분석을 위한 특정 분포를 따르는 Survival Time 데이터를 생성하는 방법에 대한 내용이다. 참고에 Stackoveflow와 해당 게시글에서 언급된 Bender et al. (2005)를 참고하여 작성하였다. 데이터 생성하는 법 정규분포, 이항분포, 포아송분포 등의 분포를 따르는 시뮬레이션 데이터는 R의 기본 내장함수를 통해 쉽게 사용할 수 있다. 하지만 어떠한 Cox 모형의 확장된 분석방법이 시뮬레이션 데이터에서 잘 작동하는지 확인하고자 할 때, Cox 모형은 관찰된 생존 시간에 대한 어떠한 가정을 하는 것이 아닌, Hazard Function에 대한 가정을 하고 있기 때문에 어떻게 생성할지 막막해진다. 2005년도에 Stat Med에서 Cox 모형을 위한 생존시간 .. 2023. 12. 22.
[R] Error invalid graphics state 이 전 게시글에서 소개한 plot을 자동으로 저장하는 옵션을 사용하다 보면, 위와 같은 에러가 발생할 때가 있다. 이 전까지만 해도 잘 그려지던 그래프가 어떠한 코드 수정도 없었는데 갑자기 그려지지 않기 때문에 많이 당황스럽다. Error 메시지 나의 경우엔 ggplot을 특정 객체 g에 저장하였고, 다시 g를 출력하려고 했을 때 다음과 같은 에러 메시지를 확인할 수 있었다. Error in .Call.graphics(C_palette2, .Call(C_palette2, NULL)) : invalid graphics state 해결방법 1. dev.off() 현재 그래프를 옆에 출력하는 것이 아닌, 특정 이름으로 저장되는 코드(ggsave, png 같은..)가 실행되고 있었기 때문에, 그동안은 객체에도 .. 2023. 12. 20.
반응형