본 게시글은 Interrupted Time Series (ITS) 분석에 대해 소개한다.
International Journal of Epi에 실린 ITS tutorial 논문을 소개하면서, ITS 방법론에 대해 리뷰하겠다.
이 논문은 ITS 분석을 Segmented Regression 모형 관점으로 소개하고, 해당 분석법의 단계와 ITS의 여러 이슈에 대해 소개한다.
Introduction
ITS는 public health intervention (개입) 평가에도 많이 쓰이고 있는 방법론인데, 특히 Randomized Controlled Trials (RCTs)가 불가능한 개입에 대한 평가 시 다른 역학 디자인에 비해 유용할 수 있다.
Population-Level 수준에서 개입 전과 개입 후의 Outcome의 Trend를 차이를 비교하는 방법론이다.
예를 들어, 새로운 백신 개발이 특정 건강 결과에 미치는 영향을 평가하고자 할 때, 백신 개발 전 후의 결과의 Trend 변화를 보는 것이 ITS이다.
- RCTs는 역학 연구의 Gold Standard이나, 역학 연구에선 RCTs가 불가능한 경우가 많다. 가장 대표적인 예시로 흡연으로 인한 건강 결과의 영향성을 평가하기 위해, 특정 그룹에게 강제로 흡연을 시킬 수 없기 때문이다.
- 대표적인 비실험 환경의 역학 연구 디자인인 Case-Control과 Cohort은 개입에 대한 평가를 하기 위해 적절한 디자인은 아니다.
- 두 실험 디자인은 보통 한 시점에서의 서로 다른 두 그룹을 비교하는 방법이다. 두 시점을 비교하는 방법은 아니다.
- Confounding 혹은 Bias의 문제를 겪는다.
아래는 본 논문에서 ITS 소개를 위해 사용한 예시의 데이터와 정책에 대한 소개이다.
논문에선 이탈리아에서 2005년 1월에 시행된 공공장소에서의 흡연금지 정책에 대하여 Acute Coronary Events (ACE)의 Trend 변화를 관찰하고자 한다.
Interrupted Time Series Design
ITS는 위의 그림처럼, 특정 결과에 대해 시간의 흐름에 따라 연속적으로 관찰되었을 때 사용하는 분석 디자인이다. (Individual or Aggregated Level 상관없이 관찰)
개입 전에 관찰된 데이터를 기반으로 Trend가 특정 시점의 개입으로 인해 Interrupted 되었다고 해서 ITS 라는 이름을 갖는다.
Counterfacutal Framework
ITS에서도 반사실적 결과 가정을 사용한다.
모든 반사실적 결과에 대한 가정이 그렇듯, ITS에서도 확인 불가능한 가정을 사용한다.
[가정] 만약 특정 정책/개입이 시행되지 않았다면, 개입 전에 관찰된 Trend가 그대로 유지되었을 것이다.
해당 가정을 기반으로 생성한 Trend 와 개입 후에 관찰한 Trend를 비교를 통해, 개입의 효과를 평가한다.
아래의 그림은 논문에서 가지고 온 첫번째 Figure인데,
2005년 이전의 관찰된 Trend가 개입 후 (회색 영역)에서도 유지된다는 가정을 사용했을 때 그려지는 그림이다.
실제 observed 된 값 (point)과 가정을 통해 생성한 Trend (dashed line)을 비교하고자 한다.
Step 1: is an ITS design appropriate?
- Clear Intervention: 특정 시점에 시행된 개입은 pre-intervention 기관과 post-intervention 기간을 명확히 구분할 수 있어야 한다.
- Quickly changed outcome: Outcome의 Type은 상관없지만, 개입이 즉각적으로 반영되는 건강 결과일수록 ITS 분석이 효과적이다. (그래서 논문에서도 급성 결과를 본다.)
- Data: 각 회귀계수 검정의 Power를 위해 개입 전과 후의 충분히 많은 데이터가 연속적으로 관찰되어야 한다.
Step 2: Proposing impact model.
논문에서 소개한 개입이 결과에 어떠한 영향을 미칠지에 대한 impact model은 위와 같다.
해당 impact model은 분석하고자 하는 데이터로 결정하는 것이 아닌, 선험적으로 선행 논문이나 지식을 검토하여 결정 내려야 한다.
(a)-(c)는 일반적으로 ITS에서 다루는 그래프이며,
(d)는 개입의 효과가 나타는 시점에 대한 Lag 고려가 필요하며, (e)와 (f)는 추가적인 모형 설정이 필요하다.
Step 3: Descriptive analysis
분석을 수행하기 전에, 개입 전의 Trend를 확인한다.
앞의 Figure처럼 scatter plot을 직접 찍어보며, 개입 전에 시계열적 패턴이 나타나진 않는지, 이상치는 없는지 확인해 보는 것이 중요하다.
Step 4: Regression analysis
논문에서 소개하는 ITS에 필요한 최소한의 변수는 다음과 같다.
$ Y_{t} = \beta_{0} + \beta_{1} T + \beta_{2} X_t + \beta_{3} TX_t $
- $Y_t$: t시점에 관찰된 결과
- $T$: 연구 시작 시점이 0을 갖는 시간 변수
- $X_t$: 개입 전(0)과 개입 후(1)의 값을 갖는 더미 변수
각 회귀계수에 대한 해석은 아래 그림에 나타내었다.
최종적으로 논문에서 적합한 모형을 그림으로 나타내면 다음과 같다.
개입 이후 Level 감소가 나타났다. (95% CI: 0.864-0.925, p < 0.001)
(임의로 Counterfactual Line을 점선으로 그려주었다.)
Step 5: Addressing methodological issues
Seasonality, Time-varying confounders, Use of controls and other more complex ITS design, Over-dispersion, Autocorrelation 등에 대해 소개한다.
각각의 주제들은 논문에서 정말 간략히 소개하기 때문에, 관심이 있다면 레퍼런스를 타고 더욱 공부해야 한다.
먼저 Seasonality, Autocorrelation 은 Regression 기반이 아닌, 시계열 모형 적합을 해야 한다.
사용한 예제 또한 계절성이 보이는 질환이기 때문에 Seasonality를 반영한 시계열 모형을 사용하는 것이 더 적절할 수 있다.
다음으로 Use of controls and other more complex ITS design은 위의 impact model에서 (e)와 (f)처럼 일반적인 ITS 디자인이 아닌 phase 별로 다르게 나타나는 효과를 어떻게 모델링할 것인지에 대한 이야기를 잠깐 다룬다.
Over-dispersion은 결과가 Counts일 때, 포아송 회귀모형이 적절하지 않을 수 있으며, 이에 대한 이야기를 다룬다.
Time varying confounders가 존재할 수도 있기 때문에, 측정이 되었다면 연도별 값에 대한 보정이 필요하다는 이야기를 다룬다.
Step 6: Model-Checking and Sensitivity Analysis
적합한 모형의 residual plot을 그려보거나 자기상관성이 있는지 확인해 보는 등으로 모형 검사를 수행할 수 있다.
모형이 검정할 수 없는 가정에 의존하기 때문에, 민감도 분석을 통해 결과를 강화하거나 다양한 관점에서 바라볼 수 있다.
'Study > Methodology' 카테고리의 다른 글
[APC] Age-Period-Cohort 방법론 (0) | 2022.08.14 |
---|