観察データでランダム化比較試験を模倣する〜Target Trialという考え方〜

疫学における因果推論の究極の目的は「注目している集団に対する介入の効果を定量化する」というものです。*1

この「介入」の存在を強く意識しているのがいわば疫学の因果推論の特徴かもしれません。

ところが観察データを用いた因果推論は克服すべき課題が非常にたくさんあってデザインが難しい。

「介入効果」を評価するのであればやはりランダム化比較試験（RCT）を行いたいところですよね。

実は観察データを用いた因果推論は、理想的なRCTをイメージした上でそれに近づけるようにデザインを設計することで多くのバイアスを未然に防ぐことができるのです。

逆にどのようなRCTが必要なのかをイメージできていないと、知らないうちにバイアスの入った分析デザインをしてしまう可能性があります。

どのようなポイントをおさえれば観察データの分析をRCTに近づけることができるのか
そうすることでどのようなバイアスを防ぐことができるのか

についてまとめていきます。

今回特に参考にしたのは以下の論文。

Target Trialとは
３つのタイミングをずれると問題が発生
対象選択が「治療割付」「タイムゼロ」の後のとき
「タイムゼロ」と治療割付が不揃いなとき
- 「タイムゼロ」が治療割付の後
  - 治療割付のタイミングが曖昧なため、ずれてしまうパターン
  - データの取得方法のため、必然的にずれてしまうパターン
- 「タイムゼロ」が治療割付の前
まとめ

Target Trialとは

f:id:KRSK_phs:20201207153516p:plain
ハーバード公衆衛生大学院の疫学の教授であるHernanらは、観察データを用いてある曝露の効果を検証したいとき、「どのようなRCTを実施することができれば理想的にその効果を検証することが可能か」をイメージするように推奨しています。

そして観察データを用いてその理想のRCT(Target Trial)を模倣(emulate)していくことで、観察研究の質を高めていこうというのが基本的な考え方です。

RCTは因果推論のための手段に過ぎませんし、RCTでも（質が低い場合には）正しく効果推定ができない場合があるので、違和感を感じる人もいるかもしれません。

しかし、Target trialを意識しながら分析デザインを設定することで観察データの分析でおちいりがちな間違いを未然に防ぐことができるという利点があります。

実際にRCTをデザインする際には、いろいろな条件を考えますよね。

どのように対象者を選択するのか、治療方針をどのようにするのか、blindingをするのか、などなど。

Target trial emulationでは、RCTのデザインに必要なこれらのポイントを１つ１つ観察データを使って可能な限り再現していきます。

詳しい手続きは以下の論文に解説があります。

今回はTarget trial emulationで考えるべき要素の中でも特に

「対象者の選択(Eligibility)」
「治療割付(Treatment Assignment)」
「タイムゼロ」

という３つについて、それぞれの時間的な前後関係という視点から整理をしていこうと思います。

「対象者の選択」というのは、最終的な分析対象を選ぶための条件（Eligibility)が全て満たされるタイミングのこと。

「治療割付」は、RCTでは「治療群かコントロール群に（ランダムに）振り分けられる」タイミング。

そしてRCTではITT(Intention-to-Treat)解析といって、（その後実際に治療をうけるかどうかとは無関係に）割付群ごとにアウトカムを比較するのが一般的です。

ところが観察研究では「治療割付」に相当する変数が存在しないことが多いと思います。

治療薬の"処方"といったデータがあるのであれば、治療割付の変数として使用することができるかもしれませんが、実際には薬を実際に使用したかどうか、曝露を実際に受けたかどうかというデータしかないことがほとんどではないでしょうか？

そのような変数を使ってemulateしたTarget trialは「割付に対するアドヒアランスが100%のとき」つまり「全員が割り付けられた通りの治療・曝露をうけるtrial」になります。

そして、曝露を実際に受けた時点を「治療割付」がおきたタイミングと捉えます。

表現を変えると「どの曝露グループに属するかが確定したタイミング」が治療割付の起きる時点です。

一見ややこしい定義ですが、後ほどその意味がわかってきます。

ちなみにこのような割付=実際の治療となる場合、割付の効果（ITT Effect）は実際の治療の効果（Per-protocol Effect)となりますね。

最後に「タイムゼロ」というのは、フォローアップが開始されるタイミングのことです。

「ベースライン」と呼ばれることもあると思います。

３つのタイミングをずれると問題が発生

（理想的な）RCTでは、

一連の除外基準に基づいて対象者を絞ったうえで
治療をランダム割付
割付後すぐに対象者をフォローアップ
その後のアウトカムを評価

するというのが一般的な手続きではないでしょうか。

f:id:KRSK_phs:20201124114713p:plain

つまり、「治療割付」「タイムゼロ」が同じタイミングで「対象者選択」はそれらと時間的に同じか前の時点で完了しているという状況です。

観察データを用いてemulateしたTarget trialでも、３つの時間的関係をRCTと同じにしていくことを目指します。

ところが多くの観察研究ではこの３つの時間的なタイミングがtarget trialからずれてしまうことがしばしば。

target trialを意識しないで３つの時間的タイミングがずれてしまうと、様々な問題・バイアスが生じます。

具体的にどのような問題が起きうるのか、事例をみていきましょう。

対象選択が「治療割付」「タイムゼロ」の後のとき

f:id:KRSK_phs:20201124114825p:plain

観察研究では、割付られる治療が確定してフォローアップを開始した後に「対象者選択」が完了するケースがしばしばあります。

例えば、「治療割付」と「タイムゼロ」のタイミングを合わせることに成功したケースを考えましょう。

ある薬Aをこれまで飲んだことがない人たちをリクルートして、そのうちベースラインで薬Aを処方された人vsされなかった人の比較を行ったとします。

「処方のありなし」のタイミングから追跡を開始するので「治療割付」「タイムゼロ」が一致しているわけです。

そして追跡後のアウトカムを群間比較するのが通常の手続きです。

ところがなんらかの理由（途中で死亡した、連絡がとれなくなったなど）で、一部の人の追跡が失敗した場合はどうなるでしょうか？

途中で追跡できなかった人たちは、アウトカムの情報がないわけですから分析に含めることができません。

言い換えると、最終的な分析対象になるためには「アウトカム評価時までフォローアップされている」ことが条件となるわけですよね。

つまりEligiblityの確定するタイミングが「治療割付」「タイムゼロ」よりも後になっている状況です。

このような状況のとき

追跡の失敗確率が割付治療に依存
追跡失敗した人と追跡できた人でアウトカムの予測因子の分布が異なる

の２条件が成立すると、たとえRCTであっても（追跡できた人のデータのみを使って）単純に割付群間でアウトカムを比較するだけでは治療効果を間違って推定してしまいます。

例えば

「薬の処方あり」の人のほうが追跡失敗の確率が低い（薬を飲んでいるから死ににくい）
追跡できた人のほうが失敗した人よりも元々の健康状態が良い傾向（単純に死ににくい）

という状況で、「薬処方なし」＆「追跡できた」人はどのような人でしょうか？

「薬処方なし」という（追跡失敗確率が高くなる）不利な条件にもかかわらず追跡に成功したということは、元々の健康状態が特別よかった人なのかもしれないですよね。

すると本当は治療になんの効果もなかったとしても、追跡できた人たちだけを見て群間比較をすると「処方なし群」のほうが見かけ上、少し健康に見えてしまうかもしれません。

いわゆる典型的な「選択バイアス」のケースですね。

選択バイアスについて詳しくは過去記事をご参照ください。

観察データでは「治療割付が確定・フォローアップを開始するタイミング」がいつかを考え、時間的にそれより後のタイミングの条件で対象選択をする際には選択バイアスに注意する必要があります。

追跡の失敗以外に、仮説の性質上、治療割付・タイムゼロのタイミングと対象選択のタイミングがずれることも。

例えば「喫煙が、生まれてきた子供の発達に与える影響」に関心があるとしましょう。

当然「治療」は母親の喫煙であり、そのタイミングは「妊娠中」です。

ここで「対象選択」のタイミングを考えます。

「生まれてきた子供の発達」を評価したいわけですから、「生まれてきて調査に参加できる」ことが分析対象となるための条件になりますよね。

言い換えると、「（流産などの理由で）生まれてこれなかった」「不健康すぎて調査に参加できなかった」といったケースでは対象選択の基準を満たさないというわけです。

もし、「妊娠中の喫煙」が上記のようなケースが起きる確率にも影響しているのだとしたら、選択バイアスが生じる可能性があります。

いわゆる「生存者バイアス」の一種ともとらえることができますが、気付きにくい例ですね。

「タイムゼロ」と治療割付が不揃いなとき

観察研究では、「タイムゼロ」と「治療割付」のタイミングがずれているケースも多くあります。

しかも、これらのケースは気付きにくいのでやっかいです。

どのような問題が生じるのか、具体例とともにみていきます。

「タイムゼロ」が治療割付の後

「治療割付」からしばらく経ってからフォローアップが開始することがあります。

治療割付のタイミングが曖昧なため、ずれてしまうパターン
データの取得方法のため、必然的にずれてしまうパターン

などいくつかの状況が考えられます。

治療割付のタイミングが曖昧なため、ずれてしまうパターン

f:id:KRSK_phs:20201207144438p:plain

単純に「〇〇の治療効果」を見たいとき、興味のあるtreatment（○○）がどのタイミングから始まっているのかを深く考えず分析してしまうことはよくあります。

例えば「ある薬A」の効果を評価したいとき、「調査開始時点でAを服用している人vs服用していない人」でその後のアウトカムを比較をするのは一般的な方法だと思います。

しかし、このようなデザインでは「タイムゼロ（調査開始時）」と「治療割付」のタイミングは一致していません。

よくよく考えてみると「ある薬Aの割付」が起きたのはいつのタイミングでしょうか？

もしかすると「調査開始時点でAを服用している人」はもっと前の時点からAを服用している可能性もありますよね？

この場合、「真の治療割付」は「タイムゼロ」よりも前に起きたことになります。

また当然のことながら調査に参加しなかった人（「タイムゼロ」より前に亡くなった人、生きていたが「タイムゼロ」で調査への不参加を決めた人）は分析対象となりません。

このように「治療割付から一定の期間のフォローアップ情報が全くない」状況のことをデータのLeft Truncationが起きていると言います。

Left Truncationがおきている場合も

(タイムゼロ以前の）治療Aがタイムゼロでの調査参加確率に影響
調査参加者と不参加者でアウトカムの予測因子の分布が異なる

の２条件が揃うと、やはり上記の追跡失敗の例と同じように選択バイアスが生じます。

追跡失敗の例との違いは、最終的な分析対象の決定がフォローアップ開始時〔タイムゼロ）でおきたのか、それ以降でおきたのかという点ですね。

どちらも選択バイアスが起こりうるという点では変わりません。

Target Trial Emulationの考え方では、「元々治療を受けていなかった人たち」を最初に選択したうえで、「タイムゼロで新しく治療を始めた人vs始めなかった人」の比較を行えば、タイムゼロが割付より後になるという問題を回避できます。

（過去の治療歴を無視して）「現時点で治療をうけている人・いない人」を比較することで生じるバイアスは(とくに薬剤疫学の世界では）Prevalent User Biasと呼ばれたりもします。

でも薬剤疫学に限らず、このような「割付のタイミングが曖昧となっている」状況ってよくありますよね。

データの取得方法のため、必然的にずれてしまうパターン

f:id:KRSK_phs:20201207144511p:plain

「治療割付」のタイミングが明確にわかっていても、ずれてしまう場合があります。

例えば、「トラウマ経験」が精神的健康に与える影響を調べたいとします。

「家族との死別」のようなトラウマ経験はそのイベントが発生したタイミング（死別の日）が明確にわかっているため、前述のprevalent userのような問題は発生しません。

ところが通常トラウマ経験のデータ収集は、イベント”後”のどこかのタイミングでretrospectiveに行われますよね（例：質問紙調査で「過去１年間の死別の有無」を聞くなど）。

前もってイベントの発生を予測して当日に調査をするなんてことは不可能なので、当然です。

このとき、イベント発生の当日（真の治療割付のタイミング）とデータ上のベースライン（測定の日＝タイムゼロ）がずれていることになります。

そして

トラウマ経験がタイムゼロでの調査参加確率に影響
調査参加者と不参加者でアウトカムの予測因子の分布が異なる

の２条件が揃うと選択バイアスが生じます。

ある曝露・治療因子への割付と同じタイミングでのデータ収集が不可能な場合は注意が必要ですね。

「タイムゼロ」が治療割付の前

f:id:KRSK_phs:20201207145715p:plain

検証したい仮説によっては「治療割付」がタイムゼロ以降となることがあります。

ここでの観察データの分析における「治療割付」は、「比較したい治療群のいずれに属するかが確定する」タイミングだと思ってください。

このような状況がおきる典型的な例は「治療の期間(treatment duration)の効果」に関心があるときです。

「ある治療Aを一ヶ月未満でやめるvs一ヶ月以上続けたときの生存期間への影響」を知りたいとしましょう。

これまで治療Aを一度も受けてこなかった人でベースライン（タイムゼロ）で「新たにAを開始した人」を対象に分析する場合を考えます。

f:id:KRSK_phs:20201207150532p:plain

上の図を見ると、「一ヶ月未満に治療Aをやめた人」にはタイムゼロから一ヶ月未満で死亡した人（パターン１）もいれば、一ヶ月後以降に死亡した人（パターン２）もいます。
ところが「一ヶ月以上治療Aを続けた人」というのはその治療群の定義上、必ず死亡するタイミングはタイムゼロから一ヶ月以降になります（パターン３）。

言い換えると、「一ヶ月以上治療Aを続けた人」にとって、タイムゼロ以降最初の一ヶ月は絶対に死なない期間になるわけです。

このような期間のことを疫学ではimmortal time(不死時間）と呼びます。

そしてimmortal timeのせいで「一ヶ月以上治療Aを継続をした人」のほうが生存期間が長くみえてしまう現象はimmortal time biasと呼ばれます。

治療割付が確定するタイミングがタイムゼロ以降の場合は注意が必要ですね。

immortal time biasについて詳しくは、以下の論文をご参照ください。