因果効果のメカニズムを検討する：媒介分析(Causal Mediation Analysis)入門②～反事実モデルに基づく媒介効果の定義～

媒介分析シリーズ、第二段です。前回は、よく使われる媒介分析の手法の問題点についてまとめました。

今回は、これらの問題を克服するべく考案された因果媒介分析（Causal Mediation Analysis)を紹介するイントロとして、そもそも「媒介効果」なるものをどうやって定義するのかについてまとめます。話の性質上、少しだけ数式が登場しますが、できるだけわかりやすく書いてみようと思います。

反事実モデルの復習
媒介効果の定義
- Controlled Direct Effect
- Natural Direct Effect & Natural Indirect Effect
  - 媒介因子の反事実を考える
  - NDEとNIEの定義
CDE と NDE/NIEの関係
定義の拡張
参考資料

反事実モデルの復習

媒介効果を定義するときに、統計的因果推論の基本中の基本である反事実モデル（Counterfactual Model)の考え方および数式での表現の仕方（notation)を知っている必要があります。詳しくは前回の記事をご参照ください。

前回までと同じ表記方法を使います。

「介入AがアウトカムYに与える影響」に関心があるとしましょう。このような因果効果は反事実モデルの下で、

f:id:KRSK_phs:20180727135244p:plain

と書くことができます。右下の小さい文字がポイントで、Y_a=1は「もしもa=1だったときにとるであろうYの値」という意味です。実際にデータから知ることができるのは、以下にで示される平均因果効果（Average Causal Effect）です。

f:id:KRSK_phs:20180727142032p:plain

現実には同じ人間は一度にA=1かA=0のどちらかしかとれないので、Ya=1 と Ya=0は片方しかわかりません。前回と同じ例、ジムへの入会（A=1で会員、A=0で非会員）と体脂肪率（Y％）の関係について考えます。合計200人の人がいて、A=1とA=0の人数が半々であるとすると、現実のデータは次のように見えると思います。*1

f:id:KRSK_phs:20180808123344p:plain

個人ひとりひとりを見ると、事実と反するシナリオ下でのアウトカム（A=1のひとにとってのYa=0、A=0の人にとってのYa=1)は絶対に知ることができません。ですが、平均同士なら計算できます。

ID=1～100の人たちのYa=1の平均がE[Ya=1|A=1]=E[Y|A=1]で、ID101～200の人たちのYa=0の平均がE[Ya=0|A=0]=E[Y|A=0]となります。

あとはExchangeabilityもしくはConditional Exchangeabilityを整えてあげれば、平均因果効果の推定完了です。繰り返しですが、忘れた人は前回記事を参照ください。

媒介効果の定義

ここからついに媒介効果の定義に入ります。Causal Mediation Analysisは反事実モデルに基づいて媒介効果を定義するため、Counterfactual-based Mediationと呼ばれることもあります。大きくわけて、二通りの定義の仕方があります。どちらかが正しいというのではなく、媒介分析の目的によって使い分けるべきものです。さらに、推定に必要な条件（Identifiability Assumption）も異なるので状況に応じて適切な方を選ぶといいと思います。

反事実モデルに基づく媒介効果の定義は以下の論文で最初に提唱されました。疫学の世界では有名なR&Gコンビです。

Robins, James M., and Sander Greenland. "Identifiability and exchangeability for direct and indirect effects." Epidemiology(1992): 143-155.

Political Scienceで有名なImai先生の以下の論文でも分かりやすくまとめてあります。

Imai, Kosuke, et al. "Unpacking the black box of causality: Learning about causal mechanisms from experimental and observational studies." American Political Science Review 105.4 (2011): 765-789.

AがYに影響するとき、そのような効果を引き起こす中間要因を媒介因子Mと呼ぶことにします。例えば、ジム入会（A)は運動量の増加（M）を通して体脂肪率（Y)に影響するかもしれません。DAGで書くと次のような感じです。とりあえず交絡がない状況を考えています。

f:id:KRSK_phs:20180808125611p:plain

AがMを通してYに与える影響（A→M→Y）を間接効果、AがMを介さずYに与える影響（A→Y）を直接効果と呼びます。

先ほどYを、反事実モデルに基づいてYa=1 と Ya=0と表記しました。媒介効果を考えるために少し拡張して、Yaｍという表記を導入します。再び右下に小さい文字が入っているので反事実モデルですが、今度はA=aだけでなくM=ｍも書いてあります。YaがA=aとする仮想の介入をしたときのYと理解できるのと同じで、YamはA=aとする介入とM=mとする介入の二つを同時に行ったときのY、すなわちAとMに対するJoint Intervention下のアウトカムとして理解することができます。

説明を簡単にするため、以下ではMが二値（一日30分以上の運動あり＝１、30分未満または運動なし＝０）であると仮定しましょう。*2

Y11は「もしA=1かつM=1であったときに観測されていたであろうYの値」

Y10は「もしA=1かつM=0であったときに観測されていたであろうYの値」

といった具合です。Y10は「ジムに入会させておきながら、一日30分以上の運動を禁止する」という不思議な介入のシナリオです。

Controlled Direct Effect

まず一つ目はControlled Direct Effect (CDE)と呼ばれるものです。次のように定義されます。

f:id:KRSK_phs:20180809012003p:plain

mに同じ値が入るというのがポイントです。例えば、CDE(0)はY10-Y00となり、「M=0に固定したとき（30分以上の運動の運動を禁止）のA=1とA=0（ジム入会の有無）の比較」と解釈することができます。

ｍの値が一定に固定されているので、Y1mとY0mの差にMは全く無関係で、純粋にAの違いから生じるものだと理解することができます。運動をしていないのにジムに入会した人とそうでない人で体脂肪率に差が出たとしたら、それはジムに入会することが運動以外のメカニズムを通して体脂肪率に影響していることを示唆します。

f:id:KRSK_phs:20180808125611p:plain

すなわち、CDE(ｍ）は「M=ｍに固定したときのA→Yで示された直接効果」となります。

媒介分析に関する前回の記事では、AとMの間の交互作用（Exposure-Mediator Interaction）が存在するシチュエーションを考えました。仮にそのような交互作用が存在した場合、CDE(ｍ）はmの値によって異なる可能性があります。

交互作用については以下の記事でまとめてあります。

Natural Direct Effect & Natural Indirect Effect

媒介因子の反事実を考える

CDEに代わる、全く新しい媒介効果の考え方がNatural Direct Effect（NDE）とNatural Indirect Effect (NIE)です。

定義に入る前に、上で新たに定義したYamに加えてもうひとつ反事実モデルに基づく新たな表記方法、Maを導入します。Maとは「もしA=aだったときにとっていたであろうMの値」という意味です。Counterfactualが入り組んできたので、下の表を見ながら考えてみましょう。

f:id:KRSK_phs:20180809065811p:plain

Consistencyを仮定すると、先ほどと同様に実際にA=1だった人たちのYaは現実のYと一致します。同じ考え方で、実際にA=１だった人たちのMa＝１は現実のMと一致します。表中の上半分の人たちを見ると、実際に同じ値が入っていることがわかります。一方、Ya=0およびMa＝0には？が入っています。？はその値が観測できないことを意味します。現実にA=1だったのだから、もしA=0だったときに何が起きていたかは個人レベルではわからないのです。

通常の統計的因果推論ではExchangeabilityという条件を整えて、集団レベルでE[Ya=1]-E[Ya=0]の計算を目指していくという話を前回しました。

因果媒介分析では集団から集めたデータを駆使して、YaだけでなくMaも考えていく必要があるので、通常よりもきつい仮定を置く必要があります。したがってCausal Mediation Analysisは、置いている仮定がどの程度もっともらしいのか、仮に仮定の違反があったときにその影響はどの程度のものか、を考える感度分析（Sensitivity Analysis）と必ずセットで行われるべきなのです。

一般的な感度分析については次の記事を参照ください。

因果媒介に必要な仮定（Identifiability Assumptions)およびSenstivity Analysisについては次回説明します。

NDEとNIEの定義

さて、さきほど導入したMaを使ってNDEとNIEは以下のように定義されます。

f:id:KRSK_phs:20180809110439p:plain

言葉でいうと、

NDEは「Mをその人がA=0であったときにとっていたであろう値（M0)に固定して、A=1とA=0のときのアウトカムYを比較したもの」

NIEは「A＝１に固定して、MがA=１でとっていたであろう値（M1)のときとA=0でとっていたであろう値（M0)のときのアウトカムを比較したもの」と解釈できます。

NDEとNIEを足し合わせると

（Y1M0-Y0M0 ）+（Y1M1-Y1M0 ）= Y1M1-Y0M0 = Y1-Y0 となります*3。つまり、NDEとNIEはAがYに与える効果全体を分解したものととらえることができます。これをEffect Decompositionと呼び、NDE/NIEを用いた媒介分析の特徴です。

先ほど説明したCDE(ｍ）＝Y1m-Y0mとはどう違うのでしょうか。CDE（ｍ）は全員に対してMをm同じ値に固定している一方、NDEとNIEの定義にあるM1やM0の値は一人ひとりで異なる、というのがポイントです。

入れ子構造になっていて分かりにくいので、例を使って説明します。次の三人を考えてみましょう。ここでは仮想的に、（タイムマシンが存在するなど）通常観測されない反事実のアウトカムおよび曝露因子を観測可能な世界にいるとします。

f:id:KRSK_phs:20180809074231p:plain

ID=1の人に注目しましょう。この人にとっての各値は以下のように解釈できます。

M0＝0「仮にA=0であったとき、媒介因子Mは0となる」

M1＝1「仮にA=1であったとき、媒介因子Mは1となる」

Y00=0 「仮にA=0かつM=0であったとき、アウトカムYは0となる」

Y10=1 「仮にA=1かつM=0であったとき、アウトカムYは1となる」

Y01=0 「仮にA=0かつM=1であったとき、アウトカムYは0となる」

Y11=1 「仮にA=1かつM=1であったとき、アウトカムYは1となる」

このとき、AがYに与える平均因果効果は

f:id:KRSK_phs:20180809143758p:plain

M0＝0, M1＝1であるこの人にとってのNDE/NIEは

f:id:KRSK_phs:20180809143534p:plain

という風に計算できます。

ちなみにこの人のCDEは

f:id:KRSK_phs:20180809143236p:plain

となります。

同じ考え方で、ID=２の人では

f:id:KRSK_phs:20180809144037p:plain

ID = 3の人では

f:id:KRSK_phs:20180809144244p:plain

となります。M1やM0の値が人によって違う点に注意です。

三人の平均を考えることで、平均因果効果の媒介分析を行うことができます。すなわち、

f:id:KRSK_phs:20180809145043p:plain

このような定義に基づき、次回紹介するIdentifiability Assumptionのもとで集団のデータからCDEやNDE/NIEを計算することができます。

CDE と NDE/NIEの関係

引き続き上記の例を使いましょう。よく見ると、ID=2の人はTotal EffectもNIEも0なのですがCDE(0)=1となっています。直接効果がないのか、あるのか困惑してしまいそうな結果です。これはExposure-Mediator InteractionがID=2の人に生じているからです。

ID=3の人もNIE=1でTotal Effectがすべて媒介効果で説明されているように見えるのに、CDE(0)=1で直接効果があるような結果となっています。これも交互作用によるものです。

さらに、最後に三人の平均をとった結果をみます。NDEとNIEは1/3ずつで、ちょうどTotal Effectの半分が媒介されているように見えるのですが、CDE = Total Effectとなっており、これは全て直接効果で間接効果がまったくないことを指しているようにも見えます。

このようなCDEとNDE/NIEの違いはとても紛らわしいのですが、そもそも媒介分析の目的がCDEをつかうときとNDE/NIEをつかうときで全く異なることを理解すると矛盾していないことがわかります。

CDEで答えることができる問いとは

「Aの効果のうち、どの程度がM=mに固定する介入をしたあとに残るのか？」

というものです。それに対して、NDE・NIEが答えている問いは

「Aの効果のうち、どの程度がMによって説明されるか？」

になります。

前者は媒介因子Mに対する積極的な「介入」を想定している問いなのに対して、後者は現象としてMによるAの効果の媒介を問うています。言い換えると、CDEはInterventionalな問い、NDE/NIEはEffect Decompositionに関する問いということになります。

したがって、なんらかの媒介因子Mに対する介入の効果を推定するなど、ポリシーメイキングに貢献するための媒介分析が目的ならばCDEのほうが相性がいいですし、逆に現象としての媒介の理解、メカニズム・Etiologyの解明に興味がある場合はNDE/NIEのフレームで媒介分析を行った方が相性がいいと思います。

本質的にCDEは媒介効果を直接見ているわけではないので、Total EffectからCDEを引いたものでもって媒介効果の推定値とするのは誤りです。実際にはMediationが全くない状況でもTotal Effect-CDEで媒介効果を定義してしまうと、０でない値が得られる場合があるからです（ID=2の人のパターン）。