因果効果のメカニズムを検討する：媒介分析(Causal Mediation Analysis)入門①～既存の手法の問題点～

お久しぶりです。無事に博士課程の進級試験（qualifying exam)を通過しましたので、ようやく長かった二年間のコースワーク期間が終わりました。まだ口頭試験がありますが、これからやっと研究に集中できるフェーズに入ります。同時に時間にも余裕ができてきたので、ブログ活動を再開します。

さて、今回は媒介分析（"causal" mediation analysis)に関してまとめます。なぜ"causal"と強調しているのかは後ほどわかると思います。

これまでデータを用いた統計的因果推論について何個か記事を書いてきました。例えば、ある薬Aが病気Yに対して本当に効果があるのかどうかをどのように統計的に検討するかという話でした。

１．因果推論入門・データから因果関係が言えなくなる主な原因について

２．反事実モデル（Counterfactual model)の考え方の導入と実際のケース（受動喫煙の健康への影響）を用いた因果推論の例

３．観察データからの因果推論を補強する感度分析の考え方について

今回のテーマである媒介分析は”AがYに影響するかどうか”から一歩進んで、”AがYになぜ・どうやって影響するのか”、”因果関係のメカニズムはなにか”を検討すための分析手法です。英語では前者が"whether"のクエスチョンであるのに対して、後者は"why and how"のクエスチョンです。

書くべきことが多いので三つの記事にわけて説明していきます。

１．媒介分析が必要な理由・よく使われる既存の手法の問題点
２．反事実モデルに基づく媒介効果の定義・考え方、既存の手法との比較
３．実際にデータから媒介分析を行う方法・必要な仮定

今回は１の「媒介分析が必要な理由・よく使われる既存の手法の問題点」についてまとめます。

なぜ媒介分析が必要なのか？その意義は？
よく使われる媒介分析の手法
問題点１: Exposure-Mediator Interaction
問題点2：Mediator-Outcome Confounding
ではどうする？
参考資料

なぜ媒介分析が必要なのか？その意義は？

さて、冒頭でも少しだけ触れましたが、「媒介分析」とは文字通り「注目している因果関係がある因子によってどの程度媒介されるか」を検討する手法です。イメージしやすいようにDAGで整理してみます。

ダイエットの例を考えてみましょう。「フィットネスジムへの会員登録」（曝露A）が「体脂肪率(％)」（アウトカムY)に与える因果効果は以下の緑の線（A→Y)で表現されます。これは、ジム会員になること（A)が体脂肪率（Y)に総合的に与える効果なのでTotal Effectと呼ばれます。実際の解析では交絡因子Cを統計的にコントロールしたり、自然実験を利用したりなどとして、このTotal effecrtを求めます。これが一般的に行われている因果推論が目指すところです。

f:id:KRSK_phs:20180707130606p:plain

これに対して、媒介分析では「なぜジム会員になると体脂肪率が落ちるのか」そのメカニズムを検討します。例えば、ジム会員になると実際に施設を使うことを通して日々の「運動量（媒介因子M)」が増えるかもしれません。運動することで体脂肪が減るとすると、ジム会員（A)の体脂肪率（Y)への影響は、運動量（M)によって媒介されているということができます。このように媒介因子Mによって説明される効果は以下で赤色の線（A→M→Y）で示され、間接効果（Indirect Effect）と呼ばれます。

しかし、ジム会員が体脂肪率を減らすメカニズムは運動量だけではないかもしれません。例えば、ジムに行くことで食事指導を受け、実際の食生活が変わったことから体脂肪率が減ったのかもしれません。この場合、たとえジム会員になったのに運動量は変わらなかった場合でも体脂肪率が減ることになります。このように、曝露Aが媒介因子Mを介さずにアウトカムYに与える影響は以下の青色の線（A→Y)で示され、直接効果（Direct Effect)と呼ばれます。

f:id:KRSK_phs:20180708065533p:plain

媒介分析を行うことで、Total effectのうちどの程度が媒介因子Mによって媒介される間接効果なのか、直接効果はあるのか、あるとしたらどの程度か、などを知ることができます。

媒介分析が価値を持つシチュエーションとして次のようなものがあると思います。

１．科学的な理解を深めたいとき

単に曝露因子AがアウトカムYに関係するかどうかではなく、そのメカニズムを知ることはAとYの関係について科学的な理解を深めることになると言えます。

２．理論の検証をしたいとき

理論的にAがMを通してYに影響するとされている場合、媒介分析を用いることで理論が正しいかどうかを検討することができます。例えば、公衆衛生学では健康信念モデル（Health Belief Model)と呼ばれる行動理論があります。ある病気の検査を受けるかどうかの行動（Y)は、その病気の深刻さを理解すること（A）などを通して検査を受けようという意思を持つこと（M)で説明されるという内容です*1。媒介分析をとおして、このような理論の妥当性を検討できます。

３．曝露因子Aに介入できないとき

アウトカムYを変えることに興味があるのに、曝露因子Aに介入が難しい・不可能なケースがあります。例えば、自然災害などのトラウマ体験がひとびとの健康に与える影響を考えてみます。当然ですが、自然災害（A)を介入によって事前に防ぐことは不可能です。それでも被災者の健康（Y)をよくしたい場合には、Aに介入するのではなく、その媒介因子Mを特定し、介入することでAがYに与える影響を和らげることができるかもしれません。

４．介入の効果を高めたいとき

曝露因子Aに介入が可能な場合でも、メカニズムを特定し媒介要因にフォーカスした介入を行うほうが、単純にAに介入するよりも効果が高いかもしれません。例えば、ある野菜を食べること（A)が糖尿病の予防（Y)につながることがわかったとします。もちろんAに介入（その野菜を食べさせる）することに効果はあるかもしれませんが、その野菜がもつ栄養素のうち糖尿病予防に貢献しているもの（M)を特定できれば、その成分を抽出したサプリメントなどを飲んだ方が効果が高いかもしれません。なお、あくまで仮の話で実際にはサプリを飲んで健康になるのは難しいとされています。

よく使われる媒介分析の手法

上記のような目的のため、媒介分析は疫学や多くの社会科学の分野で長く使われてきました。主な手法としてDifference methodやBaron-Kenny法（Product Method)と呼ばれるものがあり、現在でも「媒介分析」と名の付く分析の大半で使われています。しかし、これら伝統的な媒介分析のテクニックはいくつかの手法論的な問題点があり、ほとんどの場合で媒介効果を誤って推定(バイアスがある）している可能性が高いです。各手法を簡単に説明した後、問題点をまとめます。

1. Difference Method

疫学研究などでよく使われているのを目にする媒介分析のタイプです。もはやメソッドと呼んでいいのかどうかわからないくらい、シンプルな方法です。手順は以下の通り。

1．媒介因子Mを含まないでAのYへのTotal effectを推定する。

例えば次のような回帰モデルを使います。Cがあらゆる交絡因子をカバーしていると仮定すると、aの係数であるphi1がA→YのTotal effectの推定値となります。*2

f:id:KRSK_phs:20180708070727p:plain

2. 媒介因子Mをモデルに追加してDirect effectを推定

Difference Methodでは1の回帰モデルに媒介因子Mを追加することでDirect effectを推定できているものとします。Mを調整したうえで、得られるaの係数theta1がDirect Effect、「Mで媒介されずにAがYに直接与える効果」の推定値です。

f:id:KRSK_phs:20180708071154p:plain

3. 引き算でIndirect effectを推定

AがYに与える効果（Total effect）のうち、Mで媒介”されない”もの（Direct effect）を除けば、Mで媒介”される”効果（Indirect effect）が得られることになります。

f:id:KRSK_phs:20180708072113p:plain

”差”でもってIndirect effectを定義しているので”Difference” Methodです。Mを追加したあとでaの係数が変化すれば、「媒介あり」と判断している論文も多いです。

2. Baron-Kenny Method (Product Method)

Difference Method以上に有名で、広く使われているのがBaron-Kenny Methodです。その名の通りBaronさんとKennyさんが提唱した手法です。この手法に関して、彼らが1986年に発表した論文はまさに媒介分析の歴史のなかでも伝説的な一本であり、Natureが発表した「歴史上もっとも引用された科学論文ランキング」で３３位でした。現在の引用数はGoogle Scholarでなんと77074（！）です。

Baron, R. M., & Kenny, D. A. (1986). The moderator–mediator variable distinction in social psychological research: Conceptual, strategic, and statistical considerations. Journal of personality and social psychology, 51(6), 1173.

Baron-Kenny Methodは基本的に、アウトカムY・媒介因子Mそれぞれをモデリングすることで媒介効果を推定します。

f:id:KRSK_phs:20180708075039p:plain

f:id:KRSK_phs:20180708074906p:plain

AがMを介さずにYに与える影響、Direct effectはDifference Methodと同じくtheta1で得られます。

Baron-KennyはMによって媒介されるAの効果（Indirect effect）はAがMに与える影響の強さ（beta1)とMがYに与える影響の強さ（theta2)を合わせることで推定できると考えました。

f:id:KRSK_phs:20180708080040p:plain

(3. Structural Equation Modeling)

Structural Equation Modeling（SEM)も媒介分析でよく使われています。私はSEMのフォーマルな教育を受けたことがないので、理論的なバックグラウンドはよくわかっていません。どなたか詳しい方いたら教えてください。

しかし、上記の二つの手法と同じく、SEMも媒介分析の手法としては適切ではないのではないかと言われています。

問題点１: Exposure-Mediator Interaction

曝露因子Aと媒介因子Mの間に交互作用がある場合、従来の手法では正しく媒介効果を推定できません。交互作用については以前まとめを書いたので、わからない方はこちらをご参照ください。

どういうことかというと、Differentho MethodもBaron-Kenny Methodも、アウトカムYと曝露因子Aおよび媒介因子Mの関係をモデルするときに次の式を使っています。

f:id:KRSK_phs:20180708103358p:plain

このモデルはAとMの交互作用がないことを仮定しており、言い換えると、Aの値と無関係にMの効果は一定であるとしていうAssumptionがおかれています。SEMを用いた媒介分析でも同じことがいえると思います。

しかし、考えてみるとこの仮定が常に成り立つとは限りません。例えば、飲酒（A)は喫煙（M)を通して肺がんのリスク（Y)を高めるとしましょう。喫煙者はお酒を飲むときに一緒にタバコを吸いがちなので、喫煙が媒介要因となって肺がんのリスクが高まる可能性があります。タバコに含まれる有害成分は、お酒のアルコールと一緒になることで効力が高まるかもしれません。その場合、喫煙（M)のアウトカムYへの効果が飲酒（A)の値によって異なる、すなわちAとMの間に交互作用が存在するということになります*3。

このようにAとMの間の交互作用、Exposure-Mediator Interactionが存在する場合、真のモデルは次のようになります。

f:id:KRSK_phs:20180708110440p:plain

仮にこのモデルを使用した場合、Difference MethodやBaron-Kenny Methodで使われている定義ではIndirect effectを知ることができません（交互作用項の係数theta3を無視しているため）。

問題点2：Mediator-Outcome Confounding

もう一つの重要な問題はおなじみ交絡とよばれる現象です。通常、因果推論の枠組みに基づいた分析では、理論上AとYの交絡因子となりうるであろう要因Cのデータを集めて統計的に処理または研究デザインの工夫で対応します。もしAのランダム割付を行うことができれば、平均的にCのようなものは存在しないと期待できるので最高です。

f:id:KRSK_phs:20180708111945p:plain

しかし曝露因子AとアウトカムYの間の交絡（C）が問題視され、なんらかの対処がされている一方で、媒介因子MとアウトカムYの間の交絡（U)は全く注目されず、なんの対応もされていないことが多いのです。

たとえ因果推論における最強のデザインであるランダム化比較試験であっても、媒介因子Mのランダム化はできていないので交絡Uが存在すると考えられます。

仮にUの条件を満たすような要因が存在し、かつ何も対処がなされていなかったとした場合、いくつかの問題が発生します。Exposure-mediator Interactionが存在しない次のモデルを考えます。

f:id:KRSK_phs:20180708103358p:plain

このモデルから得られるtheta1はDirect effectの推定値とされていました。しかし、このモデルは媒介因子Mもモデルに含まれている、すなわちMで条件付けされています。DAGのルールで考えると、このときAとUの共通効果M（Collider）をConditioningしているので、A→M←U→Yというパスが開き、Selection bias（またはcollider stratification biasとも呼ばれる）が生じています。この点、詳しくは過去記事を参照ください。

f:id:KRSK_phs:20180708120023p:plain

Selection biasによってAがYに与える因果関係の推定にバイアスが生じており、上記のモデルから得られたtheta1はDirrect effectの誤った推定値ということになります。ちなみに、（Cを条件づけることを前提として）AがYに与えるTotal effectの推定はUが存在しても正しく行えるということは言わずもがなです。

以上のことから、もし媒介分析が研究の主な目的の一つになるのであれば、Uに相当するMediator-outcome confoundersを吟味・測定するということを調査の設計段階から行う必要があります。しかし、前述したBaron & Kenny (1986)ではmediator-outcome confoundingについて全く触れられていません。その結果からか、これまでの媒介分析のほとんどはUの影響をまったく考慮せず行われてきました。

補足：SEMについて
SEMを用いた媒介分析でも全く同じように上記の問題が当てはまります。問題点１に関しては、SEMなら対応可能なのかもしれません。
しかし、これらの問題点に加え、SEMは共変量（C)間の関係性もモデルしなければならず、非常に強い線形性の仮定をおいていると批判されています。この点について詳しくは、VanderWeele (2012)をご参照ください。私自身はSEMに明るくないので、この点について異論がある方は教えていただけると勉強になり、ありがたいです。

VanderWeele, T. J. (2012). Invited commentary: structural equation models and epidemiologic analysis. American journal of epidemiology, 176(7), 608-612.

ではどうする？

以上のことから、従来使われてきた媒介分析の手法では正しく媒介効果を推定することができない可能性が高いということがわかりました。

これらの点を克服するべく、主に疫学と政治学（Political Science)の分野の因果推論研究者が、まったく新しい媒介分析の枠組みを作りました。

疫学の世界では、Robins & Greenland (1992)から始まり、VanderWeeleやValeriといった人たちが媒介分析の理論を発展させてきました。政治学ではImaiらを中心に媒介分析の研究が進んでいます。

異なる分野から出発しましたが、①どちらも近代的な因果推論の基本である反事実モデル（Counterfactual Model）に基づき、Direct effect & Indirect effectを定義しなおしました。そして、②どのような仮定のもとにどのような手法を使えばデータからDirect & Indirect effectを得ることができるのか（Identification Strategy）を検討しました。

①の定義の部分は両分野とも全く同じものを使っていますが、②のIdentification Strategyに関しては微妙に異なるアプローチをとっています。本ブログでは疫学の世界で発展してきた手法を紹介していきます。次回が①、その次が②についてまとめます。

これら反事実モデルに基づく媒介分析は、伝統的な媒介分析と区別するために、Counterfactual-based Mediation AnalysisまたはCausal Mediation Analysisと呼ばれています。本ブログでは以降、Causal Mediation Analysisという言葉を採用します。