Unboundedly

統計的因果推論・疫学についてのお話

「交互作用」とはなにか:介入効果が一様でないときの統計手法~その目的と分類、解釈~

今回は「交互作用(interaction)」と呼ばれる概念について書いていきます。端的に言えば、”人によって効果が違う”という現象を見る統計学の考え方だと思います。例えば「薬Aが病気Dのリスクを10パーセント下げる」といったとき、実はその薬は女性では効果がめちゃくちゃあるが男性にはほとんど効かない、なんてことがあるかもしれません。交互作用の考え方を使えば、このように介入の効果が一様でない現象の存在を調べることができます。
交互作用は統計を使う学問で広く使われているのですが、割とルーズに使われていることが多い印象が個人的にあります。交互作用のなかにもいくつか異なるタイプがあり、その種類によって解釈が変わってきます。また、そもそも交互作用を見る目的によって、必要となる統計モデルの作り方も異なってきます。このように「交互作用」を扱ううえで注意すべきポイントについて、一般的な統計学の教科書に載っているイントロから少しだけ踏み込んだ内容までまとめていきます。

交互作用の定義・統計モデルでの扱い方

まずは交互作用の基本の確認をしておきます。この辺りは余裕で分かっている方も多いと思うので、必要に応じて飛ばして読んでください。

交互作用を想定しない場合

先に述べたように「交互作用」とは、”人によって効果が違う”といった現象です。もう少しフォーマルな言い方をすると、介入・曝露因子の効果がそのほかの要因のレベルに依存している状態です。
仮に考えうるバイアスを全て克服し、何らかの介入(例:血圧を下げる薬)がアウトカム(例:血圧)に与える因果効果を推定することができたと仮定しましょう。観察データでも実験データでもよいのですが、ひとまず完璧なRCTを行った時のことを考えてみます。この場合、介入群とコントロール群のアウトカムの差を比較することで介入効果*1を知ることができます。例えば、血圧を下げる薬を飲んだ人たち(介入群)と薬を飲まなかった人たち、プラセボ薬を飲んだ人たち(コントロール群)をランダムに割り付けて、両群の血圧(アウトカム)を比較することで薬の効果を知ることができます。血圧の平均値を比較したとしましょう。*2

f:id:KRSK_phs:20170703004352p:plain

上記のような結果が得られたとしましょう。上の血圧が少し高めな人たちに血圧を下げる薬か偽の薬(プラセボ)をランダムに割付して飲んでもらったあとの血圧を測定しました。ちなみにランダム化が成功していれば実際に薬を飲む前の血圧は両群で差がないと予想されます(そしておそらく150mmHg)くらいです。

両群のアウトカムの差、150-130=20が介入効果となります。この数字は、「対象となった集団全員にこの薬を投与すると全体で血圧が平均20mmHg下がる」と解釈できます。このように統計的因果推論に基づいて推定された介入効果の解釈について詳しくはこちらの過去記事をご参照ください。

これは、統計モデルを使って以下のような回帰分析を行ったときに得られるβ1の解釈と同じです。Yが血圧、Xは1=介入群、0=コントロール群とするダミー変数。ちなみにβ0=150になるはずです。

f:id:KRSK_phs:20170703005033p:plain

 

交互作用を想定した場合

さて、この薬の効果ですが細かく見ると男女で効き目が違うことがわかりました。男女別に平均血圧を出すと以下のようになったとします。

f:id:KRSK_phs:20170703005940p:plain

この時、男性における介入効果が155-140=15 (mmHg)であるのに対して、女性における介入効果が145-120=25 (mmHg)となっています。要するに、この薬はどうも女性のほうが効きやすく男性ではあまり効果がなさそうだ、ということです。言い換えると、薬の介入効果が性別という変数のレベルに依存していることになります。この時、薬の介入効果と性別の間に交互作用があると言います。これを統計モデルで表すと以下のようになります。性別をA(1=男性, 0=女性)として

f:id:KRSK_phs:20170703010157p:plain

式に二つ新たに変数が追加されました。AとX*Aです*3。掛け算項(X*A)をモデルに含めることで交互作用を表現することができます。交互作用を想定しないモデルと比べて、推定されたβの解釈が大きく異なるので注意が必要です。 A=1、0をそれぞれ代入してみましょう。

A=1(男性)のとき

f:id:KRSK_phs:20170703013907p:plain

A=0(女性)のとき

f:id:KRSK_phs:20170703013944p:plain

先ほどの交互作用を想定していないモデルではβ1集団全体における薬の介入効果であったのに対して、今回のβ1は「女性における介入効果」と解釈することができます。言い換えると、「対象集団の女性全員にこの薬を投与すると、平均して血圧がβ1=25 mmHg下がる」といえます。

逆に「男性における介入効果」はβ1+β3であり、「対象集団の男性全員にこの薬を投与すると平均して血圧がβ1+β3=15 mmHg下がる」と解釈できます。

では、掛け算項の推定結果であるβ3はどのように解釈したらよいでしょうか。上記の解釈を見れば、直感的にβ3が男女における介入効果の差を表していることが分かると思います。β3=(β1+β3) - β1 = 15 - 25 = -15です。つまりβ3は「女性(A=0)と比較したときに、男性(A=1)における介入効果は15小さい」と解釈することができます。

このように掛け算項を含めることで、介入効果が他の変数によってどのくらい変わるのか、その交互作用の程度を知ることができます

ここまでが教科書に載っているような交互作用の基本です。

そもそもなぜ交互作用を見るのか?その目的は?

さて、効果が一様でない交互作用という現象はあらゆる介入効果において存在していそうです。しかも、細かく見ていけばきりがありません。例えば、薬の効果なんかは性別だけでなく年齢や体格などによっても変わってきそうです。

では、統計モデルのなかに交互作用は必ず含めなければいけないのでしょうか。それは分析の目的によるでしょう。シンプルに集団全体における介入・曝露因子の効果に関心がある場合は、基本的に交互作用を考慮する必要がないのではと個人的に思います。

逆に次のような目的で分析を行う場合には、交互作用を積極的に考慮したほうがよいかもしれません。

1.限られた資源で介入すべきサブグループを同定したい

 注目している集団全体に対して介入を行うことが可能な場合は、そんなに多くありません。たいてい人的・物的リソースが不足してしまいます。あらゆる人に投薬を行うことは難しいというわけです。

このように限られたリソースを活用して、アウトカムを改善するための効果的な介入策を考えるうえで交互作用を見てみる、というのは一つの手です。全員に投薬をするのが無理でも、特に薬の効果が高い集団(例:60歳以上の女性)を特定してその人たちを重点的に治療することで限られた資源を最大限に活用できます。

2.介入が悪影響を及ぼす集団を同定したい

 交互作用による介入・曝露因子の効果の違いは、薬が効きやすい・効きやすくないといった効果の強弱だけに限りません。効果の方向が変わる可能性だってあります。ちなみに疫学では、このように効果の向きを変えてしまう交互作用のことを質的交互作用(Qualitative interaction)と呼びます。

もし質的交互作用が存在していたら大問題です。病気を治す効果があると信じられている薬が、特定の条件をもった人たちには逆効果で健康を損ねてしまっているかもしれません。子どもの学業成績向上を狙った教育介入が、一部の子どもでは成績を下げてしまう効果をもつこともあるかもしれません。

質的交互作用によって効果の向きが変わるのであれば、介入が悪い影響をおよぼすと考えられるサブグループへの介入を避けるべきではないでしょうか。

3.介入・曝露因子の効果のメカニズムを知りたい

交互作用を検討することで、なぜ曝露因子がアウトカムに影響するのか、なぜある介入が効果を持つのか、その理由・メカニズムのヒントを得ることができるかもしれません。

介入・曝露因子の効果が別の要因に依存している(交互作用)場合、その第三の要因が何らかの形で介入・曝露因子が効果をもつメカニズムに関係していることがわかります。上記の例だと、ある薬が女性の方で効きやすいとわかれば、女性特有の何らかの特徴(性ホルモンなど)が薬が効き目を持つ機序に関わっているのでは?と考えることができるのです。

4.そもそも効果の違いに興味がある

異なる集団で効果が異なるかどうか自体に関心がある場合もあります。

ある介入が注目している集団(例:20-40代の男女)全体で効果があったとしても、交互作用のためにそのサブグループ(例:20代男性)では効果が全くないかもしれません。得られた知見がどれくらい他の集団に当てはまるか、その一般化可能性を検討するうえで交互作用は有効です。

また、格差」という視点から介入効果を考えるという点でも交互作用を確認することに意義があります。例えば、ある教育介入を行ったことで学校全体の学業成績が伸びたとしましょう。しかし、よくよく見てみれば成績が上がったのは親が裕福な家庭の子ども達のみで、貧しい家の子ども達は教育介入の恩恵を受けていないかもしれません(介入*親の所得の交互作用)。この場合、介入によって集団全体でのアウトカムが向上していても、同時にその内部で格差を拡大しているということになり、介入の改善を検討する必要が出てきます*4

5.曝露因子以外に介入する対象を見つける

注目している曝露因子が常に介入可能なものとは限りません。例えば、親の学歴が子どもの学業成績に影響を及ぼすことがわかったとしても、親の学歴は変えることができません(もちろん現在の子どもへの教育を改善して、将来親になる人たちの学歴に介入することはできますが)。

しかし、交互作用によって「たとえ親の学歴が低くても、〇〇がある子は学業成績がよい」という発見があるかもしれません。〇〇の部分が交互作用を引き起こす第三の要因になります。例えば、地域に安価な学習塾があることが影響しているかもしれません。この場合、メインの曝露因子(親の学歴)に介入ができなくても、交互作用を引き起こす第三の因子に介入(地域に安価な学習塾が増えるよう助成を出すなど)することで、望んでいる介入効果(親の学歴が低い子どもの学業成績を上げる)が得られる可能性があります。

また、曝露因子に介入できる場合でも、第三の因子にも介入することでメインの介入の効果を高めることができるかもしれません。

一点注意しなければいけないポイントがあります。交互作用をこのように解釈し、曝露因子のほかに介入すべき第三因子を特定するためには、後述する追加の条件を満たす必要があります。

 交互作用の分類

足し算交互作用と掛け算交互作用

数式を使った定義

交互作用と一口に言ってもいくつか種類があります。まずは足し算交互作用(additive interaction)掛け算交互作用(multiplicative interaction)の二つから紹介します。

以下の図では、投薬の有無(E)とある遺伝子の有無(G)の組み合わせごとに病気が治る(D)確率が示されています。この薬Eと遺伝子Gの交互作用について考えてみましょう。

f:id:KRSK_phs:20170705023205p:plain

この時、

G=0のときの介入によるアウトカムの:P01 - P00 = 0.05 - 0.02 = 0.03

G=1のときの介入によるアウトカムの:P11 - P10 = 0.15 - 0.04 = 0.11

Gの存在によって薬Eの効果がP11 - P10 - P01 + P00 = 0.11 - 0.03 = 0.08増加したことがわかります。これはまさに、Eの効果がGに依存している交互作用の例になります。このように、アウトカムの差に基づいて評価された交互作用をAdditive Interactionと呼びます。日本語では足し算交互作用とでもしておきましょう。

その程度はP11 - P10 - P01 + P00の式で求められ、統計モデルではlinear regressionにE*Gの掛け算項を含めた場合に得られます。疫学用語でいうと、リスク差に基づく交互作用です。

これに対して、

G=0のときの介入によるアウトカムの:P01/P00 = 0.05/0.02 = 2.5

G=1のときの介入によるアウトカムの:P11/P10 = 0.15/0.04 = 3.75

Gの存在によって薬Eの効果が[P11/P10] / [P01/P00] = 3.75/2.5 = 1.5倍になっていることがわかります。このように、アウトカムの比に基づいて評価された交互作用をMultiplicative Interactionと呼びます。同様に日本語では掛け算交互作用と呼ぶことにします。

リスク比やオッズ比に基づく交互作用であり、統計モデルでは、ロジスティック回帰やポアソン回帰などにE*G項を含めた場合に確認できるタイプの交互作用です。

上記の例のように、足し算交互作用と掛け算交互作用の両方が同時に存在する場合もあれば、片方しか存在しない場合もあります。ただ、数学的にどちらか片方は必ず存在することになります。

 足し算と掛け算、どちらを見るべきか?

足し算交互作用を見るのか、掛け算交互作用を見るのかによって全く異なる結論が得られる場合があります。

以下の表を考えてみましょう。先ほどの例から少しだけ数字をいじりました。G=0の人とG=1の人、それぞれ100人ずついるとします。しかし、使える薬は100人分しかありません。どちらを治療したらよいでしょうか?交互作用を使って考えてみましょう。

f:id:KRSK_phs:20170705030336p:plain足し算交互作用=P11-P10-P01+P00 = 0.02 > 0

掛け算交互作用=[P11/P10] / [P01/P00] = 0.5 <1
これはトリッキーな結果です。足し算交互作用を見た場合、Gが存在すると薬の効果が0.02増加することが分かるのでG=1の人たちを治療したほうがよさそうです。一方、掛け算交互作用を見た場合、Gが存在すると薬の効果が0.5倍(減少する)になることが分かるので、G=0の人たちを治療したほうがよいという結論に至ります。

全く逆の結論が得られました。結局どちらを治療したほうがよいのでしょうか。実際に片方のグループのみを治療した場合、全体でどれだけの数の人の病気を治せるのか計算してみましょう。

G=0の100人のみを治療した場合

100*0.05 (G=0の人が治療をうけると治る確率5%)+ 100*0.04 (G=1の人が治療を受けなかった場合治る確率4%)= 9人の病気が治る

G=1の100人のみを治療した場合

100*0.01 + 100*0.10 = 11人の病気が治る

よってG=1の人を優先して治療したほうが(G=1の人もG=0の人も含む)集団全体での効果が高くなることがわかります。すなわち、足し算交互作用の結果に従った方がより良い意思決定を行えることがわかります。

一般に、介入が集団全体に与える影響に関心がある場合は足し算交互作用を使った方がより意義のある結論が得られるとされています。

しかしこれは、あくまで集団全体での効果しか考えておらず、効果の分配・格差の問題に関心がある場合は逆に掛け算交互作用を見たほうがいいかもしれません。掛け算交互作用はそれ以外にも、介入・曝露因子が効果をもたらすメカニズムを理解する助けにもなります。

とはいえ、実際には統計モデルを使ってリスク比やオッズ比を計算することが多いでしょう。このようなモデルから得られるのは基本的に掛け算交互作用ですが、それでも足し算交互作用を知りたいという場合があるかもしれません。実はリスク比・オッズ比から足し算交互作用を直接計算する方法があります。詳細は割愛しますが、Relative Excess Risk due to Interaction または RERIと呼ばれるものです。参考文献をご参照ください。

因果交互作用と効果修飾

足し算vs掛け算以外にも交互作用の分類があります。

以下に紹介するのは、交互作用を見る目的として上に挙げたもののうち、最後の「曝露因子以外に介入する対象を見つける」ための交互作用分析を行ううえで必要な区別です。

曝露因子への介入が難しいときでも、曝露因子と交互作用のある第三の因子に介入することでアウトカムを変化させることができる可能性があります。また第三因子に介入することでメインの介入の効果を高めることができるかもしれません。

ある曝露因子X(例:IQ)がアウトカムY(例:将来の年収)に与える影響について、第三の因子Q(例:読書量)との交互作用を考えていきます。データ分析の結果、全体的にIQが高いことが将来の高年収につながるという効果を見つけたとします。さらに、IQと読書量の交互作用を見た結果、IQが年収に与える影響は読書量が多いひとの間で大きいことがわかりました。

さて、介入によってIQを変えることは難しそうです。ですが、介入によって読書量を増やすことはできそうです。はたして、読書量への介入によって将来の年収を上げることができるのでしょうか?

通常の交互作用分析で見ることができるのは以下の式です(足し算交互作用の場合):

f:id:KRSK_phs:20170705042736p:plain

上記の式が意味わからんって方はこちらの記事か参考文献をご参照ください。もちろん、曝露因子Xの平均因果効果を見るための条件がそろっているという前提です。

要するに二つのグループにおける介入効果を比較しているだけです。ここからいえるのはQ=1の人とQ=0の人で介入効果がどれくらい違うか、だけです。交互作用を見る目的のうち、「介入すべきサブグループの特定」なんかの目的を果たすことができますが、Qへの介入が効果を持つかどうかはわかりません。

このようにグループ間における介入効果の違いを見ている交互作用を効果修飾(Effect modification / effect heterogeneity)と呼びます。*5

ここから一歩進んで、第三因子Qへの介入を考えます。Qに介入することでアウトカムにY影響するためには、QーY間に交絡が一切存在しないことが条件になります。この条件が満たされたとき、上記の式は

f:id:KRSK_phs:20170705044041p:plain

になります。この場合、曝露因子Xがそのままでも第三因子Qに介入することでアウトカムYに影響を与えることができます。このような交互作用を因果交互作用(Causal Interaction)と呼びます。

抑えるべきポイントが2つあります。

① 2セットの交絡因子の測定が必要

通常、統計的因果推論を行う際には曝露因子とアウトカムの間の交絡因子をすべて測定・その影響を除去する手順を踏まなければいけません。Effect heterogeneityであってもcausal interactionであってもこれは変わりません。

しかし、causal interactionを見るためにはさらにもう一セット交絡因子の測定・対処が必要です。それは交互作用をもたらす第三因子QとアウトカムYの関連にバイアスをもたらす交絡因子です。

例えば、完璧なランダム化比較試験(RCT)であっても、これら二つのうち前者の交絡の問題しか保証されません。Q-Y間の交絡因子に関するデータを追加でとる必要があります。したがって、RCTから得られたデータから交互作用を検討しても、それをcausal interactionとして解釈できるとは限りません。

② Effect heterogeneityとしては常に解釈できる

Effect heterogeneityとcausal interactionは前者が後者を内包する関係にあります。言い換えると、causal intearactionはeffect heterogeneityの特別なパターンであり、causal interactionでないものも含めてあらゆる交互作用はeffect heterogeneityとして解釈できます。介入がより効果的なサブグループや介入が悪影響を及ぼすサブグループを特定するという目的で交互作用を解釈するのは、常に可能ということです。

 

交互作用をマスターすることでより幅広いリサーチクエスチョンに答えることができるようになるだけでなく、現実世界の複雑さを反映した柔軟な分析や現場のニーズに即した介入方法の提案を行うことができるようになると思います。

参考文献

交互作用に関する教科書は以下のものが良いと思います。ハーバード公衆衛生大学院の疫学・生物統計学教授のTyler Vanderweele*6によるInteractionとmediation analysisの本です。サバティカル中に地中海で書き上げたそうです。実装のためのプログラミングコードも載っています。たしかSAS。Mediationについても近々ブログ書きます。

Explanation in Causal Inference: Methods for Mediation and Interaction

Explanation in Causal Inference: Methods for Mediation and Interaction

 

因果推論についての基本は以下の無料の本がわかりやすく書かれています。

https://www.hsph.harvard.edu/miguel-hernan/causal-inference-book/

RERIやリスク比・リスク差など疫学独特の用語を学びたければ、以下の書籍が王道です。少し難解。

Modern Epidemiology

Modern Epidemiology

  • 作者: Kenneth J. Rothman,Timothy L. Lash Associate Professor,Sander Greenland
  • 出版社/メーカー: LWW
  • 発売日: 2012/12/28
  • メディア: ハードカバー
  • この商品を含むブログを見る
 

 

 

*1:平均因果効果:average causal effect

*2:必ずしも平均値を見ることが正しい選択とは限りませんので、本当は血圧データの分布をみて比較方法を検討したいところです

*3:ちなみにAは必ずしも追加しなくてもよいです。今回はベースライン(コントロール群)で男女に差があった(155vs145)ので追加しています。

*4:まあ、格差が出ようが全体のパフォーマンスがあがればOKという見方もあります。そこは、依拠しているバリューの違いだと思います。

*5:なお、effect modificationのほうは後述のcausal interactionと同じ意味で使われることもありますが、今回は区別しています。

*6:先日書いた感度分析も彼のアイデアです