Unboundedly

統計的因果推論・疫学についてのお話

因果推論

「教科書が教えてくれない『交絡』の話」の講義資料を公開しました

先日オンラインセミナーで交絡に関するレクチャーをしました。 合計1000人以上に参加していただき、ありがとうございました。 当日の講義資料を公開します。 交絡とは何か、どうやって調整変数を選ぶか、(観察データ分析をする限り必ず生じる)未調整交絡が…

Target trial emulationの講義資料を公開します

近々トークがあるので作成した資料を公開します(諸事情で今回は英語で作成しました)。 テーマは「Target trial emulation」というもの。 疫学界隈でじわじわ流行り出しているフレームワークで、評価したい因果効果をみるのに理想的なRCT(target trial)をイ…

因果推論における「調整変数の選び方」に関する講義資料を公開しました

先日某所で「調整変数の選び方」というテーマで話をする機会をいただきました。 せっかくなので作った資料を公開します。 回帰分析をするときになにを調整したらよいかわからない・・・ 頑張って調整しても結局未測定交絡があるから結局実験じゃないと・・・…

モデルに基づく因果推論の各種手法をRで実装&結果を比較してみた

因果推論のための分析手法は様々ありますが、回帰モデルを使った主なアプローチのRでの実装方法とその推定結果の比較をします。 モチベーション的な部分は以下をご参照ください。 シミュレーションデータを使って、各手法がどのような(主にモデリングに関す…

時間によって変化する因子(Time-varying Treatment)の効果推定:なぜ必要か?

今回は曝露(Exposure)・治療因子(Treatment)が時間によって変化する時、複数時点での曝露・治療が与える効果を推定するための方法や考え方についてまとめます。 一般に「因果推論」の文脈で扱われるのは、ある一時点で測定された治療因子の効果推定がほとん…

回帰モデルを用いた因果推論のための推定手法について講義資料を公開しました

日本疫学会開催のセミナーで因果推論について60分のショートレクチャーをしました。 講義資料を公開します(本記事の一番下)。 質疑も盛り上がり楽しかったです、参加してくださった方ありがとうございました。 ボストン時間3AM~だったのでなかなかキツかっ…

観察データでランダム化比較試験を模倣する〜Target Trialという考え方〜

疫学における因果推論の究極の目的は「注目している集団に対する介入の効果を定量化する」というものです。*1 この「介入」の存在を強く意識しているのがいわば疫学の因果推論の特徴かもしれません。 ところが観察データを用いた因果推論は克服すべき課題が…

回帰分析における「調整変数」の選び方:実践編

回帰分析を用いて「●●の効果を推定する」ことに取り組んだことがある人は多いのでは無いかと思います。 回帰モデルには「調整変数」として、年齢・性別・教育歴・(医学研究の場合は)既往歴などなど様々な要因を投入して、その影響を"補正"しますよね。 今…

データの質が分析結果に与える影響について:「誰から」「なにを」「どのように」測定したのか?

データ分析に関する議論では「データをどのように分析するか」「どうやって、どのような統計的手法を用いるか」といった話題が中心です。 例えば統計的因果推論のための分析方法に関する書籍やブログ記事はたくさんありますが、「どうやって傾向スコアを使う…

傾向(プロペンシティ)スコアの各使用法の仮定・解釈の違いを比較してみた

観察データを用いた因果推論のための分析手法として非常に人気の「傾向スコア(Propensity Score)」法。 「傾向スコアを用いた分析」と言っても、マッチングや重み付けなどその使い方は様々あります。 巷にある因果推論に関する書籍では、傾向スコアを”どうや…

データから得られた知見は実在集団に当てはまるか?外的妥当性について少し深く考えてみた

データ分析をおこなう人のほとんどは「一般化可能性」とか「外的妥当性」という言葉を耳にしたことがあると思います。 例えば次のような議論を聞いたことがないでしょうか。 ・「アメリカ人のデータから●●を食べると死ににくいことがわかった」→「いやいや、…

Consistency:「●●の効果」が1つに決まらない?~見過ごされがちな因果推論の仮定~

今回は統計的因果推論の重要な仮定の1つであるConsistencyについてまとめます。 「因果推論」というと、交絡・選択バイアスといった問題の議論に終始することが多いです。それに対して、Consistencyの重要性は見過ごされがちです。 端的に言えば、「そもそ…

回帰分析を使った因果推論の仮定:パラメトリックモデルを使うということ

お久しぶりです。冬休みなので、以前Twitterでとったアンケートで一番人気だった内容について書きます。 今回は統計“モデル”を使うことの意味について因果推論の視点からまとめてみようと思います。普段なんとなく回帰分析を使っている人は一読をおススメし…

「世界一高いIQ」が生んだ謎、モンティホール問題はなぜパラドックスなのか

今回は、前回紹介したシンプソンのパラドックスと同じくらい有名な統計トリック、モンティホール問題について書きます。確率的に正しいことと、我々人間の直感が大きく食い違うシチュエーションの非常に良い例だと思います。 モンティホール問題についての解…

データ分析の不思議、シンプソンのパラドックスを統計的因果推論から考える

今回は統計学で有名な「シンプソンのパラドックス」という問題について紹介したいと思います。簡単にいえば、同じデータでも分析の仕方によって全く矛盾したように見える結果が得られるというお話です。データだけ見ると、信じがたいような直感に反する現象…

統計的因果推論のためのPythonライブラリDoWhyについて解説:なにができて、なにに注意すべきか

機械学習など主に予測を目的とした統計手法に強いイメージのPythonでしたが、統計的因果推論を行うためのライブラリ、“DoWhy”がついにリリースされました。 DoWhy | Making causal inference easy — DoWhy | Making Causal Inference Easy documentation こ…

因果効果のメカニズムを検討する:媒介分析(Causal Mediation Analysis)入門②~反事実モデルに基づく媒介効果の定義~

媒介分析シリーズ、第二段です。前回は、よく使われる媒介分析の手法の問題点についてまとめました。 今回は、これらの問題を克服するべく考案された因果媒介分析(Causal Mediation Analysis)を紹介するイントロとして、そもそも「媒介効果」なるものをどう…

データから因果関係をどう導く?:統計的因果推論の基本、「反事実モデル」をゼロから

データに基づく因果推論がどのように行われるのか、詳しく説明していきます。因果の定義、因果推論に必要な条件、RCTの意義などいろいろまとめていたら、例のごとくすごいボリュームになってしまいました。なお、本記事で使われる用語は、「疫学」の因果推論…

炭水化物は体に悪い?脂質をたくさん摂るほど健康に良い?:2017年世界一に選ばれた科学論文を解説

久しぶりのブログ更新です。今回は、「炭水化物を摂取すると死亡率があがる」「脂肪はたくさん摂っても死亡率に影響がない」ことを示したとして2017年世界中で話題になった以下の論文について、論文自体の問題点やメディアで取り上げられている内容の誤りに…

観察データを用いた因果推論で生じるバイアスの程度を考える:感度分析(Sensitivity analysis) & "E-value"入門

さて、今回からイデオロギー色の少ないブログ活動に戻ります。前回の受動喫煙に関する記事の中で、「感度分析("Sensitivity Analysis")」というテクニックを紹介しました。 どうも私の言葉足らずか、このテクニックに関して多くの方に誤解と混乱を招いたよ…

受動喫煙防止法について論点整理②:サイエンス × 価値観 ≒ 政治でつくるザッカーバーグ的理想世界

なんだか壮大なタイトルになりました(笑) 前回は「受動喫煙による健康影響・死亡数」なるものがどうやって計算されていてるか、どの程度信用できる数字なのかについて整理しました。この辺りは、私の専門性が少しだけ活きてくる部分であり、(少なくとも私が…

受動喫煙防止法について論点整理①:受動喫煙による健康リスク・死亡者数の推定はどのくらい信用できるか?

受動喫煙の防止策として、室内全面禁煙を目指す厚労省側とそれに反発する自民たばこ議連が争っています。本件に関しTwitter上でも、なかなか面白いディスカッションがおきています。 室内禁煙による受動喫煙対策は「科学的根拠(エビデンス)」に基づくもの…

【点と矢印で因果関係を考える】因果関係がないときにデータから関連が生じるパターンとその対策まとめ:因果ダイアグラム(DAG)によるバイアスの視覚的整理

よく「因果関係と相関関係は違う」といいますが、具体的にどのような場合に両者が一致しない(バイアスが生じる)のかをDAGをつかって整理します(簡単にそれぞれのバイアスへの対応策にも言及しますが、各手法の詳細は別の機会に譲ります)。

"矢印"をつかって因果関係を視覚的に整理する:因果ダイアグラム(DAG)入門②〜読み方・書き方の基本ルール〜

前回は因果ダイアグラム(DAG)という概念の導入として、そもそもなぜDAGが必要とされるのかについて書いてみました。 今回はDAGシリーズ第二弾として、実際にDAGを”書いて”いくうえでの基本ルールとDAGの”読み方”について整理してみようと思います。DAGの読…

"矢印"をつかって因果関係を視覚的に整理する:因果ダイアグラム(DAG)入門①〜なぜDAGが必要なのか〜

今回はDirected Acyclic Graph(DAG)と呼ばれるものについて書いてみようと思います。「ダグ」と読みます。日本語では「非巡回有向グラフ」とかいうなんだか難しそうな名前で呼ばれているようです。DAGが何かを一言で説明するとすれば「いろいろな要因を矢印…