Unboundedly

日々大学院で学んだこと、考えたことを更新

観察データでランダム化比較試験を模倣する〜Target Trialという考え方〜

疫学における因果推論の究極の目的は「注目している集団に対する介入の効果を定量化する」というものです。*1 この「介入」の存在を強く意識しているのがいわば疫学の因果推論の特徴かもしれません。 ところが観察データを用いた因果推論は克服すべき課題が…

回帰分析における「調整変数」の選び方:実践編

回帰分析を用いて「●●の効果を推定する」ことに取り組んだことがある人は多いのでは無いかと思います。 回帰モデルには「調整変数」として、年齢・性別・教育歴・(医学研究の場合は)既往歴などなど様々な要因を投入して、その影響を"補正"しますよね。 今…

データの質が分析結果に与える影響について:「誰から」「なにを」「どのように」測定したのか?

データ分析に関する議論では「データをどのように分析するか」「どうやって、どのような統計的手法を用いるか」といった話題が中心です。 例えば統計的因果推論のための分析方法に関する書籍やブログ記事はたくさんありますが、「どうやって傾向スコアを使う…

傾向(プロペンシティ)スコアの各使用法の仮定・解釈の違いを比較してみた

観察データを用いた因果推論のための分析手法として非常に人気の「傾向スコア(Propensity Score)」法。 「傾向スコアを用いた分析」と言っても、マッチングや重み付けなどその使い方は様々あります。 巷にある因果推論に関する書籍では、傾向スコアを”どうや…

データから得られた知見は実在集団に当てはまるか?外的妥当性について少し深く考えてみた

データ分析をおこなう人のほとんどは「一般化可能性」とか「外的妥当性」という言葉を耳にしたことがあると思います。 例えば次のような議論を聞いたことがないでしょうか。 ・「アメリカ人のデータから●●を食べると死ににくいことがわかった」→「いやいや、…

統計的因果推論入門の講義資料を公開しました

去年末に日本に帰国した際、ありがたいことに多くの方から因果推論に関するレクチャーの依頼をいただきました。 本当はこの春にも帰国してトーク予定だったのですが、コロナ渦でタイミングを逸したので思い切って講義資料を公開することにしました。 ツイッ…

Consistency:「●●の効果」が1つに決まらない?~見過ごされがちな因果推論の仮定~

今回は統計的因果推論の重要な仮定の1つであるConsistencyについてまとめます。 「因果推論」というと、交絡・選択バイアスといった問題の議論に終始することが多いです。それに対して、Consistencyの重要性は見過ごされがちです。 端的に言えば、「そもそ…