今回は統計学で有名な「シンプソンのパラドックス」という問題について紹介したいと思います。簡単にいえば、同じデータでも分析の仕方によって全く矛盾したように見える結果が得られるというお話です。データだけ見ると、信じがたいような直感に反する現象…
機械学習など主に予測を目的とした統計手法に強いイメージのPythonでしたが、統計的因果推論を行うためのライブラリ、“DoWhy”がついにリリースされました。 DoWhy | Making causal inference easy — DoWhy | Making Causal Inference Easy documentation こ…
媒介分析シリーズ、第二段です。前回は、よく使われる媒介分析の手法の問題点についてまとめました。 今回は、これらの問題を克服するべく考案された因果媒介分析(Causal Mediation Analysis)を紹介するイントロとして、そもそも「媒介効果」なるものをどう…
データに基づく因果推論がどのように行われるのか、詳しく説明していきます。因果の定義、因果推論に必要な条件、RCTの意義などいろいろまとめていたら、例のごとくすごいボリュームになってしまいました。なお、本記事で使われる用語は、「疫学」の因果推論…
お久しぶりです。無事に博士課程の進級試験(qualifying exam)を通過しましたので、ようやく長かった二年間のコースワーク期間が終わりました。まだ口頭試験がありますが、これからやっと研究に集中できるフェーズに入ります。同時に時間にも余裕ができてき…
久しぶりのブログ更新です。今回は、「炭水化物を摂取すると死亡率があがる」「脂肪はたくさん摂っても死亡率に影響がない」ことを示したとして2017年世界中で話題になった以下の論文について、論文自体の問題点やメディアで取り上げられている内容の誤りに…
今回は「交互作用(interaction)」と呼ばれる概念について書いていきます。端的に言えば、”人によって効果が違う”という現象を見る統計学の考え方だと思います。例えば「薬Aが病気Dのリスクを10パーセント下げる」といったとき、実はその薬は女性では効果が…