Unboundedly

日々大学院で学んだこと、考えたことを更新

データの質が分析結果に与える影響について:「誰から」「なにを」「どのように」測定したのか?

データ分析に関する議論では「データをどのように分析するか」「どうやって、どのような統計的手法を用いるか」といった話題が中心です。 例えば統計的因果推論のための分析方法に関する書籍やブログ記事はたくさんありますが、「どうやって傾向スコアを使う…

傾向(プロペンシティ)スコアの各使用法の仮定・解釈の違いを比較してみた

観察データを用いた因果推論のための分析手法として非常に人気の「傾向スコア(Propensity Score)」法。 「傾向スコアを用いた分析」と言っても、マッチングや重み付けなどその使い方は様々あります。 巷にある因果推論に関する書籍では、傾向スコアを”どうや…

データから得られた知見は実在集団に当てはまるか?外的妥当性について少し深く考えてみた

データ分析をおこなう人のほとんどは「一般化可能性」とか「外的妥当性」という言葉を耳にしたことがあると思います。 例えば次のような議論を聞いたことがないでしょうか。 ・「アメリカ人のデータから●●を食べると死ににくいことがわかった」→「いやいや、…

統計的因果推論入門の講義資料を公開しました

去年末に日本に帰国した際、ありがたいことに多くの方から因果推論に関するレクチャーの依頼をいただきました。 本当はこの春にも帰国してトーク予定だったのですが、コロナ渦でタイミングを逸したので思い切って講義資料を公開することにしました。 ツイッ…

Consistency:「●●の効果」が1つに決まらない?~見過ごされがちな因果推論の仮定~

今回は統計的因果推論の重要な仮定の1つであるConsistencyについてまとめます。 「因果推論」というと、交絡・選択バイアスといった問題の議論に終始することが多いです。それに対して、Consistencyの重要性は見過ごされがちです。 端的に言えば、「そもそ…

選択(セレクション)バイアスとは?人によって定義が違うので整理してみた。

疫学と経済学、どちらもある要因Xがある要因Yに与える因果的な効果の大きさを推定する「因果推論」に関心があることが多いです。 「選択(セレクション)バイアス」「交絡」「内生性」、多くの用語が因果推論で登場します。 ところが、話をしているとどうも噛…

回帰分析を使った因果推論の仮定:パラメトリックモデルを使うということ

お久しぶりです。冬休みなので、以前Twitterでとったアンケートで一番人気だった内容について書きます。 今回は統計“モデル”を使うことの意味について因果推論の視点からまとめてみようと思います。普段なんとなく回帰分析を使っている人は一読をおススメし…