勉強の記録

機械学習、情報処理について勉強した事柄など

個人因果効果を推測する②

github.com

Microsoftによる因果推論ライブラリEconMLのなかの一つのモデル.

econml.azurewebsites.net

documentのdeep instrumental variablesの項目に簡潔にまとまっている.

ひとことで言うと,

操作変数モデルにおいて各stageにNNを使用したモデル

メリット

unconfoundedness assumptionが要らない

デメリット

操作変数が必要.

つまり

まず1段目のNNで操作変数+X → treatmentを学習する

そして2段めのNNでtreatmentとXからoutcomeを学習する.この2段めの学習の際に積分が残っているので,サンプリングして対処しているらしい.

因果効果が一定という仮定をおいておらず,個人因果効果が推定できる.

また,hyper-parameter tuningのため,out-of-sample validationをしている.counterfactualだが2 stageに分けているのでいずれのstageでもそのまま計算することでvalidationが可能とのこと.

感想

操作変数さえあれば有用そうだけど,なかなか良い操作変数を見つけるのが大変と思う.

そもそも操作変数って何?

healthpolicyhealthecon.com

書籍であれば,『調査観察データの統計科学(星野崇裕)』がおすすめ. https://www.amazon.co.jp/dp/4000069721

もしくは元論文であるHartford+ 2014のsection 2に,一般的な操作変数についてかなり丁寧に書かれていた.