Rubinの因果モデル

割り付けられなかった側の測定されない未来の結果を欠損値として、もしそれが観測された時の値との差を因果効果として設定。いくつかの仮定をおいてそれを求めていく因果推論の枠組み。

CATE

conditional average treatment effect. サブグループ内での平均因果効果。これを推定したいことが多い。サブグループ内での割付が結果と独立（CIA：conditional independence assumption, or unconfoundedness assumption)でないと求められない。

propensity score

傾向スコア。Xiに対してtreatmentがなされる確率。

uplift modeling

X全体にたいしてのCATEではなく、個々のXに対するCATEのうちX全体に対するCATEからの上乗せ分をモデル化する。（全体で0.2の確率で効果がありますよ、ではなく、Aさんは0.1の確率で、Bさんは0.3の確率で…と個々に対する'Uplift'を求めたい）。

The two-model approach

treatment groupとcontrol groupを別にモデル化し差を取る。個々のモデルの性能がよくても、あくまで差をモデル化しているわけではないので、以下2つの方法よりもupliftの予測については性能が劣ることが指摘されているとのこと。

The class transformation method

binary outcomeの場合のみ。治療したのに発症したケース、治療してないのに発症していないケースをZi=1, それ以外の時をZi=0として、Ziをtargetとしてモデル化する。このとき、Xiに対するCATE：τ(Xi)は、2P(Zi=1|Xi)-1 で求められる、らしい。上記は、treatmentがbalancedなときのみだが、propensity scoreを用いてunbalancedなときへの拡張(Yi*)もしられている。

boil down to 〜: 詰まるところ〜になる

modeling uplift directly

既存の機械学習モデルを用いて、と書いてあるが具体的にはよくわからない。 'honest' approachとして、半分でモデル化し、半分で検証する方法の記載も。

Evaluation

traditional uplift metrics

個々人についてのtreatment/control outcomeは両方を観測することはできないので、uplift bins or uplift curveで評価する an idea of the uplift gain per decile Qini value いわゆるAUUCの話？

Metrics based on Y*

the class transformation methodで出現したY*に対するmetrics.

Two-model approachとtraditional uplift metricsは分かるが、それ以外のところが結局よく分からなかった。

勉強の記録

機械学習、情報処理について勉強した事柄など

uplift modeling

Rubinの因果モデル

CATE

propensity score

uplift modeling

The two-model approach

The class transformation method

modeling uplift directly

Evaluation

traditional uplift metrics

Metrics based on Y*