Uplift modeling for clinical trial data [ICML2012]

先日の「仕事のための機械学習」を読んでからUplift modelingを調べている． web界隈で有名な解析方法のようだけど，これ医療のRCTにもそのまま使えるよなと思っていたら，2012年ICMLにpaperがあった．

メモ

4章. Augmenting uplift modeling using treatment and control classifiers

は，RCTのみならず観察研究にもUplift modelingを適用できるということなのだろうか．

baseには半教師あり学習のco-training(Blum, 1998)を使っているとのこと．

Notationがややわかりにくいので以下に．

D^T：treatment dataset

D^C：control dataset

Dc^T：treatment dataset for classifier

Dc^C：control dataset for classifier

Du^T：treatment dataset for uplift model

Du^C：control dataset for uplift model

M^U：uplift model (class transformation methodを使って，一つの確率モデルで定式化する．本文3章参照．X→uplift(=2z-1)）

M^T：classifier on treatment (D^T上でのoutcome Yの確率予測モデル．X→y）

M^C：classifer on control (D^C上でのoutcome Yの確率予測モデル．X→y）

うーん，step 7,8がよく分からない．（式の上ではわかるのだけど，なぜそれでうまくの行くのかが...．）

勉強の記録