Uplift modeling for clinical trial data
Uplift modeling for clinical trial data [ICML2012]
先日の「仕事のための機械学習」を読んでからUplift modelingを調べている. web界隈で有名な解析方法のようだけど,これ医療のRCTにもそのまま使えるよなと思っていたら,2012年ICMLにpaperがあった.
メモ
4章. Augmenting uplift modeling using treatment and control classifiers
は,RCTのみならず観察研究にもUplift modelingを適用できるということなのだろうか.
baseには半教師あり学習のco-training(Blum, 1998)を使っているとのこと.
参考:半教師あり学習_Semi-Supervised Learning (Vol.20)
Notationがややわかりにくいので以下に.
DT:treatment dataset
DC:control dataset
DcT:treatment dataset for classifier
DcC:control dataset for classifier
DuT:treatment dataset for uplift model
DuC:control dataset for uplift model
MU:uplift model (class transformation methodを使って,一つの確率モデルで定式化する.本文3章参照.X→uplift(=2z-1))
MT:classifier on treatment (DT上でのoutcome Yの確率予測モデル.X→y)
MC:classifer on control (DC上でのoutcome Yの確率予測モデル.X→y)
うーん,step 7,8がよく分からない. (式の上ではわかるのだけど,なぜそれでうまくの行くのかが....)