勉強の記録

機械学習、情報処理について勉強した事柄など

Uplift modeling for clinical trial data

http://people.cs.pitt.edu/~milos/icml_clinicaldata_2012/Papers/Oral_Jaroszewitz_ICML_Clinical_2012.pdf

Uplift modeling for clinical trial data [ICML2012]

先日の「仕事のための機械学習」を読んでからUplift modelingを調べている. web界隈で有名な解析方法のようだけど,これ医療のRCTにもそのまま使えるよなと思っていたら,2012年ICMLにpaperがあった.

メモ

4章. Augmenting uplift modeling using treatment and control classifiers

は,RCTのみならず観察研究にもUplift modelingを適用できるということなのだろうか.

baseには半教師あり学習のco-training(Blum, 1998)を使っているとのこと.

参考:半教師あり学習_Semi-Supervised Learning (Vol.20)

Notationがややわかりにくいので以下に.

DT:treatment dataset

DC:control dataset

DcT:treatment dataset for classifier

DcC:control dataset for classifier

DuT:treatment dataset for uplift model

DuC:control dataset for uplift model

MUuplift model (class transformation methodを使って,一つの確率モデルで定式化する.本文3章参照.X→uplift(=2z-1))

MT:classifier on treatment (DT上でのoutcome Yの確率予測モデル.X→y)

MC:classifer on control (DC上でのoutcome Yの確率予測モデル.X→y)

うーん,step 7,8がよく分からない. (式の上ではわかるのだけど,なぜそれでうまくの行くのかが....)