勉強の記録

機械学習、情報処理について勉強した事柄など

モデルの不確実性:Analyzing the Role of Model Uncertainty for Electronic Health Records

arxiv.org

医療などの最終判断が極めて大きな意味を持つタスクにおいては最終的なモデルの出力だけではなく、それがどの程度確信を持った出力なのかが重要。そこにはdata uncertaintyと、model uncertaintyがある。

同グループから既報のMIMIC-IIIというICU電子カルテ公開データからRNNで死亡率を予測するタスクにおいて、

・random seedを振った200個のRNNから各サンプルごとの予測値の経験分布を得る

ベイズ深層学習を用いてパラメータの分布を直接学習する

という2つの方法でmodel uncertaintyを検証。その分布はよく似ており、サンプルによってsdの広い分布と、狭い分布があり、サンプルごとのmodel uncertaintyの違いを反映しているのではという結果。ベイズ深層学習モデルから、どのfeatureがmodel uncertaintyに寄与していたかをみる解析では、出現頻度の低い単語(モデルに自然言語処理モデルも内包している)のパラメータほどmodel uncertaintyへの寄与が大きい傾向にあったとのこと。

以下私見&コメント

このmodel uncertaintyの定義だと、figure2の通りmeanが0.5に近いほど大きくなる。Fig3右、Fig5右についてはmeanの影響が無視できないので、meanが等しいもの同士の比較をもっと載せてほしかった。あとはサンプルごとのmodel uncertaintyの推定が重要という主題とはずれるが、これだけ出力がブレるならensembleしないと怖いな、という印象。ensembleした上で、閾値を何割のモデルが上回っているかで切るなどするとうまくmodel uncertaintyを取り込んだ判断ができそう。

ベイズ深層学習はまだよく分かってないので、勉強したい。

このRNNモデルは確か電子カルテ中のデータをほぼ全部入れたみたいな巨大なモデルだったので、それを200個気軽に実験できるのはさすがgoogleといったところ。

なお、MIMIC-IIIの概観については以下のQiitaが手っ取り早い。

qiita.com