勉強の記録

機械学習、情報処理について勉強した事柄など

【論文メモ】Dynamic Evaluation for Neural Sequence Models

[1709.07432] Dynamic Evaluation of Neural Sequence Models f:id:tmitani-tky:20181130004743p:plain

文体などは一文の中で一定であり、文の前半でも学習させることで文後半での精度が上昇するというアイデア。 n単語(論文中のmodelではn=5)ごとにパラメータの更新を行うdynamic evaluation (⇔ static evaluation)を行った。

f:id:tmitani-tky:20181130004226p:plain

Penn TreebankやWikitext-2でのperplexityにおいてmixture of softmaxが出るまでのstate-of-the-art。 github.com