Evaluation and accurate diagnoses of pediatric diseases using artificial intelligence

Nature関連誌今週のハイライトに載っていて目に止まったので読んだ。が、なんとなくタイトルは誇大表現な気がする。F1スコアで0.9とか数字上は良い数字が並んでいる。 Evaluation and accurate diagnoses of pediatric diseases using artificial intellige…

2019-02-20

Factorization Machine

美しい強調フィルタリングからFactorization Machineの流れ強調フィルタリングやFactorization Machineは、今やレコメンドエンジンを作る上で欠かせない技術です。 Factorization Machineはニューラルネット拡張やら行列の高速計算など発展著しく、Deep、Em…

2019-02-17

機械学習モデルの判断基準を可視化する：SHAP

メモ

SHAP関連のarticleとしては2本上が2017年でKernelSHAP, DeepSHAPなどについて．下が2018年でTree ensembleモデルについてのもの．今回のメモは下のTree SHAPについての論文． A Unified Approach to Interpreting Model Predictions https://arxiv.org/abs…

2018-12-22

【論文メモ】Linguistically-Informed Self-Attention for Semantic Role Labeling

論文メモ

qiita.com EMNLP2018のベストペーパー4本のうちの1本です。上記の日本語解説が詳しいのですが、マルチタスクなのと自然言語処理系の一見よく似たタスクがいろいろ出てくるので自分を含む自然言語処理初心者には全体像が掴みづらい（掴みづらかった）のです…

2018-12-22

不均衡データを扱うサンプリング以外の方法

機械学習

不均衡データの扱いは要注意で、盲目的にbinary cross entropy lossなどを採用すると全部正と予測する役に立たないモデルができあがりがちというのは有名な話。これはlossが全データの和・平均・期待値をとっていることを忘れてしまって、本来最適化したいm…

2018-12-22

attentionは何を見ているのか？

今週のWeekly machine learningで素晴らしい記事が紹介されていた。 https://www.getrevue.co/profile/icoxfog417/issues/weekly-machine-learning-103-150407?utm_campaign=Issue&utm_content=view_in_browser&utm_medium=email&utm_source=piqcy Deconstru…

2018-12-19

バリデーションセットのサンプル数

機械学習

Train / Dev / Test sets - Practical aspects of Deep Learning | Coursera Stack Overflowの海を彷徨っていて、Andrew先生の動画に辿り着いた。やっぱりこのCourseraのコース１回しっかりやるべきか。訓練用セットと検証用セット、テストセットをどう分割…

2018-12-19

時系列データにCross validationするときの注意点

機械学習

はじめに論文ではなく、以下の記事から。 towardsdatascience.com splitting a time series without causing data leakage using nested cross-validation to obtain an unbiased estimate of error on an independent test set cross-validation with data…

2018-12-02

【論文メモ】Adaptive Input Representations for Neural Language Modeling

論文メモ

slackで流れてきたQiitaのアドベントカレンダーに参加してみました。12/1が欠番なのでトップバッターに。 qiita.com Adaptive Input Representations for Neural Language Modeling | OpenReview [1809.10853] Adaptive Input Representations for Neural La…

2018-11-30

【論文メモ】Dynamic Evaluation for Neural Sequence Models

論文メモ

[1709.07432] Dynamic Evaluation of Neural Sequence Models 文体などは一文の中で一定であり、文の前半でも学習させることで文後半での精度が上昇するというアイデア。 n単語（論文中のmodelではn=5）ごとにパラメータの更新を行うdynamic evaluation (⇔ s…

2018-11-30

multi-label learningについてメモ

機械学習

マルチラベル分類（多ラベル分類）についてメモ。 BERTでNTCIR-18 MedWebを解かせてみた。各データに対して8個のラベルの正負が割り当てられており、それらを予測するタスク。最終的なembeddingから8出力の全結合層→sigmoid functionで8つのラベルを得てcros…

2018-11-22

【論文メモ】 Importance of Self-Attention for Sentiment Analysis

論文メモ

BERTが世間を賑わせていますが、そもそもself-attentionって何してるんだか良くわからないんだよね…。ということで、EMNLP2018からself-attentionについての論文です。概要 self-attentionを使ったmodelを - Topic classification - Sentiment analysis に…