勉強の記録

機械学習、情報処理について勉強した事柄など

勉強会メモ『第2回 言語処理研究会 「自然言語処理の中長期研究構想を論じる会」』

情報処理学会自然言語処理研究会(通称:NL研)が主催した上記の勉強会に参加してきた。 自然言語処理研究者5人によるシンポジウム形式。

nl-ipsj.or.jp

1 「対話システムのあるべき姿」NTT研究所 東中竜一郎先生

対話システムの概略と、NTTで開発した対話システム(マツコロイドなど)の構成について。 end-to-endというよりはモジュールを組み合わせて作っている。 人手評価で6−70% okとされる程度の精度。

対話システムを大きく2つに分けるならタスク思考型と非タスク思考型に分かれる。 タスク志向型においても、非タスク志向型(雑談対話)を組み込むことでより自然な対話になる。

対話を作っていくためには話者間での共通基盤の構築が重要だが、それはこれから。 コールセンター対応、情報提供・物語、教育… さらにその先には交渉、議論、漫才…。

2 「構文や語彙意味論の分析結果をプログラムとして具現化する言語パターンマッチAPIの可能性」岡山大学竹内孔一先生

www.slideshare.net

モジュール間をつなぐAPIとしては人間が理解可能なラベルをつけることで、個々のモジュールごとの操作性を確保することができる。 end-to-endのモデル構築に必要な大量なデータを準備できないような局面では、このようなモジュールごとのアプローチが有用では。 操作言語としてはDIALやprologなどを。

3 「音声言語の研究と今後の展開」NAIST 中村哲先生

音声認識性能は向上してきたが、崩れた会話や未知語があるようなタスクはまだ難しい。 音声認識の研究と、音声合成の研究の組み合わせが重要。 音声言語では文字情報だけでなくイントネーションや強弱、声の高さなども人間は認識している。 それをどう組み込むか。

4 「文章生成研究は楽しい」佐藤理史先生(名古屋大)

主に小説自動生成の話。まだプロットは人手であり、ロボットは部品を組み合わせているだけ。 (自分で全部書いた小説と、プロットをロボットに与えて構築した小説を両方投稿したら後者だけ選考に通った)。

スライドもillustrativeで楽しいプレゼンだった。

5 「自然言語テキストの理解と評価」乾健太郎先生(東北大学理研AIP)

自然言語処理でかなり勢いのある研究室。 個々の技術についてではなく、どこを目指していくと「言語理解」が可能になるか、マイルストーンを提示する講演。 1. 既存のQAセットでも単純な一致で溶けるようなeasy questionが多い。hard questionは正答率が悪い。 2. 記述答案の自動評価をしたい。submitごとにすぐにinteractiveに評価が返ってくると、学習にも有用では。 技術的なチャレンジ ・どこがなぜ問題か,どうするとよいかを説明できる技術 ・文脈から言わんとする内容を推論できる談話理解 ・誤りを含む不完全な入力に対する頑健な解析

まとめ

自然言語処理の各ジャンルのトップ研究者陣による講演会。 乾先生の講演でも主要なテーマだった「言語理解」をどう目指していくかが積年の課題。