Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Reward Augmented Maximum Likelihood for Neural Structured Prediction #11

Open
sotetsuk opened this issue Apr 17, 2017 · 1 comment
Open
Assignees

Comments

@sotetsuk
Copy link
Contributor

https://arxiv.org/abs/1609.00150

@sotetsuk sotetsuk self-assigned this Apr 17, 2017
@sotetsuk
Copy link
Contributor Author

8/10

Seq2Seqなどを方策勾配法で最適化する研究はいくつかあるが、それらより圧倒的にシンプルな一方で理論的にも面白い。
アルゴリズムとしては編集距離に基づいてサンプル系列を生成し、それらをexp-scaledされた報酬(編集距離等)でISするという極めてヒューリスティックで単純なもの。
一方でそのヒューリスティックで単純な手法に対し、エントロピー正則化付きの方策勾配法との非凡な関係(KLが逆なだけ)を見出しているのは面白い。
エントロピー正則化付きの方策勾配法との関連でPCLなどにも通じる話になっている。

一方結局のところ機械翻訳ではBLEUで最適化は出来てなかったりはする(future workとされている)が、これは機械学習というよりNLPの話のように感じる。

スライドにまとめてみた:
https://docs.google.com/presentation/d/1P_ks8cqXcQmc8rBk7QlxcBHwfSdlNYnPmnWF0yj_nYs/edit#slide=id.g20593483e2_0_17

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant