We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
https://arxiv.org/abs/1609.00150
The text was updated successfully, but these errors were encountered:
8/10
Seq2Seqなどを方策勾配法で最適化する研究はいくつかあるが、それらより圧倒的にシンプルな一方で理論的にも面白い。 アルゴリズムとしては編集距離に基づいてサンプル系列を生成し、それらをexp-scaledされた報酬(編集距離等)でISするという極めてヒューリスティックで単純なもの。 一方でそのヒューリスティックで単純な手法に対し、エントロピー正則化付きの方策勾配法との非凡な関係(KLが逆なだけ)を見出しているのは面白い。 エントロピー正則化付きの方策勾配法との関連でPCLなどにも通じる話になっている。
一方結局のところ機械翻訳ではBLEUで最適化は出来てなかったりはする(future workとされている)が、これは機械学習というよりNLPの話のように感じる。
スライドにまとめてみた: https://docs.google.com/presentation/d/1P_ks8cqXcQmc8rBk7QlxcBHwfSdlNYnPmnWF0yj_nYs/edit#slide=id.g20593483e2_0_17
Sorry, something went wrong.
sotetsuk
No branches or pull requests
https://arxiv.org/abs/1609.00150
The text was updated successfully, but these errors were encountered: