ACL 2018|海德堡大学:seq2seq强化学习中Human Bandit反馈的可靠性和可学习性( 五 )

http://

ACL 2018|海德堡大学:seq2seq强化学习中Human Bandit反馈的可靠性和可学习性

----ACL 2018|海德堡大学:seq2seq强化学习中Human Bandit反馈的可靠性和可学习性//---- http://

ACL 2018|海德堡大学:seq2seq强化学习中Human Bandit反馈的可靠性和可学习性

ACL 2018 Long Papers

Sequence-to-Sequence强化学习中Human Bandit反馈的可靠性和可学习性

Reliability and Learnability of Human Bandit Feedback for Sequence-to-Sequence Reinforcement Learning

海德堡大学

推荐阅读