ACL 2018｜海德堡大学：seq2seq强化学习中Human Bandit反馈的可靠性和可学习性( 五 )

2019-02-21

http://

----ACL 2018｜海德堡大学：seq2seq强化学习中Human Bandit反馈的可靠性和可学习性//---- http://

ACL 2018 Long Papers

Sequence-to-Sequence强化学习中Human Bandit反馈的可靠性和可学习性

Reliability and Learnability of Human Bandit Feedback for Sequence-to-Sequence Reinforcement Learning

海德堡大学

推荐阅读

上一篇：爱立信联手Intel向华为发起挑战，华为准备好了吗？

下一篇：全球首款支持20W无线闪充！三款搭配小米9的无线充电新品首发