ACL 2018｜海德堡大学：seq2seq强化学习中Human Bandit反馈的可靠性和可学习性(16)

2019-02-21

论文下载链接：

http://aclweb.org/anthology/P18-1165

推荐阅读

上一篇：爱立信联手Intel向华为发起挑战，华为准备好了吗？

下一篇：全球首款支持20W无线闪充！三款搭配小米9的无线充电新品首发