会说话的机器人 如何“好好说话”?( 六 )

若想要达到相当于人类对话的水平 , 目前有几种方法可以探讨 。 其中一种是构造庞大且高度复杂的AI模型 , 如现在基于Transformer结构的Bert模型和GPT模型 , 其参数量已达到数亿级 。 然而模型越大 , 从用户输入信息到对话系统反应之间的延时就越长 , 而且实质上 , 此类模型仍然需要依赖于大量的数据 , 这与人类的思考和学习方式不符 。

第二种是Meta Learning技术 , 这种技术需要机器人具备学会学习的能力 , 能够基于过往的经验快速地学习 。 这类模型是模拟人的思考与学习方式 , 从本质上更接近人类间的相互对话 。 但问题是我们需要结合具体的任务 , 提出基于Meta Learning的解决方案 , 这无疑需要更加深入的研究 。

第三种是强化学习技术 , 强化学习系统由智能体、状态、奖赏、动作和环境5部分组成 。 现在的研究工作主要是将强化学习应用于任务型对话系统的策略学习上 , 强化学习能解决基于规则策略存在的泛化能力差、人工成本高等问题 , 并且无需大量的训练语料 , 只需要一些目标 , 便能够提高任务型对话的质量 , 弥补了深度学习的一大缺点 , 当然强化学习也会带来很多挑战 , 比如智能体会给当前互动的环境带来一定的影响等 , 这些都是需要我们去不断探索和深入研究的 。

推荐阅读