AI更懂人话:谷歌发布全新对话数据集,模仿智能助理( 四 )

对于书面对话,谷歌让人们根据每个任务概述的场景自己创建完整的对话,从而扮演用户和助手的角色。

因此,虽然口语对话更接近地反映了会话语言,但书面对话既适当丰富又复杂,但更便宜,更容易收集。

该数据集基于六个任务之一:订购披萨,创建汽车维修预约,设置租车,订购电影票,订购咖啡饮料和预订餐厅。

此数据集还使用简单的注释模式,为数据提供足够的基础,同时使工作人员可以轻松地将标签始终应用于对话框。

与传统的,详细的策略相比,谷歌只关注每种类型的会话的API参数,而不仅仅是执行事务所需的变量。

例如,在关于安排乘坐共享的对话框中,谷歌将“到”和“从”位置标记为汽车类型(经济,豪华,游泳池等)。

对于电影票,谷歌标记电影名称,剧院,时间,票数,有时标记屏幕类型(例如3D或标准)。语料库版本中包含完整的标签列表。

谷歌希望这些数据集对于研究界在对话系统和会话推荐中的实验和分析都是有用的。

推荐阅读