意图|揭秘人工智能训练师:用数据“喂养”机器人5年,AI长大了,我却遇到天花板


意图|揭秘人工智能训练师:用数据“喂养”机器人5年,AI长大了,我却遇到天花板
文章图片

图片来源:图虫创意
5年前 , 巫伟成怎么也没有想到自己的工作会和人工智能扯上关系 。
巫伟成本科就读计算机专业 , 毕业后在一家外包呼叫服务商做客服组长 , 后来偶然间接触到一款智能客服产品 。 在此之前 , 公司只有人工客服业务 。
从未接触过人工智能的巫伟成惊讶于客服机器人的效率 , “当时我看了一组数据 , 说客服机器人能取代多少人工客服 , 就觉得它一定是未来 。 ”
抱着这样的想法 , 巫伟成到了一家电商公司做高级知识库管理员 , 工作内容相当于AI训练师 。
巫伟成提到的智能客服产品是阿里2017年发布的“店小蜜” , 一款专门针对商家研发的人工智能客服机器人 , 能7*24小时在线 , 全年无休 , 缓解了618、双11咨询高峰期人工客服不够用的问题 。
伴随店小蜜出现的还有第一批AI训练师群体 。 2020年3月 , AI训练师被人力资源和社会保障部正式纳入新职业 。 这个职业中的大多数人来自客服组长、客户运营等岗位 , 此前从未接触过人工智能 , 现在却是支撑人工智能应用必不可少的一批群体 , 是人工智能背后的人工 。
“这是一份枯燥的工作”
虽然AI训练师直接面对的是新兴的人工智能技术 , 但从很多方面看 , 这都是一份较为机械和枯燥的工作 。 训练师们从上班开始面对的只有一个东西——数据 , 他们要用大量的数据喂养白纸一样的机器人 , 直到他们能听懂并回答客户的问题 。
巫伟成目前在一家智能客服供应商乐言科技做AI训练师 , 负责训练智能客服机器人 , 他们的工作包括收集不同行业的客户需求、提供数据标注原则、设计机器人对话逻辑等 。
“这项工作很考验耐心 , 我们需要把非常大量的数据进行整合 , 慢慢地把数据量减下来 , 还要把数据量转化成有效的东西 , 这是一个很枯燥的过程 。 ”
比如做3C产品的客服机器人 , 巫伟成需要先找行业内较大的店铺前线客服和销售人员沟通 , 收集店铺和客户日常的沟通数据和客户较为关心的问题 , 将问题标准化 , 并提取出行业特征 。
在实际问答过程中 , 顾客的提问方式千奇百怪 。 在某智能语音交互公司担任AI训练师的陈哲如对时代财经介绍 , 比如“忘记密码”这一件事 , 客户可能会问“我密码丢了”“不知道我密码是什么”等等 , 这就需要训练师们将典型问题标准化 , 然后编写一些相似问题进行模型训练 。
收集完数据后 , 训练师需要将数据灌入系统中 , 分解、聚类 , 再进行数据标注 。 数据标注是教人工智能认识某个句子的过程 , 标注内容包括意图、做分词等 。
比如 , “我买的手机壳尺寸不对”这句话 , 数据标注师们会将之标注到“退换货”这个意图中 , 如果某个句子没有明确的意图 , 便会根据相关的业务知识和使用场景进行标注 。
很多公司会聘请专门的数据标注人员或者外包团队负责数据标注 , 但在数据量不大或者涉及到较专业的行业知识(如医学)的情况下 , AI训练师也会做数据标注的工作 。
数据标注完成后是对话流设计 , 当顾客问出一个问题时 , 机器人需要准确识别其场景或意图 , 然后从知识库中搜索合适的回答或推送相关商品服务 。 如果说数据标注是让机器人学习知识 , 那么对话流设计就是让机器人学会运用知识 。
要让机器人准确识别出某个意图 , 背后需要有强大的模型和足够的数据量 , 巫伟成介绍 , 一个意图里面需要50-100个句子 。
对话流设计成功后是日常修复bug的工作 。 智能机器人只是AI训练师们用一堆数据堆起来的智能 , 没有任何自己思考的能力 , 当客户问到数据库里未收录的问题、问话时采用过多的修辞、方言口音过重时 , 机器人都没办法回答 , 这就需要AI训练师手动找到问题调整 。
“很多人对AI不太了解 , 他们觉得AI是可以达到一个成人智力水平的 , 但实际上它还处在比较初级的阶段 。 顾客会觉得一个这么简单的问题 , 机器人为什么回答不上来 , 实际上如果模型不行或者初始语料不够 , 以及考虑到算法在实际应用过程中的限制 , 机器人就是不会回答 。 ”会计出身、大学刚毕业就做了AI训练师的陈哲如说 。
在整个工作过程中 , 训练师们不需要掌握专业的算法知识 , 只需了解模型的基础工作原理 , 如果模型有问题可以与专业的算法团队对接 。
陈哲如所在公司有内部的算法知识分享会 , 他表示自己有一个“老大” , 依靠自学转型成为算法工程师 , 但“那是比较牛的人 , 大多数人只掌握一些基础知识 。 有一些小公司不是通过模型 , 而是直接通过关键词设置对话流 , 这就完全不需要算法 。 ”
在提供客服机器人产品的平台方做AI训练师 , 一个难点在于需要持续接触不同行业的知识 , 因为AI落地应用一定会结合到某个垂直领域 。 比如陈哲如最近在做国家电网的项目 , 对电网知识完全不懂的他需要持续学习相关知识 , 否则便无法弄懂用户的真实意图 。

意图|揭秘人工智能训练师:用数据“喂养”机器人5年,AI长大了,我却遇到天花板
文章图片

地铁里的智能客服 。 图片来源:视觉中国
AI训练部门的从0到1
当客服机器人由平台方制作好 , 交到客户手中 , 需要商家端的AI训练师针对具体业务再做优化 。
“刚引进来的智能客服只能回答行业通用问题 , 完全无法用到实际业务中 , 宛如一个人工智障 。 比如发什么快递、店铺售后流程、开发票退差价等零碎问题 , 都需要我们继续优化 。 ”赵云峰说 , “有时候甚至会出现一些离谱的错误 , 比如客户问‘什么时候发货’ , 它会识别成‘什么东西好吃’” 。
赵云峰本科毕业于交通工程专业 , 此前在阿迪达斯电商服务部做数据分析 , 因一个偶然机会接触到智能客服 , 2020年前后转行到生鲜零售电商杭州大希地公司做AI训练师 。
AI训练师赵云峰刚来时 , 公司还没有AI训练部门 , 只是因为赵云峰的数据分析工作看起来和AI训练师有联系 , 便被拉过去负责这项业务 , 没有任何经验的他从0到1摸索着搭建起了该部门 。
刚开始 , 赵云峰整天泡在客服人员旁边 , 看他们怎么回复客户问题 , 在哪些节点推荐商品 , 哪些节点发送关怀语 , 然后将这些数据模型化 , 配置话术放到机器人知识库中 。
2017年时 , AI训练师还是一个刚刚兴起的职业 , 没有同行可以参考 , 赵云峰一开始走了不少弯路 。 比如 , 电商店铺经常凌晨举办活动 , 需要机器人回答一些有时效性的问题 , 但他们不知道怎么预设回答 , 只能半夜两三点爬起来更新话术 。
经过4年多发展 , 公司的AI训练部门已经走入正轨 。 与平台端的AI训练师一样 , 商家端的AI训练师也是每天和数据打交道 , 主要工作就是对话流抽检 , 找出错误的对话 , 解决问题或将问题反馈给供应商 。
遇到最多的问题 , 还是机器无法理解人的语言导致的对话流紊乱 , 背后原因是客户提问方式有太大的不确定性 。
赵云峰介绍 , 人在线上说话经常会分段说 。 比如客户在问发货问题时可能会先说“今天上海来台风了” , 机器人的底层逻辑决定 , 必须要对客户发出去的每一句话回应 , 当客户的话没有实际的指向时 , 机器人可能会默认到错误的话术场景 。
当客户说话有太多语气词或者形容词时 , 如“我想要一件适合现在穿且防水的衣服” , 机器人都会推荐错误 , 这时候一些没有耐心的客户可能就直接不买了 。
碰见无法被识别的对话时 , 训练师需要在系统里添加新的问答和相似问题 , 最多一天需要处理10个对话流紊乱的问题 , 大约花费2小时的时间 。 赵云峰表示 , 处理对话问题时 , 最大的难点实际上在于公司内部沟通不顺畅 , 训练师往往没办法及时更新商品信息 。
与平台端AI训练师不同的是 , 商家端AI训练师更需要关注智能客服是否给品牌带来了业绩提升 , 并在此基础上 , 优化智能客服和提升品牌的服务能力 。
比如品牌端的智能客服要对客户追单 , 训练师需要跟踪追单效果 , 若效果不好则要更新智能客服的追单话术 , 或者辅之以图片、视频 。 这些都要求训练师本身有营销相关的知识 。
此外 , 商家端训练师在训练机器人时还要考虑品牌调性和人文关怀 。 比如杭州大希地公司的主要客户是白领和精致妈妈 , 客服机器人就需要用“家庭风”的语言回复 , 比如“这款食品特别适合宝宝食用” 。

意图|揭秘人工智能训练师:用数据“喂养”机器人5年,AI长大了,我却遇到天花板
文章图片

图片来源:视觉中国
训练师只是在“抓一个产品” , 始终会有天花板
团队能够正常运营后 , 赵云峰没有再继续做AI训练师 , 而是开始在探索电商行业的数智化运营方式 , 例如数智化营销、智能客服、虚拟主播等 。
巫伟成也转任了产品定义主管 。 在平台端 , 从AI训练师到产品经理是最为普遍的职业晋升道路 。
AI训练师并不需要特定的专业知识 , 所以作为一份新职业 , 并没有专业的人才输送路径 , 人才来源也较为多元 。
会计专业出身的陈哲如表示 , 自己刚来公司时 , 身边同事“学什么的都有” 。 不过 , 这几年岗位也在慢慢“内卷” , 最近一段时间他发现新来的同事都有一定专业背景 , 包括一些善于处理文字语句的汉语言文学专业 , 以及计算机背景的毕业生和有相关行业知识的人才 。
赵云峰则坦言 , 从团队搭建到现在的5年间 , 公司AI训练师人员和工作内容都没有太大变化 。 其团队人员大多来自于客服岗位 , “客服培训一个月就完全有能力上岗 , 能做一些比较标准化的日常运行工作 。 所以这个行业并不缺人 , 但缺高质量人才 。 ”
他表示 , 客服做AI训练师基本都有思维定式 , 很难跳出原本工作框架 。 所谓高质量人才是指 , 不止能做日常的运营 , 还能追踪前沿技术 , 把技术和业务相结合 , 且能想到哪些新产品能对提升公司业绩有帮助 。
赵云峰所在的公司已经从不关心这个职业到逐渐重视AI训练师群体 , 但AI训练师在公司并不是价值较高的人才 。 “目前AI训练师还只是围绕智能客服这个产品去做运维 , 没有涉及到更深层的一些东西 。 ”
另外 , 虽然AI训练师有统一的职业名称 , 但工作内容却不同 。 陈哲如去年因自身特殊原因换了三四份工作 , 他发现 , 不同公司实际工作内容会有很大区别 。
“一些AI技术不太成熟的公司 , 训练师更多会做一些数据标注或者话术设计的工作 。 在AI技术较为成熟的公司里 , 训练师则会参与产品设计和算法调优的工作 , 这时候虽然同样被叫做AI训练师 , 工作内容已经相当于AI产品助理 。 ”
【意图|揭秘人工智能训练师:用数据“喂养”机器人5年,AI长大了,我却遇到天花板】作为一份新职业 , AI训练师或许还要一段时间朝更正规的方向发展 , “训练师只是在抓一个产品 , 始终会有局限性 , 会有一个天花板在那 。 ”赵云峰感叹 。

    推荐阅读