多语种|科大讯飞用技术说话 助力冬奥会信息沟通无障碍

助力冬奥会 , 上市公司在行动 。 中国上市公司协会组织的“上市公司冬奥在行动”系列策划将目光移向冬奥会的语音技术支持方——科大讯飞 。 作为北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商 , 科大讯飞为北京2022年冬奥会提供自动翻译和相关的多语种语音转换、语音识别以及语音合成等硬核技术 , 用技术说话 , 助力实现赛场内外的沟通交流无障碍 。
突破“语言关”交流无国界
无障碍交流是人类千百年来的梦想 , 北京2022年冬奥会和冬残奥会不仅实现了这个梦想 , 还让奥运精神的落地更有温度、更显人文关怀——科大讯飞面向冬奥会场景的多语种自动语音及语言处理关键技术无处不在 , 全方位保障了来自不同国家和地区选手、教练、游客及志愿者等人群之间的语言交流 。
早在2019年 , 科大讯飞就组建了北京2022年冬奥会和冬残奥会示范应用专项团队 , 借助先进的机器翻译和多语言语音转换技术 , 围绕“人和人之间沟通无障碍、人和组织之间沟通无障碍、人和赛事之间沟通无障碍”三大方向 , 加速应用场景落地 。
两年多来 , 两年多来 , 已先后研发了面向冬奥场景的多语种智能语音识别与合成、具有冬奥特征的多语种机器翻译和基于交互问答的冬奥多语种信息获取及交互等核心技术 , 构建了面向冬奥会场景的语音及语言服务平台 , 提供语音识别、语音合成、机器翻译、自动问答等技术能力 , 支撑冬奥虚拟志愿者、便携式终端设备、赛事多媒体办公和信息发布系统等产品应用 。
为实现“人和人之间沟通无障碍” , 科大讯飞的双屏翻译机可支持60个语种的在线语音翻译、16个语种的语音离线翻译、中英16个垂直行业的翻译 , 翻译效果好、响应时间快、操作便捷自然 。 特别是针对冬奥会使用场景 , 加入了数十万专业词汇以及行业术语 , 覆盖各类体育运动和裁判用语 , 可有效满足各类人群的跨语言沟通需求 。
突破“手速关”交流无障碍
更快、更高、更强、更团结 , 这是奥林匹克精神 , 也是奥运科技的变革 , 更是讯飞赋能冬奥的追逐 。 为保障“人和组织之间沟通无障碍” , 科大讯飞面向冬奥办公与信息发布应用场景 , 基于中英文语音转写及翻译核心技术 , 推出听见转写系统 , 支持现场上屏发布、媒体采访等 , 实现及时的新闻稿发布 , 中英文整体转写准确率可以做到97%以上 。
讯飞听见转写系统 , 可支持语音实时识别、翻译、记录 , 并将识别和翻译结果形成字幕投屏展示 , 转写和同声传译的效果、实时性突破了实用门槛 。 利用机器自动翻译及转写 , 减轻了对翻译人工服务的依赖 , 让现场工作人员不必再过“手速关” , 大幅提高了多语种沟通效率与视听体验 , 在大会场景下具备很好的展示度 。 在此前的奥组委日常办公中 , 讯飞听见转写系统已经入驻了交通部、志愿者部、服务部等各个部门累计近50间办公室 , 迄今已提供超过1000场沟通无障碍服务保障 。
突破“技术关”交流无限制
冬奥虚拟志愿者“爱加”堪称是个“全能通” , 不仅能进行“面对面”的冬奥赛事、赛程实时互动交流 , 还能陪你玩一把冬奥知识游戏大PK , 周边交通、文化、旅游等咨询问答也不在话下 。 这背后 , 是科大讯飞提供的语音识别、语音合成、机器翻译和自动问答等技术能力支撑 。
语言是一门艺术、一种智慧 , 也是促进世界相知相融的重要工具 。 北京2022年冬奥会和冬残奥会上 , 科大讯飞担纲官方自动语音转换与翻译独家供应商 , 是科技发展的大势所趋 , 也是自身核心技术发展的水到渠成 。 然而 , 由于自动语音转换与翻译涉及技术众多 , 难度和挑战非常大 , 科大讯飞在为赛事提供技术支持的过程中 , 也遇到了不少难点 。
在多语种语音语言技术研发领域 , 由于涉及60多个语种的语音识别合成翻译等技术研发 , 除了中英文之外 , 针对其他语种(比如瑞典语、波兰语等)语料比较少的问题 , 通过源头核心技术创新 , 在端到端建模和无监督、弱监督训练方面取得重大突破 , 例如在多语种语音识别方面 , 100小时有监督数据加上大量无标签语音和文本数据可以达到1万小时有监督训练的效果 。 这项技术也在OpenASR国际低资源多语种语音识别挑战赛的15个语种受限赛道和7个语种非受限赛道系统 , 全部取得第一名的成绩 。
在语音同传技术实时性和效果的平衡上 , 我们知道 , 同传要解决两个问题 , 第一是要将语音识别转写出来 , 第二是将转写的内容翻译出来 , 以前这两个任务是单独建模先后完成的 , 现在我们提出“流式的CAAT语音翻译框架”模型 , 在一个模型内解决这两个问题 , 从而实现同传效果的“又快又好” 。 这些技术创新 , 对于保障冬奥场景下的语音同传应用效果起到非常关键的作用 。
【多语种|科大讯飞用技术说话 助力冬奥会信息沟通无障碍】在多语种自动问答中 , 融合了数字人生成、语音识别、语音合成、自然语言理解等多项技术 , 并结合FAQ问答、文档集合问答、知识库问答和基于文本蕴含识别的多源答案验证等技术进行知识库构建 , 最终实现人们可以和冬奥虚拟志愿者“爱加”用六种语言自由互动交流 。

    推荐阅读