中新经纬客户端8月6日电 北京时间8月5日 , 国际顶级学术会议ACL 2021正式颁发“最佳论文”奖项 , 字节跳动AI Lab的机器翻译技术论文在3350篇论文投稿中脱颖而出 , 当选今年度“最佳论文” 。
ACL大会由国际计算语言学协会主办 , 是自然语言处理与计算语言学领域最高级别的学术会议 。 自然语言处理被誉为“人工智能皇冠上的明珠” , 在机器翻译、搜索、信息流、输入法等领域有着广泛的应用 。
近年来ACL大会接收的投稿量持续上升 , 华人团队在该领域研究取得了举世瞩目的成绩 , 过去数年间曾获得“最佳长论文”“最佳学生论文”和“杰出论文”奖项 。 今年除了字节跳动赢得最高荣誉 , 大会还评出了六篇“杰出论文” , 香港中文大学与腾讯AI Lab的合作论文成功入选 。
字节跳动的获奖论文提出一种新的词表学习方案VOLT 。 词表是所有自然语言处理任务都会使用的基础组件 , 其作用就像人类查字典的索引 。 研究人员创新地把经济学和数学的知识运用到词表中:首先用“边际收益”定义了词表质量的评价指标 , 然后以“最优运输”的数学方法解决最优词表的生成问题 , 从而在多种翻译任务上取得出色的效果 。 VOLT研究项目现已向全球开发者开源 。
ACL官方评审认为 , “字节跳动的VOLT方案对机器翻译中一个重要问题提出了有效且新颖的解决方案 , 能显著减少词表的学习和搜索时间 , 相信其不仅会在研究界产生重要影响 , 在工业应用方面也有着巨大潜力” 。
据悉 , 最佳论文研究成果将在字节跳动的火山翻译业务中逐步落地 , 为飞书、今日头条等产品和火山引擎的企业级客户提供机器翻译支持 。 2021年以来 , 火山翻译实现多项重要技术突破 , 研发出支持150个语种互译的大规模翻译模型mRASP2 , 并对外开源了当前业界最快的推理和训练引擎LightSeq2.0 , 以及端到端语音翻译工具包NeurST , 获得开源社区的广泛好评 。
【词表|字节跳动获得计算语言学顶级会议ACL最高奖项】在此前由ACL举办的机器翻译大赛WMT2021上 , 火山翻译以独创的“并行翻译”系统参赛 , 夺得德语到英语方向比赛自动评估第一名 。 “并行翻译”在国际赛事中首次亮相 , 就击败了从左向右逐词翻译的传统技术 , 打破后者在机器翻译领域的绝对统治地位 , 这项技术的论文也得到ACL 2021大会收录 。 (中新经纬APP)
推荐阅读
- bleu|字节跳动火山翻译上新 38 个稀有语种,翻译能力再升级
- Baidu|百度抢跑元宇宙 却默认“输给”字节?
- 字节跳动|抖音上线学习频道,为知识内容增加一级入口
- 字节跳动|抖音正测试“通讯录”功能:神似朋友圈
- 产品|字节入局音乐流媒体,“算法推荐”会带来新“鲶鱼效应”吗?
- 字节跳动|今日头条规范MCN运营 情节恶劣将被拉入黑名单
- 字节跳动|抖音盒子正式上线 盘一盘字节跳动的电商之路
- 字节跳动|新预测称TikTok有望在2022年成为全球第三大社交网络平台
- 最新消息|胡润发布《2021全球独角兽榜》,字节跳动2.3万亿估值跃升榜首
- 字节跳动|电商领域迎来头号玩家 抖音盒子App上线:主打时尚潮品