机器之心报道
机器之心编辑部
被顶会拒稿请不要灰心 , 说不定你的论文会成为另一个顶会的最佳 。昨日 , NLP 领域国际顶会 ACL 2021 公布获奖论文信息:来自字节跳动火山翻译的一篇神经机器翻译工作被评为最佳论文 。 此外 , 最佳主题论文、杰出论文也揭晓 。
ACL , 是计算语言学和自然语言处理领域的顶级国际会议 , 由国际计算语言学协会组织 , 每年举办一次 。
一直以来 , ACL 在 NLP 领域的学术影响力都位列第一 , 它也是 CCF-A 类推荐会议 。

文章图片
今年的 ACL 大会已是第 59 届 , 计划于 8 月 1-6 日在泰国曼谷举行
不久之前 , ACL 2021 官方发布了关于本届大会接收结果:本届 ACL 共计收到 3350 篇论文投稿 , 最终有 21.3% 的论文录用到主会(Main Conference) , 并额外接收了 14.9% 的论文到 Findings 子刊 , 综合录用率为 36.2% 。 我们可以从被接收的论文作者与机构中发现 , 有大量的国内论文被接收 。
除了接收论文之外 , 今年的 ACL 的组织成员里面也有大量的华人面孔 , 特别是今年的年会主席是中科院自动化研究所的宗成庆老师 , 程序主席包括华盛顿大学的 Fei Xia 教授、香港理工大学 Wenjie Li 教授 。
昨天 , 大家最为关注的 ACL 2021 获奖论文公布 , 令人惊喜的是这些获奖论文里面也包含多篇国内研究成果:如来自字节跳动火山翻译的机器翻译研究获得最佳论文 , 来自港中文、腾讯 AI Lab 合作的论文也入选杰出论文 。
最佳论文:字节跳动火山翻译
ACL 2021 的最佳论文来自字节跳动火山翻译团队 , 该研究提出了一种新的词表学习方案‘ VOLT , 在多种翻译任务上取得了优秀的结果 。

文章图片
- 标题:Vocabulary Learning via Optimal Transport for Neural Machine Translation
- 作者:许晶晶、周浩、甘纯、郑在翔、李磊
- 论文地址:https://arxiv.org/pdf/2012.15671.pdf
- 代码地址:https://github.com/Jingjing-NLP/VOLT
为了回答该问题 , 本论文尝试提出一种无需训练的词表评价指标和针对该评价指标的词表学习方案 VOLT 。 该方案在常用的英德翻译、英法翻译、低资源翻译、多语言翻译上都取得了相比传统词表解决方案更好的结果 。

文章图片
表 1:使用 VOLT 与广泛使用的 BPE 词表进行词汇搜索的结果比较 。 VOLT 得到了更高的 BLEU 分数 , 同时大大减少了词汇量 。 此处采用的是 X-En 设置下的词汇量 。
使用 VOLT 生成词汇 , 简单的基线方法就能够实现 SOTA 结果 。 该研究在 En-De 数据集上测试了 VOLT 和其他几种方法的性能 , 结果如表 5 所示 。 与其他方法相比 , VOLT 以更少的词汇量实现了几乎最佳的性能 。 这些结果表明 , 简单的基线方法使用定义明确的词表就能够获得良好的结果 。

文章图片
表 5:VOLT 和强基准之间的比较结果 。 VOLT 在词汇量较少的情况下取得了几乎最好的表现 。
值得一提的是 , 该研究修改前的版本曾投至另一个机器学习顶会 ICLR 2021 。 在 Openreview 网站上现在还能看到该论文及匿名评审的结果 。 当时四名评审给出的意见是 3、3、4、4——未达到接收标准 , 作者做了rebuttal之后撤稿投了ACL 。
论文作者之一的周浩在社交网络中表示:「关于从 ICLR 到 ACL 的转投当时情况是这样的 , 我们在投 ICLR 的时候花了太多时间在实验上 , 在 writing 上花的时间很不够 , 整个 paper 显地平铺直叙 , Intuition 没有说出来 , 且有部分重要的实验没有补充 。 结果大家也看到了 , 我觉得这是一个重要的 lesson , 也欢迎大家对比我们两个版本的论文 。 」
论文一作许晶晶则总结了经验与教训:「我学到的最重要教训是一定要把东西写清楚 。 虽然写作不是最重要的 , idea 才是 , 但是写清楚是让评审评价工作的前提 。 其实 ICLR 的评审和 ACL 的评委都对我们的 Idea 做了肯定 , 新颖性和有趣性都是被承认的 , 我们给出的基于最大边际效应的解释 , 和把词表学习建模成一个最优运输问题都是全新的一套想法 。 ICLR 对 idea 没有太多问题 , 问题主要是在写作上 , 后来我们把写作改进之后 , 能拿到高分虽然意料之外 , 倒也在情理之中 。 有一说一 , 我们 ICLR 那篇工作确实写的不好 。 评审的反馈主要在以下几个方面:实验做的不够充分 , 方法介绍的不够清楚 , 动机也缺乏直接证据 。 后来的这几点 , 我们在 ACL 版本都做了大量的改进 。 我们补充了很多后续实验 , 写作也推倒重来 , 一遍遍推敲逻辑是否合理 , 实验是不是严谨和充分等等 , 整个过程是很痛苦的 。 所以后来我们得到 ACL 的评审认可的时候非常激动 , 毕竟投入了很多心血的工作终于得到了回报 。 」
这篇论文在一番改进之后获得了另一个顶会的最佳奖项 , 过程可谓大起大落 。
最佳主题论文:CMU
今年的最佳主题论文(Best theme paper)研究来自卡耐基梅隆大学、巴伊兰大学、加劳德特大学与艾伦人工智能研究所等机构 。 第一作者殷绮妤(Kayo Yin)本科毕业于巴黎综合理工学院 , 目前是卡耐基梅隆大学的在读研究生 。

文章图片
- 标题:Including Signed Languages in Natural Language Processing
- 作者:Kayo Yin、Amit Moryossef、Julie Hochgesang、Yoav Goldberg、Malihe Alikhani
- 机构:CMU、巴伊兰大学、加劳德特大学、艾伦人工智能研究所、匹兹堡大学
- 链接:https://arxiv.org/abs/2105.05222
六篇杰出论文
除最佳论文以外 , 今年的 ACL 还评出了六篇杰出论文(Outstanding papers) , 其中包括港中文、腾讯 AI Lab、斯坦福大学(李飞飞、曼宁等人团队)的研究 。
论文 1:All That’s ‘Human’ Is Not Gold: Evaluating Human Evaluation of Generated Text
【结果|曾被ICLR拒稿,字节跳动今斩获最佳论文,ACL 2021各大奖项揭晓】

文章图片
- 作者:Elizabeth Clark、Tal August、Sofia Serrano、Nikita Haduong、Suchin Gururangan、Noah A. Smith
- 机构:华盛顿大学、艾伦人工智能研究所
- 论文地址:https://arxiv.org/abs/2107.00061
论文 2:Intrinsic Dimensionality Explains the Effectiveness of Language Model Fine-Tuning

文章图片
- 作者:Armen Aghajanyan、Sonal Gupta、Luke Zettlemoyer
- 机构:Facebook
- 论文地址:https://arxiv.org/abs/2012.13255
论文 3:Mind Your Outliers! Investigating the Negative Impact of Outliers on Active Learning for Visual Question Answering

文章图片
- 作者:Siddharth Karamcheti、Ranjay Krishna、Li Fei-Fei、Christopher Manning
- 机构:斯坦福大学
论文 4:Neural Machine Translation with Monolingual Translation Memory

文章图片
- 作者:Deng Cai、Yan Wang、Huayang Li、Wai Lam、Lemao Liu
- 机构:香港中文大学、腾讯 AI Lab
- 论文地址:https://arxiv.org/pdf/2105.11269.pdf
论文 5:Scientific Credibility of Machine Translation Research: A Meta-Evaluation of 769 Papers

文章图片
- 作者:Benjamin Marie、Atsushi Fujita、Raphael Rubino
- 机构:NICT(日本)
- 论文地址:https://arxiv.org/pdf/2106.15195.pdf
论文 6:UnNatural Language Inference

文章图片
- 作者:Koustuv Sinha、Prasanna Parthasarathi、Joelle Pineau、Adina Williams
- 机构:麦吉尔大学、MILA、FAIR
- 论文地址:https://arxiv.org/pdf/2101.00010.pdf
- GitHub 地址:https://github.com/facebookresearch/unlu
ACL 获奖论文完整列表:https://2021.aclweb.org/program/accept/
参考内容:
https://www.zhihu.com/question/470224094
推荐阅读
- 人物|俄罗斯网络博主为吸引流量 闹市炸毁汽车 结果够“刑”
- 奇葩趣闻|男子加了2万的油发现是中围石油:同名公司曾被中国石油起诉商标侵权
- 智慧|第二届数字四川创新大赛(2021)总决赛结果揭晓,中科大旗获三等奖!
- 结果表明|奥密克戎免疫逃避添更多证据
- 调查|“2021年中国智能手机用户大调查”结果发布
- IT|电脑插个“U盘”就能给基因测序实时查看结果 售价1000美元
- China|中国移动披露发行结果:网上投资者弃购7.43亿元
- IT|大干三个月 恒大首款汽车恒驰5终下线:曾被工信部除名
- 屏幕尺寸|【尴尬】雷军:为保密给小米12Pro加了8把锁 结果12真机满天飞
- 的结果|360 推出无追搜索:体验纯净,更少广告