2018 年 Top 10 影响力 AI 研究论文( 二 )
论文思想要点
为了应对缺乏标注数据的问题,以及让 NLP 分类任务更轻松、更省时,他们提出了把迁移学习用在 NLP 问题中。这样,研究人员们不再需要从零开始训练新模型,只需要找到一个已经在相似的任务上训练完毕的模型作为基础,然后为新的具体问题微调这个模型即可。
然而,为了让这样的做法发挥出理想的效果,这个微调过程有几个细节需要注意:
网络中不同的层应该为不同的内容进行微调,因为它们捕捉的信息的类别也是有所不同的;把模型参数向新的具体任务适配时,让学习率先线性增加,再线性衰减,学习的效率会比较高;一次微调所有的层会带来灾难性的遗忘问题。所以,比较好的做法是一开始只更新最后一层的参数,然后逐步让前面的层也参与到微调中来。领域内学者评价
可以轻易得到的预训练 ImageNet 模型已经给整个计算机视觉界带来了巨大的改变。ULMFiT 也可以在 NLP 任务中起到同样的重要作用;这种方法可以用于任意语言上的任意 NLP 任务。全世界的研究人员们已经在德语、波兰语、海地语、印度尼西亚语、中文、马来语等许多语言上进行了尝试,同样得到了大幅进步的结果。未来可能的相关研究
推荐阅读
- edg战队|外媒公布最新世界赛决赛含金量TOP10,EDG对DK这场登顶
- 碧蓝航线|二次元手游TOP10,碧蓝航线跌破前十,网友热议:LSP战斗不行了
- 米莱狄|峡谷数据榜:分均输出TOP5,干将莫邪只排第四,米莱狄至今被误解
- |新作只排第四! 《银河战士》系列排名TOP10
- 炉石传说|炉石传说:版本潜行者最高斩杀上线,胜率TOP3,潜行者荣光再现
- 异界事务所|佣兵战纪女性颜值TOP3 女王英姿引人钦慕
- dota2|这些佣兵抽到了必练!盘点《佣兵战纪》传说佣兵TOP5
- RNG|小组赛选手分均伤害Top10:八人已晋级八强,RNG占两名
- edg战队|历年总决赛爆冷战役top4,S8赛季有两场,最冷门的是EDG
- 开罗|开罗游戏发表中文声明:识君代理属于侵权行为,2018年就已解约