21种NLP任务激活函数大比拼:你一定猜不到谁赢了( 二 )
我们发现一种很大程度上不为人知的激活函数在所有任务上都表现得最稳定,即所谓的 penalized tanh 函数。我们还表明它能在 LSTM 单元中成功替代 sigmoid 和 tanh 门,并能在一种高难度的 NLP 任务上取得优于标准选择 2 个百分点的表现。
1 引言
激活函数是神经网络的一大关键组件,因为它们可将原本线性的分类器转换成非线性的。神经网络近些年在众多任务上表现优异这一事实已经证明这种转换至关重要。尽管理论上而言,Sigmoid或 tanh 等不同的激活函数往往是等价的——它们都能近似任意的连续函数(Hornik, 1991),但不同的激活函数往往会在实践中表现出非常多样的行为。
举个例子,sigmoid 是一种在神经网络实践中占据了几十年主导地位的激活函数,最终却被证明不适用于学习,原因是(根据公认的看法)它的导数很小,这可能会导致梯度消失问题。在这方面,事实证明所谓的 ReLU 函数(Glorot et al., 2011)要更加适用得多。它在正的区域有一个恒等导数,因此宣称更不易受梯度消失问题的影响。因此它也已经成为了目前最流行的激活函数(有争议)。对 ReLU 的成功的认可让人们提出了多种扩展(Maas et al., 2013; He et al., 2015; Klambauer et al., 2017),但没有任何一种能一样受欢迎,原因很可能是 ReLU 很简洁,而不同扩展在不同数据集和模型上所报告的增益往往是不一致的或较低(Ramachandran et al., 2017)。
推荐阅读
- 手机游戏|梦幻西游:副本等人时可以刷的任务,随时随地领取,失败也没问题
- 老玩家|大话西游2:大话怀旧任务一览,都做过的才是老玩家!
- 荒野大镖客2|【荒野大镖客2】每日任务更新攻略2021年11月11日
- 炉石传说|炉石天梯平衡补丁曝光,任务法锁喉贼惨遭大削,BUG德无了!
- edg战队|梦幻西游:EDG粉丝硬件展示,全身高属性不磨追求任务极限!
- gta三部曲|梦幻西游:129级五开分析师,研究抓鬼任务最优化投入,不浪费一分钱
- 荒野大镖客2|【荒野大镖客2】每日任务更新攻略2021年11月9日
- 魔兽世界|魔兽世界:TBC部落萌新做任务上头,连坐车升级都不去了
- 梦幻西游|梦幻西游:工作室要哭了,新区牟利套路被曝光,战神任务要被改了
- 孤影|梦幻西游:五开起名字要注意,起这种名字的五开任务给的都是盒子