21种NLP任务激活函数大比拼:你一定猜不到谁赢了( 八 )

21种NLP任务激活函数大比拼:你一定猜不到谁赢了

图5/8

图 1:句子分类。左侧 Y 轴:最佳结果;右侧 Y 轴:平均结果。在 Y 轴上的分数是在所有 mini 实验上的平均。

3.2 CNN & 文档分类

21种NLP任务激活函数大比拼:你一定猜不到谁赢了

图6/8

图 2:文档分类

3.3 RNN & 序列标注

21种NLP任务激活函数大比拼:你一定猜不到谁赢了

图7/8

图 3:序列标注

4 分析与讨论

获胜者统计情况

在最佳表现上,句子分类、文档分类和序列标注这三个元任务平均而言都是 rectifier(整流)家族的一个成员获胜,即 relu(获胜 2 次)和 elu。另外,在每种情况中,cube 和 cosid 都位列表现最差的激活函数。Ramachandran et al. (2017) 中新提出的函数大都位居中间位置,但 swish 和 minsin 在「表现最佳」类别中表现最佳。对于「表现平均」类别,maxout 函数尤其突出,另外 penalized tanh 和 sin 也常处于领先位置。

推荐阅读