逻辑激活函数改进
传统逻辑激活函数因为使用连乘模拟逻辑运算 , 因而在处理较多特征时会产生梯度消失的问题 , 严重损害了模型的可扩展性 。 一个直接的改进思路是使用对数函数将连乘转化为连加 。 然而对数函数使得激活函数无法保持逻辑运算的特性 。 因而需要一个映射函数
文章图片
, 该映射函数至少需要满足以下三个条件:
条件 (i) 和(ii)用于保持逻辑激活函数的范围和趋势 , 而条件 (iii) 要求
文章图片
是
文章图片
的高阶无穷小 , 主要用于减缓当
文章图片
时其趋向于 0 的速度 。
取
文章图片
, 这样对逻辑激活函数的改进可以
总结为
文章图片
, 而改进后的逻辑激活函数为:
文章图片
二值化层
二值化层主要用于将连续的特征值划分为若干个单元 。 对于第 j 个连续值特征
文章图片
, 有 k 个随机下界
文章图片
和 k 个随机上界
文章图片
对其进行划分 , 进而得到以下二值向量
, 其中
文章图片
文章图片
由于逻辑层的边的连接是可以学习的 , 因此通过组合一个二值化层和一个逻辑层 , 模型可以实现自动选择适当的边界进行特征离散化(二值化) , 即以端到端的方式对特征进行二值化 。 例如:
- 当一个合取层节点连接了和 , 其表示区间
- 当一个析取层节点连接了和 , 其表示区间
虽然连续值版本的逻辑层能够使得整个 RRL 可导 , 但是在连续空间内搜索一个离散值解仍是一个巨大的挑战 。 此外 , 逻辑激活函数的特性导致 RRL 在离散点处的梯度几乎不含有用的信息 , 因此像 Straight-Through Estimator (STE)这类方法无法训练 RRL 。
推荐阅读
- 星链|石豪:在太空,马斯克和美国当局是如何作恶的
- 下架|APK Installer 和 WSATools 同时躺枪:冒牌应用登陆微软应用商店
- 影像|iQOO 9 系列预热:首发三星 GN5 传感器,150° 鱼眼超广角
- 软件和应用|AcrylicMenus:让Windows 10右键菜单获得半透明效果
- 技术|使用云原生应用和开源技术的创新攻略
- 软件和应用|iOS/iPadOS端Telegram更新:引入隐藏文本、翻译等新功能
- 实力比|小米12对标苹果遭嘲讽?雷军:国产手机的实力比想象中强,有和苹果比较的勇气
- Apple|法官称苹果零售店搜包和解协议虽不完美,但可继续进行
- 部落|excel固定显示行列视频:应用冻结窗格同时固定标题行和列
- 最新消息|宝马LG和其他公司正考虑使用量子计算机解决具体问题