网络|结合随机微分方程，多大Duvenaud团队提出无限深度贝叶斯神经网络( 三 )_训练|深度|函数|贝叶斯|研究

文章图片

因为该研究提出的近似后验可以任意表达，研究者推测如果参数化网络 f_w 的表达能力足够强，该方法可在训练结束时实现任意低的梯度方差。
图 4 显示了多个梯度估计器的方差，该研究将 STL 与「完全蒙特卡罗（Full Monte Carlo）」估计进行了比较。图 4 显示，当匹配指数布朗运动时， STL 获得的方差比其他方案低。下表 4 显示了训练性能的改进。

文章图片

实验
该研究的实验设置如下表所示，该研究在 MNIST 和 CIFAR-10 上进行了 toy 回归、图像分类任务，此外他们还研究了分布外泛化任务：

文章图片

为了对比求解器与 adjoint 的反向传播，研究者比较了固定和自适应步长的 SDE 求解器，并比较了 Li 等人提出的随机 adjoint 之间的比较，图 5 显示了这两种方法具有相似的收敛性：

文章图片

1D 回归
该研究首先验证了 SDE-BNN 在 1D 回归问题上的表现。以弥散过程的样本为条件，来自 1D SDE-BNN 的每个样本都是从输入到输出的双向映射。这意味着从 1D SDE-BNN 采样的每个函数都是单调的。为了能够对非单调函数进行采样，该研究使用初始化为零的 2 个额外维度来增加状态。图 2 显示了模型在合成的非单调 1D 数据集上学习了相当灵活的近似后验。

文章图片

图像分类
表 1 给出了图像分类实验的结果。 SDE-BNN 通常优于基线，由结果可得虽然连续深度神经 ODE (ODEnet) 模型可以在标准残差网络上实现类似的分类性能，但校准（calibration）较差。

文章图片

图 6a 展示了 SDE-BNN 的性能，图 6b 显示具有相似准确率但比神经 ODE 校准更好的结果。

文章图片

表 1 用预期校准误差量化了模型的校准。 SDE-BNN 似乎比神经 ODE 和平均场 ResNet 基线能更好地校准。

文章图片

下图 7 显示了损坏测试集上相对于未损坏数据的误差，表明随着扰动严重性级别的增加以及表 1 中总结的总体误差度量， mCE 稳步增加。在 CIFAR10 和 CIFAR10-C 上， SDE-BNN 和 SDE -BNN + STL 模型实现了比基线更低的整体测试误差和更好的校准。

网络|结合随机微分方程，多大Duvenaud团队提出无限深度贝叶斯神经网络( 三 )

推荐阅读

如何找寻自我

缝纫机调线器怎么安装平车方法如何

强组词强字组词

火笋鸡翅的做法（增肥食谱）

闺女生日快乐祝福语朋友圈

LV请来潮牌设计师做艺术总监，看中的是啥

老虎豆怎么做好吃老虎豆图片怎样弄来吃

暖气有流水声是什么原因

皮球是什么体

手机怎样开通QQ空间

男生发mua说明 mua是什么意思

手指盖凹陷怎么回事

对自己的生活失去掌控咋调整

小米10s怎么没有月亮模式

我想找个偏僻的地方搞养殖！有没有推荐的地方？

南京养老金认证上门服务怎么申请南京市养老金认证

如何评价猪场阉割猪？

最后一个字是豹的成语

泰山散酒怎么样

猫发情的声音(猫发情的叫声)