数据|用TensorFlow实现ML模型并调优：每秒可做3亿次预测( 三 )_竞标者|速度|模型|服务|研究

文章图片

优化
研究者在 TF 中实施的模型最初比定制的 FMs 慢得多，为了寻找加速空间，研究者大量使用内置的 TF 分析器来寻找执行时间最长的操作，并尽可能进行了改进。最常见的是各种冗余的 reshape 或转换运算。其中一个更有趣的发现是 Adam 优化器比 Adagrad 慢得多 (大约 50%) ，尽管二者运算数量上的差异很小。分析器显示，对稀疏权值进行梯度更新需要大量计算时间。这是因为模型的权重是稀疏的 (特征大部分是分类的，因此非常稀疏)，而优化器没有考虑到这个事实。
由于用 Adagrad 替换 Adam 意味着深度模型性能的显著降低，研究者也寻找了其他解决方案：切换到 Lazy Adam 的优化器被证明是非常有效的，因为它可以非常有效地处理稀疏权重问题。结果显示，其整体加快了超过 40% 的训练速度，与 Adagrad 相接近。
由于使用了自适应优化器（比如 Adam），这也需要存储权重矩和方差，每个参数将存储三个值，将保存的模型大小增加了三倍。然而，这些值实际上并不用于预测，只用于训练。研究者利用这一点构建了优化过程，去掉了这些值的模型，减少了 66% 的数据量，并降低了内存使用量和成本。

数据|用TensorFlow实现ML模型并调优：每秒可做3亿次预测( 三 )

推荐阅读

如何找寻自我

缝纫机调线器怎么安装平车方法如何

强组词强字组词

火笋鸡翅的做法（增肥食谱）

闺女生日快乐祝福语朋友圈

LV请来潮牌设计师做艺术总监，看中的是啥

老虎豆怎么做好吃老虎豆图片怎样弄来吃

暖气有流水声是什么原因

皮球是什么体

手机怎样开通QQ空间

男生发mua说明 mua是什么意思

手指盖凹陷怎么回事

对自己的生活失去掌控咋调整

小米10s怎么没有月亮模式

我想找个偏僻的地方搞养殖！有没有推荐的地方？

南京养老金认证上门服务怎么申请南京市养老金认证

如何评价猪场阉割猪？

最后一个字是豹的成语

泰山散酒怎么样

猫发情的声音(猫发情的叫声)