架构|综合LSTM、transformer优势，DeepMind强化学习智能体提高数据效率( 三 )_表征|研究|优势|Atari|智能|智能

文章图片

为了在具有挑战性的 3D 环境中测试 CoBERL ，该研究在 DmLab30 中运行，如下图 2 所示：

文章图片

下表 3 的结果表明与没有对比损失的 CoBERL 相比，对比损失可以显著提高 Atari 和 DMLab-30 的性能。此外，在 DmLab-30 这样具有挑战性的环境中，没有额外损失的 CoBERL 仍然优于基线方法。

文章图片

下表 4 为该研究提出的对比损失与 SimCLR、CURL 之间的比较：结果表明该对比损失虽然比 SimCLR、CURL 简单，但性能更好。

文章图片

下表 5 为从 CoBERL 中删除 LSTM 的效果（如 w/o LSTM 一列），以及移除门控及其相关的跳跃连接（如 w/o Gate 一列）。在这两种情况下 CoBERL 的性能都要差很多，这表明 CoBERL 需要这两个组件（LSTM 和 Gate）。

文章图片

下表 6 根据参数的数量对模型进行了比较。对于 Atari ， CoBERL 在 R2D2(GTrXL) 基线上添加的参数数量有限；然而， CoBERL 仍然在性能上产生了显着的提升。该研究还试图将 LSTM 移到 transformer 模块之前，在这种情况下，对比损失表征取自 LSTM 之前。

文章图片

架构|综合LSTM、transformer优势，DeepMind强化学习智能体提高数据效率( 三 )

推荐阅读

如何找寻自我

缝纫机调线器怎么安装平车方法如何

强组词强字组词

火笋鸡翅的做法（增肥食谱）

闺女生日快乐祝福语朋友圈

LV请来潮牌设计师做艺术总监，看中的是啥

老虎豆怎么做好吃老虎豆图片怎样弄来吃

暖气有流水声是什么原因

皮球是什么体

手机怎样开通QQ空间

男生发mua说明 mua是什么意思

手指盖凹陷怎么回事

对自己的生活失去掌控咋调整

小米10s怎么没有月亮模式

我想找个偏僻的地方搞养殖！有没有推荐的地方？

南京养老金认证上门服务怎么申请南京市养老金认证

如何评价猪场阉割猪？

最后一个字是豹的成语

泰山散酒怎么样

猫发情的声音(猫发情的叫声)