Huskarl 最近进展:已支持与 OpenAI Gym 环境无缝结合!( 二 )
----Huskarl 最近进展:已支持与 OpenAI Gym 环境无缝结合!//---- http://
雷锋网 AI 科技评论按:近日 , Github 上开源的一个专注模块化和快速原型设计的深度强化学习框架 Huskarl 有了新的进展 。 该框架除了轻松地跨多个 CPU 内核并行计算环境动态外 , 还已经成功实现与 OpenAI Gym 环境的无缝结合 。 TensorFlow 发布了相应的文章来报道此研究成果 , 雷锋网 AI 科技评论将其编译如下 。
背景概述
深度学习革命在计算机视觉和自然语言处理等领域取得了许多最新的进展和突破 。 尤其是在深度强化学习这个特别的领域 , 我们已经看到了非凡的进展 。 2013 年 DeepMind 出版了「用深度强化学习来玩 Atari」 , 这个模型只通过观看屏幕上的像素 , 就可以学习如何玩 Atari 游戏 。 三年后 , AlphaGo 击败了围棋世界冠军 , 这一举动吸引了全球观众的注意 。 在这之后 , AlphaZero 又打破了从人类比赛中学习的规定 , 将自我学习推广到任何完美的信息游戏 , 并有效地成为围棋、国际象棋和日本将棋的世界冠军 。 Huskarl 在这样的深度学习热潮之下 , 有了更深入的研究进展 。
推荐阅读
- RNG|MLXG透露起诉RNG公会进展,没任何商量余地,承诺以后会认真直播
- 上古卷轴6|B社文件夹进展! 老滚6要2026年后辐射5已有大纲
- 美颜|斗鱼一姐阿冷最近消息 直播不小心关了美颜秒变“照骗”
- 剑齿虎|CF:没属性的剑齿虎不够过瘾?永久的剑齿虎-X来了
- vr游戏|PS+11月会免游戏公布,会免游戏持续不行,最近操作有点迷
- ZARD|Dota2-Zard透露“刀塔拯救计划”进展:预计下个月就能做出来了!
- 地下城与勇士|DNF:“17w玉玺案”又出新进展!“骗子”9w卖出后,却被强行扣下
- 中单|为何果子哥最近舆论变好?网友调侃:三大混子,他是最强的那个
- 勇者斗恶龙10离线版|为何果子哥最近舆论变好?网友调侃:三大混子,他是最强的那个
- RNG|一招让你记住英雄联盟的英雄名字名字