Huskarl 最近进展:已支持与 OpenAI Gym 环境无缝结合!( 三 )

模型框架

Huskarl 是一个新的开源框架 , 用于深度强化学习训练 , 专注于模块化和快速原型设计 。 它基于 TensorFlow 2.0 构建 , 并使用了 tf.keras API 以实现其简洁性和可读性 。

Huskarl 最近在 PoweredByTF 2.0 挑战赛(https://tensorflow.devpost.com/)中获得第一名 , 该挑战赛意在让研究人员更易于对深度强化学习算法进行运行、测试、优化和对比的操作 。

Huskarl 与 TensorFlow 抽象出计算图的管理以及 Keras 创建高级模型的想法类似 , 它抽象出了智能体与环境的交互 。 这便使用户能够专注于开发和理解算法 , 同时还可以防止数据泄漏 。 Huskarl 可以做到与 OpenAI Gym 环境的无缝结合 , 其中也包括了 Atari 环境 。 下面是创建并可视化深度强化学习网络(DQN)智能体所需的完整代码 , 该智能体将学习 cartpole 平衡问题 。

创建并可视化深度强化学习网络(DQN)智能体的完整代码

推荐阅读