reset|支持Python 3.10,OpenAI强化学习工具包Gym迎来史上最大更新
机器之心报道
编辑:杜伟
你在用了吗?OpenAI 创建的 Gym 是开源的 Python 库 , 通过提供一个用于在学习算法和环境之间通信的标准 API 以及一组符合该 API 的标准环境 , 来开发和比较强化学习(DL)算法 。 自推出以来 , Gym 的 API 已经成为了领域标准 。
目前 , 在 Gym 的项目主页 , Star 量已经达到了 26.6k 。
文章图片
项目地址:https://github.com/openai/gym
近日 , Gym 迎来了迄今为止最大的更新 , 包括 API 变化、环境变化和其他变化 。
API 变化
首先是 API 变化 , 包括如下:
- env.reset 接受 3 个新的参数(options - 对于无再次初始化环境时控制课程学习等操作有用;seed - 未来环境 seed 可以传递到 reset 参数 。 老的 .seed() 方法被弃用 , 但考虑到向后兼容 , 该方法在 Gym 1.0 发布之前仍继续如常工作;infos - 当设置为 True , reset 将返回 obs, info 。 当前这种做法默认为 False , 但将变成 Gym 1.0 版本的默认行为);
- 环境名称在注册期间不再需要一个版本 , 并将智能推荐类似名称;
- Vector 环境支持 info 中的 terminal_observation 并支持批处理操作空间 。
- blackjack 和 frozen lake 示例环境现在使用 PyGame 进行了更好的图形渲染;
- 机器人环境已移动到 gym-robotics 包中;
- bipedal walker 和 lunar lander 环境现在被合并称为一类;
- Atari 环境现在使用标准种子 API 了;
- 修复了 car_racing box2d 环境中的大错误修复 , 碰撞版本;
- 重构了所有 box2d 和 classic_control 环境 , 以使用 PyGame 而不是 Pyglet 。 因为 pyglet 的问题一直是 gym 项目生命周期中最常见的 GitHub 问题来源之一 。
- 移除 DiscreteEnv 类 , 内置环境将不再使用;
- 增加了大数类型提示;
- 支持 Python 3.10 版;
- 大量额外的代码重构、清理、错误消息改进和小
推荐阅读
- TCL|五款TCL 30系列入门新机登陆欧洲市场:139欧元起售 仅一款支持5G
- Huawei|消息称华为Mate 40E Pro线下门店已在进货:储备麒麟9000L芯片支持5G
- 系统|微软 Surface Duo 现已支持在 Win11 PC 上运行 Android 应用
- 华海智|顶层设计 政策支持 引导培育 我市7家企业入选第六批国家级制造业单项冠军
- 官网|【苹果】海外官网支持36个月免息分期 每月不到88块即可用上13
- 警告!|Conti勒索软件团伙表态支持俄罗斯 扬言对莫斯科采取行动的国家发起报复
- 过程|华为智慧语音11.0.46.300众测:支持边播报边收音,还可查油价
- 车门|华为钱包 AITO 车钥匙开启众测:支持蓝牙车钥匙和 NFC 车钥匙
- Dev|微软 Win11 全新默认应用选择器曝光:重新设计,支持亮/暗切换
- 图片|realme 真我 Buds Q2s 耳机上架:30 小时续航,支持杜比全景声
