AI也能种黄瓜了,你想尝尝吗?( 三 )
Sonoma的AI方法论
在AI系统框架的搭建上,Sonoma团队选择基于模型的近似贝叶斯强化学习(RL),因为这一方法具有较高的样本效率,并且便于推广。Tran表示:“样本效率对现实世界的应用至关重要。即使在简单环境下,标准的强化学习算法仍需要数以百万计的试验,才可以培训出良好的代理。对于游戏领域而言,这并不是一个问题,一个代理能够随心所欲地玩各种游戏,所以RL在游戏中已经表现得很成功。而在实际应用中(例如黄瓜种植),我们无法承受数百万次的失败尝试,所以我们需要以不同的方式来思考RL。”
为了让强化学习成为能够应对当今粮食问题的可行解决方案,Sonoma团队认为AI代理必须在初始阶段就要像任何现有系统一样强大,并能够随着时间推移不断学习和改进。团队构思了一个能够综合这些特点的框架(见下图)。
这个框架以训练概率动态模型为起点。这种模型学习类似于模拟器构建,它可以帮助AI代理通过“想象”进行规划。此外,通过模仿学习,AI代理在初始阶段就能像现有的专家级策略那样行事。之后,AI代理将在基于模型的策略持续优化过程上运转,通过每次环境交互来提高其整体性能。
推荐阅读
- csgo|炉石传说:骑士也能玩隐身?驴鸽隐身骑上线,明牌斩杀堪称折磨王
- 三国杀|Win 11也能运行安卓应用,流畅度秒杀模拟器,不信你来试试?
- 手机游戏|梦幻西游手游:听说你想要豪宅?这次满足了!新版本上线前庭后院
- 地下城与勇士|DNF:低成本获取神器装扮,日积月累也能攒齐一套
- s6|金铲铲之战s6测试服:海克斯强化有多爽?超肉坦克也能成为大杀器
- 国服|AG猫神晒出国服鲁班大师和太乙,盾山不ban也能国服,确实挺努力
- 原神|0氪大佬装备堪比神豪,默默积累也能对抗高玩!
- 蒙多|当《我的世界》知名主播投身永劫无间,米子山民也能大杀四方
- 雷神|原神2.2稻妻版本:盘点那些还没上线的角色,有你想要的老婆吗?
- 热血传奇|热血传奇:神装也能贬值,一次重大BUG“祈祷头盔”几乎人手一件