MIT机器人轻松搞定桌游叠叠乐:你能玩过它算我输 |《科学》子刊( 三 )

MIT研究团队的做法是,模仿人类玩这个游戏的方式。

在训练期中,机器人会随机选择一个积木,以及推动的积木的位置。 然后用较小的力道,试图将积木推出塔外。

MIT机器人轻松搞定桌游叠叠乐:你能玩过它算我输 |《科学》子刊

对于每一次尝试,计算设备都会记录相关的视觉、触觉、力度等指标,并标注是否成功。

按照这种方法,机器人只训练大约300次,就对这些测量结果进行聚类分组。

比如,一组数据可能代表机器人在难以移动的积木上的尝试,而另一组数据则代表一个比较容易移动的积木上的尝试。

对于每个数据集群,研究团队都给机器人开发了一个简单的模型,根据当前的视觉和触觉数据来预测移动一个积木的行为。

他们说,让机器人建立聚类,然后学习每个聚类的模型,而不是学习一个能完全捕捉可能发生的一切的模型,能够极大地提高了机器人学习游戏的效率。

推荐阅读