吊打90%人类,Meta首个“AI外交模型”登上Science


吊打90%人类,Meta首个“AI外交模型”登上Science


文章图片


吊打90%人类,Meta首个“AI外交模型”登上Science


文章图片


吊打90%人类,Meta首个“AI外交模型”登上Science


文章图片


吊打90%人类,Meta首个“AI外交模型”登上Science


文章图片


吊打90%人类,Meta首个“AI外交模型”登上Science


文章图片


吊打90%人类,Meta首个“AI外交模型”登上Science


文章图片


吊打90%人类,Meta首个“AI外交模型”登上Science


文章图片


吊打90%人类,Meta首个“AI外交模型”登上Science


文章图片


吊打90%人类,Meta首个“AI外交模型”登上Science


编辑:Cris
【新智元导读】外交官的活儿 , AI也能干了?几十年来 , 外交一直被认为是「AI绝不可能接管的工作」 。
因为它要求玩家掌握、理解他人的观点以及背后的动机 , 制定复杂的计划并及时调整 , 然后应用语言与他人达成合作 , 最后说服他们建立伙伴关系和联盟等 。
对沟通、信任和背叛的关注 , 使外交与围棋和国际象棋等更注重规则的「游戏」截然不同 。
然而Meta的最新研究表明:外交官的活儿 , AI也很可能能干了!

在2022年8月至10月进行的线上外交游戏比赛中 , CICERO在所有「选手」中高居前10% 。 它的平均得分为25.8% , 是其82名对手平均得分(12.4%)的两倍还多 。
更加值得一提的是 , 在实际的比赛过程中 , 没有一名玩家——发现是人工智能在打比赛!
如今 , 这项最新成果也以论文的形式发表在了Science上 。

【吊打90%人类,Meta首个“AI外交模型”登上Science】CICERO的推出 , 必将成为自然语言处理领域的一项重大成就 。
因为这预示着人工智能有潜力「更好、更自然地与人类合作」 , 代表着人类向AGI迈进的一大步 。
吊打90%人类 , 无人发现AI参与《外交》是一款七人制经典策略游戏 , 可以说是棋盘游戏Risk、纸牌游戏扑克和电视节目Survivor的结合 , 由美国著名玩具公司孩之宝(Hasbro)于1950年代开发 。
通过对20世纪初欧洲七大国的「角色扮演」 , 玩家需要与其他选手建立信任、谈判和合作 , 并尽可能多地占领领土 。

为避免因对手的反击而被阻止 , 玩家会私下交流、讨论潜在的协调行动 , 然后将他们的行动付诸纸上 , 遵守或违反对其他参与者的承诺 。
这样一款充满欺骗与权术的游戏 , 也被一些玩家视为失去朋友的理想方式 , 堪称「友尽赛」!

正如上文所言 , 与国际象棋和围棋等游戏不同 , 外交是一种更关乎于「人」而不是「规则」的游戏 。
如果模型无法识别某人可能在虚张声势 , 或者精准识别其他玩家某步棋中的攻击性 , 它显然会很快输掉比赛 。
同样 , 如果它不像一个真人那样说话 , 表现出同理心、建立关系、谈论游戏 , 它就不会找到其他愿意与它一起工作的玩家 。
在过去的几十年里 , 研究人员一直在构建一种自然语言交流能力的「AI外交官」 。 然而因为这一重大挑战已经远远超出了现有AI的能力范畴 , 因此从来没有一名研究员成功过 。
直到近期CICERO的横空出世 , 才彻底颠覆了这个事实 。

CICERO本质上是一台「聊天机器人」 , 可以与其他外交玩家沟通 , 从而在游戏中采取有效行动 。
西塞罗则是一名古罗马著名政治家、哲学家、演说家 , 诞生于公元前106年1月3日 , 以善于雄辩而闻名于罗马政界 。
Meta将在这款AI模型取名于此 , 意义不言而喻 。

马尔库斯·图利乌斯·西塞罗
2022年8月至10月 , CICERO在webDiplomacy组织的线上《外交》比赛中 , 共参加了40场比赛 , 在所有参与者中成绩高居前10%;在打了五场或更多比赛的19人中 , 西塞罗则排名第二 。
40场比赛中 , CICERO的平均得分为25.8% , 是其他82名对手平均得分(12.4%)的两倍还多 , 并将其战略对话和游戏能力展现得淋漓尽致 。

推荐阅读