
文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

【新智元导读】外交官的活儿 , AI也能干了?几十年来 , 外交一直被认为是「AI绝不可能接管的工作」 。
因为它要求玩家掌握、理解他人的观点以及背后的动机 , 制定复杂的计划并及时调整 , 然后应用语言与他人达成合作 , 最后说服他们建立伙伴关系和联盟等 。
对沟通、信任和背叛的关注 , 使外交与围棋和国际象棋等更注重规则的「游戏」截然不同 。
然而Meta的最新研究表明:外交官的活儿 , AI也很可能能干了!
在2022年8月至10月进行的线上外交游戏比赛中 , CICERO在所有「选手」中高居前10% 。 它的平均得分为25.8% , 是其82名对手平均得分(12.4%)的两倍还多 。
更加值得一提的是 , 在实际的比赛过程中 , 没有一名玩家——发现是人工智能在打比赛!
如今 , 这项最新成果也以论文的形式发表在了Science上 。
【吊打90%人类,Meta首个“AI外交模型”登上Science】CICERO的推出 , 必将成为自然语言处理领域的一项重大成就 。
因为这预示着人工智能有潜力「更好、更自然地与人类合作」 , 代表着人类向AGI迈进的一大步 。
吊打90%人类 , 无人发现AI参与《外交》是一款七人制经典策略游戏 , 可以说是棋盘游戏Risk、纸牌游戏扑克和电视节目Survivor的结合 , 由美国著名玩具公司孩之宝(Hasbro)于1950年代开发 。
通过对20世纪初欧洲七大国的「角色扮演」 , 玩家需要与其他选手建立信任、谈判和合作 , 并尽可能多地占领领土 。
为避免因对手的反击而被阻止 , 玩家会私下交流、讨论潜在的协调行动 , 然后将他们的行动付诸纸上 , 遵守或违反对其他参与者的承诺 。
这样一款充满欺骗与权术的游戏 , 也被一些玩家视为失去朋友的理想方式 , 堪称「友尽赛」!
正如上文所言 , 与国际象棋和围棋等游戏不同 , 外交是一种更关乎于「人」而不是「规则」的游戏 。
如果模型无法识别某人可能在虚张声势 , 或者精准识别其他玩家某步棋中的攻击性 , 它显然会很快输掉比赛 。
同样 , 如果它不像一个真人那样说话 , 表现出同理心、建立关系、谈论游戏 , 它就不会找到其他愿意与它一起工作的玩家 。
在过去的几十年里 , 研究人员一直在构建一种自然语言交流能力的「AI外交官」 。 然而因为这一重大挑战已经远远超出了现有AI的能力范畴 , 因此从来没有一名研究员成功过 。
直到近期CICERO的横空出世 , 才彻底颠覆了这个事实 。
CICERO本质上是一台「聊天机器人」 , 可以与其他外交玩家沟通 , 从而在游戏中采取有效行动 。
西塞罗则是一名古罗马著名政治家、哲学家、演说家 , 诞生于公元前106年1月3日 , 以善于雄辩而闻名于罗马政界 。
Meta将在这款AI模型取名于此 , 意义不言而喻 。
马尔库斯·图利乌斯·西塞罗
2022年8月至10月 , CICERO在webDiplomacy组织的线上《外交》比赛中 , 共参加了40场比赛 , 在所有参与者中成绩高居前10%;在打了五场或更多比赛的19人中 , 西塞罗则排名第二 。
40场比赛中 , CICERO的平均得分为25.8% , 是其他82名对手平均得分(12.4%)的两倍还多 , 并将其战略对话和游戏能力展现得淋漓尽致 。
推荐阅读
- 世界上六项神秘事件,其中3个发生在中国,至今科学无法解释
- 中国将在十年内登月: 登月巨型火箭CZ-9, 为何变成了“一根棍子”?
- 矿洞发现一80万年前芯片,结构复杂,专家:外星人入侵的证据!
- 地球“仅”6 ronna克!科学家提出最新计量单位,1后面27个0!
- 如果遇到外星人怎么办?列举科学家给出的接触方式,自行判断真假
- Nature Communications:史无前例的实验证据挑战了关于等离子体如何发射或吸收辐射的传统理论
- “脱衣服” “踹胸部” 花样频出的校园霸凌何时休?
- “东油”潘哲君教授再次入选2022年度全球“高被引科学家”名单
- 「小说连载」第一章:纪元对话、灾变