把多个聊天机器人凑一块聊天,结局会是什么?这个比赛也许有答案( 五 )
具体详情:
群聊主题
在任务中,主办方会给定群聊主题,在每个主题下进行轮对话 (N 表示参与群聊机器人总数)。其中,主题包括但不限于医疗、交通、教育、金融等。
轮转策略
在某个群聊主题下,主办方将按一定策略初始化机器人回复顺序,确保所有机器人的回复优先级总体相同。而在其他群聊主题中,主办方将多次轮番调换机器人回复顺序,以保证最终评分环境的公平性。
消息决策
在评测任务中,当主办方向每个机器人请求回复时,会提供当前群聊主题和历史消息记录。参赛队伍需要根据群聊主题和历史消息记录进行相关决策,以生成合理的回复。
赛果评价方面,届时会分为初赛 & 决赛两个阶段。在初赛阶段,主办方将采取自动评价指标对参赛队伍进行评价,机器人在群聊中的性能表现将会作为排名依据,这些指标包括:
Topic:评估输出回复和群聊主题的相关程度。
推荐阅读
- 超级机器人大战30|明日方舟:白嫖材料活动更新,玩家收益减少,鹰角策划又不当人?
- edg战队|MTG运气不太好,滔博队魂湘军回归,前苏嫂的聊天记录是假的!
- 夜叉|梦幻西游:门派闯关还能玩吗?世界可以聊天,五开给的都是2药
- 集合啦动物之森|《集合啦动物之森》新增9千多个物品! DLC有BUG
- 超级机器人大战30|不怕被LCK网友喷!Ray发文力挺:希望EDG可以夺冠!祝他们有好运
- 超级机器人大战30|猫神重新跟AG一队训练,瓜主剧透:AG若打不赢狼队,最初首发不保
- 超级机器人大战30|公开讨薪这事 电竞圈也开始了
- 外挂|《超级机器人大战30》里可以挂机获取资源吗?我来教你一招
- 王者荣耀|王者荣耀DL在剑网3潜伏当007?解散多个千人阵营大群,事了拂衣去
- 新世界|《新世界》爆出恶性踢人Bug,直接聊天窗发代码