把多个聊天机器人凑一块聊天,结局会是什么?这个比赛也许有答案( 六 )
Perplexity:评估输出回复的流畅性。
Distinct:评估输出回复的多样性。
BLEU:评估输出回复相对于参考回复的 N-gram 重合度。
在决赛阶段,主办方则会采取人工评估的方式,以众包的方式对每个群聊机器人的回复在以下三个方面进行评价:
Topic:生成的回复是否符合当前群聊主题 (考虑主题)。
Fluency:生成回复的表达是否流畅,无语法错误 (考虑句子)。
Appropriateness:生成的回复是否符合人们的日常交流习惯 (考虑上下文语境)。
出于一些考虑,本次比赛中将采取匿名评测,即对外只公布参赛队伍的代号和评测成绩,不会公布参赛队伍的具体信息。
报名截止日期:8 月 28 日
按比赛通知中的要求,参赛队伍需要提供聊天机器人的接口 API,主办方将使用该接口 API 进行群聊评测。需要注意的是,接口 API 的阻塞时间为 10s,若超时未回复,则标记回复失败,多次回复失败将影响最终评测得分。
推荐阅读
- 超级机器人大战30|明日方舟:白嫖材料活动更新,玩家收益减少,鹰角策划又不当人?
- edg战队|MTG运气不太好,滔博队魂湘军回归,前苏嫂的聊天记录是假的!
- 夜叉|梦幻西游:门派闯关还能玩吗?世界可以聊天,五开给的都是2药
- 集合啦动物之森|《集合啦动物之森》新增9千多个物品! DLC有BUG
- 超级机器人大战30|不怕被LCK网友喷!Ray发文力挺:希望EDG可以夺冠!祝他们有好运
- 超级机器人大战30|猫神重新跟AG一队训练,瓜主剧透:AG若打不赢狼队,最初首发不保
- 超级机器人大战30|公开讨薪这事 电竞圈也开始了
- 外挂|《超级机器人大战30》里可以挂机获取资源吗?我来教你一招
- 王者荣耀|王者荣耀DL在剑网3潜伏当007?解散多个千人阵营大群,事了拂衣去
- 新世界|《新世界》爆出恶性踢人Bug,直接聊天窗发代码