图谱|云知声-中科院自动化所联合实验室在全国知识图谱与语义计算大会(CCKS-2021)中斩获两大医疗赛道冠亚军及技术创新奖
文章图片
日前 , 第十五届全国知识图谱与语义计算大会(CCKS-2021)线上顺利召开 。 会上公布了CCKS-2021技术评测结果 , 云知声-中科院自动化所联合实验室在医疗科普知识答非所问识别赛道斩获冠军 , 并在面向中文电子病历的医疗实体及事件抽取赛道获得亚军以及唯一的技术创新奖 。
CCKS由中国中文信息学会语言与知识计算专业委员会主办 , 是知识图谱、语义技术、链接数据等领域的核心会议 。 其中 , CCKS技术评测致力于促进国内知识图谱领域的技术发展 , 以及学术成果与产业需求的融合和对接 , 而“技术创新奖”的设立 , 专门用于鼓励创新性技术的使用 。
医疗科普知识答非所问(以下简称答非所问)是指针对问答形式的医疗科普内容 , 回答A和问题Q没有关联 , 即答案不能满足所提问题 。 在医疗科普内容里 , 一般有两种答非所问形式 , 一种是回答A和问题Q完全没有关联 , 不能回答提问的问题;第二种是回答A和问题Q有关联 , 但回答的方向不对 , 没有回答提问的问题 。 该任务是第一次在CCKS进行开展 , 旨在识别出医疗科普知识中的答非所问语句 , 助力医疗健康科普事业的发展 。
为应对样本学习难度大以及训练数据缺乏两大核心挑战 , 团队提出了一个融合多策略的系统 。 该系统由基于对抗训练和对比学习的深度学习融合模块与基于无标注数据增强和课程学习的模块共同组成 。 团队成员包括夏飞、翁诣轩、夏茂晋、王强和黄金凤 。 指导老师是何世柱、刘康、刘升平和赵军老师 。 在本次评测中 , 该系统在官方决赛测试集上取得了F1指标0.70698的最高分数 。
B榜(最终)成绩:
【图谱|云知声-中科院自动化所联合实验室在全国知识图谱与语义计算大会(CCKS-2021)中斩获两大医疗赛道冠亚军及技术创新奖】
文章图片
面向中文电子病历的医疗实体及事件抽取赛道要求参赛者提供一个解决方案来同时解决医疗实体识别和医疗事件抽取两个任务 。 其中医疗命名实体识别子任务 , 旨在对于给定的一组电子病历纯文本文档 , 识别并抽取出与医学临床相关的实体提及 , 并将它们归类到预定义类别 , 比如疾病、治疗、检查检验等;而医疗事件抽取子任务旨在给定主实体为肿瘤的电子病历文本数据 , 定义肿瘤事件的若干属性 , 如肿瘤大小 , 肿瘤原发部位等 , 识别并抽取事件及属性 , 进行文本结构化 。
为同时解决医疗实体识别和医疗事件抽取两个任务 , 团队提出了基于序列标注的实体识别与事件抽取统一建模系统 。 此外 , 为了应对医疗领域标注数据稀疏的挑战 , 该系统集成了基于大规模预训练模型继续预训练、多粒度文本模式增强训练、半监督领域自适应训练等多种训练机制 。 任务参与方包括蚂蚁集团保险技术部、腾讯医疗AI实验室、腾讯天衍实验室、阿里云、浙江大学、中国科学技术大学、协和医学院等知名研究机构及高校 。 最终团队获得亚军以及赛道唯一技术创新奖 。
推荐阅读
- 专访|专访犀思云创始人张雄国:NaaS服务的核心是成就客户
- 科技|华数集团战略合作部·华数传媒网络余浙东总经理参观云针科技
- 生产|云丁科技:用10年打造全球最大的智能门锁生产基地
- 驱动|[原]百度智能云知识中台,驱动产业智能化升级
- 影像|智慧医疗需要这样的一片“云”
- 阿里云|揭秘“云上奥运”:冬奥云数据中心300余天“免费”自然冷却
- Microsoft|前高管建议微软剥离Office和Windows以促进云计算业务
- 新浪科技|前高管建议微软剥离Office和Windows以促进云计算业务
- 新浪科技|微软前高管:建议卖掉Windows业务专注于云计算
- 利器|小时级部署安装,腾讯云遨驰推出私有化交付利器