考虑可转移跨模态表示学习的对齐高效图像句子检索
图像句子检索任务旨在搜索图像中给定的句子并从图像查询中检索句子 。目前的检索方法都是有监督的方法,需要大量的标注进行训练 。然而,考虑到劳动力成本,在许多应用(例如医学检索)中很难重新对齐大量多模态数据,这导致了无监督的多模态数据 。
【考虑可转移跨模态表示学习的对齐高效图像句子检索】

文章插图
为了解决这个问题,杨阳领导的研究团队于2024年2月15日在 高等教育出版社和施普林格·自然联合出版的《计算机科学前沿》 上发表了他们的新研究 。该团队力争通过设计对齐传输向非并行图像句子检索迈出一步 , 并提出了一种新颖的对齐高效图像句子检索方法(AEIR) 。在研究中 , AEIR使用具有多模态一致性的其他辅助并行数据作为源域,以及缺失一致性的非并行数据作为目标域 。与单模态迁移学习不同,AEIR 将语义表示和模态一致性关系一起从源域迁移到目标域 。首先,AEIR 使用源域中的跨模态并行数据学习跨模态一致性表示 。然后AEIR联合优化基于对抗性学习的语义转移约束和基于度量学习的结构转移约束来学习跨域跨模态一致性表示 , 实现一致性知识从源域到目标域的迁移 。在不同迁移场景下进行的大量实验表明,语义迁移和结构迁移可以有效地学习跨领域的跨模态的不变特征 。所提出的高效的基于对齐的图像句子检索网络验证了AEIR比当前的跨模态检索方法、半监督跨模态检索方法和跨模态转移方法更具优势 。考虑到域差异,未来的工作可以集中于进行积极的跨模式转移 。
推荐阅读
- IHI发起一项新的跨学科计划彻底改变阿尔茨海默病的检测诊断预防和治疗方式
- 青岛跨海大桥多长全长36.48公里是目前世界上最长的跨海大桥 青岛跨海大桥长度多少公里
- 液晶电视尺寸选择 液晶电视尺寸选择 必须考虑观看距离
- 关于新大学英语·跨文化交际阅读教程2 教师用书的简介 新大学英语·跨文化交际阅读教程2 教师用书
- 2018跨行转账还收费吗 2019年7月以后跨行转账收费吗
- WhatsApp可能很快就会允许跨平台消息传递
- 您是否正在寻找一款性价比较高的Android平板电脑您应该考虑的两个选择
- Jio和Airtel考虑将5G服务资费上调10%
- 2019跨行转账手续费 2019年跨行转账用不用手续费
- 止水螺杆和对拉螺杆什么区别 止水对拉螺杆定额怎么考虑的