团队|数据挖掘领域大师俞士纶团队新作:最新图自监督学习综述( 六 )



团队|数据挖掘领域大师俞士纶团队新作:最新图自监督学习综述
文章图片

5. 研究资源与实际应用
在附录内容当中 , 本文统计了图自监督学习相关的各种研究资源 , 包括:主流的数据集 , 常用的评估手段 , 不同方法的性能对比 , 以及各方法对开源代码总结 。 这些信息可以更好的帮助研究人员了解、对比和复现现有工作 。
本文总结了图自监督学习在三个领域的实际应用 , 包括:推荐系统 , 异常检测 , 以及化学领域 。 此外 , 更多应用类工作也被总结在附录当中 , 涉及到的领域包括程序修复、医疗、联邦学习等 。
6. 未来的研究方向
针对潜在的研究热点 , 本文分析了图自监督学习中存在的挑战 , 并指出了一些旨在解决这些挑战的未来研究方向 。
A. 理论基础
虽然图自监督学习在各种任务和数据集上都取得较好的性能 , 但其依然缺乏坚实的理论基础以证明其有效性 , 因为大多数工作都只是经验性地设计其代理任务 , 且仅采用实验手段进行评价 。 目前仅有的理论支持来自互信息最大化 , 但互信息的评估依然依赖于经验方法 。 我们认为 , 图自监督学习亟需与图理论相关的研究 , 潜在的理论基础包括图信号处理和谱图理论 。
B. 可解释性与鲁棒性
许多图自监督学习的工作应用于风险敏感性和隐私相关的领域 , 因此 , 可解释且鲁棒的自监督框架对于适应此类学习场景具有重要意义 。 但是 , 现有工作只将下游任务性能视为其目标 , 而忽略了学习表示和预测结果的可解释性 。 此外 , 考虑到真实数据的不完整性以及图神经网络易受对抗攻击的特点 , 我们应当考虑图自监督学习的鲁棒性;然而 , 除个别工作外 , 现有的图自监督学习方法均假定输入数据是完美的 。 因此 , 探索可解释的、鲁棒的图自监督方法是一个未来的潜在方向 。
C. 复杂类型图的代理任务设计
【团队|数据挖掘领域大师俞士纶团队新作:最新图自监督学习综述】当前的大多数工作集中于属性图的自监督学习 , 只有少数工作集中于复杂的图类型 , 例如异质或时空图 。 对于复杂图 , 主要的挑战是如何设计代理任务来捕获这些复杂图的独特数据特征 。 现有的一些方法将互信息最大化的思想应用于复杂图的学习 , 其学习能力比较有限 。 因此 , 一个潜在方向是为复杂的图数据设计多种多样的代理任务 , 这些任务应适应其特定的数据特征 。 此外 , 将自监督技术扩展到更普遍的图类型(例如超图)将是一个可行的方向 , 值得进一步探索 。
D. 图对比学习的增广方法
在 CV 的对比学习中 , 大量的数据增广策略(包括旋转、颜色扭曲、裁剪等)提供了不同的视角 , 从而支持了对比学习中的表征不变性 。 然而 , 由于图结构数据的性质(复杂和非欧几里德结构) , 图上的数据增广方案没有得到很好的探索 。 现有的图增广策略大多采用随机的遮盖 / 乱序节点特征、边修改、子图采样和图扩散等手段 , 这在生成多个图视角时无法提供丰富的多样性 , 同时其表征不变性也是不确定的 。 为了解决这个问题 , 自适应地执行图形增广 , 自动选择增广 , 或通过挖掘丰富的底层结构和属性信息联合考虑更强的增广样本都将是未来潜在的研究方向 。

推荐阅读