用Attention玩转CV,一文总览自注意力语义分割进展
机器之心专栏
作者:李夏
本文总结近两年语义分割领域对 attention 和“低秩”重建机制的探索,并介绍笔者被 ICCV 2019 接收为 Oral 的工作:Expectation-Maximization Attention Networks for Semantic Segmentation(代码已开源:github.com/XiaLiPKU/EMANet)。注:本文中的 attention 仅指 self-attention,不涉及 soft-attention。
Attention 机制继在 NLP 领域取得主导地位[1]之后,近两年在 CV 领域也开始独领风骚。率先将之引入的是 Kaiming He 组的 Nonlocal[2]。此后层出不穷的文章,引发了一波研究 attention 机制的热潮。
仅2018年,在语义分割领域就有多篇高影响力文章出炉,如 PSANet[3],DANet[4],OCNet[5],CCNet[6],以及今年的Local Relation Net[7]。此外,针对 Attention 数学形式的优化,又衍生出A2Net[8],CGNL[9]。而 A2Net 又开启了本人称之为“低秩”重建的探索,同一时期的SGR[10],Beyonds Grids[11],GloRe[12],LatentGNN[13]都可以此归类。
上述四文皆包含如下三步:1.像素到语义节点映射 2.语义节点间推理 3.节点向像素反映射。其中,step 2的意义尚未有对比实验验证,目前来看,step 1 & 3 构成的对像素特征的低秩重建发挥了关键作用。关于如何映射和反映射,又有了 APCNet[14]和笔者的 EMANet[15]等相关工作。
推荐阅读
- 法术|双城之战:羁绊、海克斯强化、装备一文看懂
- 三国杀|三国杀:天机图——到底有哪些武将能够玩转呢?
- 炉石传说|《炉石传说》佣兵战纪攻略来袭,斗鱼狗贼教你轻松玩转全新模式
- 手机游戏|英雄联盟手游:上大分太难?玩转这4点,秒变峡谷老司机
- 炉石传说|炉石传说:职业选手如何玩转佣兵战纪?速度拉满打出碾压对局
- 地下城与勇士|DNF:快速玩转100级装备体系,回归玩家也能随时成型
- 仙剑奇侠传七|“吃鸡”游戏中单价最高的氪金物品!氪度力压车皮,却一文不值!
- 手办|阴阳师:欧皇无氪入手大舅手办皮肤 教你玩转酒宴酣歌翻牌子活动
- 三国志战略版|三国志战略版:橙将朱儁来袭,看升级版群弓如何玩转三战!
- 地下城与勇士|DNF:DNF超高质量减负,9.14减负改动一文看完