用Attention玩转CV,一文总览自注意力语义分割进展( 二 )
Nonlocal
Nonlocal[2]中的核心操作为:
其中,是像素个数,是像素特征维度(通道数),计算和之间的相关度(或称“能量”),对进行变换。可以看作对的加权平均得到,作为对的重构,这里权重为。
关于和的选择,作者列出了多个选项,并最终选择了
的形式,其中分别对应 NLP Transformer 里的 query , key 和 value 。此外,经过卷积后和相加,作为 Non-local 模块的输出。最后结构图如下:
图1/13
Non-local Block
其实,这里和的具体选择,对效果影响不大。在笔者做过的语义分割实验中, query 和 key 共享,节省一些参数,并且这样计算出的是个对称矩阵。甚至可以考虑将转换省略,直接用本身计算,而把卷积放在模块之前之后,这样的效果也不逊色。当然,不同的任务应该对应于不同的最优选项。今年 arxiv 有篇文章[16]详细对比分析了这些细节在不同任务中的影响。笔者认为此处最关键的是加权平均,而非转换。
推荐阅读
- 法术|双城之战:羁绊、海克斯强化、装备一文看懂
- 三国杀|三国杀:天机图——到底有哪些武将能够玩转呢?
- 炉石传说|《炉石传说》佣兵战纪攻略来袭,斗鱼狗贼教你轻松玩转全新模式
- 手机游戏|英雄联盟手游:上大分太难?玩转这4点,秒变峡谷老司机
- 炉石传说|炉石传说:职业选手如何玩转佣兵战纪?速度拉满打出碾压对局
- 地下城与勇士|DNF:快速玩转100级装备体系,回归玩家也能随时成型
- 仙剑奇侠传七|“吃鸡”游戏中单价最高的氪金物品!氪度力压车皮,却一文不值!
- 手办|阴阳师:欧皇无氪入手大舅手办皮肤 教你玩转酒宴酣歌翻牌子活动
- 三国志战略版|三国志战略版:橙将朱儁来袭,看升级版群弓如何玩转三战!
- 地下城与勇士|DNF:DNF超高质量减负,9.14减负改动一文看完