用Attention玩转CV,一文总览自注意力语义分割进展(12)

总结

本文抛开 glocal context 的观点,重新从传统算法的角度出发,对上述文章作了重新的思考总结。回顾而来,所谓最新的成果,不过是站在了先贤的肩膀上,在深度学习的形式上进行了探索。追本溯源,笔者本人也不过是经典算法 EM 的搬运工。借此,向鼎力帮助我的三位师兄(Zhisheng Zhong,Jianlong Wu和Yibo Yang)和两位导师(Zhouchen Lin, Hong Liu)致敬。

感谢Qijie、大大拉头的仔细审稿。还要感谢《EM 算法的九层境界》的作者史博和科学空间苏剑林,他们的博文对我有很大的启发。

参考

Attention is All You Need https://arxiv.org/abs/1706.03762

Non-local Neural Networks https://arxiv.org/pdf/1711.07971.pdf

PSANet: Point-wise Spatial Attention Network for Scene Parsing https://hszhao.github.io/papers/eccv18_psanet.pdf

Dual Attention Network for Scene Segmentation https://arxiv.org/abs/1809.02983

推荐阅读