文章图片
此外 , 该研究还与不使用感知相似性的变体进行了比较 。 如表 4 所示 ,我们可以发现感知码字在线性评估和重构图像分类方面获得了更高的准确率 。 这表明感知 codebook 具有更多的语义意义 , 有利于图像重构过程 。
文章图片
下图为使用 BEiT 和 PeCo 在 ImageNet-1k 上重构任务的示例 。 对于每个样本 , 第一张是原始图像 , 第二张是对应的掩码图像 , 第三张是 BEiT 重构图像 , 最后一张是从感知 codebook(PeCo)重构的图像 。 PeCo 在感知 codebook 的帮助下 , 能够对掩码区域进行更语义化的预测 。
文章图片
推荐阅读
- 视觉|超高色准打破行业天花板,创维S82还原真实世界
- 训练|华为运动健康 Beta 新版本测试:新增健身课程分享、血压挑战计划
- 视觉|下瓦房“钻石壹号”品牌区 ——全新升级 耀世登场
- 模型|经逆向工程,Transformer「翻译」成数学框架 | 25位学者撰文
- Windows|微软正为Windows 11开发新Mica视觉效果
- 模型|神经辐射场去掉「神经」,训练速度提升100多倍,3D效果质量不减
- 硬件|瑞芯微智能视觉芯片RV1126荣获CPSE安博会最高殊荣:金鼎奖
- 检测|基于双目视觉的目标检测与追踪方案详解
- 训练|腾讯云副总裁吴运生:AI落地出现新变化,对细分行业需要深入理解
- 最新消息|视觉中国成立元视觉拍卖公司 注册资本5000万