四小时搜索NN结构,厦大提出快速NAS检索方法( 二 )
除此之外,本文还提出并证明了一种保序精度排序假设,进一步加速学习过程。在 CIFAR-10 上,通过我们的方法搜索的结构实现了 2.55%的测试误差,GTX1080Ti 上仅 4 个 GPU 小时。在 ImageNet 上,我们实现了 75.2%的 top1 准确度。
背景介绍
给定数据集,神经架构搜索(NAS)旨在通过搜索算法在巨大的搜索空间中发现高性能卷积架构。NAS 在各个计算机视觉领域诸如 图像分类,分割,检测等取得了巨大的成功。
图一:神经网络结构检索
如图一显示,NAS 由三部分组成:搜索空间,搜索策略和性能评估:传统的 NAS 算法在搜索空间中采样神经网络结构并估计性能,然后输入到搜索策略算法中进行更新,一直迭代至收敛。尽管取得了显着进步,但传统的 NAS 方法仍然受到密集计算和内存成本的限制。
例如,强化学习(RL)方法 [1] 需要在 20,000 个 GPU 上训练 4 天,以此训练和评估超过 20,000 个神经网络。最近 [2] 中提出的可微分的方法可以将搜索空间松弛到连续的空间,从而可以通过在验证集上的梯度下降来优化体系结构。然而,可微分的方法需要极高的 GPU 显存,并且随着搜索空间的大小线性增长。
推荐阅读
- 守望先锋2|最烧脑的网游建筑,内部结构精细又复杂,这就是大佬的世界么?
- |风格以魔幻为主的游戏插画,人物、结构、细节处理太赞了
- 我的世界|我的世界:遗迹结构的混乱,看似生成奇特,但却是1.18的问题所在
- rank|水子哥直播无意间暴露浏览器搜索记录!观众:这孩子长大了!
- jkl|JKL想恋爱了!疯狂搜索“去哪里求姻缘最灵”,还有各种养生方法
- 逆水寒|富婆之间的战斗有多烧钱?逆水寒富婆对线,四小时刷完3万块!
- 我的世界|我的世界:5个mc稀有结构,要塞排第三,第一还很“常见”?
- 苹果公司|苹果公司为何屡屡成功?以摄像头升级为例,看苹果独特的组织结构
- 投影仪|女老师火了,投影仪没关,搜索内容曝光
- 机器人|仿真女性机器人火了!内部结构犹如真人,用途甚至比真人还多