金磊 萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI
快 , 着实有点快 。
现在 , 经典模型BERT只需2.69分钟、ResNet只需16秒 。
啪的一下 , 就能完成训练!
文章图片
这是华为全联接2021上 , 针对异构计算架构CANN 5.0放出的最新性能“预热”:
- 4K老电影AI修复 , 原本需要几天时间 , 现在几小时就能完成;
- 针对不同模型进行智能优化 , 300+模型都能获得30%性能收益;
- 支持超大参数模型、超大图片计算 , 几乎无需手动修改原代码……
为的就是尽可能提升AI模型的计算效率 , 减少在训练和推理上占用的时间 。
它的存在 , 能让开发者在使用AI模型时 , 最大程度地发挥硬件的性能 。
异构计算架构究竟为什么重要 , 昇腾CANN 5.0又究竟有哪些特性和优势?
我们对华为昇腾计算业务副总裁金颖进行了采访 , 从CANN 5.0的功能解读中一探究竟 。

文章图片
为什么需要AI异构计算架构?
首先来看看 , AI异构计算架构到底是什么 。
通常做AI模型分两步 , 先选用一种框架来搭建AI模型 , 像常见的Caffe、Tensorflow、PyTorch、MindSpore等;再选用合适的硬件(CPU、GPU等)来训练AI模型 。
BUT , 在AI训练框架和硬件之间 , 其实还有一层不可或缺的“中间架构” , 用来优化AI模型在处理器上的运行性能 , 这就是AI异构计算架构 。

文章图片
面对各种AI任务 , AI异构计算架构会充当“引路员” , 针对硬件特点进行分工 , 用“组合拳”加速训练/推理速度 , 最大限度地发挥异构计算的优势 。
如果不重视它 , 各类硬件在处理AI任务时 , 就可能出现“长跑选手被迫举重”的情况 , 硬件算力和效率不仅达不到最优 , 甚至可能比只用CPU/GPU更慢 。
目前已有越来越多的企业和机构 , 注意到异构计算架构的重要性 , 开始着手布局相关技术 , 不少也会开放给开发者使用 。
但开发者在使用这些异构计算架构时 , 会逐渐发现一个问题:
不少AI异构计算架构 , 基本只针对一种或几种特定场景来设计 , 如安防、客服等AI应用较成熟的场景;针对其他场景设计的AI模型 , 异构计算架构的性能会有所下降 。
就像安防公司会针对安防类AI模型进行优化一样 , 这类异构计算架构往往不具有平台通用性 。
推荐阅读
- 代码|GGV纪源资本连投三轮,这家无代码公司想让运营流程变简单
- 建设|这一次,我们用SASE为教育信息化建设保驾护航
- 年轻人|人生缺少的不是运气,而是少了这些高质量订阅号
- 生活|气笑了,这APP的年度报告是在嘲讽我吧
- bug|这款小工具让你的Win10用上“Win11亚克力半透明菜单”
- Samsung|新渲染揭示Galaxy S22 Ultra几乎就是Galaxy Note复刻版
- 硬件|汽车之家年底裁员,员工称多个职能部门已被撤销
- 视点·观察|科技巨头纷纷发力元宇宙:这是否是所有人的未来?
- 硬件|Yukai推Amagami Ham Ham机器人:可模拟宠物咬指尖
- 硬件|闪极140W多口充电器发布:首发399元 支持PD3.1