深度揭秘华为AI战略!软硬件两手抓,AI王国雏形已现【附下载】| 智东西内参( 三 )

达芬奇架构,锁定 AI 算子级别优化。针对 AI 计算场景,华为研发了达芬奇指令集架构,具备高算力、高能效、灵活可裁剪的特性。达芬奇架构的主要特性是针对矩阵运算的 3D Cube技术。AI 计算过程中由于神经网络链式求导的需求,大量张量(高维矩阵)计算成为传统处理器速度的瓶颈。3D Cube 技术针对矩阵运算做加速,使 AI核心在一个时钟周期内实现 4096个 MAC 操作,从而相对 CPU 和 GPU 产生数量级的提升。

深度揭秘华为AI战略!软硬件两手抓,AI王国雏形已现【附下载】| 智东西内参

▲达芬奇架构的 3D Cube 技术

CANN 芯片算子库,工欲善其事必先利其器。CANN 指神经网络计算架构,是位于芯片底层之上的芯片算子库和算子开发工具包。CANN 兼具最优开发效率和算子性能,其核心是高度自动化算子开发工具 Tensor Engine。通过统一的 DSL 接口,配合预臵的高层模板封装、自动性能调优等工具集合,用户可以方便地在昇腾芯片上开发自定义算子。同时,CANN 已经支持所有主要 AI 框架。同样在昇腾芯片上开发这个算子,通用的 DSL 需要 63 Loc,而Tensor Engine DSL 仅需 22 Loc 就能实现同样的功能,开发效率提高将近 3 倍,是开发者提高效率的有力工具。

推荐阅读