量产车规级AI芯片,地平线的无人驾驶芯片故事该怎么讲?( 五 )

那么,如何基于算法和芯片做极致优化呢?

黄畅表示,计算架构核心本质是数据存储和传输的层次架构,而一颗芯内片内外存储的特点差异非常大,片内存储带宽是片外存储带宽的100倍;传输延迟片外存储是100ns,而片内只有5ns。片内片外功耗的差异之大也是如此。

“片内和片外的差异,需要我们优化架构和算法,使得芯片可以复用,从而极大降低功耗和延迟,把有限的片外存储带宽利用起来,不至于让你芯片处于空转,陷入低利用率的尴尬境地。”

另一方面,在实际操作中,地平线还会复杂的AI系统拆解成了很多标准化的AI算法任务,比如语音分割、人脸识别、交互手势识别等等,这些任务就像一块块标准化的积木,每一个标准化任务会在BPU SoC面积中占据面积最大最核心一块AI加速器,注重真实的AI能力输出,达到“守主效能,兼顾灵活效能”的目的。

在此基础上,地平线还推出了“天工开物”开发工具链Horizon OpenExplorer,该工具链是面向实际场景进行AI算法和应用开发的全套工具,包含模型训练工具、检查验证工具、编译器、模拟器、嵌入式开发包等,支持客户编辑处理器,快速进行产品落地。

推荐阅读