生态|在异构计算时代的数据中心,发现英特尔软件生态战略的生命力

2020年是国内半导体企业发展的黄金时期 , 上至上市企业 , 下至初创公司 , 都能在时代大潮中找到自己的位置 。 英特尔是芯片产业绕不过去的话题 , 通过观察英特尔正在做的事情 , 芯片企业很大程度上可以补足短板 , 少走弯路 。
近日英特尔发布了oneAPI Gold版本 , oneAPI是一款支持异构计算的平台软件 , 可为CPU、GPU和FPGA (统称为 XPU)开发跨架构的应用程序 , 随着数据中心所容纳的硬件平台越来越多样 , 如何以软件激发硬件价值 , 这也是英特尔软件战略的出发点 。
“我们希望利用oneAPI可以释放最大的硬件潜能 , 同时也使得我们软件生态当中的开发者 , 在软件方面的投资可以最大程度的复用 , 不需要绑定在单一的硬件架构以及制程上 , 并且我们的开发效率也可以得到最大化 。 ”英特尔架构、图形和软件集团副总裁兼中国区总经理谢晓清表示 。
“过刚易折 , 过柔则靡” , 芯片产业软硬一体的重要性 , 在异构计算时代被提升到前所未有的高度 。

生态|在异构计算时代的数据中心,发现英特尔软件生态战略的生命力
文章图片

one API , 构建系统软件栈生态
英特尔处理器涵盖了四大主要计算架构 , 包括CPU、GPU、AI以及FPGA , 不同平台在不同领域里各有所长 。 创业公司更倾向于选择专注一个硬件平台 , 做“小而美”的生意 , 大公司应该做大公司的生意 , 所以英特尔选择做系统软件栈的生态圈 。
英特尔以CPU为核心的软件生态圈已经十分成熟 , 在开源软件的各个层面都有很大的技术投入和技术储备 , 包括Linux的Kernel、KVM虚拟化等社区 , 到目前为止 , 英特尔是世界最大的代码贡献者 。
英特尔首先坚持软件优先的策略 , 比如最新发布的Xe GPU , 其在图形、多媒体、计算方面都需要非常稳定的生态 , 新的英特尔软件生态建立在其过去几十年CPU软件生态的基础上 。
英特尔在编程语言、系统库以及工具链方面已经有了非常强有力的生态支持 , 从图形和多媒体方面来看 , 英特尔在Windows和Linux的操作系统也有20多年的积累 。
其次是易于扩展 , GPU细分市场非常多 , 不同市场有不同的价格、功耗、性能需求 。 英特尔希望能够最大限度得到所有GPU开发者的支持 。
“为了得到更多开发者的支持 , 我们就需要覆盖不同的细分市场 , 这也是为什么我们现在已经建成的集成显卡生态非常重要 , 因为英特尔的集成显卡在某些领域每年都会有百万级的客户 。 这也是独立显卡和集成显卡所有的软件都具备兼容性的原因 , 并且我们在最近的‘Tiger Lake’产品发布之后 , oneAPI软件也得到了生态圈里所有开发者非常好的评价和反馈 。 ”谢晓清说道 。
最后是全新的计算负载和用户场景 。 英特尔的重点是发展新的计算负载和用户场景 , 而不是只关注已有场景 。 对英特尔这样的技术领先者而言 , 超前一步解决现有方案或者是产品还不太能够很好解决的问题 , 这是英特尔塑造产品差异性的机会 。
在oneAPI Gold版本中 , 英特尔提供了oneAPI的编译器DPC++以及所有的系统库 , 同时也包括一系列支持oneAPI的工具包 , 包括移植、分析和调试工具包等等 。 这些工具包支持系统软件的各个层面 , 开发者可以用来调试和剖析自己的应用程序 。
当硬件更新换代时 , 开发者使用one API不改动软件即可适配 , 同一份源码让开发者无缝、快速地升级到新一代硬件平台 。 “我们鼓励开发者花更多的时间在创新、开发和优化新的用户场景 , 而不是花大量的时间和精力维护现有的源码和投资 。 ”谢晓清表示 。
言而总之 , oneAPI主要价值分为三方面 , 其一是提供一个非常友好的编程环境 , 使得开发者可以自由选择硬件平台 , 不必因为某一种语言绑定在某一个硬件平台;其二 , 英特尔提供的编译器、系统高度优化 , 可以实现最大的硬件价值 , 并且最优支持不同异构计算的硬件加速;其三 , one API开发模式非常快速、高效 , 并且源码的维护成本可以达到最低 。

生态|在异构计算时代的数据中心,发现英特尔软件生态战略的生命力
文章图片

Analytics Zoo , AI落地软件流水线
人工智能脱虚向实 , 越来越多的应用已经落地到企业业务场景 , 从开发视角看 , 最大的挑战可能是如何将AI算法应用到复杂的数据当中 。
英特尔大数据技术全球CTO、大数据分析和人工智能创新院院长戴金权表示 , 企业客户面临着数据量大且数据来源复杂的难题 , 如何将AI可以直接应用到大数据的生产环境中 , 能够让其无缝的进行大规模扩展 , 这是英特尔希望通过Analytics Zoo等一系列组件实现的目标 。

生态|在异构计算时代的数据中心,发现英特尔软件生态战略的生命力
文章图片

Analytics Zoo是英特尔开源的一个端到端的大数据+AI软件平台 , 构建在基于one API的底层加速库或者底层优化框架之上 , 包括深度学习的框架、Python库 , 分布式的数据处理像Spark、Flink、Ray等数据处理分析框架 。
【生态|在异构计算时代的数据中心,发现英特尔软件生态战略的生命力】据戴金权介绍 , Analytics Zoo大致可以分为三层 , 底层提供端到端的数据流水线的能力 , 能够帮助用户可以直接无缝的将AI模型运行在其分布式大数据上;中间层是英特尔提供的机器学习工作流 , 目的是能够将很多人工的作业、人工的任务实现自动化;最上层是用户使用Analytics Zoo构建的应用场景 , 大致可以分为四类 , 推荐系统、时间序列分析、计算机视觉以及自然语言处理 。

生态|在异构计算时代的数据中心,发现英特尔软件生态战略的生命力
文章图片

以汉堡王为例 , 在快餐推荐的场景下 , 用户实时的点餐行为和各种情景特征(比如时间、天气和位置等)都是能够被用来做合适推荐的重要因素 。 在汉堡王 , 英特尔利用 Analytics Zoo提供的RayOnSpark功能 , 使用Ray、Apache Spark和 Apache MXNet 构建了一个完整的端到端的推荐系统 。
它将数据处理(使用 Spark )和分布式训练(使用 MXNet 和 Ray )集成到一个统一的数据分析和 AI 流水线中 , 并直接运行在存储数据的同一个大数据集群上 。
“整个工业界已经慢慢进入了人工智能的时代 , 但是今天所说的人工智能的基础是大数据 , AI和数据分析是我们将来非常重要的一个应用场景 , 特别是把AI和数据分析应用到现实的生产系统当中 , 端到端的AI流水线是非常重要的 。 英特尔不管是在软件、硬件层面 , 都具备高可用的产品和方案 。 ”戴金权表示 。
在异构计算时代的数据中心 , 英特尔的软件生态战略正在催发出硬件平台的最大生命力 。

    推荐阅读