我们可以把灵杰理解为四层产品的有机组合 。 它的最底层是基于云基础设施 , 比如像计算、存储、网络等等这一些我们耳熟能详的基础产品 。 和以前不同的是 , 我们并不需要思考 , 从资源视角怎么样搭一个集群、加一堆GPU、或者装一个硬盘 。 今天我们可以从需求视角来考虑 , 需要多大存储、怎样的异构计算、怎样通过云原生容器化等等方式把资源简单地链接起来 。 这是最底层基础设施给我们提供的简单化、便捷化的能力 。
文章图片
在上面是大数据和AI一体化的平台 。 我觉得它是灵杰的核心部分 。 首先它给我们提供了大数据跟AI结合的能力 。 比如MaxCompute平台已经可以调用10万台集群来支持2000万张表跟千万级任务调度 , 它的Serverless模式代表着我们可以在非常小的 , 例如一张表、一个数据集、一个GB、一个任务开始就用零公摊成本来使用几乎无限的弹性 。
和大家分享一个数字 。 过去我们经常有一个感觉 , 觉得大数据和AI是分开的 。 当我们在看阿里集团内自己的应用情况时 , 在大数据平台上 , 有超过30%的数据计算都已经应用于AI模型训练 , 这里都还没有计入AI推理这块 。 通过AI Compiler和Whale软件框架 , 我们今天也在进一步提升AI计算效率 。
当然平台的另一个重点是提升开发效率 。 在今天后面的分享中 , 我们会向大家介绍在大数据和AI一体化的平台上 , 如何用AI 工作空间这样的轻量化平台 , 以及PAI-DSW、PAI-DLC、PAI-EAS等组件来打通数据、训练、资源管理、推理和服务等等这一系列挑战 。
工程平台最终目的是为了实现算法创新 。 想象一下8年前我们要做一个AI应用的时候应该怎么办?基本上就是我们自己去搜集数据 , 然后训练一个模型 , 再非常痛苦地把这个模型在自己手工搭建Web Server里面透出出来 。 还要时刻担心 , 如果没有人来访问这个模型 , 是不是资源就浪费了 , 如果太多人来访问 , 是不是服务稳定性又会打折扣 。
文章图片
今天很多AI能力 , 比如说像OCR、语音、自然语言处理等等 , 都已经是标准化开箱即用的状态了 。 因此阿里云的工程师和达摩院的算法同学们合作 , 在10多种场景下的开放服务层 , 提供了上百种标准化的算法模型和服务 , 来解决AI落地应用最后一公里的问题 。
无论是OCR、语音、还是文本的理解 , 我们希望能够通过一个标准的模式来实现AI 模型的开通、接入和使用流程 , 就像下载和使用一个APP那么简单 。
推荐阅读
- 模型|2022前展望大模型的未来,周志华、唐杰、杨红霞这些大咖怎么看?
- 模型|经逆向工程,Transformer「翻译」成数学框架 | 25位学者撰文
- 化纤|JXK STUDIO 虎年肥猫 1/6仿真动物模型手办可爱摆件
- 人物|网曝罗振宇2022跨年演讲退票损失千万元:演讲现场无观众
- 模型|达摩院2022十大科技趋势发布:人工智能将催生科研新范式
- 创造者|李彦宏在百度首个元宇宙产品中演讲:AI黄金十年即将到来
- 模型|李彦宏:中国迎来AI黄金十年,集度汽车机器人明年亮相,智能交通10年内解决拥堵
- 模型|神经辐射场去掉「神经」,训练速度提升100多倍,3D效果质量不减
- 青少年|中科院老科学家科普演讲走进三亚中小学校
- 模型|英伟达:美团机器学习平台使用NVIDIA T4 GPU