云之变(一):云与智能的大变局( 三 )

这个流程的问题在于,从训练到推理,每个步骤所需的算力是差距巨大的。其中训练所需算力最多也最复杂。另一方面,AI模型需要反复测试,不同测试需要的算力各自不同;而如果是基于互联网的AI任务,或者模型部署的终端突然增加,也会让算力需求短时间膨胀。

这些问题决定了,AI所需算力必须具备的特点,是具有高度的灵活性。这就像我们培养一个孩子,却不能单独给他盖一座学校。需要学习的AI,也在不同流程需要不同的算力支持。这样来看,云就在现实条件下成为了AI的最佳输送方式。

现实中往往能见到这样的例子,以往进行AI训练需要花费几十万甚至上百万构建一个GPU池,但是训练完这些硬件就没用了。那么当然直接调用云端算力是更好的选择。结合其他一系列云端的优势,公有云虽然也有不尽如人意的地方,但绝对是大规模AI市场的最佳容器。

以上可以看作是云如何帮助AI落地,而反过来看,AI的到来也改变了云计算的基础规则。

一系列改变都在发生

我们知道,公有云按照交付方式,主要细分为IaaS、PaaS、SaaS三种。全球范围内看,SaaS是主流,也就是说云的主要能力是承载不同的软件应用流动。而在国内市场中,IaaS至今依旧占比超过60%。也就是说,基础设施依旧是国内云服务扮演的主要角色。

推荐阅读