参数|AI大模型还能走多远?( 四 )


4、标准易用的工作流程
“预训练大模型+微调”的方式的确加速了 AI 开发者的步伐 , 但如果把与之相适应的工作流程给搭建起来 , 大模型将会在更多场景大放光彩 。 另外 , 大模型的评估未来会有标准化成熟的体系来衡量 , 这个体系也会是行业内公认的标准 , 规范模型的通用性、易用性 , 同时用这个标准来衡量大模型的优劣而不是如今自卖自夸式的标榜 。
5、大模型能力的端侧化
未来 , 将大模型的一些运算存储等能力像芯片一样固化在一些端侧硬件设备中 , 在使用的过程中不用在重装的模型中耗时调用算力与数据 , 可以实现随时调用随时使用 。 现下的模型多是重装大模型 , 使用的话需要调用庞大的算力和运行时间 , 未来的大模型会逐渐改变这种模式 。
大模型会有哪些商业模式 更多人关心大模型未来会有哪些商业模式 。 可以从三个层面想象:
1 , 把大模型作为底座 。 既可以把底座出售或租售给国家的创新中心、政府机构 , 也可以与之联合合作 , 做上层开发 。
2 , 做开源 。 大模型涉及的许多技术问题单靠一家企业来解决是比较难的 , 可以通过开放技术的方式 , 用社区的力量共同解决 , 共享IP , 互惠互利 。
3 , 提供给一般的ISV(独立软件开发商) 。 让大模型从实验室走出来 , 直接去面对千行百业的客户 , 不太可行 。 通过把能力开放给 ISV , 他们再去接触下游更多客户 。 有两种接触方式:一种是通过流量计费、或按项目计费;再一种是让使用者免费使用 , 通过流量广告变现 。
总结展望 现如今 , 大模型的这种盛况 , 就与深度学习时代极其相似 。 然而 , 作为通向认知智能的高阶探索 , 大模型此后的路还有很远 。 能否持续提升自身的创新能力、泛化能力、落地能力 , 将会成为突破变革的关键 。
也许在未来几年内 , 会逐渐形成这样一种状态:大模型作为基础的产业生态 , 用大算力训练出最高水平的智能 , 为各种 AI 应用提供源源不断的智能服务 。 而这一切 , 都需要时间去证明 。

推荐阅读