模型|2022前展望大模型的未来,周志华、唐杰、杨红霞这些大咖怎么看?( 四 )
要全面实现以上 9 种机器认知能力还有很长的路要走 , 但我们坚信下一个人工智能浪潮的兴起必然伴随着认知智能的实现 , 让机器具有推理、解释、认知能力 , 在多项人类感知与认知任务中超越图灵测试 。 大模型已经在认知智能发展上进行了一年的探索 , 并取得阶段进展 。
三、大模型的未来
《达摩院 2022 十大科技趋势》提出 , 大小模型将在云边端协同进化 。 大模型向边、端的小模型输出模型能力 , 小模型负责实际的推理与执行 , 同时小模型再向大模型反馈算法与执行成效 , 让大模型的能力持续强化 , 形成有机循环的智能体系 。 这一观点富有启发性 , 而且有助于大模型从实验室走向规模化的产业应用 。
在我看来 , 未来大规模研究将更加注重原始创新 , 围绕认知智能以及高效应用等多个角度展开 。
在认知智能方面 , 模型参数不排除进一步增加的可能 , 甚至到百万亿、千万亿规模 , 但参数竞赛本身不是目的 , 而是要探究进一步性能提升的可能性 。 大模型研究同时注重架构原始创新 , 通过模型持续学习、增加记忆机制、突破三元组知识表示方法等方法进一步提升万亿级模型的认知智能能力 。 在模型本身方面 , 多模态、多语言、面向编程的新型模型也将成为研究的重点 。
在高效应用方面 , 将大大降低大模型使用门槛 , 让大模型用起来 , 促进中小企业形成 “大模型 + 少量数据微调” 的 AI 工业化开发模式 。 主要实现:
1)降成本:降低模型在预训练、适配下游任务、推理过程中的算力消耗;
2)提速度:通过模型蒸馏、模型裁剪等手段提升千亿或以上规模模型推理速度 2 个数量级;
3)搭平台:通过搭建一站式开发及应用平台提供从在线模型构建、在线模型部署、应用发布的全流程预训练服务 , 能够支持成百上千个应用的开发与部署 , 相信后续大模型的广泛应用将成为赋智我国经济高质量发展的关键助推剂 。
思考的快与慢 , 与下一代人工智能
阿里巴巴达摩院人工智能科学家 杨红霞
文章图片
人工智能学者一直试图从大脑工作模式中汲取灵感 , 但大脑究竟如何思考是非常复杂的课题 。 诺贝尔经济学奖获得者丹尼尔 · 卡内曼教授的《思考, 快与慢》指出 , 人的思考有两种模式 。 我们很多时候下意识地作出反应 , 是快的模式 。 举个例子 , 如果每天从家到公司的路线一模一样 , 就不需要做太多思考 , 沿着原路走就行 , 这是快思考 。 什么是慢思考?突然有一天 , 公司和家之间在修路 , 需要重新规划路径 , 这时就不得不进行慢思考 。
推荐阅读
- 齐鲁|齐鲁医学创新高峰论坛召开 专家共话前沿科技促医学进步
- 顺利交付|2022开年第一辆!齐河融媒体直播车顺利交付!
- 出货|集邦咨询:预计 2022 年手机相机模组出货 49.2 亿颗,增长 2%
- 识别|外卖界又一黑科技 饿了么计划2022年覆盖100000顶智能头盔
- 斯达|汉威科技:目前能斯达的电子皮肤已有小批量商用
- 快科技2018|2022年首款力作!苹果迄今性能最强新品曝光 超有质感
- 新浪科技综合|中国学者找到新生儿黄疸与空气污染的关系 建预测模型
- 财联社|比尔·盖茨谈疫情前景:奥密克戎后不太可能出现传染性更强的变种
- 澎湃新闻|“漠河舞厅”商标被经销公司抢注,当前状态为“等待实质审查”
- 杜比|联想拯救者 Y9000P 2022 款预热:可选 RTX 3070 Ti 150W 满功耗