训练|同一模型完成多场景任务 人工智能大模型或加速技术落地( 二 )


得益于这些优势 , 人工智能的发展已经从“大炼模型”逐步迈向“炼大模型”的阶段 。 以美国OpenAI、谷歌、微软、脸书等机构为代表 , 布局大规模智能模型已成为全球引领性趋势 , 并形成了GPT—3、Switch Transformer等千亿或万亿参数量的大模型 。 可以说 , 人工智能大模型时代正在到来!
“人工智能大模型是‘大数据+大算力+强算法’结合的产物 , 是集成大数据内在精华的‘隐式知识库’ , 也是实现人工智能应用的载体 。 大模型是连接人工智能技术生态和产业生态的桥梁 , 向下带动基础软硬件发展 , 向上支撑了智能应用百花齐放 , 是整个人工智能生态的核心 。 ”黄铁军表示 。
北京智源人工智能研究院理事长张宏江博士指出:“未来 , 大模型会形成类似电网的智能基础平台 , 像发电厂一样为全社会源源不断地供应‘智力源’ 。 ”
通用智能应用前景广阔
类比人的教育培养 , 大模型所完成的培训就如同基础性、通识性的大学本科培养 , “学成”后的大模型具备处理一般事物的能力 。 如果要完成更专业、更高级的任务 , 大模型还需要“研究生”阶段的专业培养 。
黄铁军进一步指出:“AI大模型通常是在大规模无标注数据上进行训练 , 学习数据中蕴含的特征、结构和知识 。 ”
在这一趋势下 , 北京智源人工智能研究院2021年3月发布悟道1.0 , 是中国首个人工智能大模型 , 取得多项国际领先的AI技术突破;2021年6月发布的悟道2.0 , 参数规模达到1.75万亿 , 是OpenAI的GPT—3模型的10倍 , 一跃成为世界最大模型 。
北京智源人工智能研究院学术副院长、清华大学教授唐杰表示 , 大模型可以包含更多数据 , 表示更多信息 , 模型往超大规模发展是一个必然的趋势 。
“超大规模预训练模型的出现 , 很可能改变信息产业格局 , 即基于数据的互联网时代、基于算力的云计算时代之后 , 接下来可能将进入基于大模型的AI时代 。 ”唐杰认为 。
据介绍 , 超大规模智能模型的通用智能能力在医疗、金融、新闻传播等行业应用前景广阔 。 例如 , 在医疗健康领域 , 大模型在医疗数据格式化、病历自动解读与分析、自动问诊系统等方面都可以发挥巨大效用 。 在金融、法律、财务、人力资源、零售等传统行业领域 , 大模型能提供高性能的智能信息解析和提取、智能数据整合、自动机器翻译、辅助决策等功能 , 提升业务流程效率和水平 。 在新闻传播领域 , 基于模型可实现智能新闻线索收集、机器写作、辅助编辑、虚拟主播等应用 。 目前 , 智源悟道大模型 , 也在为北京冬奥会提供新场景下的人工智能服务应用;并正在通过大模型开启手机AI语音技术新路径 , 赋能智能终端新一轮AI体验革新 。

推荐阅读