在历经上世纪几次起起落落后 , 2010 年代的人工智能(以下简称为「AI」)迎来一次前所未有的大爆发 , 从基础研究的众多突破到海量的场景应用 , 「AI 改变世界」已不再是一句口号 , 在 AI 持续助力人类抗疫的同时 , 无论是全球各行业日益增长的智能化产业升级需求 , 还是AI在生命科学、智能汽车、金融风控等领域的一系列落地应用 , 即将开始的「咆哮二十年代」里 , AI 都在扮演重要角色 。
作为中国最早将 AI 作为重要发展方向的公司 , 百度也在这场「 AI 大考」中拿出了一份漂亮的成绩单 。
疫情期间 , 百度通过百度大脑平台与合作伙伴快速上线 AI 抗疫产品 , 保障复工复产;进入 2021 年 , 百度智能云提供我国首辆火星车「祝融号」虚拟数字人技术支持 , 未来将肩负科普太空知识、宣传中国火星探索进展的重任;在《互联网周刊》发布的 2020 年度 AI 企业百强榜单上 , 百度不仅在总分位居第一 , 还在细分的 AI 影响力、智能化维度处于领先地位 。 另一方面 , 百度也在 AI 基础研究与专利领域取得诸多成果 。 公开资料显示 , 仅 2020 年 , 在业界权威的 CVPR、ACL、NeurIPS 等学术会议上 , 百度 AI 获得 30 多个冠军 , 还有 260 多篇论文被收录;根据国家工业信息安全发展研究中心等部门发布的《2020 人工智能中国专利技术分析报告》 , 在 AI 专利申请量和授权量方面 , 百度以 9364 件专利申请和 2682 件专利授权处于第一位 , 连续第三年位居第一 。
文章图片
如此亮眼的成绩的背后 , 离不开百度过去十一年对 AI 的持续技术与资金投入 , 特别是 2020 年 , 百度确定了全新的「云智一体」战略 , 并在架构层面打通云平台与 AI 平台之间的关系 , 实现「以云计算为基础 , 以人工智能为抓手 , 聚焦重要赛道」的战略目标 。
一年后 , 百度 AI 的上述成绩以及基于百度 AI 的智能云业务同比 67% 的年度营收增长(2020 财年年化收入 130 亿人民币) , 进一步展现出该战略的正确性 。 从 AI 研究到 AI 赋能 , 从实验室的神经网络参数到各行各业通过 AI 获得真金白银 , 百度不仅展现出 AI 的巨大潜力 , 也向外界展现其 AI 领导力 。
百度 AI 领导力密码之一:技术融合 不久前的博鳌亚洲论坛上 , 百度 CTO 王海峰分享了他对 AI 行业正在融合创新的观察 , 其中的一个融合领域是技术融合 。 换句话说 , AI 已不再局限于之前「算法+算力+数据」的组合 , 而是向更深层次与更广泛的领域拓展 。
比如向下与专属芯片的融合 , 百度推出了云端通用的百度昆仑芯片 , 相比于 Google、AWS 的 AI 专属芯片 , 昆仑芯片已完成与众多国产 CPU、国产操作系统的适配 , 更重要的一点 , 百度自主研发的昆仑芯片原生支持国内首个开源深度学习平台飞桨 , 这不仅使得百度 AI 具备软硬件一体能力 , 更为中国 AI 独立发展提供了软硬件支持 , 这在当下复杂的产业形势里至关重要 。
根据公开资料 , 百度昆仑 1 代已实现万片以上的应用部署 , 在芯片权威的 Hotchips 大会上 , 百度昆仑团队的论文在 2020 年第四次被收录 。 而百度此前曾透露 , 昆仑 2 代芯片会采用 7nm 先进工艺 , 预计在 2021 年上半年量产 , 性能上 , 昆仑 2 代性能将提升 3 倍 , 还带有高速片间互联 , 以多款 AI 板卡型号来覆盖云训练、云推理以及边缘计算等场景 。
文章图片
另一方面 , AI 的技术融合还呈现「深度学习+X」的特征 , 比如「知识图谱」就在与深度学习的融合中得以快速发展 , 基于知识图谱 , 计算机或者程序可以更好理解用户意图 , 由此带来的是计算机认知层面的大跨越 。
百度目前拥有世界上最大规模的知识图谱 , 超过 50 亿实体和 5500 亿事实 , 除了基础的实体图谱 , 针对不同的应用场景和知识形态 , 构建了不同领域的知识图谱 , 例如事件图谱、多媒体图谱、行业图谱等 。
与此同时 , 百度将知识引入到语义理解中 , 创新实现知识增强语义理解技术——文心(ERNIE) , 将大数据预训练与多元丰富知识相结合 , 通过持续学习技术 , 实现模型效果不断进化 , 在中英文多项任务上取得最好的效果 。
举个例子 , 下面是「基于知识图谱的视频语义理解」的示意图 , 利用知识图谱 , 计算机或程序可以从左侧一张图片里「理解」并读取到一系列内容(右侧) , 这项技术可以应用于视频产品的多个场景里 , 极大提升了用户体验 。
从纵向的专属芯片融合到横向的多技术融合 , 持续推动百度 AI 技术集大成者的百度大脑的进化 , 「AI 新型基础设施」的百度大脑 , 正在成为产业智能化的创新基座 。
文章图片
百度 AI 领导力密码之二:产业融合 AI 技术要实现各行各业的场景覆盖 , 除了底层技术的持续突破 , 还需要更友好或者更低的使用门槛 , 正如王海峰此前所言:「人工智能技术发展到今天 , 从科学研究的角度面临的问题越来越复杂 , 但从应用的角度实际上门槛在不断降低」 。
AI 的下一步就是通过简单、便宜的 AI 开发/部署平台 , 让各行各业的开发者甚至业务人员都可以快速上线 AI 应用 。
【昆仑|多技术融合,百度 AI 成产业智能化创新基座】百度飞桨正是这样的一个平台 。
自 2016 年正式开源以来 , 飞桨已经成长为我国首个自主研发、功能完备、开源开放的产业级深度学习平台 。 2021 年 3 月 , 随着飞桨发布 2.0 版本 , 成熟完备的动态图模式、全新升级的 API 体系以及业内首个通用异构参数服务器架构等一系列新特性 , 进一步提升了 AI 模型训练的效率 , 而根据此前飞桨平台透露的信息 , WAVE SUMMIT 2021 深度学习开发者峰会已定档 5月 20 日 , 届时还将为飞桨带来更多新特性 。
一方面 , 飞桨通过多种形式的培训渠道 , 为企业与学校的开发者提供培训、认证 , 截止到 2020 年底 , 飞桨开发者生态已经拥有 265 万开发者 。 另一方面 , 飞桨积极与硬件生态伙伴 , 特别是国产硬件厂商加快合作 , 目前已和 20 家生态伙伴合作适配了 29 种芯片或 IP 。
文章图片
更进一步 , 面对企业 AI 应用开发需求越来越强烈的行业现状 , 飞桨企业版应运而生 , 在开源版本功能的基础之上 , 提供了面向中小企业的 EasyDL 与适用于大型企业的 BML 。
这其中 , EasyDL 可以说是「零门槛的 AI 开发平台」 , 能够帮助企业实现从数据标注到模型部署等一整套 AI 模型开发部署流程 , 目前支持图像、文本、语音、OCR、视频、结构化数据等 6 大技术方向 15 种定制化类型 , 文本领域更是拥有由百度自研、业界领先的语义理解技术文心 ERNIE 。
根据 IDC 公布的《深度学习框架和平台市场份额》报告 , 截至 2020 年 12 月 , 百度 EasyDL 已连续两年位居中国机器学习平台细分市场份额第一 。 已有超过 4 万多个用户在 EasyDL 上累计训练了近 10 万个模型 , 近 2 万个模型在不同环境下部署上线 , 并在零售、工业、安防、医疗、互联网、物流等 20 多个行业中落地应用 。
百度 AI 产业融合的第三个层次则是把 AI 能力开放给各行各业 。 所谓「能力」 , 就是将一系列 AI 技术封装 , 通过抽象、统一、组件化的方式提供给企业 , 目前百度 AI 能力开放平台涵盖了语音、视觉、AR/VR、语言与知识四大 AI 技术方向能力 , 已经开放了 270 余项 AI 技术 , 形成业界最全面和最领先的 AI 开放能力集合 。
2020 年百度又推出 AI 中台解决方案 , 旨在解决企业部署 AI 过程中的「烟囱化建设」、资源浪费和使用率低下的问题 , 目前 , AI 中台解决方案已落地多家大企业客户 , 尤其在能源电力行业 。
在历史悠久的云南丽江 , 基于百度 AI 打造的「丽江城市大脑」 , 拥有「1+1+4+N」的大脑架构 , 即 1 张神经感知网络 , 1 个城市智能云平台 , 4大中台(AI 中台、数据中台、感知中台、交互中台) , N 个应用场景 , 为城市各领域业务应用提供数据支持和 AI 赋能 。
在福建泉州 , 百度智能云将 AI 各项能力与水务行业需求相结合 , 与合作伙伴共同构建了智能的「水务大脑」 , 从全厂 AI 巡检到设备监控预警再到 AI 用水量预测模型 , 形成兼具效率与智能的水务管理「泉州模式」 。
文章图片
利用飞桨、AI 能力开发平台、AI 中台等一系列门槛更低也更友好的平台产品 , 百度构建起了一条将 AI 技术快速、稳定输出到产业的通道 , 成为百度 AI 赋能千行万业的重要布局 。
百度 AI 领导力密码之三:引领技术发展趋势 作为一个持续且高速发展的领域 , AI 的发展方向成为整个产业界关注的焦点 , 百度 AI 过去几年已经在某些领域形成引领态势 。
比如坚定推进飞桨的开源开放 。 作为一个扎根中国、面向中国企业的深度学习开源平台 , 飞桨之于中国深度学习发展的意义不言而喻 , 中国需要属于自己的深度学习开源平台 , 也需要更多基于中国市场需求进行创新的企业开发者 。 飞桨的技术突破、服务生态以及落地能力 , 正在成为承载中国企业 AI 发展以及产业转型的舞台 , 也将使得中国在未来全球人工智能竞争中拥有不小的话语权 。
在被誉为「AI 皇冠上的明珠」的自然语言处理领域 , 百度的语言生成预训练模型文心(ERNIE)开创性地将大数据预训练与多元丰富知识相结合 , 通过持续学习技术 , 实现模型效果不断进化 , 可以在16 个中英文典型 NLP 任务上显著超越当时世界最好效果 。
2020 年世界人工智能大会上 , 文心摘得最高荣誉 SAIL 奖(Super AI Leader , 卓越人工智能引领者) 。 基于 ERNIE 语言模型的语言识别模型获得 INTERSPEECH 2020 阿尔茨海默症早期诊断冠军 。 2021 年 3 月 , 文心再次登上了 GLUE(通用语言理解评估基准)的榜首 。
文章图片
与此同时 , 百度还在探索量子计算、生物计算等前沿技术的应用 。 其中 , 量子计算已正式发布包括「量易伏、量桨、量脉」三大核心项目的百度量子平台 , 围绕其开展量子技术储备、量子人才培养以及量子生态构建 , 推动整个行业的发展 。
面向生物计算 , 百度发布的 PaddleHelix 螺旋桨生物计算框架 , 提供了包括 RNA 二级结构预测、大规模的分子预训练、药物-靶点亲和力预测以及 ADMET 成药性预测等算法和模型 。 重点满足疫苗设计、新药研发、精准医疗的 AI 需求 , 该项目也在国际权威榜单 OGB 两项分子性质预测任务中登顶 , 展现 AI 药物发现领域取得新的技术突破 。
事实上 , 上述这些新学科或新领域已呈现高度交叉的态势 , 都需要底层强大的计算能力与算法、数据做支撑 , 而这些也是百度在 AI 领域的技术积累 , 百度创始人、董事长兼首席执行官李彦宏前几天的一番话 , 对「AI+生物计算」的前景做了解读:「依靠生物计算引擎 , 能够有效利用大量的生物数据 , 能够把所有的尝试积累到统一的知识图谱之上 , 从而把药物发现的『大海捞针』变成『按图索骥』 , 加速发现 First-in-Class 的创新药物 , 为人类的生命健康谋福祉」 。
写在最后:技术的星辰大海永无止境 AI 作为一项全新的通用技术 , 正在成为社会经济发展的新「燃料」 , 特别是在疫情与复杂的国际形势面前 , AI 就是中国持续自主发展的重要技术支撑 。
这是对百度在内的中国众多 AI 公司的重要历史发展机遇 , 集百度 AI 之大成的百度大脑进化到 6.0 , 新的 AI 基础设施将进一步增强百度在 AI 技术与产业融合层面的竞争力 , 而百度在量子计算、生物计算等一系列前沿领域的投入 , 也会持续放大百度 AI 的行业领导力 , 这趟技术的星辰大海之旅永无止境 。 (完)
推荐阅读
- 技术|“2”类医械有重大进展:神经介入产品井喷、基因测序弯道超车
- 硬件|汽车之家年底裁员,员工称多个职能部门已被撤销
- 选型|数据架构选型必读:2021上半年数据库产品技术解析
- 技术|使用云原生应用和开源技术的创新攻略
- 语境|B站2021个人年度报告发布:你共计看了多少个视频
- 技术|聚光科技旗下临床质谱仪获批医疗器械注册证
- Apple|苹果高管解读AirPods 3代技术细节 暗示蓝牙带宽可能成为瓶颈
- 最新消息|IT系统出错 英国银行给7.5万人多发11亿工资
- 硬件|闪极140W多口充电器发布:首发399元 支持PD3.1
- MateBook|深度解析:华为MateBook X Pro 2022的七大独家创新技术