据最新调研报告显示 , 在IDC 2021年上半年深度学习框架平台市场份额调研中 , 百度位列中国深度学习平台市场综合份额第一 。 百度飞桨、Google、Facebook形成鼎立格局 , 其中飞桨是市场三强中唯一国产品牌 , 并持续稳步增长 。 市场数据显示 , 飞桨企业版EasyDL连续两年保持市场排名首位 , BML百度全功能AI开发平台显现强劲增速 。
飞桨的端到端自适应分布式框架 , 实现了数据并行、模型并行、流水线并行、分组参数切片等等 , 使得超大规模的训练能够得以有效实现 , 鹏城-百度·文心模型并行效率高达90% 。
在算法上 , 为提升模型语言理解和生成能力 , 百度提出了可控学习与可信学习算法 。 在可控学习方面 , 通过将模型预测出的文本属性和原始文本进行拼接 , 构造从指定属性生成对应文本的预训练数据 , 模型通过对该数据的学习 , 实现不同类型的零样本生成能力 。 在可信学习方面 , 针对模型生成结果与真实世界的事实一致性问题 , 通过自监督的对抗训练 , 让模型学习区分数据是真实的还是模型伪造的 , 使得模型对生成结果真实性具备判断能力 , 从而让模型可以从多个候选中选择最可靠的生成结果 , 显著提升了生成结果的可信度 。
- 最后再看数据优势 。
由此可见 , 鹏城-百度·文心大模型集合了最强算力----鹏城云脑II、最强AI架构——百度飞桨、再结合知识增强这样的核心特色 , 三方面的优势相结合 , 形成了一个重磅“核武器” , 为中国AI产业军备又填了一枚筹码 。
百度知识基因成就“与众不同” 其实 , 这两年在大模型热下 , 全球几大科技巨头不断刷新大模型的数据量上线 。 2017年Transformer结构的提出 , 使得深度学习模型参数突破了1亿 , 随后模型参数一个比一个大 , 到了BERT网络模型的提出 , 使得参数量首次超过3亿规模 , GPT-3模型超过百亿 , 鹏城盘古实现千亿稠密的规模 , 而此次百度文心参数规模达到2600亿 , 相信这个记录很快也会再次刷新 。
大模型似乎没有最大、只有更大 。 事实上 , “大”只是一个相对值 。 AI的价值除了数据量大 , 还由很多方面的因素构成 , 不同大模型需要有自己的特色 。
推荐阅读
- 测试|图森未来完成全球首次无人驾驶重卡在公开道路的全无人化测试
- ASUS|华硕预热ROG Flow Z13:称其是“全球最强悍的游戏平板”
- IT|全球汽车行业价值两年突增至3万亿美元 中国电动车企立大功
- IT|全球供应25亿剂疫苗 科兴上半年营收110亿美元
- IT|全球每日新增确诊病例首超100万例 世卫:两大毒株正掀起“疫情海啸”
- Tesla|特斯拉在美国召回约47.5万辆汽车 接近其去年全球交付总量
- 堆芯|全球首座,世界领跑!
- 集聚|向全球应用创新策源地持续迈进 上海“双千兆”应用体验中心正式揭牌
- 疫苗|中国生物:全球首支获批使用二代新冠疫苗将在阿联酋用于序贯接种
- 电子商务|国际品牌崛起 亚马逊在全球购物应用安装量中下滑至第四位