单体|解析全球最大中文单体模型鹏城-百度·文心技术细节( 三 )_训练|文本|鹏城|框架|高性能

鹏城-百度·文心超强性能：60多项任务取得最好效果，大幅刷新小样本学习任务基准
鹏城-百度·文心究竟效果如何？目前，该模型已在机器阅读理解、文本分类、语义相似度计算等60多项任务中取得最好效果。
在行业领域，仅利用少量标注数据甚至无需标注数据，就能解决新场景的任务已成为AI工业化大规模应用的关键。该模型在30余项小样本和零样本任务上均取得了最优成绩，能够实现各类AI应用场景效果的提升，也为产业化规模应用打开了新窗口。

文章图片

鹏城-百度·文心小样本学习效果

文章图片

鹏城-百度·文心零样本学习效果
解决应用落地难题：百度团队首创大模型在线蒸馏技术
大模型训练、推理所消耗的资源极其昂贵和密集。 Paddle Serving已提供了超大模型的高速推理方案，但为了进一步打造大模型的绿色落地方案，降低大模型应用成本，研究团队提出了大模型在线蒸馏技术。

文章图片

在线蒸馏技术
具体来说，该技术在鹏城-百度·文心学习的过程中周期性地将知识信号传递给若干个学生模型同时训练，从而在蒸馏阶段一次性产出多种尺寸的学生模型。相对传统蒸馏技术，该技术极大节省了因大模型额外蒸馏计算以及多个学生的重复知识传递带来的算力消耗。
这种新颖的蒸馏方式利用了鹏城-百度·文心规模优势，在蒸馏完成后保证了学生模型的效果和尺寸丰富性，方便不同性能需求的应用场景使用。此外，研究团队还发现，鹏城-百度·文心与学生模型尺寸差距千倍以上，模型蒸馏难度极大甚至失效。为此，研究团队引入了助教模型进行蒸馏的技术，利用助教作为知识传递的桥梁以缩短学生模型和鹏城-百度·文心表达空间相距过大的问题，从而促进蒸馏效率的提升。

文章图片

鹏城-百度·文心压缩版模型效果
鹏城-百度·文心在线蒸馏方案的效果非常显著，模型参数压缩率可达99.98% 。压缩版模型仅保留0.02%参数规模就能与原有模型效果相当。相比直接训练参数规模是自身2倍的BERT Base模型，鹏城-百度·文心在5项任务准确率上绝对提升了2.5% ，而相对于同等规模的RoBERTaBase ，准确率则绝对提升了3.4% ，验证了鹏城-百度·文心在线蒸馏方案的有效性。

单体|解析全球最大中文单体模型鹏城-百度·文心技术细节( 三 )

推荐阅读

如何找寻自我

缝纫机调线器怎么安装平车方法如何

强组词强字组词

火笋鸡翅的做法（增肥食谱）

闺女生日快乐祝福语朋友圈

LV请来潮牌设计师做艺术总监，看中的是啥

老虎豆怎么做好吃老虎豆图片怎样弄来吃

暖气有流水声是什么原因

皮球是什么体

手机怎样开通QQ空间

男生发mua说明 mua是什么意思

手指盖凹陷怎么回事

对自己的生活失去掌控咋调整

小米10s怎么没有月亮模式

我想找个偏僻的地方搞养殖！有没有推荐的地方？

南京养老金认证上门服务怎么申请南京市养老金认证

如何评价猪场阉割猪？

最后一个字是豹的成语

泰山散酒怎么样

猫发情的声音(猫发情的叫声)