上下文1.6万token的编程大模型来了！与Stable Diffusion出自同门，一次吃5个Python文件不费劲

一个Stable Diffusion还不够!Stability AI再放杀手锏，进击代码生成领域:
推出了一款自称具有革命性的编码工具StableCode 。
敲重点的是，StableCode不仅支持Python、Go、Java、Javascript、C、Markdown、C等多种编程语言。
还直接把上下文长度拉到16000个token 。
好家伙，网友直呼疯批:
这波还直接戳中网友痛点:
上下文窗口16000token官网显示，StableCode模型具有30亿参数，将提供基础模型、指令模型、长上下文窗口模型三种不同的模型，帮助开发人员编码。
StableCode在HPC（高性能计算）集群上，使用5600亿代码token的编程语言数据集starcoder-data对基础模型进行了训练。
StarCoder是HuggingFace和ServiceNow合作成立的开放科学合作组织BigCode于五月份开源的针对代码的大模型。
Stability AI首席研究科学家Nathan Cooper对VentureBeat表示:
对于复杂的编程任务，StableCode则针对特定用例进行了指令调优。
【上下文1.6万token的编程大模型来了！与Stable Diffusion出自同门，一次吃5个Python文件不费劲】在基础模型的基础上，用约120000个Alpaca格式的“代码指令-回答”对训练了指令模型。
△StableCode指令生成对给定指令响应的代码。此外，为了满足用户对上下文窗口长度的需求， StableCode的长上下文窗口模型直接将上下文窗口拉长至16000个token ，是此前开源模型的2-4倍。
△与类似大小的模型（3B）进行的 Humaneval 基准比较。不仅为用户提供了可单行、多行自动完成建议的工具，还允许用户同时查看编辑相当于五个中等大小的Python文件，允许更专业复杂的代码生成prompt 。
下面是一个StableCode利用Pytorch深度学习库完成一个相对复杂的Python文件展示（灰色文本显示了StableCode的预测）。
使用了RoPE的方法此外，StableCode也是用到了Transformer架构，不同于StarCoder用ALiBi（线性偏差的注意力）的方法定位模型输出， StableCode则是使用了RoPE(旋转位置嵌入)的方法。
Cooper表示:
StableCode目前还处于早期阶段，初始发布的目标是观察开发者如何接受和使用这个模型。
研究主管Christian Laforte也浅聊了StableCode的目标:
看到Stability AI再放大招的这波操作，有网友在去测试Github Copilot的路上来了个掉头:
还有网友希望“预定”下一次动作:
此外， StableCode目前已经开源啦!
参考链接:
[1]https://venturebeat.com/programming-development/stability-ai-launches-stablecode-an-llm-for-code-generation/
[2]https://twitter.com/StabilityAI/status/1688931312122675200
—完—

上下文1.6万token的编程大模型来了！与Stable Diffusion出自同门，一次吃5个Python文件不费劲

推荐阅读

如何找寻自我

缝纫机调线器怎么安装平车方法如何

强组词强字组词

火笋鸡翅的做法（增肥食谱）

闺女生日快乐祝福语朋友圈

LV请来潮牌设计师做艺术总监，看中的是啥

老虎豆怎么做好吃老虎豆图片怎样弄来吃

暖气有流水声是什么原因

皮球是什么体

手机怎样开通QQ空间

男生发mua说明 mua是什么意思

手指盖凹陷怎么回事

对自己的生活失去掌控咋调整

小米10s怎么没有月亮模式

我想找个偏僻的地方搞养殖！有没有推荐的地方？

南京养老金认证上门服务怎么申请南京市养老金认证

如何评价猪场阉割猪？

最后一个字是豹的成语

泰山散酒怎么样

猫发情的声音(猫发情的叫声)