这个过程中大模型技术持续创新研发是我们的主责主业 。 例如现在计算量还比较大、成本和能耗也比较大 , 未来大模型在现有基础上还会有很多突破 。 需要我们不断融合类脑等智能新机制 , 使得大模型的运营成本越来越低 , 越来越好用 。
目前 , 我们也正在同步研究大模型基础上蒸馏出小模型技术 , 这也非常重要 。 对于不想上云的 , 或者是应用场景不那么复杂的 , 其实并不需要用到大模型 。 因为大模型的参数特别多 , 使用成本非常高 。 这个时候 , 就可以用大模型中蒸馏出一个小模型 , 小到可能只有几兆的大小 , 不但降低成本 , 而且实现从通用向专用的进一步优化 。
打个比方来说 , 大模型类似于一个知识非常渊博的老师 , 他学了无数多的数据 , 但是如果从事一件具体的工作 , 就不需要那么渊博的知识 , 这时候 , 我们可以根据需求 , 自动蒸馏出一个小模型 , 教出一个小徒弟来做这项工作 。
人工智能要迈上工业化阶段 , 必须要满足以下几个条件 , 批量化 , 成本低 , 易访问 , 轻能耗以及最大程度的开源开放 。 未来 , “云端的大模型+末端小模型”很可能会成为人工智能应用的重要模式 。
人民网:这个平台 , 目前是否有一些成功的应用?
徐波:我们已经有一些应用 , 效果很好 。 以前解决不了或者解决不好的现在有了全新的技术手段 。
我们在智慧媒体方面做了一些探索 。 和头部视频网站合作 , 针对其海量的短视频、电影和电视剧 , 做到了跨模态内容的检索 。 比如输入一段文字 , 就能定位到视频中的某一个片段;可以根据电视剧的简介自动生成1分钟的视频摘要;还可以指定某个特定演员出现的场景、某件事的前因后果等内容进行“跳播” 。
工业视听觉已经进行了应用尝试 。 过去 , 人工智能在工业领域的应用是一个痛点 , 因为样本非常少 , 而且很多时候数据是多模态的 。 比如发动机的质检 , 往往是靠老师傅们“听”出来的 。 用人工智能怎么做呢?我们把各种各样的工业缺陷数据混合在一起 , 首先让机器进行模型自学 , 应用的时候只需要给两个样本 , 就可以达到很高的质检精度 。 这方面我们已经实验过了 , 原来可能需要一万个样本才能做到90%以上的识别率 , 现在只要用几个或几十个样本 , 精度就能达到90% , 大幅降低了人工智能的应用门槛 。
另外一个应用案例是具像化的教学 , 可以在打手语的同时生成对应图片 , 辅助学生理解 , 更好地达到教学目的 。
类似的应用还有很多 , 只靠自动化所一家单位去落地 , 会错失大量的助推产业升级的机会 , 也会比较慢 , 所以一定要在推广模式上创新 , 吸引更多的人、更多的机构来实践 , 来应用 。 我刚才说的“2.0”就是这个意思 。 现在我们自己先做一些样例出来 , 然后进一步完善模型 , 通过标准化、流程化等一系列手段 , 将门槛降下来 。 未来越多人用 , 这个模型就会越完善 , 也越好用 。
推荐阅读
- 快报|“他,是能成就导师的学生”
- 技术|“2”类医械有重大进展:神经介入产品井喷、基因测序弯道超车
- bug|这款小工具让你的Win10用上“Win11亚克力半透明菜单”
- 重大进展|“2”类医械有重大进展:神经介入产品井喷、基因测序弯道超车
- 历史|科普:詹姆斯·韦布空间望远镜——探索宇宙历史的“深空巨镜”
- 空间|(科技)科普:詹姆斯·韦布空间望远镜——探索宇宙历史的“深空巨镜”
- 样儿|从太空看地球新年灯光秀啥样儿?快看!绝美风云卫星图来了
- 精度|将建模速率提升10倍,消费级3D扫描仪Magic Swift在2021高交会大显“身手”
- 四平|智慧城市“奥斯卡”揭晓!祝贺柯桥客户荣获2021世界智慧城市治理大奖
- |南安市司法局“加减乘除” 打造最优法治营商环境