萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI
想研究可微分渲染 , 却担心找不到合适的框架?
现在 , 官方支持可微分渲染的深度学习框架来了:
文章图片
可微分渲染是计算机图形学的热门领域 , CVPR 2020的最佳论文奖 , 就颁给了可微分渲染的相关工作 (Jittor已优化开源相关代码) 。
当然 , 作为一个主打计算机图形学的深度学习框架 , Jittor的这次更新也“紧随潮流” , 加入了最新的Vision Transformer等模块 , 性能优化上较之PyTorch等框架优秀不少 。
一起来看看 。
可微分渲染 , 图像重建利器
渲染究竟是什么?
简单来说 , 「渲染」通常是指将3D场景 , 转变为2D图像的过程 。
文章图片
对于人眼来说 , 这种事情非常容易 , 因为现实世界中存在大量自然光线 , 人眼通过光线反射 , 能看清物体各个方位的深度、形状 。
但计算机眼里的3D场景 , 并没有现实世界中各种各样的光线 , 这种情况下生成的2D图像不仅没有参数 , 形状也容易出错 。 那么 , 直接在计算机中模拟四面八方来的所有光线?
计算量太大 。
所以 , 为了让计算机生成图像效果更好 , 即 更快、更逼真地生成接近于人眼看到的2D图像 , 「渲染」目前是图形学重要的研究领域 , 通常被用于如制作动画电影等方向:
文章图片
那么 , 可微分渲染呢?
这有点像是「渲染」的“反向操作” , 从2D图像中 , 生成所需的3D场景信息 , 包括3D几何、灯光、材质、视角等等 。
文章图片
在用深度学习生成3D场景的过程中 , 同样需要进行梯度下降优化算法 , 这其中 , 就会用到可微分渲染 。
目前在图像领域中 , 可微分渲染仍然是非常新颖的一个方向 , 但相比之下 , 此前只有少数深度学习框架设立一个相关的库 , 便于进行可微分渲染的相关工作 。
清华「计图」 , 自发布实例分割模型库和3D点云模型库后 , 目前正式发布可微分渲染库 , 支持obj的加载和保存、三角网格模型渲染 。
文章图片
除此之外 , 这一可微分渲染库内置2种主流可微渲染器 , 支持多种材质渲染 , 相比于PyTorch , 速度提升了1.49~13.04倍 。
文章图片
当然 , 这次「计图」的更新 , 带来的惊喜不止这些 。
视觉玩家福音:训练速度较PyTorch更快
继在NLP领域取得最优性能后 , Transformer又进入了图像领域 , 目前Vision Transformer也已经在视觉分类上取得了最佳效果 。
有关 Vision Transformer , 目前「计图」已经实现了复现 , 训练速度相比于PyTorch还要快上20% 。
【计图|清华「计图」迎来重大更新:支持热门的可微渲染,多项CV任务速度超越PyTorch】
文章图片
同时 , 这次更新还带上了 YOLOv3的加速和复现 , 训练速度相较于PyTorch提升11% 。
原来在Jittor上可以运行的 MobileNet , 这次的训练和推理速度也得到了全面提升 , 在不同的图像及batchsize大小上 , 速度提升从10%~50%不等 。
简直是视觉分类玩家的福音 。
搞图形学 , 选哪个深度学习框架?
就传统的几大主流框架而言 , 相比于Caffe的速度 , Tensorflow和PyTorch更侧重于“容易上手” 。
这里面相较于Tensorflow , PyTorch搭建在更高层 , 虽然上手更友好 , 但训练速度也会因此更慢 。
此外 , 这些深度学习框架并非像「计图」一样 , 完全针对于图形学领域 , 因此无论是渲染、还是图形处理等方向 , 并不能做到每个新领域都及时地跟进 。
Caffe作者贾扬清也曾在知乎表示 , 「计图」更关注计算图优化及JIT (实时)编译 。
文章图片
也就是说 , 在训练速度、上手友好度方向 , 「计图」都是要优于PyTorch的 , 而接口仿PyTorch , 也是为了让大家能更快适应新的框架 。
那么 , 这次的可微渲染库 , 与胡渊鸣的Taichi渲染工具相比怎么样呢?
据开发者之一梁盾介绍 , 二者整体来说属于不同的领域 。
Taichi做的是类似下图的可微物理模拟 , 而Jittor这次加入的则是可微渲染库 。
文章图片
但就渲染领域来看 , Taichi有简单的可微分渲染部分 , 目前主要还是通过物理模拟光线的折射 , 来完成简单的渲染工作 。
也就是说 , 渲染是完成三维模型和图像之间的变换 , 而物理模拟 , 则是完成三维模型和作用力之间的变化 。
文章图片
文章图片
如果想要系统地上手CV , 「计图」会是一个不错的深度学习框架 。
作者介绍
「计图」的开发团队 , 均来自清华大学计算机系图形学实验室 , 负责人是清华大学计算机系的胡事民教授 。
而主要负责开发的 , 则是来自实验室的博士生们:梁盾、杨国烨、杨国炜、周文洋……
梁盾认为 , 这次「计图」的升级 , 兼具创新、前瞻性 , 而且可微分渲染也是逐渐火热的研究领域 。
而针对Vision transformer的训练 , 速度也比许多国际主流平台要快 。
心动的同学 , 可以更新/安装起「计图」来了~
Jittor项目地址:
https://github.com/Jittor/jittor
参考链接:
https://mp.weixin.qq.com/s/MpxW82hqW7cgPL6IgncwRA
— 完—
本文系网易新闻?网易号特色内容激励计划签约账号【量子位】原创内容 , 未经账号授权 , 禁止随意转载 。
量子位年度智能商业大会启幕 , 大咖已就位!
12月16日 , 李开复博士、 谭建荣院士、清华 唐杰教授 , 以及来自 小米、 美团、 百度、 华为、 爱奇艺、 小冰、 亚信、 浪潮、 容联、 澎思、 地平线、 G7等知名AI大厂的大咖嘉宾将齐聚MEET2021大会 , 期待关注AI的朋友报名参会、共探新形势下智能产业发展之路 。
▽早鸟票限时优惠 , 扫码锁定席位吧~
量子位 QbitAI · 头条号签约作者
?'?' ? 追踪AI技术和产品新动态
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见~
推荐阅读
- 原神|《原神》「飞彩镌流年」2.4 版本预下载已开启
- 年轻人|呼叫全城玩家,魔都首发「表情包地铁」启程,2022蓝不倒!
- 雷军|和雷军一起开箱,领取小米12「专属指南」
- Siamese|一个框架统一Siamese自监督学习,清华、商汤提出简洁、有效梯度形式,
- 耳机|「以乐之名耀市而生」飞利浦Fidelio 降噪真无线耳机T1新品直播发布会圆满召开
- 独角兽|魅族 PANDAER「独角兽」iPhone 13 磁吸手机壳开售:129 元
- 设备|小米拍拍 4K 高清投屏器体验:「投屏」更高效的打开方式
- 边玩|OPPO软件商店推出「边下边玩」能力,为开发者打造留量新体验
- 旗舰|小米 12 Pro 评测:多项「首发」,能否再次成为安卓旗舰「质检员」?
- 李均|破解特斯拉漏洞,他教马斯克如何做「安全」