NV何琨:AI视频处理加速引擎及Deepstream介绍( 九 )
图11/14
这样有什么好处?如果当前Memory足够Load数据之后,把这三个网络层融合到一起,就能够节省四次的访存次数。随着网络层越来越深,网络层的读写次数越少,加速时间就会越来越多。
除了上面的融合之外,我们把三个1x1 CBR还可以融合在一起,因为它们进行相同的操作。同时自动拼接也可以省掉,因为GPU里计算完就直接执行了,可以直接消减掉。
图12/14
最后,可以看到这个过程中,这个两条线彼此之间是并不相关的,数据之间没有相互的交流。我们可以单独启动两个Stream,分别走这两条线。
就是把左侧两个数据来计算的同时,同时计算第三块数据,也就是把需要时间较少的那一部分隐藏到另一部分的时间里,当然这都是TensorRT帮我们完成的。
推荐阅读
- 吃鸡游戏|PEL决赛圈斗鱼三雄内战,LGD冷静处理强势吃鸡,超神发挥看懵解说
- lpl|LPL为何处理不了猫咪,自身了解太浅,根本不重视S11!
- 亚运会|LOL中国队夺冠视频首次公开!观众们等了三年,终于等来官方版本
- |黑神话做一个视频,就得耽误3个月的开发进度?
- 手机游戏|景雨墨一夜爆红LOLM,百万粉博主等他的素材,教学视频轻松过百万
- CPU|高通发布全新四款处理器!网友直言不如买现款
- |历时半年,玩家自制LOL真人特效视频,质量堪比游戏CG
- 快手视频|fly晒头等舱视频,战队福利尽显雄厚资本,飞牛身高再次成谜
- 短视频|亦真亦假:揭秘直播年入百万的顶级实操干货,横向纵向破法!
- 一条小团团|网红「一条小团团」不惧恶评!大方露脸,发布视频!自称:从未被认出过