NV何琨:AI视频处理加速引擎及Deepstream介绍( 九 )

NV何琨:AI视频处理加速引擎及Deepstream介绍

图11/14

这样有什么好处?如果当前Memory足够Load数据之后,把这三个网络层融合到一起,就能够节省四次的访存次数。随着网络层越来越深,网络层的读写次数越少,加速时间就会越来越多。

除了上面的融合之外,我们把三个1x1 CBR还可以融合在一起,因为它们进行相同的操作。同时自动拼接也可以省掉,因为GPU里计算完就直接执行了,可以直接消减掉。

NV何琨:AI视频处理加速引擎及Deepstream介绍

图12/14

最后,可以看到这个过程中,这个两条线彼此之间是并不相关的,数据之间没有相互的交流。我们可以单独启动两个Stream,分别走这两条线。

就是把左侧两个数据来计算的同时,同时计算第三块数据,也就是把需要时间较少的那一部分隐藏到另一部分的时间里,当然这都是TensorRT帮我们完成的。

推荐阅读