NV何琨:AI视频处理加速引擎及Deepstream介绍( 六 )
图8/14
后面画出这些图表是TensorRT当前的Performance一个优化的程度,这个是4.0版本,最新数值还要更高。我们什么都不需要做,只要用这个工具来Inference这个模型就OK了,可以达到这样一个高度。
而随着最新的TensorRT 5.0的推出,对于python的支持,对于NLP、RNN等基于时间序列的模型的支持也都非常好,特别是还有基于移动端类似于无人机、无人车等平台。
TensorRT有一个标准的Work Flow,给它一个训练好的网络模型(包括网络结构、权重参数),它会自动进行优化,而在这个优化完成后会生成一个可执行的推理引擎,只要把需要推理的数据实例,如图片、语音信息、文字等内容直接给它,它就可以加速你的模型推理。
而在模型推理过程中,我们需要它自动做这五件事:
图9/14
第一个是权重参数类型的优化,比如目前半精度和八位整形的推理,如果当数据的大小或位宽减少之后,数据传输、计算、配合最新的Tensor Core等硬件结构做推理时,整体速度会提升很多。
推荐阅读
- 吃鸡游戏|PEL决赛圈斗鱼三雄内战,LGD冷静处理强势吃鸡,超神发挥看懵解说
- lpl|LPL为何处理不了猫咪,自身了解太浅,根本不重视S11!
- 亚运会|LOL中国队夺冠视频首次公开!观众们等了三年,终于等来官方版本
- |黑神话做一个视频,就得耽误3个月的开发进度?
- 手机游戏|景雨墨一夜爆红LOLM,百万粉博主等他的素材,教学视频轻松过百万
- CPU|高通发布全新四款处理器!网友直言不如买现款
- |历时半年,玩家自制LOL真人特效视频,质量堪比游戏CG
- 快手视频|fly晒头等舱视频,战队福利尽显雄厚资本,飞牛身高再次成谜
- 短视频|亦真亦假:揭秘直播年入百万的顶级实操干货,横向纵向破法!
- 一条小团团|网红「一条小团团」不惧恶评!大方露脸,发布视频!自称:从未被认出过