基于PaddlePaddle的视频联合时空建模方法在国际赛事夺冠( 三 )
2. 3D卷积网络结构能够同时在空间和时间上建模进而得到令人称心的辨认任务结果。
众所周知,浅层的神经网络与深层神经网络相比,浅层网络在大数据集中,表现出较差的表示学习才干。
当中止大范围数据集中的人类行为辨认任务时,一方面浅层的3D卷积网络得到的视频特征的可辨别性相对深层网络较弱,另一方面,深层的3D卷积网络会招致过大的模型以及在锻炼中和推理阶段中过高的计算本钱。
部分信息和全局信息对辨认视频中的行为都起着十分重要的作用。
例如,在图1(a)中,我们能够经过部分的空间信息来辨认搬砖和搬石头,换而言之,在该图中,部分的空间信息(local spatial information)是我们辨认行为至关重要的要素。
而在图1(b)中,全局时空(global spatial-temporal)线索是用来辨别”摞卡片”和”飞卡片”这两个场景行为的关键证据。
图1部分信息足以辨别”搬砖”和”搬石头”;全局时空信息能够分别”摞卡片”和”飞卡牌”StNet的输入为平均采样的T个部分连续N帧的视频帧。
推荐阅读
- 亚运会|LOL中国队夺冠视频首次公开!观众们等了三年,终于等来官方版本
- |黑神话做一个视频,就得耽误3个月的开发进度?
- 手机游戏|景雨墨一夜爆红LOLM,百万粉博主等他的素材,教学视频轻松过百万
- |历时半年,玩家自制LOL真人特效视频,质量堪比游戏CG
- 快手视频|fly晒头等舱视频,战队福利尽显雄厚资本,飞牛身高再次成谜
- 短视频|亦真亦假:揭秘直播年入百万的顶级实操干货,横向纵向破法!
- 一条小团团|网红「一条小团团」不惧恶评!大方露脸,发布视频!自称:从未被认出过
- playstation5|《战神4》PC和PS5版游戏“早期”画面对比视频公布
- 任天堂|lol手游官方带节奏被喷,玩梗开团王者玩家,引战结束后秒删视频
- 金泰相|Doinb发道歉视频和帖子被狂喷!网友呼吁icon和Doinb携手退役