基于PaddlePaddle的视频联合时空建模方法在国际赛事夺冠( 五 )

时域Xception块结构如下:模型锻炼:数据准备终了后,经过以下方式启动锻炼(办法 1),同时我们也提供快速启动脚本 (办法 2)数据预处置阐明:模型读取Kinetics-400数据集中的mp4数据,每条数据抽取seg_num段,每段抽取seg_len帧图像,对每帧图像做随机增强后,缩放至target_size。

? 权重衰减系数为1e-4? 学习率在锻炼的总epoch数的1/3和2/3时分别做0.1的衰减模型评价:经过以下方式(办法 1)中止模型评价,同样我们也提供了快速启动的脚本(办法 2):? 若未指定--weights参数,脚本会下载已发布模型中止评价。

模型推断:可经过如下命令中止模型推断:? 若未指定--weights参数,脚本会下载已发布模型中止推断。

模型精度:当模型取如下参数时,在 Kinetics400数据集上的指标为:

推荐阅读