清华、李飞飞团队等提出强记忆力 E3D-LSTM 网络( 四 )
图中每个颜色的模块都代表了多层相应的网络。图(a)和图(b)是两种 3D 卷积和 LSTM 结合的基线方法,3D 卷积和 LSTM 线性叠加,主要起到了编码(解码器)的作用,并没有和 RNN 有机制上的结合。图(a)中 3D 卷积作为编码器,输入是一段视频帧,图(b)中作为解码器,得到每个单元的最终输出。这两个方法中的绿色模块使用的是时空长短时记忆网络(ST-LSTM)[1],这种 LSTM 独立的维护两个记忆状态 M 和 C,但由于记忆状态 C 的遗忘门过于响应具有短期依赖的特征,因此容易忽略长时依赖信息,因此 E3D-LSTM 在 ST-LSTM 的基础添加了自注意力机制和 3D 卷积操作,在一定程度上解决了这个问题。具体单元结构下一节介绍。
图(c)是 E3D-LSTM 网络的结构,3D 卷积作为编码 - 解码器(蓝色模块),同时和 LSTM 结合(橙色模块)。E3D-LSTM 既可用于分类任务,也可用于预测任务。分类时将所有 LSTM 单元的输出结合,预测时则利用 3D 卷积解码器的输出作为预测值。
E3D-LSTM 单元结构设计
推荐阅读
- 剑网3|天上蓬莱飞飞,地上小鬼追追,被剑网三蓬莱毁掉的李渡鬼城好玩么
- 学霸|清华学霸化身霸道总裁,全程带飞御姐方圆,美女直言斗鱼学霸真多
- msi|MSI新人解说登场!清华学霸和美女小姐姐,郎才女貌未来可期!
- 吸尘器|中国科技被低估了!清华学霸自研“超级电机”,小米有品众筹爆卖1500万
- 华为鸿蒙系统|为何华为不将鸿蒙设在清华北大?任正非说了一句话,让人无言以对
- 因“不想写作业”黑掉清华网站的00后黑客,1元买下购物网站,现状如何了?
- 卢伟冰不愧是清华毕业的,写打油诗嘲笑荣耀V30,一个配置用了六年
- 【Pivot捷报】重磅!CMU计算机博士全奖(机器人所)来啦!!!祝贺【清华】的同学
- 世纪悍匪叶继欢:曾10分钟打劫5家金铺,女儿进清华大学洗白
- 清华北大毕业生2019就业去向公布:华为成最大赢家