不用看数学公式!图解谷歌神经机器翻译核心部分:注意力机制( 九 )
1、编码器是一个双向(正向+反向)门控循环单元(BiGRU)。解码器是一个GRU,它的初始隐藏状态,是从反向编码器GRU的最后隐藏状态修改得来的向量。
2、注意力层中的评分函数使用的是additive/concat。
3、到下一个解码器时间步的输入是来自前一个解码器时间步(粉红色)的输出和来自当前时间步(深绿色)语境向量之间的串联。
这个模型架构,在WMT’14英语-法语数据集上的BLEU分数是26.75。
相当于在将德语文本翻译成英语的时候,用了两个翻译员。
翻译员A,在逐字逐句阅读德语文本的时候,会写下关键词。翻译员B,在倒着逐字逐句阅读德语文本的时候,写下关键词。
这两个翻译员,会定期讨论他们在讨论之前阅读的每一个单词。
读完德语文本之后,翻译员B会根据他们两个之间的讨论,以及选择的关键词,将文本翻译成英语。
在这里,翻译员A,是正向RNN,翻译员B,是反向RNN。
推荐阅读
- ag战队|KPL:恭喜AG超玩会喜提A组名额,整个AG都是问题,锅都不用分了
- 猫神|AG野射换位置成败笔,久诚招牌尽出也没用,猫神终于不用背锅了
- 原神|DNF玩家RP爆发,合成2个JP辟邪玉,看到属性:一辈子不用买YXB了
- 余霜|EDG夺冠后美女翻译夏安爆火,网友:终于不用听余霜乱翻译了!
- 哈利波特魔法觉醒|《哈利波特:魔法觉醒》新版三书海格,快速上分不用愁!
- ag战队|AG局内语音曝光,一诺再也不用指挥了,最初一句话拯救队伍
- edg战队|原神:105万伤害!平民公子达成新成就,不用五星武器也能核爆!
- 王者荣耀|受众不一样,所以也不用说谁的皮肤更好看,自己玩的开心就行了
- 原神|原神:作为兵器就不用为放出魔神,水淹璃月负责?是不是太天真了
- 交易|剑网3:八级五行石获取攻略,绑定石头多可以不用去交易行购买