ACL 2018|墨尔本大学:基于门控图神经网络的图序列学习( 九 )

我们的模型遵循类似的结构 , 其中编码器是一个GGNN , 它接收节点嵌入作为输入 , 并使用图结构作为上下文 , 生成节点隐藏状态作为最终输出 。 从上图的示例中可以看出 , 我们在AMR图中每个节点上有4个隐藏向量 。 注意力和解码器组件遵循类似的标准s2s模型 , 其中我们使用双线性注意机制和2层LSTM作为解码器 。

双向和位置嵌入

虽然我们的体系结构在理论上可以与一般图一起使用 , 但是有根有向无环图(DAG)可以说是我们所处理的问题中最常见的一类 。 这意味着节点嵌入信息以自上而下的方式传播 。 在这项工作中 , 我们也遵循这一过程 , 确保信息均匀地在图中传播 。 然而 , 这又带来了另一个限制:因为图形基本上是无方向的 , 所以编码器现在不知道输入中存在的任何内在层次结构 。 受Geern等人的启发 , 本文通过在每个节点中加入位置嵌入来解决这个问题 。 这些嵌入被表示为与根节点的最小距离的整数值索引 , 并且被学习为模型参数 。 这种位置嵌入被限制为有根DAG:对于一般图 , 可以使用不同的距离概念 。

推荐阅读