ACL 2018|康奈尔大学:多词义嵌入的概率FastText模型(16)
4 总结
本文提出了一种适用于稀有词汇和未登录词的具有灵活子词结构的概率词表示模型 。 所提出的概率公式包含了不确定性信息 , 自然地允许人们用多模密度表示来揭示多重含义 。 我们的模型能够提供更好的语义质量 , 在单词相似性基准上优于竞争模型 。 此外 , 我们的多模态密度模型可以提供可解释和分离的表示 , 并且是第一个能够处理稀有单词的多原型嵌入 。 未来的工作包括研究学习每个词分布的完全协方差矩阵、计算复杂性和性能之间的权衡 。 这一方向可能会对方差信息至关重要的任务产生重大影响 , 例如对概率分布的层次建模 。 其他未来的工作包括在多种语言上共同训练PFT 。 目前 , 关于多语言嵌入的现有工作将单词语义与预先训练的向量对齐 , 这可能是由于多义现象而导致的次优结果 。 我们设想 , 多原型性质可以帮助消除多义词的歧义 , 提升语义对齐的质量 。
推荐阅读
- 开罗|开罗游戏发表中文声明:识君代理属于侵权行为,2018年就已解约
- RNG|用数据说话 2018年与2021年的RNG谁更具统治力
- RNG|回应LCK的质疑?国服下血本庆祝RNG夺冠,力度远超2018年
- 王者荣耀|王者荣耀:冰锋战神买亏了?看到2018年先例,笑了
- 间接伤害|阴阳师:真正的SR一姐,2018年至今依然巅峰,恐怕难逃“下岗”
- 圣墟|我心中的2018年网文10大作品:《圣墟》《超神机械师》领衔
- 王者荣耀|新赛季上线1小时,王者玩家就突破2018人,只因策划一个改动
- 战神诸神的黄昏|战神诸神的黄昏对2021年度游戏志在必得
- 受疫情影响,Oracle认证考券延期声明
- 美国国防部要求增加5G投资