ACL 2018|康奈尔大学:多词义嵌入的概率FastText模型(15)
外语嵌入评价 。 下表显示了我们模型的斯皮尔曼相关性结果 。 在许多单词相似性基准上 , 我们优于FASTTEXT 。 我们的结果也明显优于基于字典的模型W2G和W2GM , 我们假设W2G和W2GM可以比当前报告的结果更好 , 前提是由于对特殊字符(如重音)单词进行适当的预处理 。
下表显示了额外的结果 , 表明可以在多种语言中观察到分离语义 。
定性评估-子字分解 。 下图显示了n-grams对最终表示的贡献 。 我们过滤掉 , 只显示上面5个和下面5个n-grams相似度得分 。 我们观察到两个单词的最终表示与n-grams“abno”、“bnor”、“abnormal”、“anbnor”、“<abn”对齐 。 事实上 , “abnormal”和“abnormality”都有相同的前5个n-grams 。 由于“autobiographer” “circumnavigations”或“hypersensitivity” 等许多罕见的词汇是由许多常见的子词组成的 , 因此n-gram结构有助于提高表示质量 。
推荐阅读
- 开罗|开罗游戏发表中文声明:识君代理属于侵权行为,2018年就已解约
- RNG|用数据说话 2018年与2021年的RNG谁更具统治力
- RNG|回应LCK的质疑?国服下血本庆祝RNG夺冠,力度远超2018年
- 王者荣耀|王者荣耀:冰锋战神买亏了?看到2018年先例,笑了
- 间接伤害|阴阳师:真正的SR一姐,2018年至今依然巅峰,恐怕难逃“下岗”
- 圣墟|我心中的2018年网文10大作品:《圣墟》《超神机械师》领衔
- 王者荣耀|新赛季上线1小时,王者玩家就突破2018人,只因策划一个改动
- 战神诸神的黄昏|战神诸神的黄昏对2021年度游戏志在必得
- 受疫情影响,Oracle认证考券延期声明
- 美国国防部要求增加5G投资