慕尼黑大学:双语任务中两种领域适应方法:简单易行、广泛适用( 六 )
在结合了这两种技术之后 , 情感分析的结果堪比使用目标语言中注释数据的系统产生的结果 , 但我们并不需要目标语言注释数据 , 这是非常大的改进 。 与域内数据训练的基线相比 , 该方法对双语词典构建也有显著改进 。
BWEs适应
在一般领域文本上训练的BWEs , 在特定领域的系统中使用时通常会导致性能降低 。 这有两个原因 。 (i)特定领域的词汇包含一般情况下不使用的词 , 例如药品或疾病的名称 。 (ii)一个词的含义在各个领域有所不同;例如 , “苹果”在一般领域中主要指水果 , 但在许多产品评论中是一种电子设备 。
为了创建适应域的BWEs , 我们首先在两种语言中训练MWEs(单语单词嵌入) , 然后使用post-hoc映射将它们映射到相同的空间 。 我们通过将单语域外数据和域内数据连接起来 , 为两种语言训练MWEs 。 域外数据允许我们创建通用词汇的精确分布式表示 , 而域内数据则嵌入特定于域的词汇 。 然后 , 我们使用一个小的种子词汇映射这两个MWEs来创建适应的BWEs 。 因为post-hoc映射只需要一个种子词汇作为双语信号 , 所以它可以很容易地用于(廉价)单语数据 。
推荐阅读
- 西凉|三国志战略版:出生州选择也有大学问,开局选好霸业即成
- 桌游|48小时里,游戏开发能给这群大学生带来什么?
- edg战队|如何看待那些彻夜疯狂庆祝edg夺冠的高校大学生?
- edg战队|这一代大学生们怎么了:EDG夺冠而已,能不能不要本末倒置?
- 超级萨米卷|校园版鱿鱼游戏,实力拯救欠下72学分的咸鱼大学生
- 雕刻|第五人格IVL采访,Xawm回应雕刻家顶级玩法,我的雕像上过大学!
- 郑州轻工业大学|英雄联盟高校行|英雄联盟全球总决赛郑州轻工业大学观赛完美收官
- 斗鱼|泡吧、蹦迪、夜不归宿!「斗鱼一姐」自曝大学期间的“放纵”生活
- 赛尔号|赛尔号:我大学的时候,玩小游戏被嘲笑!最后结局并没有反转!
- icon|大学生网恋一个半月被骗318万