慕尼黑大学:双语任务中两种领域适应方法:简单易行、广泛适用(11)

下表中的结果表明 , 在分类器中添加semisup可以进一步提高BLI的性能 。

这些结果表明 , 需要调整后的BWE来很好地利用未标记的数据 , 与之前工作中的最佳结果相比 , 仅使用未标记的数据 , 这导致总体显著增加3.71 。

总结

在通用域数据上训练的双语单词嵌入在域外任务中效果不佳 。 我们对两种不同的低资源任务/域组合进行了实验 。 我们发现在适应的BWEs的支持下 , 无论是跨语言的twitter情感分类还是医学双语词典构建 , 现成方法的性能都可以提高 。 在分类器训练时使用未标记数据 , 可以显著提高半监督系统的性能 。 此外 , CLSC结果使用目标语言标记数据的系统具有一定竞争性 , 即使我们不使用此类目标语言的标记数据 。

推荐阅读