慕尼黑大学：双语任务中两种领域适应方法：简单易行、广泛适用( 八 )_ACL2018LongPapers双语任务中两种领域

作为可比较的非Twitter数据，我们使用OpenSubtitles ，其中分别包含4920万个英语和西班牙语副标题句子（Subtitle）。实验使用两个单语推特数据集：22M_tweets和BACKGROUND 。

对于情绪分类，我们使用RepLab 2013共享任务的数据。这些数据用正面、中性和负面标签标注，并包含英语和西班牙语的tweets 。我们在资源贫乏的环境中使用了官方英语训练（26.6K tweets）和西班牙语测试（14.9K）。以便于比较我们使用7.2K西班牙语标记的训练数据。

下表给出了两个分类器的结果。在所有情况下，基于subtitle的BWEs与twitter（22M_tweets和BACKGROUND）数据的适应明显优于基线。目标感知系统在基线BWES中表现不佳，并且可以从适应方法中显著受益。与仅基于twitter数据集的BWEs相比，尽管背景数据集与RepLab训练和测试集来自同一个主题，但22M_tweets的性能还是更好。我们的推测是后者太小，无法产生好的BWE 。结合subtitle ， 22M_tweets也比结合BACKGROUND产生更好的效果。

总的来说，为twitter CLSC任务使用适应的BWEs可提高现成分类器的性能。