打破数据孤岛：联邦学习近期重要研究进展(19)_机器之心原创作者：仵冀颖编辑：H4O随

表 2. 训练模型在不同服装类别上的测试准确度.

3）语言模型

该数据库仅包含两种语言数据：对话和文本。对话数据使用的是 Cornell 电影数据库，其中包含了 300000 条语句，平均长度为 8。文本数据使用 Penn TreeBank（PTB）数据库，包含 50000 条语句，平均长度为 20。本文通过将上述两个对话和文本语料库作为域相结合构建了一个数据库。本文使用动量优化器（momentum optimizaer）训练了一个投影大小为 512 的双层 LSTM 模型。通过复杂度来衡量模型的效果，即交叉熵损失的指数，实验结果见表 3。在这两个域中，文本域的处理难度较大，AFL 的测试复杂度接近于仅针对文本数据训练的模型，优于基于均匀分布 u^训练的模型。

表 3. 不同域中训练模型的测试复杂度.