打破数据孤岛：联邦学习近期重要研究进展(30)_机器之心原创作者：仵冀颖编辑：H4O随

图37/49

随着大规模统计学习的发展，数据采集和建模技术逐渐从传统的中心化汇聚及处理改变为在外围设备上本地化处理及建模，例如电话、手表、健身手环等。伴随着分布式存储的数据增长，如何在保证足够数据用于建模的同时保护数据隐私性，这一问题面临着巨大的挑战。本文提出了「本地隐私概念」，即在统计人员或学习者能够观察到数据之前，对这些数据进行差异化、模糊化处理，从而对个人数据提供有效保护。传统的用于本地隐私保护的方法在实际应用中过于严格，特别是在现代高维统计和机器学习问题中往往无法适用。本文基于对手大概率事先能够掌握到的信息有限的考虑，为确保对手无法在一定的误差范围内重建数据，提出了一种有效的数据发布措施，同时设计了一种针对不同隐私要求的统计学习问题的最小最大（minimax）差异性隐私机制。

隐私保护机制背景知识

在联邦学习问题中，即使只在客户端和中央服务器之间传输模型的更新信息而不传输客户端本地数据，依然存在暴露用户隐私的风险。本文提出了一种基于本地私有算法的隐私保护方法。给定客户端保持私有状态的数据 x∈X，随机机制 M:XZ 是ε-本地差异性私有的，则对于所有 x，x『∈X 以及集合 S，我们有：