打破数据孤岛：联邦学习近期重要研究进展( 六 )_机器之心原创作者：仵冀颖编辑：H4O随

联邦学习介绍

联邦学习由一个中央服务器和 KxC 个随机客户端组成，其中 K 是客户端数目，C 为每轮所选参与更新的客户端比例的超参。在中央服务器和客户端之间传递要训练的全局模型的参数，包括分发、更新和上载等步骤。其中，所选客户端基于已有数据计算模型的参数更新（更新），中央服务器从客户端聚合多个更新改进全局模型（上载），之后再将全局模型分发至各个客户端（分发）。为了完成更新和上载任务，联邦学习要求每个客户端都具备一定的计算资源。在真实蜂窝网络中，由于客户端数据特征、计算能力以及通信通道性能的不同，联邦学习在客户端训练机器模型时往往会遇到很多问题。系统异质性已经成为联邦学习发展的一个瓶颈。

FedCS 介绍

图3/49

图 1. FedCS 框架概述. 图中实心黑线表示计算过程，虚线表示无线通信过程.

图 1 给出了本文提出的 FedCS 的整体结构，其中 MEC 平台表示中央服务器。与传统的随机选择客户端的方式不同，本文提出了一种客户端选择机制。首先，资源请求（Resource Request）步骤要求随机选择的客户端通知 MEC 平台其资源信息，例如无线信道状态、计算能力以及与当前训练任务相关的数据资源的大小等。然后，在客户端选择（Client Selection）步骤中引用此信息，以估计分发（Distribution）、计划的更新和上载（Scheduled Update and Upload）等步骤所需的时间，并确定由哪些客户端执行这些步骤。在分发（Distribution）步骤中，通过基站（Base station，BS）的多播将全局模型分发给所选客户端。在计划的更新和上载（Scheduled Update and Upload）步骤中，选定的客户端并行执行更新模型，将新参数上载到中央服务器。中央服务器使用验证数据评估直接聚合客户端更新的模型性能。在模型满足要求或达到执行时间要求之前，上述步骤重复执行。