以隐私的名义,一场数据的战争打响了( 五 )


微众银行的首席 AI 官杨强曾经把这个模型比作是「羊」,而数据就是「草料」。
过去训练模型的做法是从各个草场运草过来喂羊。但是在运送过程中,草有丢失的风险,这就是数据泄漏。
联邦学习的做法是,让这头「羊」走起来,到各个草场自己吃草。这样,草就永远只留在本地,也就没有了丢失的风险。
以隐私的名义,一场数据的战争打响了
文章插图
主人不知道羊吃了哪些草,但羊依旧长大了|图片来源:微众银行
其实把模型训练比作「耕牛」可能更好理解,这些耕牛原来是吃八方来的数据草料,变得强壮后再成为企业服务客户的「生产力」。而现在是把「耕牛」送到用户的田地里,吃用户数据草料,也直接更好地服务用户。加上「数据模型的集体升级能力」,这让你家的牛也和其他的牛可以一起成长,更好地服务你。
显然,通过技术模式的进步,才可以根本上避免数据泄露和恶意使用。对于日趋白热化的数据争夺而言,有了这种根本性的改变,才可以让公司间的数据共享成为可能。而在技术上建立一套数据保护的制度,也才能赢得用户的信任。
说到底,没有任何的公司,可以依靠价值观来成为个人数据问题的救世主。这些由技术带来的问题,最终还是需要由技术来解决它。
本文作者:汤一涛

推荐阅读