随着国家数据战略的深化推进,大数据本身的基础设施建设和数据资源的建设,在赋能数字经济的作用价值被人们所看到。如何保障数据在不同主体之间安全可信的共享,隐私计算成为关键技术。
魏凯表示:“数据流通在1.0阶段蕴含了很多的风险,裸数据交付较多,一旦流通出去安全风险不可预估。如今数据流通模式发生改变,隐私计算让数据变成融合后的结果,因此升级进入了数据流通的3.0阶段。”
我们之所以能够跨越到数据流通的3.0阶段,很重要的一个技术前提就是隐私计算这一类技术的支撑。他认为,“虽然隐私计算改变了数据交互与融合的模式,提出了一种新的形态,保障了从数据源、数据传输渠道、数据汇聚通道和使用方等数据流通环节的安全。但实际上没有办法解决数据在流通之前和之后的权属争议,因此也不能成为一种豁免法律义务的挡箭牌,这是毫无疑问的。”
隐私计算产品的成熟度、可用性,也是我们所关注的。考察隐私计算产品的技术水平应该从综合的角度来去评判,包括性能、安全性和准确程度,这三者缺一不可。
“隐私计算的使用和合规不能划等号”。首先,法律法规不会对技术的应用做非常确切的判断,无论是隐私计算技术还是人工智能技术的使用,法律上不会从条文上判断使用是否合法,从合法性给出确切的定义。法律只看是否侵犯相关的利益。因此在实践中要趋近于法律的最小化原则,除了技术之外还要考虑商业模式是否合规、数据来源以及授权是否合法、数据使用的目的是否正当等问题。我们要持续性的看待技术的演进和法律合规落地之间的关系。
最后魏凯指出,目前隐私计算这类产品还面临安全性挑战、性能的瓶颈、互联互通三座大山。未来隐私计算发展趋势会是外部的互联互通和内部融合的发展方向。类似与云计算、大数据平台、数据库、区块链、AI等技术融合发展,平台产品间互联互通,打破隐私计算孤岛。
二、杨强:人工智能建设离不开数据,联邦学习让数据发挥价值
加拿大工程院院士、加拿大皇家科学院院士,微众银行首席人工智能官杨强,带来了主题为《数据要素与联邦学习》的演讲。
文章插图
他以“人工智能离不开数据”引入,指明人工智能模型的建设需要数据,但是数据维度、样本数都非常少、数据所属和来源各不相同以及数据安全合规越来越严,因此亟需一个更强的工程和科学发展来应对这种需求,因此提出了联邦学习。联邦学习可以让数据可用而不可见。
他表示从时间上来看隐私计算基本经历了四个发展阶段:安全多方计算(MPC)、差分隐私(DP)、集中加密计算(TEE)、联邦学习(FL)。其实在数据可用而不可见的范畴内,我们可以用各种各样的技术手段来解决问题,进而随着技术不断发展,形成大数据流通和隐私计算的行业生态。
而联邦学习的方法是让“数据不动、模型动”,模型参数加密以不暴露原始数据和各方模型。杨强还介绍了横向联邦学习和纵向联邦学习带来的作用。其中有一个典型的场景:“互联网公司可以提供用户画像的信息,但它却没有银行风险控制的信息。银行有用户借款的信息以及逾期率,但却不知道用户平时上网的行为、看视频的喜好等等。如果能把两种信息聚合起来,那么风险模型就会更靠谱,坏账率也会变低,这就是纵向联邦学习的作用。”
据介绍联邦学习目前国内国外也都在建立相关标准,国内杨强团队领导IEEE建立全球首个联邦学习标准,同时也做了世界上第一个开源平台FATE,贡献给Linux Foundation,联邦学习还被纳入Gartner技术成熟度曲线,成为下一代隐私计算发展的关键。
推荐阅读
- 隐私|小米应用商店移除32位包必传限制,开发者可自主决定上传APK类型
- 浙江大学|IEEE正式推行首个隐私保护机器学习国际标准 蚂蚁集团参与制定
- 瀚巍微电子|融资丨「瀚巍微电子」完成8000万人民币Pre-A+轮融资,光速中国和高榕资本联合领投
- 春华资本|植物蛋白食品科技企业星期零获春华资本领投1亿美元B轮融资
- 送上门|快递不用送上门?你可能没有意识到,你被资本家PUA了
- 店铺|当心!你的旧手机可能会泄露个人隐私数据,提前清空也没用
- 脸书|违反数据隐私规则,谷歌脸书遭法国罚款2.1亿欧元
- 操作规程|拟加码隐私保护快递运单不得“裸奔”
- 个人隐私|国家计算机病毒应急处理中心监测发现 20 款违法 App
- 债券|洞见科技“隐私计算+资管”项目成功入选