富矿|人工智能大会“论道”:旧互联网打法难以为继,开采数据富矿亟待新办法( 二 )


求解数据合作难题进行时
大数据的核心价值在于连接与共享 。 "好的模型离不开高质量的数据 。 "星云Clustar CTO张骏雪表示 , 人工智能早期在视觉、语言处理这样容易获取高质量数据的行业落地较快 , 而在金融、制造、医疗领域的应用会因高质量数据获取难度大受到一些阻碍 。
科大讯飞西南研究院院长杨芳勋认为 , 数据所有者是有意愿把数据贡献出来 , 进一步流通产生价值的 , 但要建立在技术、策略、管理支撑下的合法、合规前提之下 。
因此 , 如何建立起一个同时实现数据主体、数据控制者和数据使用者三者利益平衡 , 处理好隐私保护、数据安全和数据价值挖掘三者关系的共享机制 , 成为会上一项重要议题 。
“在合理保护个人隐私的同时 , 恢复数据产业的发展 , 现在已经成为国际上的一个趋势 。 ”国务院发展研究中心金融研究所副所长陈道富表示 , “建立以征信体系为核心的信息共享 , 搭建地方政府主导的以政务数据为主的数据共享 , 探索企业市场化方式的数据流通 , 以隐私保护计算技术实现数据的合规、安全流通 , 将成为我国数据共享方式的重要思路 。 ”
香港科技大学智能网络系统实验室主任、副教授、星云Clustar创始人陈凯也认为 , 隐私计算技术可以帮助人工智能为代表的应用领域 , 合理引入更多受隐私、安全因素限制的数据 , 促进人工智能模型向精准化、效率化发展;推动不同机构的数据融合 , 催生出新的应用场景 , 让过去的不可能成为可能 。
【富矿|人工智能大会“论道”:旧互联网打法难以为继,开采数据富矿亟待新办法】“数据要素分为可用数据和不可用数据 , 不可用数据的边界由《数据安全法》《个人信息保护法》界定 , 而可用不可见的数据受法律、商业权益、个人隐私多重因素制约 。 ”CAAI名誉副理事长杨强表示 , 联邦学习具备数据不出库、性能效率大幅改善的技术优势 , 以赋能金融行业数字化转型为例 , 大多数金融机构往往受限于隐私保护、安全、合规的要求 , 不能轻易进行多方数据流通 , 通过联邦学习技术实现联合建模、扩充模型空间 , 可以构建更加精准化、智能化的金融服务体系 。

推荐阅读