视频播放|何向南:算法解耦有助于防控偏见

中新经纬客户端6月25日电 (张燕征)近日 , 由中国人民大学高瓴人工智能学院等单位主办的“推荐算法社会价值与可持续发展”研讨会在中国人民大学举行 。 中国科学技术大学信息科学技术学院教授何向南在研讨会上表示 , 算法解耦有助于防控偏见等问题 。
何向南表示 , 从算法角度来说 , 推荐算法系统学习的核心就是用户的行为 。 然而用户行为耦合了许多因素 , 解耦能不能做好 , 对于理解用户兴趣且控制偏见是非常关键的 。 比如视频播放的场景 , 通常视频越短 , 它被完播的概率更高 , 那么时长特征对于预测视频是否被完播是非常关键的 。 实际上 , 视频越短越容易完播 , 是一种数据偏见(或者说业务逻辑造成的) , 因为对于很短的视频 , 被用户完播并不能代表用户喜欢它 。
【视频播放|何向南:算法解耦有助于防控偏见】“但是我们发现协同过滤算法不用任何时长相关特征 , 只要有用户的行为 , 学出的物品表示已经能够encode(编码)视频时长 。 也就是说 , 我们将视频时长特征显示地引入到协同过滤算法后 , 并没有提升完播的预测准确度 。 这样一个简单的案例表明 , 通过用户行为学习到的物品表示 , 已经耦合了许多特征的语义 , 即使我们没有把这些特征显示地加入到模型中 。 而这些隐式耦合的特征 , 很可能带来偏见 。 因此要从算法层面进行改进 , 我们需要利用辅助信息对表示学习进行解耦 , 只有解耦出来了 , 才可以配合一些综合操作来控制我们想要防范的偏见 。 ”何向南称 。
在信息技术研究领域 , 耦合是指两个或两个以上的体系或两种运动形式间通过相互作用而彼此影响以至联合起来的现象 。 解耦就是用数学方法将两种运动分离开来处理问题 , 常用的解耦方法就是忽略或简化对所研究问题影响较小的一种运动 , 只分析主要的运动 。 (中新经纬APP)
中新经纬版权所有 , 未经书面授权 , 任何单位及个人不得转载、摘编或以其它方式使用 。

    推荐阅读