云脑科技徐昊:AutoML 工程实践与大规模行业应用( 四 )
图3/10
云脑在这些优化环节是如何做的?
样本效率
样本效率是机器学习最核心的问题之一,机器学习本质上是一个采样加拟合的过程,但是这个过程在很多系统中并不是一次性完成的。很多情况下,样本的处理都很简单,大量样本没有用或者效率较低。样本的选择对精度的影响较大,其数量对耗时的影响是线性的。
我们把信息量大的样本留下来,信息量小的去掉。如何衡量样本信息量?可以从无监督角度和业务角度考察样本的信息量。
图4/10
下面来看一个例子。下图是游戏点击率的线上数据。这是一个重度玩家在 11 天内楼兰游戏时对不同游戏的点击和曝光数。如果我们需要分析用户的喜好,只需要输入几百个甚至几十个样本点,而不需要输入全部 3000 个样本点,这就是样本的静态效率可以提升的空间。
推荐阅读
- 永劫无间|国产游戏优化都不行?永劫无间更新“黑科技”,玩家:丝滑般体验
- 吕蒙|三国志战略版:吕蒙、关银屏黑科技联动,技穷、缴械全都有
- 黄忠|三国志战略版黄忠蜀盾黑科技,蜀盾内战和打弟弟一样!
- ai|EDG夺冠,虎牙斗鱼B站直播间AI字幕黑科技比拼亮眼,虎牙的最准确
- 一加科技|钱小佳签约后平台未定,神豪“A皇”爆料,他复播不会选择斗鱼
- 地下城与勇士|DNF:堆满暴击率的4种方法!土豪靠“科技”,平民靠“变异”
- 主机掌机类游戏|我的世界:mc“穿越事件”,第一天还在砍树,数月后科技拉满!
- t1|LOL:T1黑科技时光辅助锁定赛点,六神跑酷烬DK毫无办法!
- 动视|巾帼不让须眉,新赛季女将黑科技十分惊艳,硬刚T0吴枪麒麟弓
- 剑网3|《英雄联盟手游》小法成为黑科技,打野发挥很重要