item|推荐策略产品经理实操(三):推荐系统与搜索系统的区别——整体逻辑流程对比
编辑导语:推荐的目的主要在于依据用户行为偏好,为用户推荐可能喜欢的事物;而搜索则是用户出于一定目的进行检索,前者为被动获取,后者为主动获取。具体而言,推荐系统与搜索系统有何差异?本篇文章里,作者从整体逻辑层面对推荐系统与搜索系统的区别进行了总结,一起来看一下。
文章插图
根据我平时接触的推荐和搜索业务,简单地将2个业务的流程进行梳理以及知识点扩展,便于需要的同学能够快速地了解2个系统的基本逻辑。
一、推荐系统逻辑推荐的本质就是为了解决信息过载造成的“选择困难症”,便于用户能够在自己选物之前,系统已经帮用户筛选到了最想要的信息。
以下是我按照用户打开APP进入推荐页面时,推荐系统返回给该用户推荐列表的整体流程:
文章插图
整个流程的重点逻辑主要在召回、排序、重排三层,这一节专门讲这一块,至于AB实验平台上的逻辑,后面会有专门的一节进行AB实验的详解。
1. 召回什么是召回?大多数人都会很快解释:召回是从物料库中获取一小部分物料,这一小部分物料会在后续的环节被模型用来进行打分排序。
这里我们再直白一点理解吧,召回就是捞,给用户推荐的时候,不可能把平台上所有的item都拿出来走模型排序,这样的话计算时间会很长,且资源消耗很大、不合理。这个时候就需要去平台内容库里把最适合用户的item捞出来,这就是我们说的召回。
通常都是从亿万级数据或千万级数据中捞出千百级别的item。召回这一步主要是处理数据量大,需要步骤速度够快、模型不能太复杂且使用特征相对排序少。
当然,召回也是决定个性化推荐的基础,目前来看,召回多数是多路召回(这里可以理解为通过不同限制条件去捞)。
多路召回的好处:
- 提高召回率和准确率,这里不对这2个名词作解释,可以找相关文章自行查询;
- 个性化推荐的基础,用户多样性兴趣探索,多元化召回;
- 保证线上事故发生时还有存余召回兜底,避免推荐接口没有返回的数据;
- 贴近业务,各业务需求不一样,需要进行融合(广告召回、强插、item冷启动等)。
1)协同过滤
基于用户的协同过滤,基于item的协同过滤;简单来说就是喜欢A内容的用户,还喜欢B游戏(这种召回方式比较老,现在很少有公司会用)。
协同过滤和用户及游戏都有关,矩阵,玩过就是1,没玩就是0,没玩过的游戏很多,很多都是0,所以会做矩阵分解:用户矩阵和商品矩阵,每一列就是用户向量或商品向量。
2)word2vec(词向量)
(最早用于NLP中)需要拿到用户的玩游戏序列,每个游戏做one-hot编码,会有一个神经网络模型,输入是A→B→?→D→E,输出是C,或A→B→C→D去预测E。
模型中间的隐藏层就叫词向量,和游戏有关,和用户没关,拿数据的时候和用户有关(向量用法:用户和游戏算相似度:用户A和游戏B向量做相似度计算;用户和用户、游戏和游戏)。
3)内容匹配召回
这一块主要和标签(类别)召回有关,比如:用户玩了王者荣耀,那么可以尝试召回推荐类似王者荣耀的吃鸡游戏,这是基于内容标签的召回;又或者用户玩了植物大战僵尸1,那么也可以尝试推荐植物大战僵尸2/3等,这是基于知识储备的匹配。
4)高热召回(热门召回)
这一路召回主要是新用户用的比较多,新用户刚来APP,拿不到过多的用户信息且没有行为,这种情况下,平台高热召回就起了大作用,用来做新用户冷启动;用户冷启动这里不做过多结束,后面会有专门的一节做介绍。
推荐阅读
- 国家互联网信息办公室|国家网信办:算法推荐服务提供者不得利用算法实施影响网络舆论
- f快速掌握Meta 技术和全漏斗策略,兼顾品牌和效果
- 行稳致远|人民日报评论:算法须有“道”,“推荐”不能乱来
- 大数据|你的APP被大数据支配了吗?国家发布重磅新规,限制个性推荐
- 信息化部|市场要闻|算法监管落槌,四部门联合发布《互联网信息服务算法推荐管理规定》
- 算法|网信办等四部门:算法推荐服务须提供不针对个人特征选项且可关闭
- 云鲸J2和石头G10哪个值得推荐?
- 商用密码|《安全419编辑推荐2021年优秀网络安全厂商》商用密码应用篇
- 央行|刚刚!央行等七部委重磅发文,“剑指”直播营销金融产品!不得用演艺明星推荐,来看四大“禁令”
- 威胁|《安全419 编辑推荐 2021年度优秀安全厂商》高级威胁检测与响应篇