电商|电商搜索系统精讲系列三步曲2( 四 )


第一个维度:实体维度;
比如:商品、品牌、商家、类目等。
第二个维度:时间维度;
比如:1天、3天、7天、14天、30天等。
第三个维度:行为维度;
比如:曝光、点击、收藏、加购、购买、评论、点赞等。
第四个维度:统计维度;
比如:数量、人数、频率、点击率、转化率等。
每个特征从以上4个维度中各取一到两个进行组合,再从历史数据中统计该组合特征最终的特征值:
比如:

  • 商品(实体)最近1天(时间)的曝光(行为)量(统计指标);
  • 商品所在店铺(实体)最近30天(时间)的销量(行为类型+统计维度)等等。
由以上方法产生的结果数量级,等同于去计算4个维度的笛卡尔积,再对笛卡尔积的算分高低进行排序;
好了,说到现在关于召回的商品排序所采用的算法目前我所了解的就这么多,当然能力有限,有些搜索的细节依然需要进一步去摸索;
03 召回与排序总结
电商|电商搜索系统精讲系列三步曲2
文章插图
我们来对上一篇文章和今天讲的内容简单的做个总结,当用户在淘宝APP搜索框中输入“2021年新款花式促销女士连衣裙”时,搜索引擎系统首先要去理解用户的意图,理解的方式就是上篇文章提到的分析器,通过对语义的理解、命名实体识别、拼写纠错、停止词模型等手段去理解用户的意图,进而通过这个意图计算机去到后台数据库中检索符合意图的所有商品,当商品被检索出来之后,搜索引擎系统首先要通过各类函数和模型对商品进行粗排,再对粗排的结果进行精排,精排的依据就是上面的函数和模型,当然还有类目预测模型和人气模型,这个就是大概的流程;
依然没有结束,首先来看下面这张图:
想一想,上面左图中的热搜底纹和热搜列表是怎么来的、右图中的下拉提示又是这么出现的?这个就是原计划需要在今天跟大家讲的引导排序内容;
关于引导排序这块的内容我们放到下一篇继续分享,今天就写到这,再见!
04 预告
电商|电商搜索系统精讲系列三步曲2
文章插图
电商|电商搜索系统精讲系列三步曲2
文章插图
本文由 @产品研究站 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Pexels,基于CC0协议

推荐阅读