白酒|电商搜索系统精讲系列:业务分析及召回模型( 二 )


所以上面的:用户用眼睛扫描超市白酒专区各类品种的酒——对应:搜索
线上业务建模是不是就结束了,当然不是,人类可以用眼睛、用视觉、用听觉以及自己的逻辑判断和思考能力去搜索商品,这个过程本身就是各种复杂的规则在你的大脑里不停的运算和处理,比如我需要个55度的白酒,那么这个55度的白酒我是送人还是自己喝呢?如果送人我买什么包装的合适呢?55度的白酒价格我能承受多少呢?我需要购买几瓶白酒呢?我买了十箱白酒回去我怎么运回家呢?如果白酒有破损我该怎么退换呢?
这些问题的性质是什么,说白了就是不停的问自己不停的让自己的大脑在思考,给出答案,最终让自己决策到底要购买什么白酒买多少;
那么同样的道理,计算机也需要有一套这种认知系统,计算机虽没有像人类那样拥有聪明智慧的大脑,好就好在它能被我们人类主宰,但是人类需要给他一系列的运算规则才能主宰它,告诉计算机怎么想,怎么决策,怎么查询,怎么筛选,最后把运算结果给到用户,那么就能达到我们人类的目标;
我们的目标是能够让计算机理解我们的人类的意思,如何去做?
接下来引入一个新的概念:自然语言处理(Natural Language Processing, NLP)
首先来解释下:NLP是计算机科学领域与人工智能领域的一个重要研究方向。
它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,自然语言处理并不是一般地研究自然语言,而在于研究能有效地实现自然语言通信的计算机系统,特别是其中的软件系统,所以呢也算是计算机科学的一部分,反正这个内容我在大学没学过;
好了,接下来聊的内容都会跟这个概念有关,接着往下看:
首先我们来看用户在淘宝APP搜索框中搜索“苹果”两个字后的结果:
白酒|电商搜索系统精讲系列:业务分析及召回模型
文章插图
问下自己:为什么在搜索结果的推荐内容里没有食物类的苹果,而全都是手机类的苹果?
答案是:计算机理解了用户需要搜索的是手机类苹果而不是食物类的苹果;
那么计算机凭什么理解了用户的意图?计算机是怎么给出这个搜索结论的?这个里面就要引入另外两个概念——-分析器和召回;
03 分析器与召回所谓分析器指的是电商平台在接收到用户搜索的关键词之后,计算机需要通过某种策略和方式去理解用户的意图,这种方式和策略的呈现就是分析器,说白了分析器是关键词的大脑,没有分析器,用户搜索就是白搭,因为计算机并不明白你要搜索什么;
【 白酒|电商搜索系统精讲系列:业务分析及召回模型】再来看召回:指的是通过分析器既定的规则查询到结果的整个过程统称为召回,比如用户在淘宝APP搜索框中输入“2021年夏季新款连衣裙”几个字,点击搜索,查询到所有连衣裙完整的过程就是召回;
好,那么在解释上面的截图当中为什么搜索的结果里面只有苹果手机而没有食物类苹果这个问题之前,我们先来剖析分析器:
分析器的分类:
关键词分析器:
适合一些需要精确匹配的场景。如标签、关键词等,不拆分关键词(下文统一定义为不分词,拆分关键词就是分词)的字符串或数值内容
举例:用户在淘宝APP搜索框里搜索“连衣裙”,查询结果的商品里面必须要有“连衣裙”完整的三个字,才会被召回展示在界面上,如果输入“连衣”、“裙”,则不会被召回,这里类似于常见的精确查询;

推荐阅读