电商运营之站内搜索的全面指南 (七)( 三 )
基于字符串匹配的分词方法
又称为机械分词方法,它需要有一个初始的充分大的词典,然后将待分词的字符串与词典中的元素进行匹配,若能成功匹配,则将该词切分出来。
按扫描方向的不同,字符串匹配分词方法可以分为正相匹配和逆向匹配;按照不同长度的匹配优先度可以划分为最大匹配和最小匹配(细节我就不在这说了,这种分词方式是属于最为简单分词方式,可以自行百度其工作逻辑和流程).
基于理解的分词方法
这个就有点技术含量,国内的主要搜索大厂,比如百度、字节跳动等都在开发带有人工智能模块的搜索算法。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。它通常包括三个部分:分词子系统、句法语义子系统、总控部分。
由于汉语语言知识的笼统、复杂性,难以将各种语言信息组织成机器可直接读取的形式,因此目前基于理解的分词系统还处在验证和试用型阶段。
基于统计的分词方法
推荐阅读
- 魔兽世界|运营一个月玩家少了70万,想跟WOW叫板的新世界,又被愉悦送走了
- bilibili|B站虚拟UP主“星宫汐Official”被运营骗了上万元,字幕组工资被组长私吞遭到圈内网友痛斥!
- lpl|S11的LPL如此拉跨,为何依然被吹到世界第一?多半是因为电商三大家!
- 堡垒之夜|《堡垒之夜》国服关服,腾讯运营三年以彻底失败告终
- 卡牌|冰霜流内战该如何破解?墨泽新奇的运营方式,竟然能化腐朽为神奇
- |时间如沙,盘点那些至今还在运营的经典游戏
- 国服|FGO国服运营小绯透露工程进度,降临者275会UP,希望别再出错
- 手机游戏|英雄联盟手游:神龙尊者活动有变,开服7天变老玩家,运营又被怼
- estar|SK太会教了,现在的eStar会打架会运营!瓶子:MTG是站着死的!
- lpl|S11是LPL最后的希望?S12大批战队可能跑路,战队运营成绩保持费用巨大!