HanLP分词工具中的ViterbiSegment分词流程( 五 )
3. 数字识别
如果配置变量numberQuantifierRecognize为true , 则在粗分结果的基础上进行数字合并操作 , 否则直接跳过该步 。 对应方法为
void mergeNumberQuantifier(List<Vertex> termList WordNet wordNetAll Config config) 。
4. 实体识别
配置变量ner为true时 , 则需要进行各种实体的识别 , 继续向下执行 。 需要注意该变量受其他实体识别变量影响 , 只要其他任意实体配置变量为true , 则ner就会为true 。 如果ner为false , 则跳过下边各项实体识别继续词性标注环节 。
(1)中国人名识别
执行此步 , 配置变量nameRecognize必须为true 。 调用方法为
PersonRecognition.recognition(vertexList wordNetOptimum wordNetAll) 。 人名使用隐马 , 因此有转移矩阵nr.tr.txt和发射矩阵nr.txt 。 由于HanLP不提供训练语料 , 我们自己也很难得到有角色标注的语料 , 因此我们一般只修改nr.txt文件 , 删除nr.txt.bin文件后生效 。
推荐阅读
- 魔兽世界|暴雪嘉年华内容遭泄露,引玩家众怒,魔兽世界成捞钱工具?
- canyon|恐怖的中野联动!许秀给Canyon当工具人,DK扳回一城
- 魔兽世界|暴雪嘉年华原定内容泄露,5个魔兽世界同步推进,wow变捞钱工具?
- 马戏团|剑与远征:新英雄曝出,造型酷似工具人,两款新皮齐上线春姑火了
- 打野|王者荣耀:本赛季还是工具人法师的天下,虽然法核能玩,但不推荐
- 原神|米游社的原神版块有什么?旅行工具和签到系统对玩家帮助很大!
- 猫神|KPL猫神沦为抵债工具?阿泰开播爆料: RNGM买6.6没给钱,拿猫抵债
- mod|《CS》最好玩的七个版本,MOD模组是个强大的工具
- 冲浪|阴阳师SP浪川削弱后强度详解 无脑人权卡即将变成二流强度工具人
- 张良|工具人中单墨子张良纷纷落榜,只剩控制优秀的她深受玩家喜爱!