HanLP分词工具中的ViterbiSegment分词流程( 七 )
PlaceRecognition.recognition(vertexList wordNetOptimum wordNetAll) 。 地名使用隐马 , 因此有转移矩阵ns.tr.txt和发射矩阵ns.txt 。 由于HanLP不提供训练语料 , 我们自己也很难得到有角色标注的语料 , 因此我们一般只修改ns.txt文件 , 删除ns.txt.bin文件后生效 。
(5)机构名识别
执行此步 , 配置变量organizationRecognize必须为true 。 调用方法为
OrganizationRecognition.recognition(vertexList wordNetOptimum wordNetAll) 。 注意这里在调用机构名识别之前先进行了一次识别 , 也就是层叠隐马 , 而人名和地名的识别就是普通的隐马 。 机构名的识别使用层叠隐马 , 涉及的文件有转移矩阵nt.tr.txt和发射矩阵nt.txt 。 由于HanLP不提供训练语料 , 我们自己也很难得到有角色标注的语料 , 因此我们一般只修改nt.txt文件 , 删除ns.txt.bin文件后生效 。 机构名的识别需要人名地名识别具有较高准确率 。
至此 , 分词流程已全部介绍了 。
还需要注意下边的内容
推荐阅读
- 魔兽世界|暴雪嘉年华内容遭泄露,引玩家众怒,魔兽世界成捞钱工具?
- canyon|恐怖的中野联动!许秀给Canyon当工具人,DK扳回一城
- 魔兽世界|暴雪嘉年华原定内容泄露,5个魔兽世界同步推进,wow变捞钱工具?
- 马戏团|剑与远征:新英雄曝出,造型酷似工具人,两款新皮齐上线春姑火了
- 打野|王者荣耀:本赛季还是工具人法师的天下,虽然法核能玩,但不推荐
- 原神|米游社的原神版块有什么?旅行工具和签到系统对玩家帮助很大!
- 猫神|KPL猫神沦为抵债工具?阿泰开播爆料: RNGM买6.6没给钱,拿猫抵债
- mod|《CS》最好玩的七个版本,MOD模组是个强大的工具
- 冲浪|阴阳师SP浪川削弱后强度详解 无脑人权卡即将变成二流强度工具人
- 张良|工具人中单墨子张良纷纷落榜,只剩控制优秀的她深受玩家喜爱!