部分常用分词工具使用整理( 六 )
segmentor.load('model/ltp_data_v3.4.0/cws.model') # 模型放置的路径
text = '化妆和服装'
words = segmentor.segment(text)
words = list(words)
print(words)
7、THULAC(清华中文词法分析工具包)
THULAC(THU Lexical Analyzer for Chinese)由清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包 , 具有中文分词和词性标注功能 。
项目Github地址:THULAC-Python
安装:
pip install thulac
使用:
import thulac
thu = thulac.thulac(seg_only=True)
text = '化妆和服装'
推荐阅读
- 侵权|关于关停部分“传奇”游戏非法QQ群(第七批)的公告
- 拉克罗斯|《宝可梦》使用虫系精灵的馆主阿笔,常用精灵不少都能Mega?
- 孙尚香|孙尚香新传说11号上架,大招巨龙特效太酷,部分玩家仅需1042点券
- 夺宝|官方再次放大招,部分玩家免费拿到荣耀水晶,这是最后一波韭菜了
- 地下城与勇士|DNF:10.28版本新活动-阿拉德每日计划,部分活动结束时间延后
- |刚玩原神不知道怎么配武器?常用角色武器统计来了,三星都有神器
- 小智|《宝可梦》拥有初代大部分火系,夏伯的核心精灵到底是哪只?
- 地下城与勇士|DNF满足我对游戏大部分要求,华丽连招,是所有玩家有目共睹的
- 主机游戏|《暗黑破坏神2》几大常用字母缩写—不全的评论区补充
- 王者荣耀|王者荣耀:为什么大部分玩家宁愿练英雄被打穿,也不愿意打辅助?