部分常用分词工具使用整理( 六 )

2019-05-29

segmentor.load('model/ltp_data_v3.4.0/cws.model') # 模型放置的路径

text = '化妆和服装'

words = segmentor.segment(text)

words = list(words)

print(words)

7、THULAC（清华中文词法分析工具包）

THULAC（THU Lexical Analyzer for Chinese）由清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包，具有中文分词和词性标注功能。

项目Github地址：THULAC-Python

安装：

pip install thulac

使用：

import thulac

thu = thulac.thulac(seg_only=True)

text = '化妆和服装'

推荐阅读

上一篇：街舞2吴建豪战队吓坏众人的参赛选手吴建豪：赶紧给你条毛巾我不想看了

下一篇：拿下37份5G订单，获三大运营商150亿，诺基亚或将赶超华为！