部分常用分词工具使用整理( 七 )

words = thu.cut(text text=True).split()

print(words)

NLPIR(汉语分词系统)

主要功能包括中文分词;英文分词;词性标注;命名实体识别;新词识别;关键词提取;支持用户专业词典与微博分析 。 NLPIR系统支持多种编码、多种操作系统、多种开发语言与平台 。

项目Github地址:pynlpir

安装:

pip install pynlpir

下载证书覆盖到安装目录 , NLPIR.user 例如安装目录:/usr/lib64/python3.4/site-packages/pynlpir/Data

使用:

import pynlpir

pynlpir.open()

text = '化妆和服装'

words = pynlpir.segment(text pos_tagging=False)

推荐阅读