当前位置: 首页 > 图灵资讯 > 行业资讯> Python jieba库分词模式怎么用?

Python jieba库分词模式怎么用?

来源:图灵python
时间: 2024-09-18 20:05:31

在中文分词中,jiebe库之所以最常见,主要是因为它独特的支持分词模式,如精确模式、全模式和搜索引擎模式。它还对应三种方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。以下是操作这些分词模式和使用方法的实例。让我们了解一下。

全模式:

importjieba
seg_list=jieba.cut("欢迎来到南京长江大桥。",cut_all=True)
print(type(seg_list),seg_list)

精确模式:

seg_list1=jieba.lcut("欢迎来到南京长江大桥。",cut_all=False)
print(type(seg_list1),seg_list1)

搜索模式:

seg_list2=jieba.cut_for_search("欢迎来到南京长江大桥。")
print(type(seg_list2),seg_list2)
print("全模式:"+"/".join(seg_list))
print("精确模式:"+"/".join(seg_list1)
print("搜索引擎模式:"+"/".join(seg_list2)

输出结果:

<class'list'>['南京市','长江大桥','欢迎','你','。']
<class'generator'><generatorobjectTokenizer.cut_for_searchat0000002ED4C4>
全模式:南京/南京/京市/市长/长江/长江大桥/大桥/欢迎/您/。
精准模式:南京/长江大桥/欢迎/你/。
搜索引擎模式:南京/京/南京/长江/大桥/欢迎/你/。

一组实例给大家详细讲解。 如果你感兴趣,可以试着学习jieba库分词模式的使用方法~