python——jieba分词过程

 1 import jieba
 2 """函数2：分词函数"""
 3 def fenci(training_data):
 4     """-------------------------------------------------------
 5     seg_list = jieba.cut("他来到上海交通大学", cut_all=True)
 6     print("【全模式】：" + "/ ".join(seg_list))
 7     他/ 来到/ 上海交通大学
 8     ----------------------------------------------------------"""
 9     seg_list = jieba.cut(training_data)             # 默认是精确模式
10     training_ci = " ".join(seg_list)                # 空字符串中join加入分词后的词            
11     training_ci = training_ci.split()               # 以空格符作为分界线进行分割，保存为list
12     return training_ci
13 training_data="他来到上海交通大学"
14 training_ci=fenci(training_data)
15 print("training_ci1",training_ci)

1 training_ci 他 来到 上海交通大学
2 training_ci ['他', '来到', '上海交通大学']

萍水相逢逢萍水，浮萍之水水浮萍!

查看全文

相关阅读:
[iOS]Xcode+GitHub远程代码托管(GIT, SVN)
[iOS]Xcode处理过时方法的警告
 [iOS]@synthesize和@dynamic关键字
 [iOS]图片高清度太高, 导致内存过大Crash
[软件]Xcode查找系统framework所在路径
 [软件]在浏览器里添加MarkDown Here(插件)
[PHP]利用XAMPP搭建本地服务器, 然后利用iOS客户端上传数据到本地服务器中(四. iOS端代码实现)
ios -Unity3D的EasyAR集成到已经有项目中。
iOS创建安全的单例
 阿里云轻量应用服务器配置mysql详解(转载)

原文地址：https://www.cnblogs.com/AIBigTruth/p/10765561.html