jieba库分词

（1）团队简介的词频统计

 1 import jieba
 2 import collections
 3 s="制作一个购票小程序，这个购票小程序可以根据客户曾经的购票历史"
 4 s+="和评分记录自动推荐用户感兴趣的内容以及热门的热点项"
 5 s+="目，类似于大数据的推荐系统。"
 6 s1=jieba.cut(s)
 7 k=[]
 8 l=['、','，','。','；','！']
 9 for i in s1:
10     if i not in l:
11         k.append(i)
12 count=collections.Counter(k)
13 for a,b in count.most_common(4):
14     print(a,b)

结果如下图所示：

（2）词频分布图

1 import numpy as np
2 import matplotlib.pyplot as plt
3 fracs = [3,1,1,1,1]
4 labels = 'goupiao', 'lishi', 'ganxingqu','remen','pingfen'
5 explode = [ 0.1,0,0,0,0]
6 plt.axes(aspect=1)
7 plt.pie(x=fracs, labels=labels, explode=explode,autopct='%3.1f %%',
8         shadow=True, labeldistance=1.1, startangle = 90,pctdistance = 0.6)
9 plt.show()

结果如下图所示：

（3）简介

制作一个购票小程序，该小程序可以根据客户曾经的购票历史和评分记录自动推荐用户感兴趣的内容以及热门的热点项目，类似于大数据的推荐系统。

查看全文

相关阅读:
pdf.js使用
 当前时间距离下一个分钟值以0或者5结尾的时间点（单位：毫秒）小于1分钟时，返回下下个以0或5结尾的时间点
 1
Could not get JDBC Connection; nested exception is java.sql.SQLException: Cannot get a connection, pool error Pool exhausted 异常原因排查
 gcp导出mysql慢日志写入数据库分析
 redis慢日志结构化
 谷歌云监控告警
 google-cloud的sql-rds导出my.cnf
慢sql 实时钉钉告警
 docker跨网段搭建gp测试环境

原文地址：https://www.cnblogs.com/fangzehui/p/8795092.html