统计词语频率保存到xls

import json
import jieba.analyse as anl
import xlwt

# 获取待统计的文本内容
# 打开文件
f = open('zhilian.json', 'r', encoding='utf-8')
ans_data = ''
for index in range(1867):
    data = f.readline().replace('},', '}')
    dict = json.loads(data)
    ans_data += dict['job_content']
# 关闭文件
f.close()

# xls的相关操作
# 新建文件，后面save
workbook=xlwt.Workbook(encoding='ascii')
# 新建sheet表
worksheet=workbook.add_sheet('python招聘分词')

# jieba分词统计ans_data文本中，分词后的频率
seg = anl.extract_tags(ans_data, topK=150, withWeight=True)
index = 0
for tag, weight in seg:
    print("%-20s：%3s %-8s" % (weight, index, tag))
    # 写入xls的单元格
    worksheet.write(index, 0, label=index + 1)
    worksheet.write(index, 1, label=tag)
    worksheet.write(index, 2, label=weight)
    index += 1
# 保存xls文件
workbook.save('python招聘分词统计.xls')

查看全文

相关阅读:
adb 连接 Android 手机的两种方式
 Jmeter GUI及NON GUI下实现分布式
 史上最全最细 App 自动化环境部署
 不懂Java代码，照样把jmeter指定数据写入execl
Dockerfile 让你轻松创建属于你的镜像 (下)
Dockerfile 让你轻轻松松创建属于你的镜像 (上)
Python vs Java (一)：史上最全变量类型区别，99.99%的人都收藏了
 浏览器F12调试器定位系统前后端bug
cookie，session
App 抓包提示网络异常怎么破？（抓包HTTPS）

原文地址：https://www.cnblogs.com/andy9468/p/7860389.html