zoukankan      html  css  js  c++  java
  • 【Python】政府工作报告词云

     

    2019政府工作报告.txt

     https://www.lanzous.com/iby44eh

     栗子1:

    import wordcloud
    import jieba
    f=open("2019政府工作报告.txt","r",encoding="utf-8")
    t=f.read()
    f.close()
    ls=jieba.lcut(t)
    txt=" ".join(ls)
    w=wordcloud.WordCloud(font_path="msyh.ttc",
        width=1000,height=700,background_color="white",
            )
    w.generate(txt)
    w.to_file("2019政府工作报告.png")       

    结果

    可以添加

    max_words=15 

    限制词语数量

    栗子2:自定义词云背景样式,背景样式自己找一个图片

    代码:

    # 分词模块
    import jieba
    # 画图模块
    import matplotlib.pyplot as plt
    # 文字云模块
    from wordcloud import WordCloud
    # 这是一个处理图像的函数,读取背景图片
    #from scipy.misc import imread  #这句出错imread不用另安装
    from matplotlib.pyplot import imread
     
    # 词源的文本文件
    wf = '2019政府工作报告.txt'
    # 读取文件内容
    word_content = open(wf,'r', encoding='utf-8').read().replace('
    ','')
    # 设置背景图片
    img_file = 'bj.jpg'
    # 解析背景图片
    mask_img = imread(img_file)
    # 进行分词
    word_cut = jieba.cut(word_content)
    # 把分词用空格连起来
    word_cut_join = " ".join(word_cut)
    # 设置词云参数
    wc = WordCloud(
        #字体
        font_path="msyh.ttc",
        # 允许最大词汇量
        max_words = 2000,
        # 设置最大号字体大小
        max_font_size = 90,
        # 设置使用的背景图片,这个参数不为空时,width和height会被忽略
        mask = mask_img,
        # 设置输出的图片背景色
        background_color = 'white'
       )
     
    # 生成词云
    wc.generate(word_cut_join)
    wc.to_file("2019政府工作报告.png") 

    结果:

  • 相关阅读:
    mysql内置函数
    phpmyadmin 安装
    java 命令行JDBC连接Mysql
    数据库工具
    java JDBC
    mysql 各种关系代数的使用
    恢复误删的DB table数据
    eclipse php pdt插件安装
    mysql通配符使用
    关系代数和sql语句对应关系
  • 原文地址:https://www.cnblogs.com/HGNET/p/12778898.html
Copyright © 2011-2022 走看看