zoukankan      html  css  js  c++  java
  • 【Python】政府工作报告词云

     

    2019政府工作报告.txt

     https://www.lanzous.com/iby44eh

     栗子1:

    import wordcloud
    import jieba
    f=open("2019政府工作报告.txt","r",encoding="utf-8")
    t=f.read()
    f.close()
    ls=jieba.lcut(t)
    txt=" ".join(ls)
    w=wordcloud.WordCloud(font_path="msyh.ttc",
        width=1000,height=700,background_color="white",
            )
    w.generate(txt)
    w.to_file("2019政府工作报告.png")       

    结果

    可以添加

    max_words=15 

    限制词语数量

    栗子2:自定义词云背景样式,背景样式自己找一个图片

    代码:

    # 分词模块
    import jieba
    # 画图模块
    import matplotlib.pyplot as plt
    # 文字云模块
    from wordcloud import WordCloud
    # 这是一个处理图像的函数,读取背景图片
    #from scipy.misc import imread  #这句出错imread不用另安装
    from matplotlib.pyplot import imread
     
    # 词源的文本文件
    wf = '2019政府工作报告.txt'
    # 读取文件内容
    word_content = open(wf,'r', encoding='utf-8').read().replace('
    ','')
    # 设置背景图片
    img_file = 'bj.jpg'
    # 解析背景图片
    mask_img = imread(img_file)
    # 进行分词
    word_cut = jieba.cut(word_content)
    # 把分词用空格连起来
    word_cut_join = " ".join(word_cut)
    # 设置词云参数
    wc = WordCloud(
        #字体
        font_path="msyh.ttc",
        # 允许最大词汇量
        max_words = 2000,
        # 设置最大号字体大小
        max_font_size = 90,
        # 设置使用的背景图片,这个参数不为空时,width和height会被忽略
        mask = mask_img,
        # 设置输出的图片背景色
        background_color = 'white'
       )
     
    # 生成词云
    wc.generate(word_cut_join)
    wc.to_file("2019政府工作报告.png") 

    结果:

  • 相关阅读:
    Java职业生涯规划
    Java类加载器总结
    Java字节流与字符流的区别
    Java堆和栈的区别
    详解Java类的生命周期
    Java编程常见问题汇总
    Java总结输入流输出流
    Java NIO:浅析I/O模型
    perl 处理文件路径的一些模块
    Delphi第三方控件安装卸载指南
  • 原文地址:https://www.cnblogs.com/HGNET/p/12778898.html
Copyright © 2011-2022 走看看