zoukankan      html  css  js  c++  java
  • Python -WordCloud安装、词云制作

    一、WordCloud 安装

    说明:Windows系统直接pip install wordcloud 是不行的,命令行会报错。

    第一步:检查自己的Python 版本。Win+R ——>CMD——>命令行输入python,我的是python 3.7 win32位的

    第二步:下载对应版本的WordCloud,进入 python 扩展包库 (非正式第三方whl文件包)下载

    第三步:安装。命令行先定位到下载的wordcloud安装文件路径,再输入 pip install wordcloud-1.6.0-cp37-cp37m-win32.whl  回车安装

    二、词云制作

    # 导入相关库
    import jieba
    from wordcloud import WordCloud
    from PIL import Image
    import numpy as np
    from matplotlib import pyplot as plt
    
     
    # 分词(或者直接读取分词后的文件)
    with open('C:/Users/Administrator/Desktop/test.txt') as f:
        f_read = f.read()
        key_words =" ".join(jieba.cut(f_read)) # 分词再组成字符串
        print(key_words)
        
    # 增加一个词云图片(一定得白底背景图)
    images = Image.open("C:/Users/Administrator/Desktop/map.jpg") # Image打开图片
    images_array = np.array(images) # 然后用numpy转换一下成数组
    
       
    # 生成词云(自动按词频展示大小)
    wc =WordCloud( font_path="msyh.ttc"    # 注意:font_path字体样式不要漏掉,否则中文会乱码
                  ,background_color="white" # 背景底色
                  ,mask=images_array # 插入的图片
                  ,collocations=False # 是否统计搭配词(默认True,会导致词云关键词重复)
    #               ,max_font_size=100 # 最大字体大小
    #               ,width=1500,height=1500 #设置图片长宽
    #               ,max_words=10000 #词云允许最大显示词的个数
                    )#设置词云属性
    wc.generate(key_words) #根据文本生成词云
    # wc.fit_words(key_words_cnts) #根据给定单词频率生成词云
    
    
    
    # 展示&保存词云
    plt.imshow(wc) # 展示词云
    wc.to_file("C:/Users/Administrator/Desktop/key_words_cloud.jpg") # 保存词云图片
    # 或者 wc.to_image().show() # 保存为图片&展示

    未加入个性图片,普通输出:

    插入下面图片(一定要是白底背景图)后,个性化输出:

          输出——>

     
  • 相关阅读:
    Oracle分析函数
    oracle row_number的使用
    lru缓存测试类
    注解测试类
    lucene测试类
    SVN中检出(check out) 跟导出(export) 的区别
    Lucene原理与代码分析
    Lucene入门基础教程
    linux的less命令
    day4 大纲笔记
  • 原文地址:https://www.cnblogs.com/zwt20120701/p/12138007.html
Copyright © 2011-2022 走看看