zoukankan      html  css  js  c++  java
  • 【python 基础】词云

    import re # 正则表达式库
    import collections # 词频统计库
    import numpy as np # numpy数据处理库
    import wordcloud # 词云展示库
    from PIL import Image # 图像处理库
    import matplotlib.pyplot as plt # 图像展示库
    with open('E:\Walden.txt') as f:
        lines = f.read()
    a1 = [a.lower() for a in re.split('\W+',lines)[:-1]]
    a2 = set(a1)
    zidian = { zi:a1.count(zi) for zi in a2 }
    # 词频展示
    mask = np.array(Image.open('E:\LOVE.jpg')) # 定义词频背景
    wc = wordcloud.WordCloud(
        font_path='C:/Windows/Fonts/simhei.ttf', # 设置字体格式
        mask=mask, # 设置背景图
        max_words=200, # 最多显示词数
        max_font_size=100 # 字体最大值
    )
    wc.generate_from_frequencies(zidian) # 从字典生成词云
    image_colors = wordcloud.ImageColorGenerator(mask) # 从背景图建立颜色方案
    wc.recolor(color_func=image_colors) # 将词云颜色设置为背景图方案
    plt.imshow(wc) # 显示词云
    plt.axis('off') # 关闭坐标轴
    plt.show() # 显示图像
  • 相关阅读:
    Python基础实例001:数字组合问题
    Python集合
    标量、向量、矩阵、张量
    re模块函数之search
    Python常用字符串操作
    Python基础之元组
    Bai, IEEE 2019
    词嵌入
    RNN 训练时梯度爆炸和梯度消失的理解
    OCR 综述
  • 原文地址:https://www.cnblogs.com/duolaAbao/p/10565743.html
Copyright © 2011-2022 走看看