zoukankan      html  css  js  c++  java
  • 根据词频生成词云(Python wordcloud实现)

    网上大多数词云的代码都是基于原始文本生成,这里写一个根据词频生成词云的小例子,都是基于现成的函数。

    另外有个在线制作词云的网站也很不错,推荐使用:WordArt

    安装词云与画图包

    pip3 install wordcloud
    pip3 install matplotlib
    

    word_cloud.py(生成词云的程序)

    from wordcloud import WordCloud
    import matplotlib.pyplot as plt
    
    # 生成词云
    def create_word_cloud():
        frequencies = {}
        for line in open("./record.txt"):
            arr = line.split(" ")
            frequencies[arr[0]] = float(arr[1])
        # 支持中文, SimHei.ttf可从以下地址下载:https://github.com/cystanford/word_cloud
        wc = WordCloud(
            font_path="./SimHei.ttf",
            max_words=100,
            width=2000,
            height=1200,
        )
        word_cloud = wc.generate_from_frequencies(frequencies)
        # 写词云图片
        word_cloud.to_file("wordcloud2.jpg")
        # 显示词云文件
        plt.imshow(word_cloud)
        plt.axis("off")
        plt.show()
    
    # 根据词频生成词云
    create_word_cloud()
    

    record.txt文件示例,第1列是单词,第2列是频率,空格分隔

    中文 100
    英文 2
    日语 3
    

    运行后得到如下结果:

  • 相关阅读:
    MMU_段式映射
    MMU段式映射(VA -> PA)过程分析
    NOR FLASH驱动程序
    PCB上 如何显示 汉字
    poj1273 Drainage Ditches
    poj2349 Arctic Network
    poj3660 Cow Contest
    poj3259 Wormholes
    poj3159 Candies
    poj1011 Sticks
  • 原文地址:https://www.cnblogs.com/sxpujs/p/12343358.html
Copyright © 2011-2022 走看看