zoukankan      html  css  js  c++  java
  • python词云生成-wordcloud库

    python词云生成-wordcloud库

    全文转载于'https://www.cnblogs.com/nickchen121/p/11208274.html#autoid-0-0-0'

    一.wordclound库基本介绍

    1.1wordclound

    wordcloud是优秀的词云展示第三方库

    049-模块6-wordcloud库的使用-01.jpg?x-oss-process=style/watermark

    • 词云以词语为基本单位,更加直观和艺术的展示文本

    1.2 wordcloud库的安装

    049-模块6-wordcloud库的使用-02.jpg?x-oss-process=style/watermark

    二、wordcloud库使用说明

    2.1 wordcloud库的使用

    • wordcloud.WordCloud()代表一个文本对应的词云
    • 可以根据文本中词语出现的频率等参数绘制词云
    • 绘制词云的形状、尺寸和颜色都可以设定

    2.2 wordcloud库常规方法

    • 以WordCloud对象为基础
    • 配置参数、加载文本、输出文件
    方法 描述
    w.generate(txt) 向WordCloud对象w中加载文本txt,w.generate("Python and WordCloud")
    w.to_file(filename) 将词云输出为图像文件,.png或.jpg?x-oss-process=style/watermark格式,w.to_file("outfile.png")
    • 步骤1:配置对象参数
    • 步骤2:加载词云文本
    • 步骤3:输出词云文件
    import wordcloud
    
    w = wordcloud.WordCloud()
    w.generate("Python and WordCloud")
    c.to_file("pywordcloud.png")
    

    049-模块6-wordcloud库的使用-03.jpg?x-oss-process=style/watermark

    049-模块6-wordcloud库的使用-04.jpg?x-oss-process=style/watermark

    2.3 配置对象参数

    参数 描述
    width 指定词云对象生成图片的宽度,默认400像素
    height 指定词云对象生成图片的高度,默认200像素
    min_font_size 指定词云中字体的最小字号,默认4号
    max_font_size 指定词云中字体的最大字号,根据高度自动调节
    font_step 指定词云中字体字号的步进间隔,默认为1
    font_path 指定字体文件的路径,默认None
    max_words 指定词云显示的最大单词数量,默认200
    stop_words 指定词云的排除词列表,即不显示的单词列表
    mask 指定词云形状,默认为长方形,需要引用imread()函数
    background_color 指定词云图片的背景颜色,默认为黑色
    # mask
    from imageio import imread 
    
    mk=imread("pic.png")
    w=wordcloud.WordCloud(mask=mk)
    

    2.4 wordcloud应用实例

    049-模块6-wordcloud库的使用-05.jpg?x-oss-process=style/watermark

    中文需要先分词并组成空格分隔字符串

    import jieba
    import wordcloud
    
    txt = "Nick 是上海虹桥最帅的男人,没有之一,因为他就是最帅的"
    
    w = wordcloud.WordCloud( width=1000,
    font_path="/Library/Fonts/Heiti.ttc",height=700)
    w.generate(" ".join(jieba.lcut(txt)))
    w.to_file("pywcloud.png")
    import jieba
    import wordcloud
    
    txt = "Nick 是上海虹桥最帅的男人,没有之一,因为他就是最帅的"
    
    w = wordcloud.WordCloud( width=1000,
    font_path="/Library/Fonts/Heiti.ttc",height=700)
    w.generate(" ".join(jieba.lcut(txt)))
    w.to_file("pywcloud.png")
    Building prefix dict from the default dictionary ...
    Loading model from cache /var/folders/mh/krrg51957cqgl0rhgnwyylvc0000gn/T/jieba.cache
    Loading model cost 1.047 seconds.
    Prefix dict has been built succesfully.
    
    
    

    049-模块6-wordcloud库的使用-07.png?x-oss-process=style/watermark

  • 相关阅读:
    source insight快捷键及使用技巧
    HTTP 状态码
    select poll epoll三者之间的比较
    服务器程序后台化以及守护进程的编写规范
    Linux 信号表
    Linux下有线无线网络配置------命令模式
    浅谈 qmake 之 pro、pri、prf、prl文件
    Python VUE 基础知识
    VUE 实现tab切换页面效果
    爬虫框架:scrapy
  • 原文地址:https://www.cnblogs.com/pythonywy/p/11420381.html
Copyright © 2011-2022 走看看