zoukankan      html  css  js  c++  java
  • wordcloud库基本介绍和使用方法

    一、wordcloud库基本介绍

    1.1 wordcloud库概述

    wordcloud是优秀的词云展示第三方库

    049-模块6-wordcloud库的使用-01.jpg?x-oss-process=style/watermark

    • 词云以词语为基本单位,更加直观和艺术的展示文本

    1.2wordcloud库的安装

    pip install wordcloud(cmd命令行)

    049-模块6-wordcloud库的使用-02.jpg?x-oss-process=style/watermark

    二、wordcloud库使用说明

    2.1 wordcloud库基本是使用

    wordcloud库把词云当作一个WordCloud对象

    • wordcloud.WordCloud()代表一个文本对应的词云
    • 可以根据文本中词语出现的频率等参数绘制词云
    • 绘制词云的形状、尺寸和颜色都可以设定

    2.2 wordcloud库常规方法

    w = wordcloud.WordCloud()
    
    • 以WordCloud对象为基础
    • 配置参数、加载文本、输出文件
    方法 描述
    w.generate(txt) 向WordCloud对象w中加载文本txt,w.generate("Python and WordCloud")
    w.to_file(filename) 将词云输出为图像文件,.png或.jpg,w.to_file("outfile.png")
    • 步骤1:配置对象参数
    • 步骤2:加载词云文本
    • 步骤3:输出词云文件
    import wordcloud
    
    w = wordcloud.WordCloud()
    w.generate("Python and WordCloud")
    w.to_file("pywordcloud.png")
    


    049-模块6-wordcloud库的使用-03.jpg?x-oss-process=style/watermark

    049-模块6-wordcloud库的使用-04.jpg?x-oss-process=style/watermark

    2.3 配置对象参数

    w = wordcloud.WordCloud(<参数>)
    
    参数 描述
    width 指定词云对象生成图片的宽度,默认400像素
    height 指定词云对象生成图片的高度,默认200像素
    min_font_size 指定词云中字体的最小字号,默认4号
    max_font_size 指定词云中字体的最大字号,根据高度自动调节
    font_step 指定词云中字体字号的步进间隔,默认为1
    font_path 指定字体文件的路径,默认None
    max_words 指定词云显示的最大单词数量,默认200
    stop_words 指定词云的排除词列表,即不显示的单词列表
    mask 指定词云形状,默认为长方形,需要引用imread()函数
    background_color 指定词云图片的背景颜色,默认为黑色
    # mask
    from scipy.misc import imread 
    
    mk=imread("pic.png")
    w=wordcloud.WordCloud(mask=mk)
    

    2.4 wordcloud应用实例

    import wordcloud
    
    txt = "life is short, you need python"
    w = wordcloud.WordCloud(background_color="white")
    w.generate(txt)
    w.to_file("pywcloud.png")
    

    049-模块6-wordcloud库的使用-05.jpg?x-oss-process=style/watermark

    中文需要先分词并组成空格分隔字符串

    在当下的阶段,必将由程序员来主导,甚至比以往更甚。
  • 相关阅读:
    环境是如何建立的 启动文件有什么
    环境中存储的是什么
    串行 并行 异步 同步
    TPC-H is a Decision Support Benchmark
    进程通信类型 管道是Linux支持的最初Unix IPC形式之一 命名管道 匿名管道
    删除环境变量
    14.3.2.2 autocommit, Commit, and Rollback 自动提交 提交和回滚
    14.3.2.2 autocommit, Commit, and Rollback 自动提交 提交和回滚
    14.3.2.1 Transaction Isolation Levels 事务隔离级别
    14.3.2.1 Transaction Isolation Levels 事务隔离级别
  • 原文地址:https://www.cnblogs.com/randysun/p/11215095.html
Copyright © 2011-2022 走看看