zoukankan      html  css  js  c++  java
  • 049 模块6-wordcloud库的使用

    一、wordcloud库基本介绍

    1.1 wordcloud库概述

    wordcloud是优秀的词云展示第三方库

    049-模块6-wordcloud库的使用-01.jpg?x-oss-process=style/watermark

    • 词云以词语为基本单位,更加直观和艺术的展示文本

    1.2 wordcloud库的安装

    pip install wordcloud(cmd命令行)

    049-模块6-wordcloud库的使用-02.jpg?x-oss-process=style/watermark

    二、wordcloud库使用说明

    2.1 wordcloud库基本使用

    wordcloud库把词云当作一个WordCloud对象

    • wordcloud.WordCloud()代表一个文本对应的词云
    • 可以根据文本中词语出现的频率等参数绘制词云
    • 绘制词云的形状、尺寸和颜色都可以设定

    2.2 wordcloud库常规方法

    w = wordcloud.WordCloud()

    • 以WordCloud对象为基础
    • 配置参数、加载文本、输出文件
    方法 描述
    w.generate(txt) 向WordCloud对象w中加载文本txt,w.generate("Python and WordCloud")
    w.to_file(filename) 将词云输出为图像文件,.png或.jpg?x-oss-process=style/watermark格式,w.to_file("outfile.png")
    • 步骤1:配置对象参数
    • 步骤2:加载词云文本
    • 步骤3:输出词云文件
    import wordcloud
    
    w = wordcloud.WordCloud()
    w.generate("Python and WordCloud")
    c.to_file("pywordcloud.png")
    

    049-模块6-wordcloud库的使用-03.jpg?x-oss-process=style/watermark

    049-模块6-wordcloud库的使用-04.jpg?x-oss-process=style/watermark

    2.3 配置对象参数

    w = wordcloud.WordCloud(<参数>)

    参数 描述
    width 指定词云对象生成图片的宽度,默认400像素
    height 指定词云对象生成图片的高度,默认200像素
    min_font_size 指定词云中字体的最小字号,默认4号
    max_font_size 指定词云中字体的最大字号,根据高度自动调节
    font_step 指定词云中字体字号的步进间隔,默认为1
    font_path 指定字体文件的路径,默认None
    max_words 指定词云显示的最大单词数量,默认200
    stop_words 指定词云的排除词列表,即不显示的单词列表
    mask 指定词云形状,默认为长方形,需要引用imread()函数
    background_color 指定词云图片的背景颜色,默认为黑色
    # mask
    from imageio import imread 
    
    mk=imread("pic.png")
    w=wordcloud.WordCloud(mask=mk)
    

    2.4 wordcloud应用实例

    import wordcloud
    
    txt = "life is short, you need python"
    w = wordcloud.WordCloud(background_color="white")
    w.generate(txt)
    w.to_file("pywcloud.png")
    

    049-模块6-wordcloud库的使用-05.jpg?x-oss-process=style/watermark

    中文需要先分词并组成空格分隔字符串

    import jieba
    import wordcloud
    
    txt = "Nick 是上海虹桥最帅的男人,没有之一,因为他就是最帅的"
    
    w = wordcloud.WordCloud( width=1000,
    font_path="/Library/Fonts/Heiti.ttc",height=700)
    w.generate(" ".join(jieba.lcut(txt)))
    w.to_file("pywcloud.png")
    
    import jieba
    import wordcloud
    
    txt = "Nick 是上海虹桥最帅的男人,没有之一,因为他就是最帅的"
    
    w = wordcloud.WordCloud( width=1000,
    font_path="/Library/Fonts/Heiti.ttc",height=700)
    w.generate(" ".join(jieba.lcut(txt)))
    w.to_file("pywcloud.png")
    
    Building prefix dict from the default dictionary ...
    Loading model from cache /var/folders/mh/krrg51957cqgl0rhgnwyylvc0000gn/T/jieba.cache
    Loading model cost 1.047 seconds.
    Prefix dict has been built succesfully.
    
    
    
    
    
    <wordcloud.wordcloud.WordCloud at 0x1150979e8>
    

    049-模块6-wordcloud库的使用-07.png?x-oss-process=style/watermark

  • 相关阅读:
    yk20192320
    JS常用方法 限制用户输入的方法
    话说最强悍的团队,博客园团队!
    输入框打开禁用自动填充功能
    老生常谈:Asp.net MVC 3+ Jquery UI Autocomplete实现百度效果
    节日logo
    第一篇:Asp.net MVP模式介绍
    VBS 类
    《JavaScript编程精解》简明读书心得上
    Three.js源码阅读笔记1
  • 原文地址:https://www.cnblogs.com/nickchen121/p/11208274.html
Copyright © 2011-2022 走看看