zoukankan      html  css  js  c++  java
  • python 中关于词云wordcloud的一些总结:

    wordcloud类

    from wordcloud import WordCloud
    
    wc = WordCloud(参数)
    
    #参数
    # font_path:字体文件(OTF或TTF)的路径,字符串
    
    # 绘图区宽度,默认400,整型
    
    # height:绘图区高度,默认200,整型
    
    # prefer_horizontal:单词倾向于水平放置还是垂直放置,如果值小于1,则会在不合适的情况下旋转单词,浮点型,默认0.9
    
    # mask:是否在给定的形状内绘制单词,这个参数使我们能够根据给定的轮廓形状绘制各种词云图,当此参数不为None时,width和height将被忽略,nd-array型或None,默认None
    
    # scale:计算过程和实际绘图的比例,浮点型,默认1
    
    # min_font_size:绘图时最小的字体大小,整型,默认4
    
    # font_step:字体大小的迭代步长,大于1时可能会出现错误排列,整型,默认1
    
    # max_words:绘图使用的最大单词数,整型,默认200
    
    # stopwords:排除的单词集,字符串集或None,默认为None时,内置的字符串集将会被使用
    
    # background_color:背景颜色,颜色值,默认为'black'
    
    # max_font_size:绘图时最大字体大小,整型或None,默认为None
    
    # mode:模式,默认为'RGB',当为'RGBA'时,倘若背景颜色为None,则会得到透明的背景
    
    # relative_scaling:单词出现频率对其字体大小的权重,值为0时,只考虑单词排名对字体大小的影响,值为1时,具有2倍出现频率的单词具有2倍的字体大小,一般值设置为0.5最棒,浮点型
    
    # color_func:颜色函数,用于生成不同颜色单词的词云图,默认为None
    
    # regexp:正则表达式,用于分词,默认为 r"w[w']+" 
    
    # collocations:是否包括二元词组,布尔型,默认为True
    
    # colormap:颜色图,随机分配颜色给每个单词,如果指定了color_func,则本参数被忽略,字符串或matplotlib colormap型,默认为'viridis'
    
    # normalize_plurals:移除单词末尾的's',布尔型,默认为True
    

    属性

    wc.words_
    #对应频率的词例,字典类型{字符串:浮点数}
    
    wc.layout_
    #记录每个单词的值,字体大小,位置,方向以及颜色,由一系列元组组成的列表,每个元组格式为(string, int, (int, int), int, color)
    

    方法

    wc.generate(text)
    #从文本中生成词云图
    
    wc.fit_words(frequencies)
    #根据给定单词及频率生成词云图
    #frequencies:元组型数组,每个元组包含一个单词及其频率
    
    wc.generate_from_frequencies(frequencies, max_font_size=None)
    #根据给定单词及频率生成词云图
    #frequencies:字典,包含字符串(单词):浮点数(频率)的值对
    #max_font_size:最大字体大小
    
    wc.process_text(text)
    #将长文本分词,并移除stopwords集合中的单词
    #返回字典,dict (string, int)
    
    wc.recolor(random_state=None, color_func=None, colormap=None)
    #重新上色
    #random_state:随机种子,整型或None
    
    wc.to_array()
    #以numpy矩阵的格式返回词云图
    
    to_file(filename)
    #以图片的格式返回词云图
    #filename:保存路径
    

      

  • 相关阅读:
    Parameter Binding in ASP.NET Web API
    Which HTTP methods match up to which CRUD methods?
    ErrorHandling in asp.net web api
    HttpStatusCode
    Autofac Getting Started(默认的构造函数注入)
    Autofac Controlling Scope and Lifetime
    luvit 被忽视的lua 高性能框架(仿nodejs)
    undefined与null的区别
    VsCode中使用Emmet神器快速编写HTML代码
    字符串匹配---KMP算法
  • 原文地址:https://www.cnblogs.com/chengxiaoxiao/p/14818051.html
Copyright © 2011-2022 走看看