wordcloud库的基本介绍
wordcloud概述
- 词云以词语为基本单位,更加直观和艺术的展示文本
基本使用
wordcloud库把词云当作一个WordCloud对象
- wordcloud.WordCloud()代表一个文本对应的词云
- 可以根据文本中词语出现的频率等参数绘制词云
- 绘制词云的形状、尺寸和颜色都可以设定
常规方法
- 以WordCloud对象为基础
- 配置参数、加载文本、输出文件
| 方法 | 描述 |
|---|---|
| w.generate(txt) | 向WordCloud对象w中加载文本txt,w.generate("Python and WordCloud") |
| w.to_file(filename) | 将词云输出为图像文件,.png或.jpg?x-oss-process=style/watermark格式,w.to_file("outfile.png") |
-
步骤1:安装库
pip install wordcloud
pip install matplotlib
-
步骤2:配置对象参数
-
步骤3:加载词云文本
-
步骤4:输出词云文件
import wordcloud
w = wordcloud.WordCloud()
w.generate("Python and WordCloud")
c.to_file("pywordcloud.png")
配置对象参数
w = wordcloud.WordCloud(<参数>)
| 参数 | 描述 |
|---|---|
| width | 指定词云对象生成图片的宽度,默认400像素 |
| height | 指定词云对象生成图片的高度,默认200像素 |
| min_font_size | 指定词云中字体的最小字号,默认4号 |
| max_font_size | 指定词云中字体的最大字号,根据高度自动调节 |
| font_step | 指定词云中字体字号的步进间隔,默认为1 |
| font_path | 指定字体文件的路径,默认None |
| max_words | 指定词云显示的最大单词数量,默认200 |
| stop_words | 指定词云的排除词列表,即不显示的单词列表 |
| mask | 指定词云形状,默认为长方形,需要引用imread()函数 |
| background_color | 指定词云图片的背景颜色,默认为黑色 |
mask参数详解
指定词云形状,默认为长方形,需要引用imread()函数
-
步骤1:安装库
pip install wordcloud
pip install matplotlib
pip install scipy
pip install pillow
pip install imageio -
步骤2:配置对象参数
-
步骤3:加载词云文本
-
步骤4:输出词云文件
import wordcloud
from imageio import imread
# 图片指定词云的形状(只能是白色背景的.png图片)
mask = imread(r'C:Users青柠Desktop预科 est1.png')
# 打开指定文件并读取该文件内容,作为词云中的词语
file = open(r'C:Users青柠Desktop预科第六天sanguo','r',encoding='utf-8').read()
w = wordcloud.WordCloud(font_path='rC:WindowsFontssimsun.ttc', mask=mask, width=1000, height=700,background_color="white")
w.generate(file)
w.to_file("pywordcloud.png")
