zoukankan      html  css  js  c++  java
  • 【Python】以词云分析文章

    import wordcloud,jieba
    from scipy.misc import imread #安装scipy库才可以
    mk = imread('love.jpg')  #选择形状图片
    #对象的创建与参数设置
    w = wordcloud.WordCloud(mask=mk,width=1000,height=700,font_path='msyh.ttc',background_color = 'white')  #形状,宽,高,字体路径,背景色
    #文本文件的解析,并整合成一段以空格为间断的字符串
    txtjb = open('C:/Users/eternal/中国.txt','r',encoding='UTF-8')  #路径,打开模式,编码模式
    txt = txtjb.read() #ok
    for rev in '。,·1234567890-=【】;‘、~!@#¥%……&*()——+{}:“《》?|  ':  #去掉这些东西,但是jieba库自带去掉..我白忙活
    txt = txt.replace(rev,'') #居然需要返回到txt
    #以jieba库来变成以空格为间断的字符串
    newtxt = ' '.join(jieba.lcut(txt))
    #以wordcloud库把这些以空格分成的字符串变成图
    w.generate(newtxt)  #赋予词云对象-字符串
    w.to_file('中国.png')  #产生词云图的名称
    print(newtxt)
  • 相关阅读:
    关于接口与抽象类
    C# 高级编程(笔记4)
    泛型与委托
    C# 高级编程(笔记2)
    构造函数的代码膨胀问题
    C# 高级编程(笔记3)
    C# 高级编程(笔记1)
    Web(7)补充
    理解synchronized对象锁
    robbin谈管理:改造团队的经验
  • 原文地址:https://www.cnblogs.com/naraka/p/8992058.html
Copyright © 2011-2022 走看看