zoukankan      html  css  js  c++  java
  • 【Python】以词云分析文章

    import wordcloud,jieba
    from scipy.misc import imread #安装scipy库才可以
    mk = imread('love.jpg')  #选择形状图片
    #对象的创建与参数设置
    w = wordcloud.WordCloud(mask=mk,width=1000,height=700,font_path='msyh.ttc',background_color = 'white')  #形状,宽,高,字体路径,背景色
    #文本文件的解析,并整合成一段以空格为间断的字符串
    txtjb = open('C:/Users/eternal/中国.txt','r',encoding='UTF-8')  #路径,打开模式,编码模式
    txt = txtjb.read() #ok
    for rev in '。,·1234567890-=【】;‘、~!@#¥%……&*()——+{}:“《》?|  ':  #去掉这些东西,但是jieba库自带去掉..我白忙活
    txt = txt.replace(rev,'') #居然需要返回到txt
    #以jieba库来变成以空格为间断的字符串
    newtxt = ' '.join(jieba.lcut(txt))
    #以wordcloud库把这些以空格分成的字符串变成图
    w.generate(newtxt)  #赋予词云对象-字符串
    w.to_file('中国.png')  #产生词云图的名称
    print(newtxt)
  • 相关阅读:
    搭建DHCP服务
    sshd免密登陆
    加密类型以及数据加密解密过程
    搭建私有CA并实现证书颁发
    CentOS 7 启动流程
    Linux命令:tcpdump命令
    Linux命令:ping命令
    Linux命令:ss命令
    Linux命令:ip命令
    Linux命令:netstat命令
  • 原文地址:https://www.cnblogs.com/naraka/p/8992058.html
Copyright © 2011-2022 走看看