zoukankan      html  css  js  c++  java
  • python实现jieba库分词制作词云

        《老人与海》是我最喜爱的一部外国名著,该作围绕一位老年古巴渔夫,与一条巨大的马林鱼在离岸很远的湾流中搏斗而展开故事的讲述。尽管海明威笔下的老人是悲剧性的,但他身上却有着尼采"超人"的品质,泰然自若地接受失败,沉着勇敢地面对死亡,这些"硬汉子"体现了海明威的人生哲学和道德理想,即人类不向命运低头,永不服输的斗士精神和积极向上的乐观人生态度。

        现在我们通过python来分析第一章中出现最多的单词,通过jieba库和word cloud库将里面出现的单词的频率图像化地表现出来。

    一、新建一个记事本文件,并重命名为The old man and the sea

    二、把《老人与海》第一章放到刚刚建立的txt文件里边

    三、工具的准备,需要安装jieba库和wordcloud库    

    from os import path
    
    from wordcloud import WordCloud
    
    import matplotlib.pyplot as plt
    
     
    
    d=path.dirname(__file__)
    
    text=open(path.join(d,"The old man and the sea.txt")).read()
    
     
    
    # 步骤3-2:设置一张词云图对象
    
    wordcloud = WordCloud(background_color="white", max_font_size=40).generate(text)
    
     
    
    # 步骤4-1:创建一个图表画布
    
    plt.figure()
    
    # 步骤4-2:设置图片
    
    plt.imshow(wordcloud, interpolation="bilinear")
    
    # 步骤4-3:取消图表x、y轴
    
    plt.axis("off")
    
    # 显示图片
    
    plt.show()
    

      

    这里我出现了一点点小差错,因为我的pip版本是18.1的,我需要更新到19.0,否则无法安装wordcloud库

    到这里终于完成jieba库和wordcloud库的安装!!!!!!!

    三、编写代码

    四、运行结果如下

        我们可以看到,出现最多的是boat和old man。

  • 相关阅读:
    Winform 积累
    mvc部署iis遇到的问题总结
    开始我的BLOG生活
    sql 总结
    ajax:AutoCompleteExtender版本问题
    ancms即将上线
    ancms v2.3语言介绍
    asp.net的cms 核心代码篇
    div+css布局
    js词法结构
  • 原文地址:https://www.cnblogs.com/daydayup12138/p/10646275.html
Copyright © 2011-2022 走看看