zoukankan      html  css  js  c++  java
  • 对采集的游记进行数据分析

    使用jieba模块对内容进行处理,在tfidf.py源码中加入一些自定义的停用词,然后将生成的列表词组使用WordCloud展示出来

    from jieba import analyse
    # 引入TF-IDF关键词抽取接口
    tfidf = analyse.extract_tags

    import matplotlib.pyplot as plt
    from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
    import jieba
    from scipy.misc import imread
    d = os.path.dirname(__file__)
    font = r'C:WindowsFonts0CAB71B.007.ttf'

     

    对游记中出现的地名统计发现:

     在地图中的位置如下:

  • 相关阅读:
    7-4
    7-3
    第五章例5-2
    第五章例5-1
    第四章例4-12
    第四章例4-11
    第四章例4-10
    第四章例4-9
    第四章例4-8
    第四章例4-7
  • 原文地址:https://www.cnblogs.com/qqzj/p/7726711.html
Copyright © 2011-2022 走看看