zoukankan      html  css  js  c++  java
  • 黄聪:Python+NLTK自然语言处理学习(一):环境搭建

    最近开始学习Python+NLTK自然语言处理,在此分享自己的学习经验,因为是初学,肯定有很多很多不懂的地方,发布此文章绝非为了显示自己的水平,而是因为网络上对NLTK的资料实在太少了,我就想分享一下自己的心得,也希望能够得到更多高手的指点,希望高手们发现不对的地方耐心指点,切勿针锋相对,这样会打击小弟的学习动力的,呵呵~

    好了,开始吧。

    一、到NLTK的官网下载Python2.66(虽然Python已经到3.0了,但是2.x的比较稳定,兼容2.x的软件也比较多一些)、PyYAML和NLTK。

    下载地址:http://www.nltk.org/download

    二、讲这些都安装好,然后运行Python的IDE环境:

    三、敲入下面的代码,进入NLTK数据源下载界面:

    import nltk
    nltk.download()

    选择all,设置好下载路径(Download Directory),然后点击Download,系统就开始下载NLTK的数据包了,下载的时间比较漫长,大家要耐心等待。如果有个别数据包无法下载,你可以切换到All Packages标签页,双击指定的包来进行下载:

    如果都不行的话,你还可以直接到 http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml 去下载数据包,只要将数据包复制到你的Download Directory目录下即可。

    四、安装NLTK

    form nltk.book import  *

    键入以上代码可以得到图中的显示,就说明NLTK数据包都安装好了~

    五、实践。使用NLTK进行字符串查询

    text1.concordance('monstrous')

    说明:

    text1为NLTK数据包中的一段数据源,是一大串字符串。(原文在数据包下载目录下的gutenberg.zip中的melville-moby_dick.txt

    text1.concordance('monstrous')这句话实现的是从这一大串字符串中找寻出包含monstrous这个单词的语句。

    好了,这就是NLTK的一个简单的应用,自然语言的处理中查询是一个很重要的操作,希望大家能好好了解一下本篇文章,还是那句话,我也是初学,肯定有说得不好的地方,希望大家多多指点,但千万不要恶语相对,谢谢。如果喜欢本文,请在后面留个言哈~


  • 相关阅读:
    Linux安装python3.6
    Python安装常见问题(1):zipimport.ZipImportError: can't decompress data
    ModuleNotFoundError: No module named 'apt_pkg'
    【第九届蓝桥杯大赛决赛真题】JAVA大学C组题解
    Mineweep(扫雷)
    Josephus环的四种解法(约瑟夫环)
    java背包的数组实现,链表实现
    Java 实现栈,队列
    java实现单链表
    MySql8最新配置方式(完美)
  • 原文地址:https://www.cnblogs.com/huangcong/p/2157437.html
Copyright © 2011-2022 走看看