zoukankan      html  css  js  c++  java
  • nltk下载出现问题

    nltk下载出现问题

    今天继续项目三,由于需要做一个英文的关键词提取,所以需要用到nltk的库文件。

    from nltk.stem import WordNetLemmatizer
    # 使用WordNetLemmatizer类,即wordnet词形还原方法
    def Lemmatization_text(text_cut_list):
        wnl = WordNetLemmatizer()
        return [wnl.lemmatize(n) for n in text_cut_list]
    
    text_list=['another','day','is','coming']
    Lemmatization_text(text_list)
    

      

    LookupError:
    **********************************************************************
    Resource wordnet not found.
    Please use the NLTK Downloader to obtain the resource:

    >>> import nltk
    >>> nltk.download('wordnet')

    For more information see: https://www.nltk.org/data.html

    Attempted to load corpora/wordnet.zip/wordnet/

    Searched in:
    - 'C:\Users\Administrator/nltk_data'
    - 'C:\ProgramData\Anaconda3\nltk_data'
    - 'C:\ProgramData\Anaconda3\share\nltk_data'
    - 'C:\ProgramData\Anaconda3\lib\nltk_data'
    - 'C:\Users\Administrator\AppData\Roaming\nltk_data'
    - 'C:\nltk_data'
    - 'D:\nltk_data'
    - 'E:\nltk_data'
    **********************************************************************


    import nltk
    nltk.download('wordnet')
    [nltk_data] Error loading wordnet: <urlopen error [Errno 11004]
    [nltk_data] getaddrinfo failed>

    看到一个方法:
    打开CMD
    命令进入Python交互模式
    >>> import nltk
    >>> nltk.download()
    会弹出一个界面,如图:点击Models ,双击punkt或者选择点击Download安装完成就不会报错了。

    结果还是出现错误信息
    [Errno 11004]get addrinfo failed
    推断可能是网络问题,是不是需要climb the wall?
    经过处理,重新下载。
    [nltk_data] Downloading package wordnet to
    [nltk_data] C:UsersAdministratorAppDataRoaming ltk_data...
    [nltk_data] Unzipping corporawordnet.zip.
    Out[35]:
    True

    解决问题,大功告成。

  • 相关阅读:
    ViewModel和LiveData问题思考与解答
    vps_centos_7_系统环境常规配置备忘
    JVM内存管理&GC
    sping注解
    ibatis order by 防止sql注入
    好用的绿色工具(mss2sql,jd-gui)
    mysql优化
    Spring事务
    好文分享_java堆栈的区别
    Linux usual cmd
  • 原文地址:https://www.cnblogs.com/z-cm/p/12911750.html
Copyright © 2011-2022 走看看