zoukankan      html  css  js  c++  java
  • nltk下载出现问题

    nltk下载出现问题

    今天继续项目三,由于需要做一个英文的关键词提取,所以需要用到nltk的库文件。

    from nltk.stem import WordNetLemmatizer
    # 使用WordNetLemmatizer类,即wordnet词形还原方法
    def Lemmatization_text(text_cut_list):
        wnl = WordNetLemmatizer()
        return [wnl.lemmatize(n) for n in text_cut_list]
    
    text_list=['another','day','is','coming']
    Lemmatization_text(text_list)
    

      

    LookupError:
    **********************************************************************
    Resource wordnet not found.
    Please use the NLTK Downloader to obtain the resource:

    >>> import nltk
    >>> nltk.download('wordnet')

    For more information see: https://www.nltk.org/data.html

    Attempted to load corpora/wordnet.zip/wordnet/

    Searched in:
    - 'C:\Users\Administrator/nltk_data'
    - 'C:\ProgramData\Anaconda3\nltk_data'
    - 'C:\ProgramData\Anaconda3\share\nltk_data'
    - 'C:\ProgramData\Anaconda3\lib\nltk_data'
    - 'C:\Users\Administrator\AppData\Roaming\nltk_data'
    - 'C:\nltk_data'
    - 'D:\nltk_data'
    - 'E:\nltk_data'
    **********************************************************************


    import nltk
    nltk.download('wordnet')
    [nltk_data] Error loading wordnet: <urlopen error [Errno 11004]
    [nltk_data] getaddrinfo failed>

    看到一个方法:
    打开CMD
    命令进入Python交互模式
    >>> import nltk
    >>> nltk.download()
    会弹出一个界面,如图:点击Models ,双击punkt或者选择点击Download安装完成就不会报错了。

    结果还是出现错误信息
    [Errno 11004]get addrinfo failed
    推断可能是网络问题,是不是需要climb the wall?
    经过处理,重新下载。
    [nltk_data] Downloading package wordnet to
    [nltk_data] C:UsersAdministratorAppDataRoaming ltk_data...
    [nltk_data] Unzipping corporawordnet.zip.
    Out[35]:
    True

    解决问题,大功告成。

  • 相关阅读:
    pytest实现参数化(@pytest.mark.parametrize)
    pytest标记测试用例为预期失败(@pytest.mark.xfail)
    pytest标记跳过某些测试用例不执行
    pytest的conftest.py配置
    pytest之fixture使用
    模拟赛42 题解
    模拟赛41 题解
    一些可能永远用不到的性质
    补锅
    骗分杂谈
  • 原文地址:https://www.cnblogs.com/z-cm/p/12911750.html
Copyright © 2011-2022 走看看