zoukankan      html  css  js  c++  java
  • pyhanlp安装教程

    1、hanlp简介

    HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

    Hanlp具有以下功能:

    • 中文分词
    • 词性标注
    • 命名实体识别
    • 依存句法分析
    • 关键词提取新词发现
    • 短语提取
    • 自动摘要
    • 文本分类
    • 拼音简繁

    2、hanlp安装

    第一步:hanlp提供了python库模块,需要在系统命令框(ctrl+r,enter :cmd)中输入如下代码,即可安装pyhanlp库

    pip install pyhanlp

    第二步:hanlp库依赖数据包,因此要成功使用还需要下载特定的数据包,需要的数据包有:data-for-1.7.7.zip(最新版),

    data下载地址:https://github.com/hankcs/HanLP/releases

    下载后,放入文件目录,目录根据你安装python编译器的位置而定,如我的目录是:E: oolpythonLibsite-packagespyhanlpstatic,找不到你的路径可以在命令框中重新输入一遍安装命令,即可。注意,下载好数据包后,不用解压,直接放到你的目录下。然后输入以下代码:

    from python import*

     运行,即可自动解压,成功后,开始测试。

    3、hanlp功能测试

    输入简单的测试代码,测试hanlp的功能:

    from pyhanlp import*
    
    sentence = "我喜欢当个作家,那种写自己爱看的书的作家,写能让很多读者看来欲罢不能的书的作家,写那种酣畅淋漓的书的作家"
    
    terms = HanLP.segment(sentence )
    print(terms)

    结果展示:

    输出:[我/rr, 喜欢/vi, 当/p, 个/q, 作家/nnt, ,/w, 那种/r, 写/v, 自己/rr, 爱看/v, 的/ude1, 书/n, 的/ude1, 作家/nnt, ,/w, 写/v, 能/v, 让/v, 很多/m, 读者/n, 看来/v, 欲罢不能/vl, 的/ude1, 书/n, 的/ude1, 作家/nnt, ,/w, 写/v, 那种/r, 酣畅淋漓/al, 的/ude1, 书/n, 的/ude1, 作家/nnt]

    4、hanlp参考文档

    pyhanlp的参考文档:https://github.com/hankcs/pyhanlp

    hanlp的参考文档:https://github.com/hankcs/HanLP/blob/master/README.md

    5、注意事项

    pynlp和hanlp都是hanlp旗下的分词、词性标注工具,HanLP是一个Java工具包,python是基于python的工具包,如果是用pycharm编译python程序,安装pyhanlp足以。

  • 相关阅读:
    第二十三篇 jQuery 学习5 添加元素
    第二十二篇 jQuery 学习4 内容和属性
    第二十一篇 jQuery 学习3 特效效果
    第二十篇 jQuery 初步学习2
    第十九篇 jQuery初步学习
    第十八篇 JS传参数
    第十七篇 JS验证form表单
    第十六篇 JS实现全选操作
    第十五篇 JS 移入移出事件 模拟一个二级菜单
    第十四篇 JS实现加减乘除 正则表达式
  • 原文地址:https://www.cnblogs.com/maxxu11/p/12594387.html
Copyright © 2011-2022 走看看