zoukankan      html  css  js  c++  java
  • hanlp添加词典不起作用

    不起作用的原因很多,这里列举几个

    这里的hanlp我虽然用的maven建立的但是要添加自定义词典,所以没有用maven引入的方式,而是下载了data+hanlp.jar文件          data下载地址https://pan.baidu.com/s/1o8Rri0y

    1、没有删除custom文件夹下的所有bin文件

      当添加新词典后,没有删除原来自动生成的缓存词典,直接运行不成功。所以要删除这个文件

    2、hanlp.properties中配置不对(注意这个文件的位置

    ·  root=D:/Project/public_sentiment_monitor/plugin/项目名字(hanlp2)/

    3、字典文本类型utf-8

    4、添加的词典还要添加到CustomDictionaryPath中      如:

    CustomDictionaryPath=data/dictionary/custom/CustomDictionary.txt;现代汉语补充词库.txt; 全国地名大全.txt ns; 人名词典.txt; 机构名词典.txt; 上海地名.txt ns;data/dictionary/person/nrf.txt nrf;data/dictionary/custom/my.txt

    5、字典内的文本不要有空格

      如:我爱我 家 n 1

    这里我爱我家不能断

    测试程序:

            String text = "比妳聰明的人,請不要讓他還比妳努力";
            System.out.println(HanLP.segment(text)); // 分词
            System.out.println(HanLP.extractKeyword(text, 2)); // 提取关键字,同时指定提取的个数
            System.out.println(HanLP.extractPhrase(text, 2)); // 提取短语,,同时指定提取的个数
            System.out.println(HanLP.extractSummary(text, 2)); // 提取摘要,同时指定提取的个数
            System.out.println(HanLP.getSummary(text,10));  //提取短语,同时指定摘要的最大长度
            System.out.println(HanLP.convertToTraditionalChinese(text)); // 简体字转为繁体字
            System.out.println(HanLP.convertToSimplifiedChinese(traditionText)); // 繁体字转为简体字
            System.out.println(HanLP.convertToPinyinString(text, " ", false)); // 转为拼音

    参考:https://www.cnblogs.com/hufulinblog/p/10025933.html

  • 相关阅读:
    Type Safety and Type Inference
    LEARN SWIFT
    swift 类型备份
    Swift
    associatedtype关联类型
    深入理解 Swift 派发机制
    Swift中self和Self
    Postfix Self Expression
    CGContext与上下文
    eeee
  • 原文地址:https://www.cnblogs.com/51python/p/11087204.html
Copyright © 2011-2022 走看看