不起作用的原因很多,这里列举几个
这里的hanlp我虽然用的maven建立的但是要添加自定义词典,所以没有用maven引入的方式,而是下载了data+hanlp.jar文件 data下载地址https://pan.baidu.com/s/1o8Rri0y
1、没有删除custom文件夹下的所有bin文件
当添加新词典后,没有删除原来自动生成的缓存词典,直接运行不成功。所以要删除这个文件
2、hanlp.properties中配置不对(注意这个文件的位置)
· root=D:/Project/public_sentiment_monitor/plugin/项目名字(hanlp2)/
3、字典文本类型utf-8
4、添加的词典还要添加到CustomDictionaryPath中 如:
CustomDictionaryPath=data/dictionary/custom/CustomDictionary.txt;现代汉语补充词库.txt; 全国地名大全.txt ns; 人名词典.txt; 机构名词典.txt; 上海地名.txt ns;data/dictionary/person/nrf.txt nrf;data/dictionary/custom/my.txt
5、字典内的文本不要有空格
如:我爱我 家 n 1
这里我爱我家不能断
测试程序:
String text = "比妳聰明的人,請不要讓他還比妳努力"; System.out.println(HanLP.segment(text)); // 分词 System.out.println(HanLP.extractKeyword(text, 2)); // 提取关键字,同时指定提取的个数 System.out.println(HanLP.extractPhrase(text, 2)); // 提取短语,,同时指定提取的个数 System.out.println(HanLP.extractSummary(text, 2)); // 提取摘要,同时指定提取的个数 System.out.println(HanLP.getSummary(text,10)); //提取短语,同时指定摘要的最大长度 System.out.println(HanLP.convertToTraditionalChinese(text)); // 简体字转为繁体字 System.out.println(HanLP.convertToSimplifiedChinese(traditionText)); // 繁体字转为简体字 System.out.println(HanLP.convertToPinyinString(text, " ", false)); // 转为拼音