zoukankan      html  css  js  c++  java
  • anjs 分词器初步使用

    由于ik没有歧义分词的功能,打算用anjs 对前端传递过来的数据用anjs进行分词

    anjs 操作文档官网地址:http://nlpchina.github.io/ansj_seg/

    刚刚开始由于jar包问题折腾了一会,所以将jar 共享出来

    jar 包下载地址:http://yunpan.cn/cmuTuFhBxREnx (提取码:20c4)

    import java.util.List;
    
    import org.ansj.domain.Term;
    import org.ansj.splitWord.analysis.BaseAnalysis;
    import org.ansj.splitWord.analysis.IndexAnalysis;
    import org.ansj.splitWord.analysis.NlpAnalysis;
    import org.ansj.splitWord.analysis.ToAnalysis;
    
    /**
     * @author 作者 E-mail:
     * @version 创建时间:2015年9月1日 下午5:35:33
     * 类说明
     */
    public class AnjsAnalyserWord {
    
    	public static void main(String[] args) throws Throwable {
    		 
    		//String strbuf = "让战士们过一个欢乐祥和的新春佳节";
    		String strbuf = "洁面仪配合洁面深层清洁毛孔 清洁鼻孔面膜碎觉使劲挤才能出一点点皱纹 脸颊毛孔修复的看不见啦 草莓鼻历史遗留问题没辙 脸和脖子差不多颜色的皮肤才是健康的 长期使用安全健康的比同龄人显小五到十岁 28岁的妹子看看你们的鱼尾纹";
    		baseAnalys(strbuf);
    		realyAnalys(strbuf);
    		nlyAnalys(strbuf);
    		searchAnalys(strbuf);
    	}
    	
    	//基本分词
    	public static void baseAnalys(String strbuf){
    		 List<Term> parse = BaseAnalysis.parse(strbuf);
    		    System.out.println("基础分词:"+parse);
    	}
    	//精准分词
    	public static void realyAnalys(String strbuf){
    		List<Term> parse = ToAnalysis.parse(strbuf);
    	    System.out.println("精准分词:"+parse);
    	}
    	
    	//nly分词
    	public static void nlyAnalys(String strbuf){
    		List<Term> parse = NlpAnalysis.parse(strbuf);
    	    System.out.println("nly分词:"+parse);
    	}
    	
    	//search分词
    	public static void searchAnalys(String strbuf){
    		List<Term> parse = IndexAnalysis.parse(strbuf);
    	    System.out.println("search分词:"+parse);
    	}
    }
    
  • 相关阅读:
    Design:目录
    前端框架:template
    Template-ArtTemplate:artTemplate.js
    开发框架:AdminLTE
    开发框架:目录
    杂项:短网址
    httpd
    Java实现洛谷 P1428 小鱼比可爱
    Java实现洛谷 P1428 小鱼比可爱
    java实现洛谷P1308统计单词数
  • 原文地址:https://www.cnblogs.com/zhanggl/p/4776661.html
Copyright © 2011-2022 走看看