zoukankan      html  css  js  c++  java
  • lucene集成IK实现中文分词检索

      这里采用IK分词器。
         IKAnalyzer2012_u5.zip下载地址:http://code.google.com/p/ik-analyzer/downloads/detail?name=IKAnalyzer2012_u5.zip&can=2&q=

        1、将IKAnalyzer2012.jar导入工程;
        2、将IKAnalyzer.cfg.xml、stopword.dic文件拷贝到src根目录下(编译后在classes根目录下);
        3、修改CreateIndex.java文件,用IK分词器替换lucene默认分词器。找到
            indexWriter = new IndexWriter(dir, new StandardAnalyzer(
    Version.LUCENE_30), true,
    IndexWriter.MaxFieldLength.UNLIMITED);
            替换为:
            indexWriter = new IndexWriter(dir,new IKAnalyzer(), true,
    IndexWriter.MaxFieldLength.UNLIMITED); 
        4、修改Select.java文件,用IK分词器替换lucene默认分词器。找到
            QueryParser queryParser = new QueryParser(Version.LUCENE_30,   
                "contents",   new IKAnalyzer() );  

        以上四步即完成集成IK分词器操作。
  • 相关阅读:
    CControlLayer
    CBiontCache
    CHero
    CWidgetMgr---cpp
    CWidgetMgr---H
    CXAnimation类
    CXAnimation.h动画类
    CXCommon.h工具类
    【leetcode】441. Arranging Coins
    【linux基础】关于ARM板子使用O3编译选项优化
  • 原文地址:https://www.cnblogs.com/shihao/p/2695419.html
Copyright © 2011-2022 走看看