zoukankan      html  css  js  c++  java
  • lucene 中文分词器中的一个Bug

    lucene 中文分词器如何扩充中文词库啊
    求帮助???1534432371@qq.com这是我的邮箱
    在帮着找找这个小程序那错了??(我想让“烟台大学”作为一个语汇单元,不分词)


    import java.io.BufferedWriter;
    import java.io.FileWriter;
    import java.io.IOException;
    import java.util.ArrayList;
    import java.util.Iterator;

    import org.apache.lucene.analysis.Analyzer;
    import org.wltea.analyzer.lucene.IKAnalyzer;

    import LuceneUtil.AnalyzerUtils;

    import com.chenlb.mmseg4j.analysis.MMSegAnalyzer;

    public class TestAnalyzer {
     static ArrayList<String> list=null;
     
     
     public static void main (String [] args) throws IOException{
      //addNewWord( "烟台大学 ");
      test();
      
      
     }
     
     public static void test()
     {
      Analyzer a1=new IKAnalyzer();
      String txt="我是一名大学生,我来自菏泽,我现在烟台大学。";
      AnalyzerUtils.displayToken(txt,a1);
      ArrayList<String> list=new ArrayList<String>();
      list.add("烟台大学 ");
      org.wltea.analyzer.dic.Dictionary.addWords(list);
        
       
      
     }
     }


     

  • 相关阅读:
    作业01
    C语言I博客作业08
    C语言I博客作业07
    C语言I博客作业06
    C语言I博客作业05
    C语言I博客作业04
    C语言II博客作业04
    C语言II—作业03
    C语言II博客作业02
    C语言II博客作业01
  • 原文地址:https://www.cnblogs.com/lixingle/p/3313038.html
Copyright © 2011-2022 走看看