zoukankan      html  css  js  c++  java
  • 利用IK Analyzer分词

     1 import java.io.IOException;
     2 import java.io.StringReader;
     3 import org.apache.lucene.analysis.Analyzer;
     4 import org.apache.lucene.analysis.TokenStream;
     5 import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
     6 import org.wltea.analyzer.lucene.IKAnalyzer;
     7 
     8 public class IK_Analyzer {
     9     
    10     public static String Seg(String sentence) throws IOException {
    11         String text="";
    12         //创建分词对象
    13         Analyzer anal=new IKAnalyzer(true);
    14         StringReader reader=new StringReader(sentence);
    15         //分词
    16         TokenStream ts=anal.tokenStream("", reader);
    17         CharTermAttribute term=ts.getAttribute(CharTermAttribute.class);
    18         //遍历分词数据
    19         while(ts.incrementToken()){
    20             text+=term.toString()+"/";
    21         }
    22         reader.close();
    23         anal.close();
    24         return text.trim()+"
    ";
    25     }
    26 
    27     public static void main(String[] args) {
    28         try {
    29             System.out.println(IK_Analyzer.Seg("你妈妈喊你回家吃饭哦,回家喽!回家喽!"));
    30             System.out.println(IK_Analyzer.Seg("你非常好,像白马一样。"));
    31             System.out.println(IK_Analyzer.Seg("白龙马,名著小说《西游记》中的角色。本是西海龙王三太子,因纵火烧毁玉帝赏赐的明珠而被西海龙王上天庭告忤逆,要被斩首。后因南海观世音菩萨出面才免于死罪,被贬到蛇盘山鹰愁涧等待唐僧取经。之后又误吃唐僧所骑的白马,被菩萨点化,变身为白龙马,皈依佛门,载乘唐僧上西天取经,最终修成正果,被升为八部天龙广力菩萨(又称八部天龙马)。后在化龙池得复原身,盘绕在大雷音寺的擎天华表柱上。"));
    32         } catch (IOException e) {
    33                 e.printStackTrace();
    34         }
    35     }
    36 }

  • 相关阅读:
    电脑缺少网卡驱动不能上网
    eclipse的package, folder, source folder 异同以及相互转化
    向数据库表插入查询的数据
    更换项目jdk版本
    linux安装jdk(非rpm命令)
    主机ping不同虚拟机
    如何实现VoIP中大并发应用
    简单设置几个参数让你的电脑无人可染指(只有你能用)
    aliyun阿里云Maven仓库地址——加速你的maven构建
    nodejs持续学习--必须关注4网站
  • 原文地址:https://www.cnblogs.com/qijunhui/p/8445542.html
Copyright © 2011-2022 走看看