zoukankan      html  css  js  c++  java
  • C#中文分词算法:ChineseAnalyzer

    C#中文分词算法:ChineseAnalyzer 。首先需要引用 2个dll库文件 Lucene.Net.dll + Lucene.China.dll ,会打包在本文结束处,使用VS2008调试通过:

    using Lucene.Net;
    using Lucene.Net.Analysis;
    using Lucene.China;

    ----------
    使用方法举例:

            private void button1_Click(object sender, EventArgs e)
            {
                StringBuilder sb = new StringBuilder();
                sb.Remove(0, sb.Length);
                string t1 = "";
                int i = 0;
                Analyzer analyzer = new Lucene.China.ChineseAnalyzer();
                StringReader sr = new StringReader(richTextBox1.Text);
                TokenStream stream = analyzer.TokenStream(null, sr);
            
                long begin = System.DateTime.Now.Ticks;
                Token t = stream.Next();
                while (t != null)
                {
                    t1 = t.ToString();   //显示格式: (关键词,0,2) ,需要处理
                    t1 = t1.Replace("(","");
                    char[] separator = { ',' };
                    t1 = t1.Split(separator)[0];
                    
                    sb.Append(i+":"+ t1 + "\r\n");
                    t = stream.Next();
                    i++;
                }
                richTextBox2.Text = sb.ToString();
                long end = System.DateTime.Now.Ticks; //100毫微秒
                int time = (int)((end - begin) / 10000); //ms            richTextBox2.Text += "耗时" + (time) + "ms \r\n=================================\r\n";
            }
    截图如下:
    C#中文分词算法:ChineseAnalyzer
    下载地址:
    中文分词算法:ChineseAnalyzer.rar 
  • 相关阅读:
    程序员无休止加班的真正原因!
    Tomcat 爆出高危漏洞!
    Spring Boot 2.3 终于要来了!
    2020 年 4月全国程序员工资出炉!
    面试官再问你如何看待义务加班,学会如何怼回去!
    如何在一分钟内搞定面试官?
    安装android studio时,解决unable to access android sdk add-on list
    poj 3230 Travel(dp)
    hdu 2059 龟兔赛跑(dp)
    解决未能启动服务“VMware Authorization Service”
  • 原文地址:https://www.cnblogs.com/top5/p/2144030.html
Copyright © 2011-2022 走看看