zoukankan      html  css  js  c++  java
  • 基于朴素贝叶斯分类器的文本分类算法C#版

    该程序用到了Lucene.Net,用到了基于词典的ICTCLAS中文分词1.0.

    ICTCLAS中文分词for Lucene.Net接口代码(实现Analyzer):

    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

     1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

     2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

     3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

     4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.IO;

     5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Analysis;

     7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Analysis.Standard;

     8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

    10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /**//// <summary>

    13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// ICTCLAS分词组件for Lucene.net接口

    14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// </summary>

    15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class ICTCLASAnalyzer : Analyzer

    16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        //定义要过滤的词

    18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public static readonly System.String[] CHINESE_ENGLISH_STOP_WORDS = new string[428];

    19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public string NoisePath = Environment.CurrentDirectory + "\\data\\stopwords.txt";

    20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public ICTCLASAnalyzer()

    22基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    23基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            StreamReader reader = new StreamReader(NoisePath, System.Text.Encoding.Default);

    24基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string noise = reader.ReadLine();

    25基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            int i = 0;

    26基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            

    27基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            while (!string.IsNullOrEmpty(noise))

    28基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    29基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                CHINESE_ENGLISH_STOP_WORDS[i] = noise;

    30基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                noise = reader.ReadLine();

    31基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                i++;

    32基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

    33基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            

    34基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

    35基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    36基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                /**//**//**//// Constructs a {@link StandardTokenizer} filtered by a {@link

    37基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生       /// StandardFilter}, a {@link LowerCaseFilter} and a {@link StopFilter}. 

    38基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 

    39基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public override TokenStream TokenStream(System.String fieldName, System.IO.TextReader reader)

    40基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    41基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            TokenStream result = new ICTCLASTokenizer(reader);

    42基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            result = new StandardFilter(result);

    43基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            result = new LowerCaseFilter(result);

    44基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            result = new StopFilter(result, CHINESE_ENGLISH_STOP_WORDS);

    45基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return result;

    46基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

    47基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    48基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    49基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

    50基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

     

    ICTCLAS中文分词for Lucene.Net接口代码(实现Tokenizer):

    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

     1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

     2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

     3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

     4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Analysis;

     6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using SharpICTCLAS;

     7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.IO;

     8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

    10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class ICTCLASTokenizer : Tokenizer

    12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        int nKind = 1;

    14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        List<WordResult[]> result;

    15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        int startIndex = 0;

    16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        int endIndex = 0;

    17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        int i = 1;

    18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//**/

    19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// 

    20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 待分词的句子

    21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 

    22基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private string sentence;

    23基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//**/

    24基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// Constructs a tokenizer for this Reader. 

    25基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public ICTCLASTokenizer(System.IO.TextReader reader)

    26基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    27基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            this.input = reader;

    28基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            sentence = input.ReadToEnd();

    29基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            sentence = sentence.Replace("\r\n", "");

    30基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string DictPath = Path.Combine(Environment.CurrentDirectory, "Data") + Path.DirectorySeparatorChar;

    31基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            //Console.WriteLine("正在初始化字典库,请稍候");

    32基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            WordSegment wordSegment = new WordSegment();

    33基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            wordSegment.InitWordSegment(DictPath);

    34基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            result = wordSegment.Segment(sentence, nKind);

    35基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

    36基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    37基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//**/

    38基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// 进行切词,返回数据流中下一个token或者数据流为空时返回null

    39基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 

    40基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public override Token Next()

    41基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    42基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            Token token = null;

    43基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            while (i < result[0].Length - 1)

    44基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    45基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                string word = result[0][i].sWord;

    46基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                endIndex = startIndex + word.Length - 1;

    47基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                token = new Token(word, startIndex, endIndex);

    48基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                startIndex = endIndex + 1;

    49基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    50基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                i++;

    51基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                return token;

    52基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    53基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

    54基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return null;

    55基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

    56基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    57基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

    58基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

     

    中文分词器代码:

    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

     1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

     2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

     3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

     4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.IO;

     5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Analysis;

     7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Analysis.Standard;

     8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Documents;

     9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Analysis.Cn;

    11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Analysis.KTDictSeg;

    12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

    14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /**//// <summary>

    16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// 中文分词器

    17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// </summary>

    18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class ChineseSpliter

    19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public static string Split(string text, string splitToken)

    21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    22基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            StringBuilder sb = new StringBuilder();

    23基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    24基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            Analyzer an = new ICTCLASAnalyzer();

    25基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    26基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            //TokenStream ts = an.ReusableTokenStream("", new StringReader(text));

    27基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    28基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            TokenStream ts = an.TokenStream("", new StringReader(text));

    29基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    30基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            Lucene.Net.Analysis.Token token;

    31基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            while ((token = ts.Next()) != null)

    32基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    33基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                sb.Append(splitToken + token.TermText());

    34基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

    35基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    36基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return sb.ToString().Substring(1);

    37基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

    38基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

    39基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

     

    训练管理器代码:

    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

      1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

      2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

      3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

      4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.IO;

      5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

      6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text.RegularExpressions;

      7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

      8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

      9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

     10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /**//// <summary>

     12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// 训练管理器

     13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// </summary>

     14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class TrainingDataManager

     15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

     16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private string[] trainingFileClassicfications; //训练预料分类数组

     17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private DirectoryInfo trainingTextDir; //训练预料存放目录

     18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private string defaultDir = "D:\\SogouC.mini.20061127\\SogouC.mini\\Sample";

     19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        //private string defaultDir = @"J:\SogouC.reduced.20061127\SogouC.reduced\Reduced";

     20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public TrainingDataManager()

     22基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

     23基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            if (!Directory.Exists(defaultDir))

     24基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

     25基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                throw new Exception("当前语料目录不存在!");

     26基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

     27基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            trainingTextDir = new DirectoryInfo(defaultDir);

     28基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     29基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            trainingFileClassicfications = Directory.GetDirectories(defaultDir,"*",SearchOption.TopDirectoryOnly);

     30基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     31基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            for (int i = 0; i < trainingFileClassicfications.Length; i++)

     32基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

     33基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                trainingFileClassicfications[i] = (Regex.Split(trainingFileClassicfications[i], "\\\\"))[(Regex.Split(trainingFileClassicfications[i], "\\\\")).Length - 1];

     34基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                //Console.WriteLine(trainingFileClassicfications[i]);

     35基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

     36基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

     37基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     38基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

     39基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 获取分类列表

     40基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

     41基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns></returns>

     42基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public string[] GetTrainingClassifications()

     43基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

     44基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return trainingFileClassicfications;

     45基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

     46基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     47基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

     48基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 获取指定分类下的文件路径

     49基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

     50基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="classification"></param>

     51基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns></returns>

     52基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public string[] GetFilesPath(string classification)

     53基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

     54基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string[] ret = Directory.GetFiles(defaultDir+"\\"+classification);

     55基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生           

     56基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return ret;

     57基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

     58基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     59基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

     60基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 获取指定位置的文件内容

     61基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

     62基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="filepath"></param>

     63基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns></returns>

     64基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public string GetFileText(string filepath)

     65基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

     66基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            FileStream fs = new FileStream(filepath, FileMode.Open, FileAccess.Read, FileShare.Read);

     67基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            byte[] bt = new byte[fs.Length];

     68基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            fs.Read(bt, 0, bt.Length);

     69基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            fs.Close();

     70基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string s = Encoding.Default.GetString(bt);

     71基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return s;

     72基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

     73基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     74基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

     75基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 获取训练文本集中的文本数目

     76基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

     77基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns></returns>

     78基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public int GetTrainFileCount()

     79基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

     80基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            int ret = 0;

     81基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            for (int i = 0; i < trainingFileClassicfications.Length; i++)

     82基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

     83基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                ret += GetTrainFileCountOfCertainClassification(trainingFileClassicfications[i]);

     84基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

     85基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return ret;

     86基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

     87基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     88基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

     89基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 获取指定分类下的文本数目

     90基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

     91基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="classification"></param>

     92基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns></returns>

     93基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public int GetTrainFileCountOfCertainClassification(string classification)

     94基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

     95基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            int ret = 0;

     96基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     97基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            ret = Directory.GetFiles(defaultDir + "\\" + classification).Length;

     98基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     99基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return ret;

    100基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

    101基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    102基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

    103基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 获取指定分类包含关键字或关键词的样本数目

    104基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

    105基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="classification">指定分类</param>

    106基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="key">关键词或关键字</param>

    107基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns>样本数目</returns>

    108基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public int GetCountContainKeyOfClassification(string classification, string key)

    109基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    110基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            int ret = 0;

    111基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string[] filepaths = GetFilesPath(classification);

    112基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            try

    113基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    114基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                

    115基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                for (int i = 0; i < filepaths.Length; i++)

    116基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    117基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                    string text = GetFileText(filepaths[i]);

    118基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                    if (text.Contains(key))

    119基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    120基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                        ret++;

    121基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                    }

    122基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                }

    123基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

    124基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            catch

    125基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    126基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                throw new Exception("error!");

    127基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

    128基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return ret;

    129基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

    130基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

    131基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

    132基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     

    先验概率计算代码:

    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

     1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

     2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

     3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

     4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

     6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

     7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /**//// <summary>

     8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// 先验概率(事先概率)计算

     9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// </summary>

    10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class PriorProbability

    11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private static TrainingDataManager tdm = new TrainingDataManager();

    13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

    15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 计算先验概率

    16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

    17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="c">给定的分类</param>

    18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns>给定条件下的先验概率</returns>

    19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public static float CaculatePc(string c)

    20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float ret = 0F;

    22基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float Nc = tdm.GetTrainFileCountOfCertainClassification(c);

    23基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float N = tdm.GetTrainFileCount();

    24基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            ret = Nc / N;

    25基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return ret;

    26基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

    27基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

    28基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

     

    条件概率计算代码:

    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

     1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

     2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

     3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

     4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

     6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

     7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /**//// <summary>

     8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// 条件概率计算

     9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// </summary>

    10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class ClassConditionalProbability

    11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private static TrainingDataManager tdm = new TrainingDataManager();

    14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private static float M = 0F;

    15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

    17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 类条件概率

    18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

    19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="x">给定关键字</param>

    20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="c">给定分类</param>

    21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns></returns>

    22基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public static float CaculatePxc(string x, string c)

    23基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    24基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float ret = 0F;

    25基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float Nxc = tdm.GetCountContainKeyOfClassification(c, x);

    26基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float Nc = tdm.GetTrainFileCountOfCertainClassification(c);

    27基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float V = tdm.GetTrainingClassifications().Length;

    28基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    29基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            ret = (Nxc + 1) / (Nc + V + M);//为避免出现0这样的极端情况,进行加权处理

    30基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    31基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return ret;

    32基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

    33基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

    34基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

     

    用于保存分类结果的类:

    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

     1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

     2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

     3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

     4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

     6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

     7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /**//// <summary>

     8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// 保存分类结果

     9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// </summary>

    10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class ClassifyResult

    11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public double probability; //分类概率

    14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public string classification;  //分类

    15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public ClassifyResult()

    16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            probability = 0;

    18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            classification = string.Empty;

    19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

    20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

    21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

     

    贝叶斯分类器代码:

    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

     1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

     2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

     3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

     4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

     5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

     6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

     7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /**//// <summary>

     8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// 朴素贝叶斯分类器

     9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// </summary>

    10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class BayesClassifier

    11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private TrainingDataManager tdm; //训练集合管理器

    14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        //private string trainingDataPath; //训练集合路径

    15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private static float zoomFactor = 10.0F;

    16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

    18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 默认构造器,初始化训练集合

    19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

    20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public BayesClassifier()

    21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    22基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            tdm = new TrainingDataManager();

    23基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

    24基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    25基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

    26基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 计算给定的文本属性向量X在给定的分类Cj中的类条件概率

    27基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

    28基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="X">文本属性向量X</param>

    29基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="Cj">给定的分类</param>

    30基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns>分类条件概率连乘值</returns>

    31基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        protected float CaluProd(string[] X, string Cj)

    32基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    33基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float ret = 1.0F;

    34基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            for (int i = 0; i < X.Length; i++)

    35基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    36基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                string Xi = X[i];

    37基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                ret *= ClassConditionalProbability.CaculatePxc(Xi, Cj) * zoomFactor;//因为数值过小,因此将连乘值放大10倍(通过乘以zoomFactor)

    38基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

    39基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            ret *= PriorProbability.CaculatePc(Cj); //再乘以先验概率

    40基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return ret;

    41基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

    42基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    43基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

    44基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 对指定文本进行分类

    45基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

    46基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="text">指定文本</param>

    47基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns>分类结果</returns>

    48基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public List<ClassifyResult> Classify(string text)

    49基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    50基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string[] terms = ChineseSpliter.Split(text, "|").Split('|'); //中文分词处理(分词结果可能包含停用词)

    51基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string[] classes = tdm.GetTrainingClassifications();  //分类列表数组

    52基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float probility = 0.0F;

    53基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            List<ClassifyResult> crs = new List<ClassifyResult>(); //分类结果

    54基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            for (int i = 0; i < classes.Length; i++)

    55基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    56基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                string Ci = classes[i];

    57基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                probility = CaluProd(terms, Ci); //计算给定的文本属性向量terms在给定的分类Ci中的分类条件概率

    58基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                ClassifyResult cr = new ClassifyResult();

    59基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                cr.classification = Ci;

    60基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                cr.probability = probility;

    61基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                crs.Add(cr);

    62基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

    63基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return crs;

    64基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

    65基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

    66基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public string GetMaxNum(List<ClassifyResult> crs)

    67基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    68基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            double ret = 0;

    69基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string classification = string.Empty;

    70基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            ret = crs[0].probability;

    71基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            for (int i = 0; i < crs.Count; i++)

    72基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    73基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                if (crs[i].probability > ret)

    74基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

    75基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                    ret = crs[i].probability;

    76基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                    classification = crs[i].classification;

    77基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                }

    78基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

    79基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return classification;

    80基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

    81基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

    82基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

  • 相关阅读:
    keepass
    gpg
    Wireshark实践
    ssh
    namp
    第十二周
    第十一周
    第十周总结
    第九周学习总结
    编程语言
  • 原文地址:https://www.cnblogs.com/wycg1984/p/1722398.html
Copyright © 2011-2022 走看看