1、提供文本文件
2、将文本文件解析成词条向量(Word2Vec)
3、朴素贝叶斯文本分类,得到p0vec,p1vec,pSpam
4、classifyNB:
用到的函数
文本解析:textParse()
构建词向量(词袋模型):cteateVocablist()
p0V,p1V,pSpam=trainNB0(trainSet,trainClass)
bool = classifyNB(wordVector,p0V,p1V,pSpam)