技术栈:马尔可夫模型、多维数据的相似度夹角
1、定义标签
X1:词语1、词语2、词语3、...
X2:词语1、词语2、词语3、...
2、用马尔可夫分词模型,对内容分词识别出多维标签,生成一个多维向量(X1,X2)