参考: 向量空间模型(Vector Space Model)的理解
参考: TF-IDF与余弦相似性的应用(一):自动提取关键词
参考: TF-IDF与余弦相似性的应用(二):找出相似文章
参考: TF-IDF与余弦相似性的应用(三):自动摘要
参考: 如何计算两个文档的相似度(二) - gensim
参考: 第4章-模型中特征子集的选择
参考: 统计机器学习中的特征选择方法
参考: 齊夫定律 - Wikipedia
参考: Zipf定律 - 360百科
参考: 机器学习中的特征空间 (特征空间, TF-IDF)
参考:深入浅出最大似然估计(Maximum Likelihood Estimation)