最近在研究sample之间的similarity,以便更好地进行clustering,一下是相关资料
TF-IDF与余弦相似性的应用(一):自动提取关键词
TF-IDF与余弦相似性的应用(二):找出相似文章
相似度(距离计算)汇总
常用的相似度计算方法原理及实现
机器学习中的相似性度量
大量短文本聚类效果优化:余弦相似度,Spark,Mini Batch Kmeans
Clustering cosine similarity matrix
如何用 word2vec 计算两个句子之间的相似度?
机器学习之划分聚类及代码示例
字符串相似度比较算法:Jaro–Winkler similarity的原理及实现