包括两种方式—基于内容的过滤和协同过滤
Tf-idfTF—出现频率IDF—在其他文档中出现的频率,(在其他文档也经常出现,则IDF值会比较低)
向量空间模型相似度—余弦距离存在的问题LSA—隐含语义分析
L(pj)是指向其他人个数,d是参数,通常设为0.85