摘自推荐系统
一、描述
有一些指标是可以通过近邻算法给出的
二、指标
1、预测用户u对新物品i的评分rw。
跟用户u相似的用户称为近邻,挑选出足够多的对物品i都评分的近邻用户,然后对新物品进行评分。公式:
w代表其它用户和u的相似度,r代表用户v对商品i的评分。用|w|对公式进行标准化,防止负的评分值使得整体超出评分的范围
上个式子有缺陷,即当某个用户和目标用户u的相似度不高时,那么此时如果评分很高的话会影响总体结果。解决这个问题可以将rwi进行标准化转换。公式:
2、基于用户的分类
3、基于用户和基于物品推荐的对比
- 准确性
- 稳定性
- 合理性
- 惊喜度
三、评分标准化
每个用户都有自己的评价准则额。即使显示地定义每个评分的意义,有些用户依然会不情愿给他们喜欢的物品评高分或给他们不喜欢的物品评低分。均值中心化和Z-Score这两种通用的标准化机制可以将个人评分标准转换到更一般的整体评分标准。
1、均值中心化
其中rm代表均值
2、Z-score