NDCG - 走看看

zoukankan html css js c++ java

NDCG

转自怎么理解推荐系统中的NDCG？

CG

CG（cumulative gain，累计增益）可以用于评价基于打分/评分的个性推荐系统。假设我们推荐k个物品，这个推荐列表的CGk计算公式如下：

[CG_k=sum_{i=1}^k ext{rel}_i ]
(rel_i) 表示第 (k) 个物品的相关性或者评分。假设我们共推荐 (k) 部电影，(rel_i) 可以是用户对第 (i) 部电影的评分。

比如豆瓣给用户推荐了五部电影，分别为 (M_1,M_2,M_3,M_4,M_5)，该用户对这五部电影的评分分别是5, 3, 2, 1, 2，那么这个推荐列表的CG等于

[CG_5=5+3+2+1+2=13 ]

DCG

然而CG没有考虑推荐的次序，如果引入对物品顺序的考虑，就有了DCG(discounted CG)，折扣累积增益。公式如下：

[DCG_k=sum_{i=1}^k frac{2^{ ext{rel}_i}-1}{log_2(i+1)} ]
还是上面那个例子，计算结果为：

[DCG_5=frac{2^5-1}{log_2 2}+frac{2^3-1}{log_2 3}+frac{2^2-1}{log_2 4}+frac{2^1-1}{log_2 5}+frac{2^2-1}{log_2 6}=31+4.4+1.5+0.4+1.2=38.5 ]

NDCG

DCG没有考虑到推荐列表和每个检索中真正有效结果个数，所以最后我们引入NDCG(normalized discounted CG)，顾名思义就是标准化之后的DCG。

[NDCG_k=frac{DCG_k}{IDCG_k} ]
其中IDCG是指ideal DCG，也就是完美结果下的DCG。

继续上面的例子，如果相关电影一共有7部 (M_1,M_2,M_3,M_4,M_5,M_6,M_7)，该用户对这七部电影的评分分别是5, 3, 2, 1, 2 , 4, 0，把这7部电影按评分排序5, 4, 3, 2, 2, 1, 0，这个情况下的完美DCG是：

[IDCG_5=frac{2^5-1}{log_2 2}+frac{2^4-1}{log_2 3}+frac{2^3-1}{log_2 4}+frac{2^2-1}{log_2 5}+frac{2^2-1}{log_2 6}=31+9.5+3.5+1.3+1.2=46.5 ]
所以：

[NDCG_5 = frac{DCG_5}{IDCG_5}=frac{38.5}{46.5}=0.827 ]
NDCG是0到1的数，越接近1说明推荐越准确。

查看全文

相关阅读:
Java Web的web.xml文件作用及基本配置（转）
Java Web的传值汇总（含JavaBean）
路径前面的符号意思（~/,./,../,/）
MySQL的insert语句的区别
 Linux 安全
 拇指玩」制作的「谷歌安装器」app
经典角色权限系统设计五张表及拓展应用
 MySQL用户和权限管理
 【基于url权限管理 shiro(一)】--基础
 android图片文件的路径地址与Uri的相互转换

原文地址：https://www.cnblogs.com/zyb993963526/p/14086135.html