zoukankan      html  css  js  c++  java
  • NDCG

    转自怎么理解推荐系统中的NDCG?

    CG

    CG(cumulative gain,累计增益)可以用于评价基于打分/评分的个性推荐系统。假设我们推荐k个物品,这个推荐列表的CGk计算公式如下:

    [CG_k=sum_{i=1}^k ext{rel}_i ]

    (rel_i) 表示第 (k) 个物品的相关性或者评分。假设我们共推荐 (k) 部电影,(rel_i) 可以是用户对第 (i) 部电影的评分。


    比如豆瓣给用户推荐了五部电影,分别为 (M_1,M_2,M_3,M_4,M_5),该用户对这五部电影的评分分别是5, 3, 2, 1, 2,那么这个推荐列表的CG等于

    [CG_5=5+3+2+1+2=13 ]



    DCG

    然而CG没有考虑推荐的次序,如果引入对物品顺序的考虑,就有了DCG(discounted CG),折扣累积增益。公式如下:

    [DCG_k=sum_{i=1}^k frac{2^{ ext{rel}_i}-1}{log_2(i+1)} ]

    还是上面那个例子,计算结果为:

    [DCG_5=frac{2^5-1}{log_2 2}+frac{2^3-1}{log_2 3}+frac{2^2-1}{log_2 4}+frac{2^1-1}{log_2 5}+frac{2^2-1}{log_2 6}=31+4.4+1.5+0.4+1.2=38.5 ]



    NDCG

    DCG没有考虑到推荐列表和每个检索中真正有效结果个数,所以最后我们引入NDCG(normalized discounted CG),顾名思义就是标准化之后的DCG。

    [NDCG_k=frac{DCG_k}{IDCG_k} ]

    其中IDCG是指ideal DCG,也就是完美结果下的DCG。


    继续上面的例子,如果相关电影一共有7部 (M_1,M_2,M_3,M_4,M_5,M_6,M_7),该用户对这七部电影的评分分别是5, 3, 2, 1, 2 , 4, 0,把这7部电影按评分排序5, 4, 3, 2, 2, 1, 0,这个情况下的完美DCG是:

    [IDCG_5=frac{2^5-1}{log_2 2}+frac{2^4-1}{log_2 3}+frac{2^3-1}{log_2 4}+frac{2^2-1}{log_2 5}+frac{2^2-1}{log_2 6}=31+9.5+3.5+1.3+1.2=46.5 ]

    所以:

    [NDCG_5 = frac{DCG_5}{IDCG_5}=frac{38.5}{46.5}=0.827 ]

    NDCG是0到1的数,越接近1说明推荐越准确。

  • 相关阅读:
    Jmeter 02 JMeter体系结构
    从一个实例详解敏捷测试的最佳实践
    BI测试
    A/B测试与灰度发布
    性能测试之稳定性测试(可靠性测试)
    Jmeter 01
    浅谈<持续集成、持续交付、持续部署>(二)
    浅谈<持续集成、持续交付、持续部署>(一)
    Python总结
    Latex技巧:LaTex插图命令includegraphics参数详解
  • 原文地址:https://www.cnblogs.com/zyb993963526/p/14086135.html
Copyright © 2011-2022 走看看