zoukankan      html  css  js  c++  java
  • 算法备忘录按权重选取数据

    今天看到一段Javascirpt 代码,其功能是按数据权重(weight)来显示广告.
    基本算法描述如下:
    给每个数据(节点)指定一个权重.
    1.将各节点的权重求和得到总数sum.
    2.采用随机函数(js中为 Math.round(Math.random() *sum) )生成一个取值范围在[1~sum]之间的值ranSum.
    3.接着遍历所有数据(节点),访问顺序可以随意.将当前节点的权重值加上前面访问的各节点权重值得curSum,判断curSum >= ranSum,如果条件成立则返回当前节点,如果不是则继续累加下一节点. 直到符合上面的条件,由于ranSum<=sum 因此一定存在curSum >=ranSum.

    说明:
    假设有这么一组数据: A4,A5,A3,A1,A2 其对应的权重为 10,20,40,20,10 现在我们要从这5个值中按他们的权重取数据,
    那么每100次取值应该有10次能取到A4,40次能取到A3等等,现在根据下面的表示,并考虑上面的算法
    0--A4---A5------------A3-------A1--A2>100
    每次取值时的遍历操作按A4,A5,A3,A1,A2的顺序访问,按上面的条件,ranSum的范围应该在1-100,对于A4按上面的算法在ranSum取1-10时都符合条件,因此每100次取值应该有10次被取到的机会,对于A3它的范围应该是31-70(a4+a5,a4+a5+a3),那么ranSum为31到70之间数值的可能性为每100次里有40次.由上面过程我们可以看到数据被获取的概率只跟其权重有关,跟算法中数据访问顺序无关.

    代码(C#伪代码)
    class Node
    {
      public int Weight=0;
      public string Data;
    }

    public Node GetNode(IList<Node> nodes){
     int sum=GetSum(nodes);
     int ranSum=GetRandom(sum); //获取1到sum之间的随机数
     int curSum=0;
     foreach(Node node in Nodes){
        curSum +=node.Weight;
        if(curSum >= ranSum) return node;
     }
     return null;
    }


  • 相关阅读:
    Spark Steaming消费kafka数据条数变少问题
    intellij idea 搜索
    ZooKeeper shell
    linux 端口映射设置
    maxCompute odps 行转列
    dev stg prd 开发 测试 生产环境
    大数据之路
    MYSQL性能优化
    JavaScript学习笔记-setTimeout应用
    JavaScript学习笔记-函数
  • 原文地址:https://www.cnblogs.com/wdfrog/p/994963.html
Copyright © 2011-2022 走看看