zoukankan      html  css  js  c++  java
  • 解题思路:蓄水池问题

    在面美团实习的时候,面试官问了这道蓄水池问题:给定一个链表,长度未知(但是大于k),你只能遍历一次,要求随机挑出k个节点。

    刚听完题目的我是一脸蒙蔽的,what is the fuck? 长度未知?遍历一遍?那每个节点被挑选的概率如何计算?

    我当时的答案是遍历两遍链表。

    后来想想这样的确很蠢,蓄水池问题的一个变种:有一个网络数据流,要你随机抓一个包,所有包被抓到的概率要求相等。

    如果用我的遍历两遍链表的方法肯定不行!

    然后我google了一下,发现了神奇的蓄水池解法:

      对于链表随机挑k个节点,先把前k个节点作为已经选定的节点,从第k+1个节点开始,每个节点以1/(k+1)的概率被选中,并从选定的节点中随机挑选一个替换它,成为新的候选节点。

    vector<int> vec(k,0);
    int num  = k,curlen  = k+1;
    
    while(num--){
         vec[k-num] = head->val;
         head = head->next;
    }
    
    while(head){
         int m = rand()%curlen;
         if(m < k) swap(vec[m],head->val);
         head = head->next;
         curlen++;
    }
    

      这样一来,第i个节点被选中的概率为1/i。而它之前的节点i-1被选中的概率为 1/(i-1)*(1-1/i) = 1/i。满足题意。这个思路实在是666。

  • 相关阅读:
    NIS详解
    Linux的硬链接和软链接有何区别?
    使用sed和cut将进程的pid过滤出来
    sticky(粘附位)的含义
    使用ulimit来产生core dump文件
    Linux常用shell脚本
    LFS5.0安装完成心得
    sshd + xinetd 限制IP登录
    Linux磁盘限额配置(Ext3)
    LFS安装手记
  • 原文地址:https://www.cnblogs.com/unclelin/p/6565389.html
Copyright © 2011-2022 走看看