引用洗牌算法

zoukankan html css js c++ java

引用洗牌算法

http://www.matrix67.com/blog/archives/879

记得当年搞NOIp时，我犯过一个相当严重的错误：错误地把Floyd算法的i, j, k三层循环的位置顺序搞颠倒了。直到准备省选时我才突然意识到，Floyd算法应该最先枚举用于松驰操作的那个“中间变量”k，表示只经过从1到k的顶点的最短路；而我却一直习惯性地以为i, j, k应该顺次枚举。令人惊讶的是，这个错误跟了我那么久我居然从来都没有注意到过。后来，我发现有我这种经历的人不止一个。惯性思维很可能会让你接受一些明显错误的算法，并且让你用得坦坦荡荡，一辈子也发觉不了。
    假使你需要把一个数组随机打乱顺序进行重排。你需要保证重排后的结果是概率均等、完全随机的。下面两种算法哪一种是正确的？其中，random(a,b)函数用于返回一个从a到b（包括a和b）的随机整数。

1. for i:=1 to n do swap(a[i], a[random(1,n)]);
2. for i:=1 to n do swap(a[i], a[random(i,n)]);

    如果不仔细思考的话，绝大多数人会认为第一个算法才是真正随机的，因为它的操作“更对称”，保证了概率均等。但静下心来仔细思考，你会发现第二种算法才是真正满足随机性的。为了证明这一点，只需要注意到算法的本质是“随机确定a[1]的值，然后递归地对后n-1位进行操作”，用数学归纳法即可轻易说明算法的正确性。而事实上，这段程序一共将会产生n*(n-1)*(n-2)*…*1种等可能的情况，它们正好与1至n的n!种排列一一对应。
     有人会问，那第一种算法为什么就错了呢？看它的样子多么对称美观啊……且慢，我还没说第一种算法是错的哦！虽然第一种算法将产生比第二种算法更多的可能性，会导致一些重复的数列，但完全有可能每种数列重复了相同的次数，概率仍然是均等的。事实上，更有可能发生的是，这两种算法都是正确的，不过相比之下呢第一种算法显得更加对称美观一些。为此，我们需要说明，第一种算法产生的所有情况均等地分成了n!个等价的结果。显然，这个算法将会产生n^n种情况，而我们的排列一共有n!个，因此n^n必须能够被n!整除才行（否则就不能均等地分布了）。但是，n!里含有所有不超过n的质数，而n^n里却只有n的那几个质因子。这表明要想n^n能被n!整除，n的质因子中必须含有所有不超过n的质数。这个结论看上去相当荒唐，反例遍地都是，并且直觉上告诉我们对于所有大于2的n这都是不成立的。为了证明这一点，只需要注意到2是质数，并且根据Bertrand-Chebyshev定理，在n/2和n之间一定还有一个质数。这两个质数的乘积已经大于n了。搞了半天，第一种看似对称而美观的算法居然是错的！

我的看法是.从上面这个BC定理知道n/2到n之见的这个数在分母里面但是不在分子的因子里面.因为分子里面只有n,把任意个n拆开再乘起来都拼不出来这个素因子.

网上其他人的证明说因为这种算法让1到1的概率比1/n小,我算了半天也是1/n.其实不应该这么看,洗牌不是让每一个位置出现1的概率都是1/n就完事了,而是还要保证任何一种1到n的排列都要出现.然后任意一种排列出现概率都一样.

查看全文

相关阅读:
NetCore+Dapper WebApi架构搭建（三）：添加实体和仓储
 NetCore+Dapper WebApi架构搭建（二）：底层封装
 NetCore+Dapper WebApi架构搭建（一）：基本框架
 net core WebApi——缓存神器Redis
net core Webapi基础工程搭建（六）——数据库操作_Part 2
net core Webapi基础工程搭建（七）——小试AOP及常规测试_Part 2
springBoot+mybatisPlus小demo
JAVA并发(一)
tomcat解析
 JAVA并发-线程状态

原文地址：https://www.cnblogs.com/zhangbo2008/p/8315498.html