埃氏晒
埃拉托斯特尼筛法,简称埃氏晒,是一种用来求自然数n以内的全部素数。
他的基本原理是,如果我们要获得小于n的所有素数,那就把不大于根号n的所有素数的倍数剔除。
埃氏晒的原理很容易理解,一个合数,必然可以表示成,一个自然数 i 和一个素数的乘积。因此我们找到一个素数后,把他小于n的倍数全部标记为合数,这就是我们要做的。
void prime(int n) { bool flag[MAX];//0为素数 1为合数 memset(flag, 0, sizeof(flag)); for (int i = 2; i * i < n; i++) { //i为素数 if (flag[i] == false) { for (int j = i * i; j < n; j += i) { //将其倍数标记为合数 flag[j] = true; } } } }
上述代码有几个关键点要注意
1. 外层循环的终止条件是 i * i < n,因为我们是要把不大于根号n的所有素数的倍数剔除。
2. 内层循环,j 可以从 i * i 开始,因为 i * (2 ~ i –1 ),在之前的循环中,已经被筛去。
我们如果观察被筛掉的数据,我们可以发现,一个合数,可能会被筛掉多次,例如,
30 = 2 * 15 = 3 * 10 = 5 * 6,所以30 就至少被2,3,5这三个质数分别筛过了,这个地方就会造成时间的浪费。我们能不能找到一种关系,使得每个合数,只被筛掉一次呢?
线性筛(欧拉筛)
欧拉筛是一种复杂度很低的素数筛选法,原因在于,每一个合数,只被筛选了一次。
void euler_sieve(int n) { //记录当前找到素数的数量 int sum = 0; //flag用来记录第i个数字是否为合数 true为合数 bool flag[MAX]; memset(flag, 0, sizeof(flag)); //primes用来记录每一个找到的素数 int primes[MAX]; memset(primes, 0, sizeof(primes)); for (int i = 2; i <= n; i++) { if (!flag[i]) primes[sum++] = i; for (int j = 0; i * primes[j] <= n; j++) { flag[i * primes[j]] = true; if (i % primes[j] == 0) break; } } }
我们要用到的重要的定理:
[n=Factory_{max} ast P]
上式中,n是一个合数,每一个合数都可以唯一的表示成如上的形式。其中
Factory是除了n以外的n的最大因数,而P满足一下两点:
1. P是一个素数
2. P小于等于Factory的所有因数
综上可知,P就是n的最小质因数。
证明如下:
1.假设P为合数,则P = P1 * P2 * ···· * Pn,其中,P1<P2<····<Pn,且Pi都为质数
因此存在一个F = Fatory * P1为n的因数,且F > Fatory,
所以和Factory是n的最大的因数矛盾,故假设不成立
2.假设P大于Factory的某个因数,不妨设P>P1
因为 Factory = P1 * P2 * ···· * Pn
因此 P * P2 * ··· * Pn 必然大于Factory
所以和Factory是n的最大因数矛盾,故假设不成立
上面的定理就是欧拉筛的原理,我们创建一个数组prime[]来存储目前找到的素数,一个数组flag[]用来标记数字是否为合数(合数为1)。我们每次枚举一个数字i(从2开始枚举),如果这个flag[i] == 0,则i为质数,存入prime。然后把由i和目前已找到的素数相乘得到的合数,标记为1(flag[ i * prime[n]] = 1)。
如何保证prime[n]是i * prime[n] 的最小质因数?
由于任一个数字,都可以表示成有限质数的和,所以当 i % prime[n] == 0,时,可以得出,prime[n]是 i 的一个质因数,同时也是i * prime[n]的质因数,而prime[]数组中的素数,是我们从小到大得出的,此时prime[n]是 i * prime[n]的最小质因数(这部分不容易理解),因此,prime[n+1] 等等都必定不是i * prime[n + 1]的最小质因数。
简单举个例子:
i = 77 = 7 * 11,此时prime[]中已经储存了 3 5 7 9 …等素数
1. prime[1] = 3 ,3满足 i * 3的最小质因数的条件
2.prime[2] = 5,5满足i * 5的最小质因数条件
3.prime[3] = 7,7满足 i * 7的最小质因数条件,但此时 i % 7 == 0,因为 i 的一个质因数也是7
4.prime[4] = 11,此时就不满足 是最小质因数的条件了,i 中有比11更小的因数,因此 i * 11 中也有比11更小的因数。
欧拉筛解释思路借鉴 链接