zoukankan      html  css  js  c++  java
  • 质因数分解的rho以及miller-rabin

    一、前言

       质因数分解,是一个在算法竞赛里老生常谈的经典问题。我们在解决许多问题的时候需要用到质因数分解来辅助运算,而且质因数分解牵扯到许许多多经典高效的算法,例如miller-rabin判断素数算法,rho启发式搜索质因数分解算法等。在此文里,我要介绍的就是miller-rabin算法以及rho启发式搜索分解算法。

    二、算术基本定理

       首先,我们得知道,任意一个大于1的自然数都可以分解为有限个质数的乘积。这里因子均为质数,且为正整数。我们把这样的分解成为N的标准分解式。关于算数基本定理的应用有许多,例如可以证明素数无限,定义god,lcm等,在此不一一赘述。有了算数基本定理,我们可以发现计算数论函数,约数和等都是十分方便的,这大大的方便了我们的解题。接下来我们介绍如何来分解质因数。

    三、质因数分解的算法

    所谓质因数,是某自然数的因素而且这个因素还得是质数。

    我们不难想到基本的枚举,即暴力枚举1~n所有数,判断是否能够被n整除且该数是否为质数。大概代码如下:

    For i:=1 to n do 

      If n mod i=0 then 

       If check(i) then  //check为检验i是否为质数的子函数,返回值为boolean

        Writeln(i);

     

    Function check(n:longint):boolean;

    Var i:longint;

    begin

       For i:=2 to n do 

    If n mod i=0 then exit(false); //如果一旦有比它小的数除他为0,那么该数不为质数

         Exit(true); //否则显然为质数

    End;

     

      这个是最朴素的方法,虽然代码简洁思路简单,但是时间复杂度实在是太高了。

    于是我们有了优化1,我们发现判断一个数是否为素数只需枚举到sqrt(i),为何呢?因为一个数若不是素数,那么它必定是两个数的乘积,这两个数显然有一个小于等于sqrt(i),否则sqr(sqrt(i))=i,那么显然为质数。

    Function check(n:longint):boolean;

    Var i:longint;

    Begin 

    For i:=2 to sqrt(n) do  If n mod i=0 then exit(false);

    Exit(true);

    End;

    但是我们发现时间复杂度还是比较高O(sqrt(n)*n)

    于是我们有了优化2。我们不暴力判断n的每个因素,而是不断去试除。

    何谓试除?设x是n的质因数,我们在分解的过程中每找到一个x就把它记录下来,并且让n:=n div x;那么我们在遇见x的倍数时,显然不可能会再有x的倍数了。那么我们就能通过“类似筛法”的思想,在O(sqrt(n))时间内,对n进行质因数分解,这也是现在比较常用的方法。

    I:=2;

    While n<>1 do 

    Begin

    While n mod i=0 do 

    Begin

    Writeln(i);

    N:=n div i;

    End;

    Inc(i);

    End;

    我们在不断的div i中,我们把i的所有存在于n的因素里的倍数全部给丢掉了。

    (即,n=12时,n=2*2*3=3*4 那么我们在i=2的时候,把4给筛掉了。)

    在这里,我们发现每个i都会是质数,即i的变化总是2→3→5→7.......

    于是我们有了优化3。如果我们能预先存储不大于sqrt(n)的所有质数,我们就可以快速调用了,不要小看这个优化,在n的质因数比较大的时候,O(n)的线性时间是我们耗费不起的。先来说下筛法(摘自百度百科)

    用筛法求素数的基本思想是:把从1开始的、某一范围内的正整数从小到大顺序排列, 1不是素数,首先把它筛掉。剩下的数中选择最小的数是素数,然后去掉它的倍数。依次类推,直到筛子为空时结束。如有:

    1 2 3 4 5 6 7 8 9 10

    11 12 13 14 15 16 17 18 19 20

    21 22 23 24 25 26 27 28 29 30

    1不是素数,去掉。剩下的数中2最小,是素数,去掉2的倍数,余下的数是:

    3 5 7 9 11 13 15 17 19 21 23 25 27 29

    剩下的数中3最小,是素数,去掉3的倍数,如此下去直到所有的数都被筛完,求出的素数为:

    2 3 5 7 11 13 17 19 23 29

     

    procedure get(n:longint);  //Get函数为利用筛法求素数

    var maxfactor,newp:longint;

    begin

      maxfactor:=trunc(sqrt(n));

      fillchar(hash,sizeof(hash),true);

      for i:=2 to maxfactor do

        if hash[i] then

          begin

            newp:=i shl 1;  //等价于newp:=i*2;

            while newp<n do

               begin

                 hash[newp]:=false;

                 inc(newp,i);

               end;

          end;

        hash[1]:=false;

      for i:=2 to n do

        if hash[i] then

          begin

            inc(sushut);

            sushu[sushut]:=i;

          end;

    end;

     

    procedure solve(n:longint);   inline;

    var i:longint;

    begin

      i:=1;

      while sushu[i]<=n do

            begin

                    tot:=0;

                    if sushu[i]=0 then break;

                    while n mod sushu[i]=0 do

                            begin

                              n:=n div sushu[i];

                              inc(tot);

                              if tot=1 then

                               begin

                                  inc(ans);

                                  sum[ans].number:=sushu[i];

                               end;

                              sum[ans].k:=tot;

                            end;

                    if sushu[i]=2 then fuck:=tot;

                    inc(i);

            end;

    end;

     

    可是这样的复杂度在n为超大整数类型且素因子十分大的时候也无能为力了,不仅会MLE,更会TLE。那么,我们来说一下这次的重头戏,也就是rho分解大法。

    我们必须知道Fermat分解:

         首先,对于任意的一个偶数,我们都可以提取出一个2的质因子,如果结果仍为偶数,则可继续该操作,直至将其化为一个奇数和2的多少次幂的乘积,那么我们可以假定这个奇数可以被表示成2*N+1,如果这个数是合数,那么一定可以写成N=c*d的形式,不难发现,式中的c和d都是奇数,不妨设c>d,我们可以令a=(c+d)/2,b=(c-d)/2,那么的可以得到N=a*a-b*b,而这正是Fermat整数分解的基础;由不等式的关系,我们又可以得到a>=sqrt(c*d)=sqrt(N),那么,我们就可以枚举大于N的完全平方数a*a,计算a*a-N的值,判断计算的结果是否为一个完全平方数,如果是,那么a,b都是N的因子,我们就可以将算法递归的进行下去,知道求出N的所有质因子。容易看出,Fermat分解大数的效率其实并不高,但是比起试除法要好了很多;而且每次的计算都是计算出N的一个因子,更加降低了其效率。这就让我们想着去尝试新的算法,那就是Pollard rho算法。

          Pollard rho算法的原理就是通过某种方法得到两个整数a和b,而待分解的大整数为n,计算p=gcd(a-b,n),直到p不为1,或者a,b出现循环为止。然后再判断p是否为n,如果p=n成立,那么返回n是一个质数,否则返回p是n的一个因子,那么我们又可以递归的计算Pollard(p)和Pollard(n/p),这样,我们就可以求出n的所有质因子。

       具体操作中,我们通常使用函数x2=x1*x1+c来计算逐步迭代计算a和b的值,实践中,通常取c为1,即b=a*a+1,在下一次计算中,将b的值赋给a,再次使用上式来计算新的b的值,当a,b出现循环时,即可退出进行判断。

      在实际计算中,a和b的值最终肯定一出现一个循环,而将这些值用光滑的曲线连接起来的话,可以近似的看成是一个ρ型的。

         对于Pollard rho,它可以在O(sqrt(p))的时间复杂度内找到n的一个小因子p,可见效率还是可以的,但是对于一个因子很少、因子值很大的大整数n来说,Pollard rho算法的效率仍然不是很好,那么,我们还得寻找更加的方法了。

    有了上述预备知识还不够,我们还得知道miller-robin素性检验。

    根据费马小定理,

    若n是一个奇素数,a是任何整数(1≤ a≤n-1) ,则 a^(n-1)≡1(mod n)。

    miller-robin的理论基础:

    如果n是一个奇素数, 将n-1表示成2^s*r的形式(r是奇 数),a 是和n互素的任何整数, 那么ar≡1(mod n) 或者对某个j(0≤j ≤s -1, j∈Z) 等式 a2jr ≡-1(mod n)成立。 这个理论是通过一个事实经由Fermat定理推导而来: n是一个奇素数,则方程x2 ≡ 1 mod n只有±1两个解。

    注意,miller-rabin算法只是一种素性判断的概率算法,关于miller-rabin,pascal贴吧里应该有相关的帖子介绍,而miller-rabin的判断错误的概率是相当低的,(0.25)^t,t为素性测试的轮数。Miller-rabin算法在Int64范围内无法解决的强伪素数特殊判断一下即可。

    接下来我们上代码:(我没找到Pas的,于是自己写了一份很丑的Pas代码,大神勿喷)

    const count=10;

          pri:array [0..10] of longint=(2,3,5,7,11,13,17,19,23,29,31);

     

     

    var n,total:int64;

        i:longint;

        ans:array [0..10000] of int64;

     

    function multi(a,b,m:int64):int64;

    //考虑到64位二进制数能表示的范围,只需取前9个素数为基

    var ans:int64;

    begin

      ans:=0;

      a:=a mod m;

      while b<>0 do

        begin

          if (b and 1)=1 then

            begin

              ans:=(ans+a) mod m;

              dec(b);

            end;

          b:=b>>1;

          a:=(a+a) mod m;

        end;

      exit(ans);

    end;

     

    function gcd(x,y:int64):int64;

    begin

      if x mod y=0 then

        exit(y)

      else exit(gcd(y,x mod y));

    end;

     

    function quick_mod(a,b,m:int64):int64;

    var ans:int64;

    begin

            ans:=1; a:=a mod m;

            while b<>0 do

                    begin

                            if (b and 1)=1 then

                                    begin

                                            ans:=multi(ans,a,m);

                                            dec(b);

                                    end;

                            b:=b>>1;

                            a:=multi(a,a,m);

                    end;

            exit(ans);

    end;

     

    function prime(n:int64):boolean;

    var m,k,a,x,y:int64; i,j:longint;

    begin

      if n=2 then exit(true);

      if (n<2) or ((n and 1)=0) then exit(false);

      m:=n-1; k:=0;

      while (m and 1)=0 do

            begin

                    inc(k);

                    m:=m>>1;

            end;

      randomize;

      for i:=0 to count do

            begin

              a:=random(n) mod (n-1)+1;

              x:=quick_mod(a,m,n);

              y:=0;

              for j:=0 to k-1 do

                    begin

                            y:=multi(x,x,n);

                            if (y=1) and (x<>1) and (x<>n-1) then exit(false);

                            x:=y;

                    end;

              if y<>1 then exit(false);

            end;

      exit(true);

    end;

     

     

    function pollard_rho(n,c:int64):int64;

    var i,k,x,y,d:int64;

    begin

      i:=1; k:=2;

      randomize;

      x:=random(n) mod (n-1)+1;

      y:=x;

      while true do

        begin

          inc(i);

          x:=(multi(x,x,n)+c) mod n;

          d:=gcd(y-x,n);

          if (d>1) and (d<n) then exit(d);

          if (x=y) then exit(n);

          if (i=k) then

            begin

             y:=x;

             k:=k<<1;

            end;

        end;

    end;

     

    procedure find(n,c:int64);

    var p,k:int64;

    begin

      if n=1 then exit;

      if prime(n) then

        begin

          inc(total);

          ans[total]:=n;

          exit;

        end

      else

        begin

          p:=n;

          k:=c;

          randomize;

          while p>=n do

            begin

                  p:=pollard_rho(p,c);

                  dec(c);

            end;

          find(p,k);

          find(n div p,k);

        end;

    end;

     

    begin

      read(n);

      find(n,120);

      for i:=1 to total do

      writeln(ans[i]);

    end.

     

    至此,我们在Int64范围内解决了质因数分解的若干问题。

     

  • 相关阅读:
    [模仿]Google Doodles 的春分和秋分
    [模仿]canvas视频拼图
    SQL--from w3c school
    txt文件导入mysql
    公益图书馆-基本环境搭建及代码规范
    IP地址
    Android基础_1
    Android_输入输出流
    设计模式(2):观察者模式-2 (委托、事件)
    小张日记 一 正式场合说话要正式
  • 原文地址:https://www.cnblogs.com/logichandsome/p/4054543.html
Copyright © 2011-2022 走看看