摘要: C实现大整数幂求模问题的两种算法 :分治法和二进制分解法。
难度: 初级
一、 问题描述:
计算 (a^power) % m , 其中power 是非负的大整数, a, m 为大于1 的整数。
二、 问题分析:
很显然, 由于 power 是大整数,因此,必须考虑到幂计算的溢出问题。怎么避免溢出呢? 可以通过降低幂次、逐次取模来实现。一个自然的想法是,将power 分成两个整数之和, power = n1 + n2,则 a^power = (a^n1) * (a^n2) . 通常采用二分法, n1 = n2 或 |n1-n2| = 1 。这就涉及到 (a * b) % m 的计算 。
不难证明: (a * b) % m = ((a % m) * (b % m)) % m。
证明如下: 设 a = pm + r1, b = qm + r2 , 则 r1 = a % m, r2 = b % m ,
则 (a * b) % m = (r1 * r2) % m = ((a % m) * (b % m)) % m. 证毕。
特别地,当 a = b 时, (a^2) % m = ((a % m)^2) % m ; 这是一个简单却又关键性的结论。
三、 算法设计:
算法1: 分治策略:
(1)若power 为奇数: 令 power = 2k+1, k 为非负整数 , 则
a^(2k+1) = (a^k)^2 *a ; a^(2k+1) % m = ((a^k % m)^2 % m * a) % m
(2) 若power 为偶数: 令 power = 2k, k为非负整数, 则
a^(2k) = (a^k)^2 ; a^(2k) % m = (a^k % m)^2 % m
(3) 若power == 1 : 返回 a % m ; 若 power == 0: 返回 1 % m。
据以上(1)/(2)/(3) 条, 即可设计出相应的递归求解程序。时间复杂度为T(n) = T(n/2) + C = O(logn) ,空间复杂度为 O(1), 不足之处在于有一定的递归调用开销。
算法2: 整数的二进制分解
将大整数 power 按照二进制进行分解:
power = a[N] * 2^N + a[N-1] * 2^(N-1) + … + a[1] * 2 + a[0]
其中: a[i] 取值为 0 或 1 ( i=0,1,.., N),则
a^power = a^(a[N] * 2^N) * a^(a[N-1] * 2^(N-1)) * … * a^(a[1] * 2) * a^a[0]
很显然:
(1) 若 a[i] = 0, 则 a[i] * 2^i = 0 , a^(a[i]*2^i) = 1, 该乘积项可以消去;
(2) 若 a[i] = 1, 则 a[i] * 2^i = 2^i , a^(2^i) % m = (a^(2^(i-1)) % m)^2 % m.
令 temp = a^(2^(i-1)) % m , 则 a^(2^i) % m = (temp * temp) % m。
比如, power = 26 = 16 + 8 + 2 = (11010)2, 则 a^26 = a^(2^4 + 2^3 + 2^1);
计算 a^power 实际上是计算 power 的二进制表示中所有位为1对应的乘积项。
(a^26) % m = ((a^16 %m) * (a^8 %m) * (a^2 % m)) %m
而, a^8 % m = ((a^4 %m) × (a^4%m)) % m 是可以用动态规划法逐次求解的。 简单起见, 将 (a^i) % m 称为 “取模乘积项”。
算法描述:
令 temp = a^(2^i) % m , i 是 power 的当前二进制位所对应的位置,
temp 表示 power 的当前二进制位所对应的(取模)乘积项
STEP1: 初始化 temp 为 a % m , result = 1;
STEP2: 对 power 进 行二进制分解。 若 power >=1 , 则进行模2运算:否则转至 STEP3
[1] 若余数为1, 则该位置上的二进制为1, 乘积中需要加入此时的 temp 项 : result = (result * temp) % m;
下一个二进制位对应的乘积项为 temp = (temp * temp) % m
[2] 若余数为0, 则该位置上的二进制为0,乘积中不需要加入 temp 项, result 保持不变,
下一个二进制位对应的乘积项为 temp = (temp * temp) % m
STEP3: 所有的二进制位对应的乘积项都已计算,算法结束。
比如, result = (3^26) % 5 的计算过程如下:26 = (11010)2 ;
(1)初始化: temp = 3^1 % 5 = 3;, result = 1 ;
(2) 检测 26 的最低位二进制为0, 则 不加入乘积项,result = 1, temp =(3^2) % 5 = (temp * temp) % 5 = 4
(3) 检测 26 的次低位二进制为1, 则 加入乘积项, result = (result * temp) % 3 = 4 , temp = (3^4) % 5 = (4*4) % 5 = 1;
(4) 检测 26 的次低位二进制为0, 则 不加入乘积项, result = 4, temp = (3^8) % 5 = (1*1) % 5 = 1;
(5) 检测 26 的次低位二进制为1, 则 加入乘积项, result = (result * temp) % 5 = 4, temp = (3^16) % 5 = 1;
(6) 检测 26 的次低位二进制为1, 则 加入乘积项, result = (result * temp) % 5 = 4, temp = (3^32) % 5 = 1.
由于所有位都检测完毕, 故 3^26 % 5 = 4. 由上可知,
3^26 % 5 = ((3^16) % 5)) * ((3^8) % 5) * ((3^2) % 5) % 5. 其中 3^16 % 5, 3^8 % 5, 3^2 % 5 是通过动态规划法逐渐求得的。
完整的程序如下:
程序在 Ubuntu10.10 gcc4.4.5 环境下编译运行通过。
$ gcc -g -Wall bintmode.c runtime.c -o bintmode # 编译连接
$ bintmode or gdb bintmode # 运行
/* * bintmode.c : 此程序计算 (a^power) % mod. power 是大整数 * 基本公式: (a*b) mod m = ((a mod m) * (b mod m)) mod m */ #include <stdio.h> #include <assert.h> int modMRec(int, int, int); int modMDyn(int, int ,int); void testModMRec(int); void testModMDyn(int); void testValid(int (*fun)(int a, int power, int mode)); void testInvalid(int (*fun)(int a, int power, int mode)); int main() { printf(" ******** 使用递归技术求解: ******** \n"); testValid(modMRec); /* testInvalid(modMRec); */ defRuntime(testModMRec); printf(" ******** 使用二进制分解技术求解: ******** \n"); testValid(modMDyn); /* testInvalid(modMDyn); */ defRuntime(testModMDyn); return 0; } /* * modMRec: 递归求解 (a^power) % mod , power 是个大整数 */ int modMRec(int a, int power, int mod) { assert(a>=1 && power >=0 && mod >=1); if (power == 0) { return 1 % mod; } if (power == 1) { return a % mod; } if (power % 2 != 0) { int temp = modMRec(a, power/2, mod); return (temp * temp * a) % mod; } else { int temp = modMRec(a, power/2, mod); return (temp * temp) % mod; } } /* * modMDyn: 使用二进制分解技术求解 (a^power) % mod , power 是个大整数 */ int modMDyn(int a, int power, int mod) { assert(a>=1 && power >=0 && mod >=1); int result = 1; int temp = a % mod; while (power >= 1) { if (power % 2 != 0) { result = (result * temp) % mod; } temp = (temp * temp) % mod; power /= 2; } return result; } void testValid(int (*fun)(int a, int power, int mode)) { int base[5] = {2,3,5,7,11}; int i,k; for (i=0; i < 5; i++) { for (k = 0; k < 20; k++) { printf("%d ^ %d mod %d = %d .\n", base[i], k, 10, (*fun)(base[i], k, 10)); } } } void testInvalid(int (*fun)(int a, int power, int mode)) { printf("0 ^ 3 mod 5"); (*fun)(0, 3, 5); printf("3 ^ -1 mod 5"); (*fun)(3, -1, 5); printf("3 ^ 5 mod 0"); (*fun)(3, 5, 0); } void testModMRec(int n) { modMRec(2, n, 10); } void testModMDyn(int n) { modMDyn(2, n , 10); } #include <stdio.h> #include <time.h> #define MAX_SCALE 10 long defScale[MAX_SCALE] = {1, 10, 100, 1000, 10000, 100000, 1000000, 10000000, 100000000, 1000000000}; /* runtime: 测量 fun 指向的函数的运行时间 * fun: 指向测试函数的指针 ; * scale: 问题规模数组 */ void runtime(void (*fun)(long scale), long* scale, int len); void defRuntime(void (*fun)(long scale)); void runtime(void (*fun)(long scale), long *scale, int len) { int i; clock_t start, end; for (i = 0; i < len; i++) { start = clock(); (*fun)(scale[i]); end = clock(); printf("scale: %12ld\t run time: %8.4f (ms). \n", scale[i], ((double)(end-start)) * 1000 / CLOCKS_PER_SEC); } } void defRuntime(void (*fun)(long scale)) { runtime(fun, defScale, MAX_SCALE); }
四、总结: 关于科学计算的算法
1. 往往要先查阅相关资料,了解相应的数学性质及结论,并对问题进行化简;例如本例中使用 (a*b)%m = ((a%m)*(b%m))%m 的模性质,避免了乘法溢出的问题。
2. 可以首选分治法和二进制分解法。分治法将所要求解的数值规模减半,而二进制分解则从数值的一个特别角度来寻求问题的解答。