Description:
Decode the message.
You intercept the following message, which you know has been encoded using the modulus
m = 956331992007843552652604425031376690367 and exponent e = 12398737.
Break the code and decipher the message.
821566670681253393182493050080875560504,
87074173129046399720949786958511391052,
552100909946781566365272088688468880029,
491078995197839451033115784866534122828,
172219665767314444215921020847762293421.
Answer:
1、观察到模数m比较小,使用sage 可以轻松做分解质因数的运算:prime_divisors(956331992007843552652604425031376690367)
提醒:sage还提供另外的方法直接求欧拉函数(因为求出p和q也就是为了求欧拉函数):euler_phi(956331992007843552652604425031376690367)
2、此时得到:
n = 956331992007843552652604425031376690367
p = 7746289204980135457
q = 123456789012345681631
fn = (p-1)*(q-1) = 956331992007843552521401346814050873280
e = 12398737
这是需要计算用扩展欧几里得算法计算e的乘法逆元d,使用sage 依然可以轻松做扩展欧几里得算法:r,x,d = xgcd(fn,e),此时得到的d为负数,根据模运算的性质,d = d + fn。[-x ≡ n-x (mod n)]
得到d = 801756262003467870842260800571951669873
提醒:为了求乘法逆元d,sage还有更直接的方法: inverse_mod(e,fn)
3、解密阶段。运用快速幂取模算法可以高效求出 M = C^d % n.得到的明文如下:
30181514191616152815243012281124131815
29251611281930182315301913281526221915
14301815232513213031283022151123121930
19252414192930281113301925243117221916
19131130192524112414141528192919252434
4、为了解密信息,理应考虑如何将数字串转换为符号串。显然无论如何划分,数字都是十进制,若根据现有的编码方式,应该把十进制转换为二进制数进行编码。以下是我尝试的过程:
(1) Ascii码:Ascii码范围是[0x0, 0x7f],即[0, 127]。先看第一个串,划分显然是30, 18,… ,会出现不可打印字符,不可行。
(2) Unicode码:汉字字符集的范围是[0x4e00, 0x9fa5],即[19968, 40896]。先看第一个串,划分显然为30181, 51419,…,第二个划分会超出范围,不可行(英文字母的范围与Ascii码相同)。
当然还有其他很多种编码方式,但是做到这里就不应该再尝试下去了。理由如下:回到问题本身,我们要传输的是信息,是英文或汉字。我相信应该优先考虑信息是英文,因为如果信息是汉字而又不采用Unicode,采用GBK等其他编码方式,问题就过于复杂,偏离了问题本身关注的RSA,当然也有可能存在这种可能性,留作其他方式都不行再尝试。[另外一个不靠谱的根据是题目本身是英文题目:-) ]
基于这个假设,重新看看Ascii码。原因是转换后存在不可打印字符。那么不存在不可打印字符就行了,也就是说只有26个英文字母(忽略大小写)的26个映射。可以假设这里是一种新的简单的编码方式,只存在26种映射。(http://www.cfca.com.cn/zhishi/wz-012.htm 网上就有一个简单的实例来说明RSA算法,它就用到一个简单的映射01-a, 02-b, … , 26-z.)
受此启发,我将数字串分为两个数字为一组,得到如下序列:
30, 18, 15, 14, 19, 16, 16, 15, 28, 15, 24, 30, 12, 28, 11, 24, 13, 18, 15
29, 25, 16, 11, 28, 19, 30, 18, 23, 15, 30, 19, 13, 28, 15, 26, 22, 19, 15
14, 30, 18, 15, 23, 25, 13, 21, 30, 31, 28, 30, 22, 15, 11, 23, 12, 19, 30
19, 25, 24, 14, 19, 29, 30, 28, 11, 13, 30, 19, 25, 24, 31, 17, 22, 19, 16
19, 13, 11, 30, 19, 25, 24, 11, 24, 14, 14, 15, 28, 19, 29, 19, 25, 24, 34
不难观察到,所有数字的范围都在[11, 34]。可以猜测a-10或a-11
当a-10时,得到以下序列:
uifejggfsfoucsbodiftpgbsjuinfujdsfqmjfeuifnpdluvsumfbncjujpoejtusbdujpovhmjgjdbujpoboeefsjtjpoy
不能得到有含义的英文信息。
当a-11时,得到以下序列:
thedifferentbranchesofarithmeticrepliedthemockturtleambitiondistractionuglificationandderisionx
简单划分后得到:the different branches of arithmetic replied the mock turtle ambition distraction uglification and derision x
猜测最后那个x的出现可能只是用作填充,即The different branches of arithmetic replied the mock turtle, ambition, distraction, uglification and derision.
出处:(The Mock Turtle's Story, Alice's Adventures in Wonderland, by Lewis Carroll)《爱丽丝梦游仙境》
到这里可以肯定以上假设都正确。解密完毕。