问题
考虑下面的01串序列:
0, 00, 01, 10, 00, 001, 010, 011, 100, 101, 110, 0000, 0001, ……, 1101, 1110, 00000, ……
- 首先是长度为1的串,然后是长度为2的串,依次推类。如果看成二进制,相同长度的后一个串等于前一个串加1。上述序列中不存在全为1的串;
- 编写一个解码程序。首先输入一个编码头(例如 AB#TANCnrtXc), 则上述序列的每个串依次对应编码头的每个字符。例如0对应A,00对应B,01对应#,……;
- 接下来是编码文本(可能由多行组成,你应当把它们拼成一个长度的01串);
- 编码文本由多个小节组成,每个小节的前3个数字代表小节中每个编码的长度(用二进制表示,例如010代表长度为2),然后是各个字符的编码,以全1结束。编码文本以编码长度为000的小节结束;
例如
编码头:$#**
编码文本:0100000101101100011100101000
解码: 010(编码长度为2)
00(#)
00(#)
10(*)
11(小节结束)
011(编码长度为3)
000()
111(小节结束)
001(编码长度为1)
0($)
1(小节结束)
000(编码结束)
分析
使用二进制,不必以字符串的形式保存编码,只需要把编码理解成二进制,用
(len,value)
这个二元组来表示一个编码;其中
len
是编码长度,value
是编码对应的十进制值,用codes[len][value]
来保存编码所对应的字符;
代码
#include<stdio.h>
#include<string.h>
int readchar() {
for(;;) {
int ch=getchar();
if(ch != '
' && ch != '
') return ch; // 一直读到非换行符为止
}
}
int readint(int c) { //将二进制C转换为十进制数
int v = 0;
while(c--) {
v = v*2 + readchar() - '0';
}
return v;
}
int code[8][1<<8]; //设置编码头数组,首下标代表示例序列中每个元素的数字个数,尾下标代表在这一列中的字符序号,用位运算表示
int readcodes() { //生成编码数组
memset(code, 0, sizeof(code));// 清空数组
code[1][0]=readchar(); //直接调到下一行开始读取。如果输入已经结束,会读到EOF
for(int len = 2;len<=7;len++) {
for(int i=0;i<(1<<len)-1;i++) {
int ch=getchar();
if(ch==EOF) return 0;
if(ch=='
' || ch=='
') return 1;
code[len][i]=ch;
}
}
return 1;
}
void printcodes() { // 输出调试用
for(int len=1;len<=7;len++) {
for(int i=0;i<(1<<len)-1;i++){
if(code[len][i]==0) return;
printf("code[%d][%d]=%c
",len,i,code[len][i]);
}
}
}
int main() {
while(readcodes()) { // 无法读取更多便码头时退出
printcodes();
for(;;) {
int len = readint(3);
if(len == 0) break;
// printf("len=%d
",len);
for(;;) {
int v=readint(len);
// printf("v=%d
",v);
if(v == (1 <<len) - 1) break;
putchar(code[len][v]);
}
}
putchar('
');
}
return 0;
}