特定的文字必然对应着固定的二进制,否则在转换时将发生混乱。那么,怎样将文字与二进制对应起来呢?这就需要有一套规范,计算机公司和软件开发者都必须遵循。这样的一套规范就成为字符集(Character Set)或者字符编码(Character Encoding)。
严格来说,字符集和字符编码不是一个概念,字符集定义了文字和二进制的对应关系,为字符分配了唯一的编号,而字符编码规定了如何将文字的编号存储到计算机中。我们暂时先不讨论这些细节,姑且认为他们是一个概念,本节中我也混用了这两个概念,未做区分。
字符集为每个字符分配一个唯一的编码,类似于学生的学号,通过编码就能找到对应的字符。
可以将字符集理解成一个很大的表格,它列出了所有字符和二进制的对应关系,计算机显示文字或者存储文字,就是一个查表的过程。
ASCLL编码和C语言
C语言中有时候使用ASCLL编码,有时候却不是,而是使用GBK编码和Unicode字符集。