国标二级字库汉字GB内码un码三合一对照表
字王2016版
汉字内码表,是制作字库的基础,简单、便利的版本很少,根据实战经验,特此制作这个三合一版本的汉字、GB内码、Unicode码对照表:
l 提供GB内码、Unicode内码两种不同格式的版本。
l 格式如下:汉字,GB内码、Unicode-16内码;中间用英文逗号符分隔,
l 每行最后的逗号符,并非多于,便于编程、批命令需要,特别是python的list列表导入。
l 国标一二级字库,源自1980年颁布的《信息交换用汉字编码字符集--基本集》,国家标准号为:GB2312-80.
l 国标一级字库3755字,是常用汉字,按拼音排序;二级字库3008字,是非常用汉字,按部首和笔画排序。
l 1975年,根据涵盖数亿、专业汉字频度统计,实际使用汉字数为6335个,其中3000多个汉字累计频度为了99.9%,另外3000多个累计频度不到0.1%,说明了常用汉字与次常用汉字的数量不足7000个,这就为国家制定汉字库标准提供了依据。
l 截图、内码查看,使用的是软件:ultraEdit
字王国标三合一内码对照表,共收录了以下四个内码表格文件:
n 文件:gb7652_un内码版.txt,unicode内码版本,字王增强型汉字内码表,共7652个字符,除国标二级汉字外,还收录了全角/半角英文字母、数字,以及日文、制表符、常用标点符号,和部分增补汉字。
n 文件:gb7652_gb内码版.txt,除内码是GB格式外,内容同上。
n 文件:gb6763k_un内码版.txt,纯国标汉字内码表,共6763个汉字,unicode内码版本。
n 文件:gb6763k_gb内码版.txtt,除内码是GB格式外,内容同上。
【GB内码版本】截图
【Unicode内码版本】截图
注意
l unicode文件,开头两个字符内码是:FF FE,这是unicode文件的识别符号,不是正文
l Unicode内码顺序是反的,截图汉字“啊”的内码是:554A ,在截图中显示的是:4A 55
字王·中国
l 技术Blog:http://blog.sina.com.cn/zbrow
l 网盘下载:http://pan.baidu.com/s/1tY7Wq
l QQ群:124134140 (字王云字库&zwPython,字王项目,唯一互动平台)
l 字王Git项目总览:https://github.com/ziwang-com/,