zoukankan      html  css  js  c++  java
  • unicode 编码表(转)

    Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符, 比如汉字"经"的编码是0x7ECF, 0x7ECF转换成十进制就是32463,UCS-2用两个字节来编码字符, 2的16次方等于65536,所以UCS-2最多能编码65536个字符。编码从0到127的字符与ASCII编码的字符一样,比如字母"a"的Unicode 编码是0x0061,十进制是97,而"a"的ASCII编码是0x61,十进制也是97,对于汉字的编码,事实上Unicode对汉字支持不怎么好,简体和繁体总共有六七万个汉字,而UCS-2最多能表示65536个,才六万多个,所以Unicode只能排除一些几乎不用的汉字,好在常用的简体汉字也不过七千多个,为了能表示所有汉字,Unicode也有UCS-4规范,就是用4个字节来编码字符,不过现在普遍采用的还是UCS-2,只用两个字节来编码。
    汉字Unicode编码的区间为:0x4E00--0x9FA5。
     
     
    汉字编码表 

     U+  0  1  2  3  4  5  6  7  8  9  A  B  C  D  E  F   
    ----------------------------------------------------- 
    4e00 一 丁 丂 七 丄 丅 丆 万 丈 三 上 下 丌 不 与 丏 
    4e10 丐 丑 丒 专 且 丕 世 丗 丘 丙 业 丛 东 丝 丞 丟 
    4e20 丠 両 丢 丣 两 严 並 丧 丨 丩 个 丫 丬 中 丮 丯 
    4e30 丰 丱 串 丳 临 丵 丶 丷 丸 丹 为 主 丼 丽 举 丿 
    4e40 乀 乁 乂 乃 乄 久 乆 乇 么 义 乊 之 乌 乍 乎 乏 
    4e50 乐 乑 乒 乓 乔 乕 乖 乗 乘 乙 乚 乛 乜 九 乞 也 
    4e60 习 乡 乢 乣 乤 乥 书 乧 乨 乩 乪 乫 乬 乭 乮 乯 
    4e70 买 乱 乲 乳 乴 乵 乶 乷 乸 乹 乺 乻 乼 乽 乾 乿 
    4e80 亀 亁 亂 亃 亄 亅 了 亇 予 争 亊 事 二 亍 于 亏 
    4e90 亐 云 互 亓 五 井 亖 亗 亘 亙 亚 些 亜 亝 亞 亟 
    4ea0 亠 亡 亢 亣 交 亥 亦 产 亨 亩 亪 享 京 亭 亮 亯 
    4eb0 亰 亱 亲 亳 亴 亵 亶 亷 亸 亹 人 亻 亼 亽 亾 亿 
    4ec0 什 仁 仂 仃 仄 仅 仆 仇 仈 仉 今 介 仌 仍 从 仏 
    4ed0 仐 仑 仒 仓 仔 仕 他 仗 付 仙 仚 仛 仜 仝 仞 仟 
    4ee0 仠 仡 仢 代 令 以 仦 仧 仨 仩 仪 仫 们 仭 仮 仯 
    4ef0 仰 仱 仲 仳 仴 仵 件 价 仸 仹 仺 任 仼 份 仾 仿 
    4f00 伀 企 伂 伃 伄 伅 伆 伇 伈 伉 伊 伋 伌 伍 伎 伏 
    4f10 伐 休 伒 伓 伔 伕 伖 众 优 伙 会 伛 伜 伝 伞 伟 
    4f20 传 伡 伢 伣 伤 伥 伦 伧 伨 伩 伪 伫 伬 伭 伮 伯 
        
     
    ------------------------------------------------------
     
    3 汉字编码表

     U+  0  1  2  3  4  5  6  7  8  9  A  B  C  D  E  F   
    -----------------------------------------------------   
    4f30 估 伱 伲 伳 伴 伵 伶 伷 伸 伹 伺 伻 似 伽 伾 伿 
    4f40 佀 佁 佂 佃 佄 佅 但 佇 佈 佉 佊 佋 佌 位 低 住 
    4f50 佐 佑 佒 体 佔 何 佖 佗 佘 余 佚 佛 作 佝 佞 佟 
    4f60 你 佡 佢 佣 佤 佥 佦 佧 佨 佩 佪 佫 佬 佭 佮 佯 
    4f70 佰 佱 佲 佳 佴 併 佶 佷 佸 佹 佺 佻 佼 佽 佾 使 
    4f80 侀 侁 侂 侃 侄 侅 來 侇 侈 侉 侊 例 侌 侍 侎 侏 
    4f90 侐 侑 侒 侓 侔 侕 侖 侗 侘 侙 侚 供 侜 依 侞 侟 
    4fa0 侠 価 侢 侣 侤 侥 侦 侧 侨 侩 侪 侫 侬 侭 侮 侯 
    4fb0 侰 侱 侲 侳 侴 侵 侶 侷 侸 侹 侺 侻 侼 侽 侾 便 
    4fc0 俀 俁 係 促 俄 俅 俆 俇 俈 俉 俊 俋 俌 俍 俎 俏 
    4fd0 俐 俑 俒 俓 俔 俕 俖 俗 俘 俙 俚 俛 俜 保 俞 俟 
    4fe0 俠 信 俢 俣 俤 俥 俦 俧 俨 俩 俪 俫 俬 俭 修 俯 
    4ff0 俰 俱 俲 俳 俴 俵 俶 俷 俸 俹 俺 俻 俼 俽 俾 俿 
    5000 倀 倁 倂 倃 倄 倅 倆 倇 倈 倉 倊 個 倌 倍 倎 倏 
    5010 倐 們 倒 倓 倔 倕 倖 倗 倘 候 倚 倛 倜 倝 倞 借 
    5020 倠 倡 倢 倣 値 倥 倦 倧 倨 倩 倪 倫 倬 倭 倮 倯 
    5030 倰 倱 倲 倳 倴 倵 倶 倷 倸 倹 债 倻 值 倽 倾 倿 
    5040 偀 偁 偂 偃 偄 偅 偆 假 偈 偉 偊 偋 偌 偍 偎 偏 
    5050 偐 偑 偒 偓 偔 偕 偖 偗 偘 偙 做 偛 停 偝 偞 偟 
    5060 偠 偡 偢 偣 偤 健 偦 偧 偨 偩 偪 偫 偬 偭 偮 偯 
    5070 偰 偱 偲 偳 側 偵 偶 偷 偸 偹 偺 偻 偼 偽 偾 偿 
        
      【此处略去4-62页的内容】

     
    63 汉字编码表

     U+   0  1  2  3  4  5  6  7  8  9  A  B  C  D  E  F   
    -----------------------------------------------------   
    9e60 鹠 鹡 鹢 鹣 鹤 鹥 鹦 鹧 鹨 鹩 鹪 鹫 鹬 鹭 鹮 鹯 
    9e70 鹰 鹱 鹲 鹳 鹴 鹵 鹶 鹷 鹸 鹹 鹺 鹻 鹼 鹽 鹾 鹿 
    9e80 麀 麁 麂 麃 麄 麅 麆 麇 麈 麉 麊 麋 麌 麍 麎 麏 
    9e90 麐 麑 麒 麓 麔 麕 麖 麗 麘 麙 麚 麛 麜 麝 麞 麟 
    9ea0 麠 麡 麢 麣 麤 麥 麦 麧 麨 麩 麪 麫 麬 麭 麮 麯 
    9eb0 麰 麱 麲 麳 麴 麵 麶 麷 麸 麹 麺 麻 麼 麽 麾 麿 
    9ec0 黀 黁 黂 黃 黄 黅 黆 黇 黈 黉 黊 黋 黌 黍 黎 黏 
    9ed0 黐 黑 黒 黓 黔 黕 黖 黗 默 黙 黚 黛 黜 黝 點 黟 
    9ee0 黠 黡 黢 黣 黤 黥 黦 黧 黨 黩 黪 黫 黬 黭 黮 黯 
    9ef0 黰 黱 黲 黳 黴 黵 黶 黷 黸 黹 黺 黻 黼 黽 黾 黿 
    9f00 鼀 鼁 鼂 鼃 鼄 鼅 鼆 鼇 鼈 鼉 鼊 鼋 鼌 鼍 鼎 鼏 
    9f10 鼐 鼑 鼒 鼓 鼔 鼕 鼖 鼗 鼘 鼙 鼚 鼛 鼜 鼝 鼞 鼟 
    9f20 鼠 鼡 鼢 鼣 鼤 鼥 鼦 鼧 鼨 鼩 鼪 鼫 鼬 鼭 鼮 鼯 
    9f30 鼰 鼱 鼲 鼳 鼴 鼵 鼶 鼷 鼸 鼹 鼺 鼻 鼼 鼽 鼾 鼿 
    9f40 齀 齁 齂 齃 齄 齅 齆 齇 齈 齉 齊 齋 齌 齍 齎 齏 
    9f50 齐 齑 齒 齓 齔 齕 齖 齗 齘 齙 齚 齛 齜 齝 齞 齟 
    9f60 齠 齡 齢 齣 齤 齥 齦 齧 齨 齩 齪 齫 齬 齭 齮 齯 
    9f70 齰 齱 齲 齳 齴 齵 齶 齷 齸 齹 齺 齻 齼 齽 齾 齿 
    9f80 龀 龁 龂 龃 龄 龅 龆 龇 龈 龉 龊 龋 龌 龍 龎 龏 
    9f90 龐 龑 龒 龓 龔 龕 龖 龗 龘 龙 龚 龛 龜 龝 龞 龟 
    9fa0 龠 龡 龢 龣 龤 龥  
      
    ------------------------------------------------------------------

     

     

    附查询Unicode编码的网址:

    http://www.nengcha.com/code/unicode/class/

  • 相关阅读:
    理解字节序(转)
    《逆向分析实战》数据的存储及表示形式
    C语言——内存分配
    C语言编程基础学习字符型数据的ASCII码值为何是负数?
    你知道嵌入式C语言中各变量存储的位置吗?
    stm32入门(从51过渡到32)
    说说M451例程讲解之LED
    说说M451的例程库的说明
    STM32总线结构和存储器
    STM32学习之路入门篇之指令集及cortex——m3的存储系统
  • 原文地址:https://www.cnblogs.com/chenwenbiao/p/2140794.html
Copyright © 2011-2022 走看看