zoukankan      html  css  js  c++  java
  • 【Unicode编码表】UniCode编码表+转化器

    UniCode编码表【转载:https://www.cnblogs.com/csguo/p/7401874.html

    Unicode编码则是采用双字节16位来进行编号,可编65536字符,基本上包含了世界上所有的语言字符,它也就成为了全世界一种通用的编码,而且用十六进制4位表示一个编码,非常简结直观,为大多数开发者所接受,特别是十六进制编码后,可以解决汉字在js再编码过程中出现乱码问题,提高解释速度,我们建议在js脚本中使用十六进制unicode编码。

    UniCode汉字转换,网上很多,但相对比较好使的比较少,大都写法一样,转换的效果差别不大,或多或少有些遗憾,我这找到个相对较好的,能直接转换标点符号的转换器。

    地址:http://javawind.net/tools/native2ascii.jsp?action=transform

    【Unicode 码表】

    0000-007F:C0控制符及基本拉丁文 (C0 Control and Basic Latin)
    0080-00FF:C1控制符及拉丁文补充-1 (C1 Control and Latin 1 Supplement) 
    0100-017F:拉丁文扩展-A (Latin Extended-A) 
    0180-024F:拉丁文扩展-B (Latin Extended-B) 
    0250-02AF:国际音标扩展 (IPA Extensions) 
    02B0-02FF:空白修饰字母 (Spacing Modifiers) 
    0300-036F:结合用读音符号 (Combining Diacritics Marks) 
    0370-03FF:希腊文及科普特文 (Greek and Coptic) 
    0400-04FF:西里尔字母 (Cyrillic) 
    0500-052F:西里尔字母补充 (Cyrillic Supplement) 
    0530-058F:亚美尼亚语 (Armenian) 
    0590-05FF:希伯来文 (Hebrew) 
    0600-06FF:阿拉伯文 (Arabic) 
    0700-074F:叙利亚文 (Syriac) 
    0750-077F:阿拉伯文补充 (Arabic Supplement) 
    0780-07BF:马尔代夫语 (Thaana) 
    07C0-077F:西非書面語言 (N'Ko) 
    0800-085F:阿维斯塔语及巴列维语 (Avestan and Pahlavi) 
    0860-087F:Mandaic 
    0880-08AF:撒马利亚语 (Samaritan) 
    0900-097F:天城文书 (Devanagari) 
    0980-09FF:孟加拉语 (Bengali) 
    0A00-0A7F:锡克教文 (Gurmukhi) 
    0A80-0AFF:古吉拉特文 (Gujarati) 
    0B00-0B7F:奥里亚文 (Oriya) 
    0B80-0BFF:泰米尔文 (Tamil) 
    0C00-0C7F:泰卢固文 (Telugu) 
    0C80-0CFF:卡纳达文 (Kannada) 
    0D00-0D7F:德拉维族语 (Malayalam) 
    0D80-0DFF:僧伽罗语 (Sinhala) 
    0E00-0E7F:泰文 (Thai) 
    0E80-0EFF:老挝文 (Lao) 
    0F00-0FFF:藏文 (Tibetan) 
    1000-109F:缅甸语 (Myanmar) 
    10A0-10FF:格鲁吉亚语 (Georgian) 
    1100-11FF:朝鲜文 (Hangul Jamo) 
    1200-137F:埃塞俄比亚语 (Ethiopic) 
    1380-139F:埃塞俄比亚语补充 (Ethiopic Supplement) 
    13A0-13FF:切罗基语 (Cherokee) 
    1400-167F:统一加拿大土著语音节 (Unified Canadian Aboriginal Syllabics) 
    1680-169F:欧甘字母 (Ogham) 
    16A0-16FF:如尼文 (Runic) 
    1700-171F:塔加拉语 (Tagalog) 
    1720-173F:Hanunóo 
    1740-175F:Buhid 
    1760-177F:Tagbanwa 
    1780-17FF:高棉语 (Khmer) 
    1800-18AF:蒙古文 (Mongolian) 
    18B0-18FF:Cham 
    1900-194F:Limbu 
    1950-197F:德宏泰语 (Tai Le) 
    1980-19DF:新傣仂语 (New Tai Lue) 
    19E0-19FF:高棉语记号 (Kmer Symbols) 
    1A00-1A1F:Buginese 
    1A20-1A5F:Batak 
    1A80-1AEF:Lanna 
    1B00-1B7F:巴厘语 (Balinese) 
    1B80-1BB0:巽他语 (Sundanese) 
    1BC0-1BFF:Pahawh Hmong 
    1C00-1C4F:雷布查语(Lepcha) 
    1C50-1C7F:Ol Chiki 
    1C80-1CDF:曼尼普尔语 (Meithei/Manipuri) 
    1D00-1D7F:语音学扩展 (Phonetic Extensions) 
    1D80-1DBF:语音学扩展补充 (Phonetic Extensions Supplement) 
    1DC0-1DFF:结合用读音符号补充 (Combining Diacritics Marks Supplement) 
    1E00-1EFF:拉丁文扩充附加 (Latin Extended Additional) 
    1F00-1FFF:希腊语扩充 (Greek Extended) 
    2000-206F:常用标点 (General Punctuation) 
    2070-209F:上标及下标 (Superscripts and Subscripts) 
    20A0-20CF:货币符号 (Currency Symbols) 
    20D0-20FF:组合用记号 (Combining Diacritics Marks for Symbols) 
    2100-214F:字母式符号 (Letterlike Symbols) 
    2150-218F:数字形式 (Number Form) 
    2190-21FF:箭头 (Arrows) 
    2200-22FF:数学运算符 (Mathematical Operator) 
    2300-23FF:杂项工业符号 (Miscellaneous Technical) 
    2400-243F:控制图片 (Control Pictures) 
    2440-245F:光学识别符 (Optical Character Recognition) 
    2460-24FF:封闭式字母数字 (Enclosed Alphanumerics) 
    2500-257F:制表符 (Box Drawing) 
    2580-259F:方块元素 (Block Element) 
    25A0-25FF:几何图形 (Geometric Shapes) 
    2600-26FF:杂项符号 (Miscellaneous Symbols) 
    2700-27BF:印刷符号 (Dingbats) 
    27C0-27EF:杂项数学符号-A (Miscellaneous Mathematical Symbols-A) 
    27F0-27FF:追加箭头-A (Supplemental Arrows-A) 
    2800-28FF:盲文点字模型 (Braille Patterns) 
    2900-297F:追加箭头-B (Supplemental Arrows-B) 
    2980-29FF:杂项数学符号-B (Miscellaneous Mathematical Symbols-B) 
    2A00-2AFF:追加数学运算符 (Supplemental Mathematical Operator) 
    2B00-2BFF:杂项符号和箭头 (Miscellaneous Symbols and Arrows) 
    2C00-2C5F:格拉哥里字母 (Glagolitic) 
    2C60-2C7F:拉丁文扩展-C (Latin Extended-C) 
    2C80-2CFF:古埃及语 (Coptic) 
    2D00-2D2F:格鲁吉亚语补充 (Georgian Supplement) 
    2D30-2D7F:提非纳文 (Tifinagh) 
    2D80-2DDF:埃塞俄比亚语扩展 (Ethiopic Extended) 
    2E00-2E7F:追加标点 (Supplemental Punctuation) 
    2E80-2EFF:CJK 部首补充 (CJK Radicals Supplement) 
    2F00-2FDF:康熙字典部首 (Kangxi Radicals) 
    2FF0-2FFF:表意文字描述符 (Ideographic Description Characters) 
    3000-303F:CJK 符号和标点 (CJK Symbols and Punctuation) 
    3040-309F:日文平假名 (Hiragana) 
    30A0-30FF:日文片假名 (Katakana) 
    3100-312F:注音字母 (Bopomofo) 
    3130-318F:朝鲜文兼容字母 (Hangul Compatibility Jamo) 
    3190-319F:象形字注释标志 (Kanbun) 
    31A0-31BF:注音字母扩展 (Bopomofo Extended) 
    31C0-31EF:CJK 笔画 (CJK Strokes) 
    31F0-31FF:日文片假名语音扩展 (Katakana Phonetic Extensions) 
    3200-32FF:封闭式 CJK 文字和月份 (Enclosed CJK Letters and Months) 
    3300-33FF:CJK 兼容 (CJK Compatibility) 
    3400-4DBF:CJK 统一表意符号扩展 A (CJK Unified Ideographs Extension A) 
    4DC0-4DFF:易经六十四卦符号 (Yijing Hexagrams Symbols) 
    4E00-9FBF:CJK 统一表意符号 (CJK Unified Ideographs) 
    A000-A48F:彝文音节 (Yi Syllables) 
    A490-A4CF:彝文字根 (Yi Radicals) 
    A500-A61F:Vai 
    A660-A6FF:统一加拿大土著语音节补充 (Unified Canadian Aboriginal Syllabics Supplement) 
    A700-A71F:声调修饰字母 (Modifier Tone Letters) 
    A720-A7FF:拉丁文扩展-D (Latin Extended-D) 
    A800-A82F:Syloti Nagri 
    A840-A87F:八思巴字 (Phags-pa) 
    A880-A8DF:Saurashtra 
    A900-A97F:爪哇语 (Javanese) 
    A980-A9DF:Chakma 
    AA00-AA3F:Varang Kshiti 
    AA40-AA6F:Sorang Sompeng 
    AA80-AADF:Newari 
    AB00-AB5F:越南傣语 (Vi?t Thái) 
    AB80-ABA0:Kayah Li 
    AC00-D7AF:朝鲜文音节 (Hangul Syllables) 
    D800-DBFF:High-half zone of UTF-16 
    DC00-DFFF:Low-half zone of UTF-16 
    E000-F8FF:自行使用區域 (Private Use Zone) 
    F900-FAFF:CJK 兼容象形文字 (CJK Compatibility Ideographs) 
    FB00-FB4F:字母表達形式 (Alphabetic Presentation Form) 
    FB50-FDFF:阿拉伯表達形式A (Arabic Presentation Form-A) 
    FE00-FE0F:变量选择符 (Variation Selector) 
    FE10-FE1F:竖排形式 (Vertical Forms) 
    FE20-FE2F:组合用半符号 (Combining Half Marks) 
    FE30-FE4F:CJK 兼容形式 (CJK Compatibility Forms) 
    FE50-FE6F:小型变体形式 (Small Form Variants) 
    FE70-FEFF:阿拉伯表達形式B (Arabic Presentation Form-B) 
    FF00-FFEF:半型及全型形式 (Halfwidth and Fullwidth Form) 
    FFF0-FFFF:特殊 (Specials)
    U+0123456789ABCDEF
    0000 NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
    0010 DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
    0020   ! " # $ % & ' ( ) * + , - . /
    0030 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
    0040 @ A B C D E F G H I J K L M N O
    0050 P Q R S T U V W X Y Z [ ] ^ _
    0060 ` a b c d e f g h i j k l m n o
    0070 p q r s t u v w x y z { | } ~ DEL
    0080 PAD HOP BPH NBH IND NEL SSA ESA HTS HTJ VTS PLD PLU RI SS2 SS3
    0090 DCS PU1 PU2 STS CCH MW SPA EPA SOS SGCI SCI CSI ST OSC PM APC
    00A0 NBSP ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ SHY ® ¯
    00B0 ° ± ² ³ ´ µ · ¸ ¹ º » ¼ ½ ¾ ¿
    00C0 À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
    00D0 Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
    00E0 à á â ã ä å æ ç è é ê ë ì í î ï
    00F0 ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ
    U+0123456789ABCDEF
    0100 Ā ā Ă ă Ą ą Ć ć Ĉ ĉ Ċ ċ Č č Ď ď
    0110 Đ đ Ē ē Ĕ ĕ Ė ė Ę ę Ě ě Ĝ ĝ Ğ ğ
    0120 Ġ ġ Ģ ģ Ĥ ĥ Ħ ħ Ĩ ĩ Ī ī Ĭ ĭ Į į
    0130 İ ı IJ ij Ĵ ĵ Ķ ķ ĸ Ĺ ĺ Ļ ļ Ľ ľ Ŀ
    0140 ŀ Ł ł Ń ń Ņ ņ Ň ň ʼn Ŋ ŋ Ō ō Ŏ ŏ
    0150 Ő ő Œ œ Ŕ ŕ Ŗ ŗ Ř ř Ś ś Ŝ ŝ Ş ş
    0160 Š š Ţ ţ Ť ť Ŧ ŧ Ũ ũ Ū ū Ŭ ŭ Ů ů
    0170 Ű ű Ų ų Ŵ ŵ Ŷ ŷ Ÿ Ź ź Ż ż Ž ž ſ
    0180 ƀ Ɓ Ƃ ƃ Ƅ ƅ Ɔ Ƈ ƈ Ɖ Ɗ Ƌ ƌ ƍ Ǝ Ə
    0190 Ɛ Ƒ ƒ Ɠ Ɣ ƕ Ɩ Ɨ Ƙ ƙ ƚ ƛ Ɯ Ɲ ƞ Ɵ
    01A0 Ơ ơ Ƣ ƣ Ƥ ƥ Ʀ Ƨ ƨ Ʃ ƪ ƫ Ƭ ƭ Ʈ Ư
    01B0 ư Ʊ Ʋ Ƴ ƴ Ƶ ƶ Ʒ Ƹ ƹ ƺ ƻ Ƽ ƽ ƾ ƿ
    01C0 ǀ ǁ ǂ ǃ DŽ Dž dž LJ Lj lj NJ Nj nj Ǎ ǎ Ǐ
    01D0 ǐ Ǒ ǒ Ǔ ǔ Ǖ ǖ Ǘ ǘ Ǚ ǚ Ǜ ǜ ǝ Ǟ ǟ
    01E0 Ǡ ǡ Ǣ ǣ Ǥ ǥ Ǧ ǧ Ǩ ǩ Ǫ ǫ Ǭ ǭ Ǯ ǯ
    01F0 ǰ DZ Dz dz Ǵ ǵ Ƕ Ƿ Ǹ ǹ Ǻ ǻ Ǽ ǽ Ǿ ǿ
    U+0123456789ABCDEF
    0200 Ȁ ȁ Ȃ ȃ Ȅ ȅ Ȇ ȇ Ȉ ȉ Ȋ ȋ Ȍ ȍ Ȏ ȏ
    0210 Ȑ ȑ Ȓ ȓ Ȕ ȕ Ȗ ȗ Ș ș Ț ț Ȝ ȝ Ȟ ȟ
    0220 Ƞ ȡ Ȣ ȣ Ȥ ȥ Ȧ ȧ Ȩ ȩ Ȫ ȫ Ȭ ȭ Ȯ ȯ
    0230 Ȱ ȱ Ȳ ȳ ȴ ȵ ȶ ȷ ȸ ȹ Ⱥ Ȼ ȼ Ƚ Ⱦ ȿ
    0240 ɀ Ɂ                            
    0250 ɐ ɑ ɒ ɓ ɔ ɕ ɖ ɗ ɘ ə ɚ ɛ ɜ ɝ ɞ ɟ
    0260 ɠ ɡ ɢ ɣ ɤ ɥ ɦ ɧ ɨ ɩ ɪ ɫ ɬ ɭ ɮ ɯ
    0270 ɰ ɱ ɲ ɳ ɴ ɵ ɶ ɷ ɸ ɹ ɺ ɻ ɼ ɽ ɾ ɿ
    0280 ʀ ʁ ʂ ʃ ʄ ʅ ʆ ʇ ʈ ʉ ʊ ʋ ʌ ʍ ʎ ʏ
    0290 ʐ ʑ ʒ ʓ ʔ ʕ ʖ ʗ ʘ ʙ ʚ ʛ ʜ ʝ ʞ ʟ
    02A0 ʠ ʡ ʢ ʣ ʤ ʥ ʦ ʧ ʨ ʩ ʪ ʫ ʬ ʭ ʮ ʯ
    02B0 ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ʸ ʹ ʺ ʻ ʼ ʽ ʾ ʿ
    02C0 ˀ ˁ ˂ ˃ ˄ ˅ ˆ ˇ ˈ ˉ ˊ ˋ ˌ ˍ ˎ ˏ
    02D0 ː ˑ ˒ ˓ ˔ ˕ ˖ ˗ ˘ ˙ ˚ ˛ ˜ ˝ ˞ ˟
    02E0 ˠ ˡ ˢ ˣ ˤ ˥ ˦ ˧ ˨ ˩ ˪ ˫ ˬ ˭ ˮ ˯
    02F0 ˰ ˱ ˲ ˳ ˴ ˵ ˶ ˷ ˸ ˹ ˺ ˻ ˼ ˽ ˾ ˿
    U+0123456789ABCDEF
    0300  ̀  ́  ̂  ̃  ̄  ̅  ̆  ̇  ̈  ̉  ̊  ̋  ̌  ̍  ̎  ̏
    0310  ̐  ̑  ̒  ̓  ̔  ̕  ̖  ̗  ̘  ̙  ̚  ̛  ̜  ̝  ̞  ̟
    0320  ̠  ̡  ̢  ̣  ̤  ̥  ̦  ̧  ̨  ̩  ̪  ̫  ̬  ̭  ̮  ̯
    0330  ̰  ̱  ̲  ̳  ̴  ̵  ̶  ̷  ̸  ̹  ̺  ̻  ̼  ̽  ̾  ̿
    0340  ̀  ́  ͂  ̓  ̈́  ͅ  ͆  ͇  ͈  ͉  ͊  ͋  ͌  ͍  ͎ CGJ
    0350  ͐  ͑  ͒  ͓  ͔  ͕  ͖  ͗  ͘  ͙  ͚  ͛  ͜  ͝  ͞  ͟
    0360  ͠  ͡  ͢  ͣ  ͤ  ͥ  ͦ  ͧ  ͨ  ͩ  ͪ  ͫ  ͬ  ͭ  ͮ  ͯ
    0370         ʹ ͵         ͺ       ;  
    0380         ΄ ΅ Ά · Έ Ή Ί   Ό   Ύ Ώ
    0390 ΐ Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο
    03A0 Π Ρ   Σ Τ Υ Φ Χ Ψ Ω Ϊ Ϋ ά έ ή ί
    03B0 ΰ α β γ δ ε ζ η θ ι κ λ μ ν ξ ο
    03C0 π ρ ς σ τ υ φ χ ψ ω ϊ ϋ ό ύ ώ  
    03D0 ϐ ϑ ϒ ϓ ϔ ϕ ϖ ϗ Ϙ ϙ Ϛ ϛ Ϝ ϝ Ϟ ϟ
    03E0 Ϡ ϡ Ϣ ϣ Ϥ ϥ Ϧ ϧ Ϩ ϩ Ϫ ϫ Ϭ ϭ Ϯ ϯ
    03F0 ϰ ϱ ϲ ϳ ϴ ϵ ϶ Ϸ ϸ Ϲ Ϻ ϻ ϼ Ͻ Ͼ Ͽ
    U+0123456789ABCDEF
    0400 Ѐ Ё Ђ Ѓ Є Ѕ І Ї Ј Љ Њ Ћ Ќ Ѝ Ў Џ
    0410 А Б В Г Д Е Ж З И Й К Л М Н О П
    0420 Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
    0430 а б в г д е ж з и й к л м н о п
    0440 р с т у ф х ц ч ш щ ъ ы ь э ю я
    0450 ѐ ё ђ ѓ є ѕ і ї ј љ њ ћ ќ ѝ ў џ
    0460 Ѡ ѡ Ѣ ѣ Ѥ ѥ Ѧ ѧ Ѩ ѩ Ѫ ѫ Ѭ ѭ Ѯ ѯ
    0470 Ѱ ѱ Ѳ ѳ Ѵ ѵ Ѷ ѷ Ѹ ѹ Ѻ ѻ Ѽ ѽ Ѿ ѿ
    0480 Ҁ ҁ ҂  ҃  ҄  ҅  ҆    ҈  ҉ Ҋ ҋ Ҍ ҍ Ҏ ҏ
    0490 Ґ ґ Ғ ғ Ҕ ҕ Җ җ Ҙ ҙ Қ қ Ҝ ҝ Ҟ ҟ
    04A0 Ҡ ҡ Ң ң Ҥ ҥ Ҧ ҧ Ҩ ҩ Ҫ ҫ Ҭ ҭ Ү ү
    04B0 Ұ ұ Ҳ ҳ Ҵ ҵ Ҷ ҷ Ҹ ҹ Һ һ Ҽ ҽ Ҿ ҿ
    04C0 Ӏ Ӂ ӂ Ӄ ӄ Ӆ ӆ Ӈ ӈ Ӊ ӊ Ӌ ӌ Ӎ ӎ  
    04D0 Ӑ ӑ Ӓ ӓ Ӕ ӕ Ӗ ӗ Ә ә Ӛ ӛ Ӝ ӝ Ӟ ӟ
    04E0 Ӡ ӡ Ӣ ӣ Ӥ ӥ Ӧ ӧ Ө ө Ӫ ӫ Ӭ ӭ Ӯ ӯ
    04F0 Ӱ ӱ Ӳ ӳ Ӵ ӵ Ӷ ӷ Ӹ ӹ            
    U+0123456789ABCDEF
    0500 Ԁ ԁ Ԃ ԃ Ԅ ԅ Ԇ ԇ Ԉ ԉ Ԋ ԋ Ԍ ԍ Ԏ ԏ
    0510                                
    0520                                
    0530   Ա Բ Գ Դ Ե Զ Է Ը Թ Ժ Ի Լ Խ Ծ Կ
    0540 Հ Ձ Ղ Ճ Մ Յ Ն Շ Ո Չ Պ Ջ Ռ Ս Վ Տ
    0550 Ր Ց Ւ Փ Ք Օ Ֆ     ՙ ՚ ՛ ՜ ՝ ՞ ՟
    0560   ա բ գ դ ե զ է ը թ ժ ի լ խ ծ կ
    0570 հ ձ ղ ճ մ յ ն շ ո չ պ ջ ռ ս վ տ
    0580 ր ց ւ փ ք օ ֆ և   ։ ֊          
    0590   ֑ ֒ ֓ ֔ ֕ ֖ ֗ ֘ ֙ ֚ ֛ ֜ ֝ ֞ ֟
    05A0 ֠ ֡ ֢ ֣ ֤ ֥ ֦ ֧ ֨ ֩ ֪ ֫ ֬ ֭ ֮ ֯
    05B0 ְ ֱ ֲ ֳ ִ ֵ ֶ ַ ָ ֹ   ֻ ּ ֽ ־ ֿ
    05C0 ׀ ׁ ׂ ׃ ׄ ׅ ׆ ׇ                
    05D0 א ב ג ד ה ו ז ח ט י ך כ ל ם מ ן
    05E0 נ ס ע ף פ ץ צ ק ר ש ת          
    05F0 װ ױ ײ ׳ ״                      
    U+0123456789ABCDEF
    0600                       ؋ ، ؍ ؎ ؏
    0610 ؐ ؑ ؒ ؓ ؔ ؕ           ؛     ؞ ؟
    0620   ء آ أ ؤ إ ئ ا ب ة ت ث ج ح خ د
    0630 ذ ر ز س ش ص ض ط ظ ع غ          
    0640 ـ ف ق ك ل م ن ه و ى ي ً ٌ ٍ َ ُ
    0650 ِ ّ ْ ٓ ٔ ٕ ٖ ٗ ٘ ٙ ٚ ٛ ٜ ٝ ٞ  
    0660 ٠ ١ ٢ ٣ ٤ ٥ ٦ ٧ ٨ ٩ ٪ ٫ ٬ ٭ ٮ ٯ
    0670 ٰ ٱ ٲ ٳ ٴ ٵ ٶ ٷ ٸ ٹ ٺ ٻ ټ ٽ پ ٿ
    0680 ڀ ځ ڂ ڃ ڄ څ چ ڇ ڈ ډ ڊ ڋ ڌ ڍ ڎ ڏ
    0690 ڐ ڑ ڒ ړ ڔ ڕ ږ ڗ ژ ڙ ښ ڛ ڜ ڝ ڞ ڟ
    06A0 ڠ ڡ ڢ ڣ ڤ ڥ ڦ ڧ ڨ ک ڪ ګ ڬ ڭ ڮ گ
    06B0 ڰ ڱ ڲ ڳ ڴ ڵ ڶ ڷ ڸ ڹ ں ڻ ڼ ڽ ھ ڿ
    06C0 ۀ ہ ۂ ۃ ۄ ۅ ۆ ۇ ۈ ۉ ۊ ۋ ی ۍ ێ ۏ
    06D0 ې ۑ ے ۓ ۔ ە ۖ ۗ ۘ ۙ ۚ ۛ ۜ ۝ ۞ ۟
    06E0 ۠ ۡ ۢ ۣ ۤ ۥ ۦ ۧ ۨ ۩ ۪ ۫ ۬ ۭ ۮ ۯ
    06F0 ۰ ۱ ۲ ۳ ۴ ۵ ۶ ۷ ۸ ۹ ۺ ۻ ۼ ۽ ۾ ۿ
    U+0123456789ABCDEF
    0700 ܀ ܁ ܂ ܃ ܄ ܅ ܆ ܇ ܈ ܉ ܊ ܋ ܌ ܍    
    0710 ܐ ܑ ܒ ܓ ܔ ܕ ܖ ܗ ܘ ܙ ܚ ܛ ܜ ܝ ܞ ܟ
    0720 ܠ ܡ ܢ ܣ ܤ ܥ ܦ ܧ ܨ ܩ ܪ ܫ ܬ ܭ ܮ ܯ
    0730 ܰ ܱ ܲ ܳ ܴ ܵ ܶ ܷ ܸ ܹ ܺ ܻ ܼ ܽ ܾ ܿ
    0740 ݀ ݁ ݂ ݃ ݄ ݅ ݆ ݇ ݈ ݉ ݊     ݍ ݎ ݏ
    0750 ݐ ݑ ݒ ݓ ݔ ݕ ݖ ݗ ݘ ݙ ݚ ݛ ݜ ݝ ݞ ݟ
    0760 ݠ ݡ ݢ ݣ ݤ ݥ ݦ ݧ ݨ ݩ ݪ ݫ ݬ ݭ    
    0770                                
    0780 ހ ށ ނ ރ ބ ޅ ކ އ ވ މ ފ ދ ތ ލ ގ ޏ
    0790 ސ ޑ ޒ ޓ ޔ ޕ ޖ ޗ ޘ ޙ ޚ ޛ ޜ ޝ ޞ ޟ
    07A0 ޠ ޡ ޢ ޣ ޤ ޥ ަ ާ ި ީ ު ޫ ެ ޭ ޮ ޯ
    07B0 ް ޱ                            
    07C0                                
    07D0                                
    07E0                                
    07F0                                
    U+0123456789ABCDEF
    0800                                
    0810                                
    0820                                
    0830                                
    0840                                
    0850                                
    0860                                
    0870                                
    0880                                
    0890                                
    08A0                                
    08B0                                
    08C0                                
    08D0                                
    08E0                                
    08F0                                
    U+0123456789ABCDEF
    0900  
    0910
    0920
    0930     ि
    0940    
    0950      
    0960
    0970                            
    0980        
    0990    
    09A0  
    09B0             ি
    09C0          
    09D0                        
    09E0    
    09F0          
    U+0123456789ABCDEF
    0A00            
    0A10    
    0A20  
    0A30             ਿ
    0A40                
    0A50                      
    0A60            
    0A70                      
    0A80      
    0A90  
    0AA0  
    0AB0         િ
    0AC0        
    0AD0                              
    0AE0    
    0AF0                              
    U+0123456789ABCDEF
    0B00        
    0B10    
    0B20  
    0B30         ି
    0B40              
    0B50                      
    0B60        
    0B70                            
    0B80            
    0B90            
    0BA0                  
    0BB0         ி
    0BC0            
    0BD0                              
    0BE0            
    0BF0          
    U+0123456789ABCDEF
    0C00      
    0C10  
    0C20  
    0C30           ి
    0C40        
    0C50                            
    0C60        
    0C70                                
    0C80        
    0C90  
    0CA0  
    0CB0       ಿ
    0CC0        
    0CD0                          
    0CE0        
    0CF0                                
    U+0123456789ABCDEF
    0D00        
    0D10  
    0D20  
    0D30         ി
    0D40          
    0D50                              
    0D60        
    0D70                                
    0D80      
    0D90      
    0DA0
    0DB0        
    0DC0              
    0DD0    
    0DE0                                
    0DF0                          
    U+0123456789ABCDEF
    0E00  
    0E10
    0E20
    0E30         ฿
    0E40
    0E50        
    0E60                                
    0E70                                
    0E80                  
    0E90          
    0EA0            
    0EB0      
    0EC0        
    0ED0        
    0EE0                                
    0EF0                                
    U+0123456789ABCDEF
    0F00
    0F10
    0F20
    0F30 ༿
    0F40  
    0F50
    0F60          
    0F70   ཿ
    0F80        
    0F90  
    0FA0
    0FB0   ྿
    0FC0    
    0FD0                            
    0FE0                                
    0FF0                                
     
     
     
     Unicode编码范围表查询
     
     

    十进制 十六进制  字符数 编码分类(中文) 编码分类(英文)
    起始 终止 起始 终止 (个)    
    0 127 0000 007F 128 C0控制符及基本拉丁文 C0 Control and Basic Latin
    128 255 0080 00FF 128 C1控制符及拉丁文补充-1 C1 Control and Latin 1 Supplement
    256 383 0100 017F 128 拉丁文扩展-A Latin Extended-A
    384 591 0180 024F 208 拉丁文扩展-B Latin Extended-B
    592 687 0250 02AF 96 国际音标扩展 IPA Extensions
    688 767 02B0 02FF 80 空白修饰字母 Spacing Modifiers
    768 879 0300 036F 112 结合用读音符号 Combining Diacritics Marks
    880 1023 0370 03FF 144 希腊文及科普特文 Greek and Coptic
    1024 1279 0400 04FF 256 西里尔字母 Cyrillic
    1280 1327 0500 052F 48 西里尔字母补充 Cyrillic Supplement
    1328 1423 0530 058F 96 亚美尼亚语 Armenian
    1424 1535 0590 05FF 112 希伯来文 Hebrew
    1536 1791 0600 06FF 256 阿拉伯文 Arabic
    1792 1871 0700 074F 80 叙利亚文 Syriac
    1872 1919 0750 077F 48 阿拉伯文补充 Arabic Supplement
    1920 1983 0780 07BF 64 马尔代夫语 Thaana
    1984 2047 07C0 07FF 64 西非書面語言 N'Ko
    2048 2143 0800 085F 96 阿维斯塔语及巴列维语 Avestan and Pahlavi
    2144 2175 0860 087F 32 Mandaic Mandaic
    2176 2223 0880 08AF 48 撒马利亚语 Samaritan
    2304 2431 0900 097F 128 天城文书 Devanagari
    2432 2559 0980 09FF 128 孟加拉语 Bengali
    2560 2687 0A00 0A7F 128 锡克教文 Gurmukhi
    2688 2815 0A80 0AFF 128 古吉拉特文 Gujarati
    2816 2943 0B00 0B7F 128 奥里亚文 Oriya
    2944 3071 0B80 0BFF 128 泰米尔文 Tamil
    3072 3199 0C00 0C7F 128 泰卢固文 Telugu
    3200 3327 0C80 0CFF 128 卡纳达文 Kannada
    3328 3455 0D00 0D7F 128 德拉维族语 Malayalam
    3456 3583 0D80 0DFF 128 僧伽罗语 Sinhala
    3584 3711 0E00 0E7F 128 泰文 Thai
    3712 3839 0E80 0EFF 128 老挝文 Lao
    3840 4095 0F00 0FFF 256 藏文 Tibetan
    4096 4255 1000 109F 160 缅甸语 Myanmar
    4256 4351 10A0 10FF 96 格鲁吉亚语 Georgian
    4352 4607 1100 11FF 256 朝鲜文 Hangul Jamo
    4608 4991 1200 137F 384 埃塞俄比亚语 Ethiopic
    4992 5023 1380 139F 32 埃塞俄比亚语补充 Ethiopic Supplement
    5024 5119 13A0 13FF 96 切罗基语 Cherokee
    5120 5759 1400 167F 640 统一加拿大土著语音节 Unified Canadian Aboriginal Syllabics
    5760 5791 1680 169F 32 欧甘字母 Ogham
    5792 5887 16A0 16FF 96 如尼文 Runic
    5888 5919 1700 171F 32 塔加拉语 Tagalog
    5920 5951 1720 173F 32 Hanunóo Hanunóo
    5952 5983 1740 175F 32 Buhid Buhid
    5984 6015 1760 177F 32 Tagbanwa Tagbanwa
    6016 6143 1780 17FF 128 高棉语 Khmer
    6144 6319 1800 18AF 176 蒙古文 Mongolian
    6320 6399 18B0 18FF 80 Cham Cham
    6400 6479 1900 194F 80 Limbu Limbu
    6480 6527 1950 197F 48 德宏泰语 Tai Le
    6528 6623 1980 19DF 96 新傣仂语 New Tai Lue
    6624 6655 19E0 19FF 32 高棉语记号 Kmer Symbols
    6656 6687 1A00 1A1F 32 Buginese Buginese
    6688 6751 1A20 1A5F 64 Batak Batak
    6784 6895 1A80 1AEF 112 Lanna Lanna
    6912 7039 1B00 1B7F 128 巴厘语 Balinese
    7040 7088 1B80 1BB0 49 巽他语 Sundanese
    7104 7167 1BC0 1BFF 64 Pahawh Hmong Pahawh Hmong
    7168 7247 1C00 1C4F 80 雷布查语 Lepcha
    7248 7295 1C50 1C7F 48 Ol Chiki Ol Chiki
    7296 7391 1C80 1CDF 96 曼尼普尔语 Meithei/Manipuri
    7424 7551 1D00 1D7F 128 语音学扩展 Phonetic Extensions
    7552 7615 1D80 1DBF 64 语音学扩展补充 Phonetic Extensions Supplement
    7616 7679 1DC0 1DFF 64 结合用读音符号补充 Combining Diacritics Marks Supplement
    7680 7935 1E00 1EFF 256 拉丁文扩充附加 Latin Extended Additional
    7936 8191 1F00 1FFF 256 希腊语扩充 Greek Extended
    8192 8303 2000 206F 112 常用标点 General Punctuation
    8304 8351 2070 209F 48 上标及下标 Superscripts and Subscripts
    8352 8399 20A0 20CF 48 货币符号 Currency Symbols
    8400 8447 20D0 20FF 48 组合用记号 Combining Diacritics Marks for Symbols
    8448 8527 2100 214F 80 字母式符号 Letterlike Symbols
    8528 8591 2150 218F 64 数字形式 Number Form
    8592 8703 2190 21FF 112 箭头 Arrows
    8704 8959 2200 22FF 256 数学运算符 Mathematical Operator
    8960 9215 2300 23FF 256 杂项工业符号 Miscellaneous Technical
    9216 9279 2400 243F 64 控制图片 Control Pictures
    9280 9311 2440 245F 32 光学识别符 Optical Character Recognition
    9312 9471 2460 24FF 160 封闭式字母数字 Enclosed Alphanumerics
    9472 9599 2500 257F 128 制表符 Box Drawing
    9600 9631 2580 259F 32 方块元素 Block Element
    9632 9727 25A0 25FF 96 几何图形 Geometric Shapes
    9728 9983 2600 26FF 256 杂项符号 Miscellaneous Symbols
    9984 10175 2700 27BF 192 印刷符号 Dingbats
    10176 10223 27C0 27EF 48 杂项数学符号-A Miscellaneous Mathematical Symbols-A
    10224 10239 27F0 27FF 16 追加箭头-A Supplemental Arrows-A
    10240 10495 2800 28FF 256 盲文点字模型 Braille Patterns
    10496 10623 2900 297F 128 追加箭头-B Supplemental Arrows-B
    10624 10751 2980 29FF 128 杂项数学符号-B Miscellaneous Mathematical Symbols-B
    10752 11007 2A00 2AFF 256 追加数学运算符 Supplemental Mathematical Operator
    11008 11263 2B00 2BFF 256 杂项符号和箭头 Miscellaneous Symbols and Arrows
    11264 11359 2C00 2C5F 96 格拉哥里字母 Glagolitic
    11360 11391 2C60 2C7F 32 拉丁文扩展-C Latin Extended-C
    11392 11519 2C80 2CFF 128 古埃及语 Coptic
    11520 11567 2D00 2D2F 48 格鲁吉亚语补充 Georgian Supplement
    11568 11647 2D30 2D7F 80 提非纳文 Tifinagh
    11648 11743 2D80 2DDF 96 埃塞俄比亚语扩展 Ethiopic Extended
    11776 11903 2E00 2E7F 128 追加标点 Supplemental Punctuation
    11904 12031 2E80 2EFF 128 CJK 部首补充 CJK Radicals Supplement
    12032 12255 2F00 2FDF 224 康熙字典部首 Kangxi Radicals
    12272 12287 2FF0 2FFF 16 表意文字描述符 Ideographic Description Characters
    12288 12351 3000 303F 64 CJK 符号和标点 CJK Symbols and Punctuation
    12352 12447 3040 309F 96 日文平假名 Hiragana
    12448 12543 30A0 30FF 96 日文片假名 Katakana
    12544 12591 3100 312F 48 注音字母 Bopomofo
    12592 12687 3130 318F 96 朝鲜文兼容字母 Hangul Compatibility Jamo
    12688 12703 3190 319F 16 象形字注释标志 Kanbun
    12704 12735 31A0 31BF 32 注音字母扩展 Bopomofo Extended
    12736 12783 31C0 31EF 48 CJK 笔画 CJK Strokes
    12784 12799 31F0 31FF 16 日文片假名语音扩展 Katakana Phonetic Extensions
    12800 13055 3200 32FF 256 封闭式 CJK 文字和月份 Enclosed CJK Letters and Months
    13056 13311 3300 33FF 256 CJK 兼容 CJK Compatibility
    13312 19903 3400 4DBF 6592 CJK 统一表意符号扩展 A CJK Unified Ideographs Extension A
    19904 19967 4DC0 4DFF 64 易经六十四卦符号 Yijing Hexagrams Symbols
    19968 40895 4E00 9FBF 20928 CJK 统一表意符号 CJK Unified Ideographs
    40960 42127 A000 A48F 1168 彝文音节 Yi Syllables
    42128 42191 A490 A4CF 64 彝文字根 Yi Radicals
    42240 42527 A500 A61F 288 Vai Vai
    42592 42751 A660 A6FF 160 统一加拿大土著语音节补充 Unified Canadian Aboriginal Syllabics Supplement
    42752 42783 A700 A71F 32 声调修饰字母 Modifier Tone Letters
    42784 43007 A720 A7FF 224 拉丁文扩展-D Latin Extended-D
    43008 43055 A800 A82F 48 Syloti Nagri Syloti Nagri
    43072 43135 A840 A87F 64 八思巴字 Phags-pa
    43136 43231 A880 A8DF 96 Saurashtra Saurashtra
    43264 43391 A900 A97F 128 爪哇语 Javanese
    43392 43487 A980 A9DF 96 Chakma Chakma
    43520 43583 AA00 AA3F 64 Varang Kshiti Varang Kshiti
    43584 43631 AA40 AA6F 48 Sorang Sompeng Sorang Sompeng
    43648 43743 AA80 AADF 96 Newari Newari
    43776 43871 AB00 AB5F 96 越南傣语 Vi?t Thái
    43904 43936 AB80 ABA0 33 Kayah Li Kayah Li
    44032 55215 AC00 D7AF 11184 朝鲜文音节 Hangul Syllables
    55296 56319 D800 DBFF 1024 High-half zone of UTF-16 High-half zone of UTF-16
    56320 57343 DC00 DFFF 1024 Low-half zone of UTF-16 Low-half zone of UTF-16
    57344 63743 E000 F8FF 6400 自行使用區域 Private Use Zone
    63744 64255 F900 FAFF 512 CJK 兼容象形文字 CJK Compatibility Ideographs
    64256 64335 FB00 FB4F 80 字母表達形式 Alphabetic Presentation Form
    64336 65023 FB50 FDFF 688 阿拉伯表達形式A Arabic Presentation Form-A
    65024 65039 FE00 FE0F 16 变量选择符 Variation Selector
    65040 65055 FE10 FE1F 16 竖排形式 Vertical Forms
    65056 65071 FE20 FE2F 16 组合用半符号 Combining Half Marks
    65072 65103 FE30 FE4F 32 CJK 兼容形式 CJK Compatibility Forms
    65104 65135 FE50 FE6F 32 小型变体形式 Small Form Variants
    65136 65279 FE70 FEFF 144 阿拉伯表達形式B Arabic Presentation Form-B
    65280 65519 FF00 FFEF 240 半型及全型形式 Halfwidth and Fullwidth Form
    65520 65535 FFF0 FFFF 16 特殊 Specials


    UTF-8有点类似于Haffman编码,它将Unicode编码为:
    0x00-0x7F的字符,用单个字节来表示;
    0x80-0x7FF的字符用两个字节表示;
    0x800-0xFFFF的字符用3字节表示;
    汉字的unicode范围是:0x4E00~0x9FA5
    其实这个范围还包括了中,日,韩的字符。

  • 相关阅读:
    单实例应用程序程序
    Jquery自定义滚动条插件
    Js的封装和闭包
    Js 鼠标拖拽div改变其大小
    在小组里遇到的一个让我产生迷惑的题
    一个用来快速生成指定大小的随机不重复int数组的实用方法
    动态绑定ASPxGridView选中状态
    “??”操作符
    小笔记系列——Word 添加行号
    日志 查看匹配内容的前后几行
  • 原文地址:https://www.cnblogs.com/sxdcgaq8080/p/9932786.html
Copyright © 2011-2022 走看看