zoukankan      html  css  js  c++  java
  • 字节编码中文编码方式总结

    时间紧张,先记一笔,后续优化与完善。

        

        ASCII-----单字节编码

        

        

        GB2312-----中国人的简体字编码

        

        

        GBK----中国人的简繁编码

        

        GBK编码(Chinese Internal Code Specification)是中国大陆订制的、等同于UCS的新的中文编码展扩国家标准。gbk编码可以用来同时表现

        繁体字

        和简体字,而gb2312只能表现简体字,gbk是兼容gb2312编码的。

        GBK 采用了

        单双字节合混

        的式方。

        它兼容ASCII,因些0x~07F 分部的义定和ASCII 一样。对其他符字,G

        BK中个每汉字仍然包括两个字节,第一个字节的范围是0x81-0xFE(即129-254)-----最高位必须是 1

        每日一道理
    成功的花朵开放在啊勤劳的枝头,失败的苦果孕育在懒惰的温床之中。

        ,第二个字节的范围是0x40-0xFE(即64-254)。

        2.如果字节范围 0x80~0xFF,即

        最高位为 1 

        时,还要需再取下一个字节,两个字节合起来才表现一个符字。

        

        Unicode----一统码、万国码,java、python

        

        

        UTF-8-----国际编码,通用性好,前缀码,从第一个字节能就道知这是个几字节字

        

        U+

        0

        800 - U+

        F

        FFF         1110 

        ****

         10** **** 10** ****(0xE

        0

        ~0xE

        F

        )        字节最高四位是 1110, 则这是三字节编码,用于其他符字,如中文简繁等 

    文章结束给大家分享下程序员的一些笑话语录: 联想——对内高价,补贴对外倾销的伟大“民族”企业。

  • 相关阅读:
    为什么你不会redis分布式锁?因为你没看到这篇文章
    JavaScript最佳做法—创建对象
    js构造函数的定义
    作用域和闭包
    js中的call()和apply()的区别
    3种方法快速查找两个数组是否在Javascript中包含任何公共项
    JavaScript继承的6种方式以及它们的优缺点
    JS常见的内存泄漏及可用的解决方法
    Vuex简单入门
    如何使用HTML和CSS为背景创建Wave图片?
  • 原文地址:https://www.cnblogs.com/xinyuyuanm/p/3045552.html
Copyright © 2011-2022 走看看