zoukankan      html  css  js  c++  java
  • ASCII、ANSI、Unicode

    ASCII 是单字节编码: 0000 0000 - 0111 1111 即 0x00 - 0x7F
    ANSI 是双字节编码:0000 0000 1000 0000 - 1111 1111 1111 1111 即0x0080-0xFFFF, 之所以从0x80开始,是为了保证0x00-0x7F和ASCII兼容

    ANSI 不是一种特定的编码,而是不同地区扩展编码方式的统称
    例如对于简体中文,ANSI指的是GBK,对于繁体中文,ANSI指的是BIG5,对于日文,ANSI指的是SHIFT JIS

     在windows的cmd框中,右击--属性,可以查看当前的编码方式和代码页

    Unicode是一套字符集,可以理解为一张 字符 和 二进制 之间 的 对应表格
    字符集和字符编码是不同的,字符编码考虑的是如何将字符对应的字符编号存到计算机中,例如对于变长存储方案(不同字符占用字节数不同),字符编号在存储之间必须要经过转换,在读取时还要再逆向转换一次,这套转换方案叫做字符编码

    有些字符集在制定时就考虑到了编码问题,如ASCII、GB2312、GBK、BIG5等,所以你可以称它们为字符集,也可以称字符编码

    而Unicode只定义了字符集,置于怎么编码,那是字符编码的事,你可以用UTF-8、UTF-16、UTF-32这几种编码方式,将Unicode存储到计算机中

    参考博客:https://www.cnblogs.com/lanhaicode/p/11214827.html

  • 相关阅读:
    常用知识点集合
    LeetCode 66 Plus One
    LeetCode 88 Merge Sorted Array
    LeetCode 27 Remove Element
    LeetCode 26 Remove Duplicates from Sorted Array
    LeetCode 448 Find All Numbers Disappeared in an Array
    LeetCode 219 Contains Duplicate II
    LeetCode 118 Pascal's Triangle
    LeetCode 119 Pascal's Triangle II
    LeetCode 1 Two Sum
  • 原文地址:https://www.cnblogs.com/shuaishuaidefeizhu/p/15333485.html
Copyright © 2011-2022 走看看