zoukankan      html  css  js  c++  java
  • ASCII、ANSI、Unicode

    ASCII 是单字节编码: 0000 0000 - 0111 1111 即 0x00 - 0x7F
    ANSI 是双字节编码:0000 0000 1000 0000 - 1111 1111 1111 1111 即0x0080-0xFFFF, 之所以从0x80开始,是为了保证0x00-0x7F和ASCII兼容

    ANSI 不是一种特定的编码,而是不同地区扩展编码方式的统称
    例如对于简体中文,ANSI指的是GBK,对于繁体中文,ANSI指的是BIG5,对于日文,ANSI指的是SHIFT JIS

     在windows的cmd框中,右击--属性,可以查看当前的编码方式和代码页

    Unicode是一套字符集,可以理解为一张 字符 和 二进制 之间 的 对应表格
    字符集和字符编码是不同的,字符编码考虑的是如何将字符对应的字符编号存到计算机中,例如对于变长存储方案(不同字符占用字节数不同),字符编号在存储之间必须要经过转换,在读取时还要再逆向转换一次,这套转换方案叫做字符编码

    有些字符集在制定时就考虑到了编码问题,如ASCII、GB2312、GBK、BIG5等,所以你可以称它们为字符集,也可以称字符编码

    而Unicode只定义了字符集,置于怎么编码,那是字符编码的事,你可以用UTF-8、UTF-16、UTF-32这几种编码方式,将Unicode存储到计算机中

    参考博客:https://www.cnblogs.com/lanhaicode/p/11214827.html

  • 相关阅读:
    C#小数点位数处理方法
    C#获取硬盘空间信息
    Linux双网卡绑定实现负载均衡
    CentOS、Ubuntu配置网卡子接口
    CentOS7修改网卡名称,禁用ipv6
    centos命令自动补全增强
    使用批处理文件访问ORACLE数据库
    Mac 常用终端命令
    常用正则表达式
    pickle 模块
  • 原文地址:https://www.cnblogs.com/shuaishuaidefeizhu/p/15333485.html
Copyright © 2011-2022 走看看