zoukankan      html  css  js  c++  java
  • 编码

    编码表:其实就是生活中字符和计算机二进制的对应关系表。
    1、ASCII:一个字节中的 7 位就可以表示。对应的字节都是正数。0-xxxxxxx
    2、ISO-8859-1:拉丁码表 latin,用了一个字节 8 位。1-xxxxxxx 负数。
    3、GB2312:简体中文码表。包含 6000-7000 中文和符号。用两个字节表示。两个字节第一个字
    节是负数,第二个字节可能是正数
    4、GBK:目前最常用的中文码表,2 万的中文和符号。用两个字节表示,其中的一部分文字,第一个字节开头是 1,第二字节开头是 0
    5、 GB18030:最新的中文码表
    6、unicode:国际标准码表:无论是什么文字,都用两个字节存储。
     Java 中的 char 类型用的就是这个码表。char c = 'a';占两个字节。
     Java 中的字符串是按照系统默认码表来解析的。简体中文版 字符串默认的码表是 GBK。
    7、UTF-8:基于 unicode,一个字节就可以存储数据,不要用两个字节存储,而且这个码表更加的标准化,在每一个字节头加入了编码信息(后期到 api 中查找)。
    能识别中文的码表:GBK、UTF-8;正因为识别中文码表不唯一,涉及到了编码解码问题。
    对于我们开发而言;常见的编码 GBK UTF-8 ISO-8859-1
    文字--->(数字) :编码。 “abc”.getBytes() byte[]
    (数字)--->文字:解码。 byte[] b={97,98,99} new String(b)

  • 相关阅读:
    Chat Icon
    docker 容器无root 权限,如何获得docker容器里面的root权限
    yolo训练自己的数据
    jetson nano(1-1) 系统烧录和备份
    jetson nano(2)软件环境开发
    jetson nano(1-2)配置VNC
    坐标映射(remap重映射)
    opencv图像格式
    matlab相机标定导出xml文件
    jupyter安装和链接aconda
  • 原文地址:https://www.cnblogs.com/fanyizhan/p/10055212.html
Copyright © 2011-2022 走看看