zoukankan      html  css  js  c++  java
  • 编码

    编码表:其实就是生活中字符和计算机二进制的对应关系表。
    1、ASCII:一个字节中的 7 位就可以表示。对应的字节都是正数。0-xxxxxxx
    2、ISO-8859-1:拉丁码表 latin,用了一个字节 8 位。1-xxxxxxx 负数。
    3、GB2312:简体中文码表。包含 6000-7000 中文和符号。用两个字节表示。两个字节第一个字
    节是负数,第二个字节可能是正数
    4、GBK:目前最常用的中文码表,2 万的中文和符号。用两个字节表示,其中的一部分文字,第一个字节开头是 1,第二字节开头是 0
    5、 GB18030:最新的中文码表
    6、unicode:国际标准码表:无论是什么文字,都用两个字节存储。
     Java 中的 char 类型用的就是这个码表。char c = 'a';占两个字节。
     Java 中的字符串是按照系统默认码表来解析的。简体中文版 字符串默认的码表是 GBK。
    7、UTF-8:基于 unicode,一个字节就可以存储数据,不要用两个字节存储,而且这个码表更加的标准化,在每一个字节头加入了编码信息(后期到 api 中查找)。
    能识别中文的码表:GBK、UTF-8;正因为识别中文码表不唯一,涉及到了编码解码问题。
    对于我们开发而言;常见的编码 GBK UTF-8 ISO-8859-1
    文字--->(数字) :编码。 “abc”.getBytes() byte[]
    (数字)--->文字:解码。 byte[] b={97,98,99} new String(b)

  • 相关阅读:
    iscroll在iphone浏览器上闪动的BUG
    Emmet (ZenCoding) 缩写语法
    jqmobi快速开始(翻译)
    前端资源站点
    DOM Storage全解析
    html5离线应用
    XML的浏览器解析方案,正在尝试 。
    用 JavaScript来判断浏览器的种类
    delphi7判断字符串的组成
    没想到手机发邮件要占用那么大的空间
  • 原文地址:https://www.cnblogs.com/fanyizhan/p/10055212.html
Copyright © 2011-2022 走看看