zoukankan      html  css  js  c++  java
  • Unicode编码相关概念

    1.Unicode是一种字符映射方案,这种映射并不是编码(即还没有到二进制机器码层面),而是像一个电话本一样,把全世界所有语言使用的字符,都映射成一个"u+"开头的数字(在JAVA中,除了映射表中最后一个字符u+10400,都可以使用以"u"开头的单个java char来表示);

    2.将Unicdoe字符映射到机器码的编码方案有UTF-8和UTF-16;

    (1)UTF-8:是一种变长的编码方案,在0~127之间的Unicode码将会使用一个字节来编码(并且这个映射和ASCⅡ相同),超过127的用2个或4个字节;

    (2)UTF-16:固定使用2个或4个字节。

    3.Unicode只是一个字符到数字的映射的标准,它对支持的字符数量没有限制;

    4.永远记得通过Content-Type或者meta charset便签来显式指定你的文档的编码,这样浏览器就不会猜测你使用什么编码而造成编码错误。

    参考:http://www.freebuf.com/articles/others-articles/25623.html

  • 相关阅读:
    五、MongoDB的索引
    四、MongoDB的查询
    各模块启动
    HBase1.2.6 javaapi查看rowkey 所在分区等信息
    HBase1.2.6 预分区后,数据不进入预定分区的一个 bug
    SparkStreaming程序设计
    SparkSQL程序设计
    Spark SQL概述
    常用RDD
    spark程序设计
  • 原文地址:https://www.cnblogs.com/huiAlex/p/8182691.html
Copyright © 2011-2022 走看看