UTF-8 - 走看看

zoukankan html css js c++ java

UTF-8

          UTF-8的基本定义：

           UTF，是UnicodeTransformationFormat的缩写，意为Unicode转换格式。

如果UNICODE字符由2个字节表示，则编码成UTF-8很可能需要3个字节，而如果UNICODE字符由4个字节表示，则编码成UTF-8可能需要6个字节。用4个或6个字节去编码一个UNICODE字符可能太多了，但很少会遇到那样的UNICODE字符。

       优点
              UTF-8编码可以通过屏蔽位和移位操作快速读写。字符串比较时strcmp()和wcscmp()的返回结果相同，因此使排序变得更加容易。字节FF和FE在UTF-8编码中永远不会出现，因此他们可以用来表明UTF-16或UTF-32文本（见BOM） UTF-8 是字节顺序无关的。它的字节顺序在所有系统中都是一样的，因此它实际上并不需要BOM。
       缺点
              你无法从UNICODE字符数判断出UTF-8文本的字节数，因为UTF-8是一种变长编码它需要用2个字节编码那些用扩展ASCⅡ字符集只需1个字节的字符 ISO Latin-1 是UNICODE的子集，但不是UTF-8的子集 8位字符的UTF-8编码会被email网关过滤，因为internet信息最初设计为7位ASCⅡ码。因此产生了UTF-7编码。UTF-8 在它的表示中使用值100xxxxx的几率超过50%，而现存的实现如ISO 2022， 4873， 6429，和8859系统，会把它错认为是C1 控制码。因此产生了UTF-7.5编码。

查看全文

相关阅读:
EasyUI 清空表格
 【21年01月DW打卡】Task02
【BUG12】排查解决一个锁超时 "MySQLTransactionRollbackException: Lock wait timeout exceeded; try restarting transaction" 的SQL问题
 【20年12月DW打卡】joyful-pandas
【21年01月DW打卡】Task01
【12月DW打卡】joyful-pandas
【12月DW打卡】joyful-pandas
【Pandas】resample重采样中的周‘W’按周日开始为一周（'W'的频率偏移默认为‘right’、使用label = 'left' 重设）+ 常用freq的别名/注释
 【12月DW打卡】joyful-pandas
【12月DW打卡】joyful-pandas

原文地址：https://www.cnblogs.com/doubiqi/p/5008268.html

Copyright © 2011-2022 走看看