UTF8编码 - 走看看

zoukankan html css js c++ java

UTF8编码

UTF-8是Unicode的实现方式之一。

UTF-8最大的一个特点，就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号，根据不同的符号而变化字节长度。

UTF-8的编码规则很简单，只有二条：

1）对于单字节的符号，字节的第一位设为0，后面7位为这个符号的unicode码。因此对于英语字母，UTF-8编码和ASCII码是相同的。

2）对于n字节的符号（n>1），第一个字节的前n位都设为1，第n+1位设为0，后面字节的前两位一律设为10。剩下的没有提及的二进制位，全部为这个符号的unicode码。

下表总结了编码规则，字母x表示可用编码的位。

Unicode符号范围 | UTF-8编码方式
(十六进制)　　 | （二进制）
--------------------+---------------------------------------------
0000 0000-0000 007F | 0xxxxxxx
0000 0080-0000 07FF | 110xxxxx 10xxxxxx
0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx
0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

查看全文

相关阅读:
【调查】用户眼中已经消亡的十大IT技术
 Asp.net Cache
双卡已落伍三卡三待全键盘手机亮相
 C#修改本机的IP，网关等网络地址的代码片段
 【ZT】实战.NET大规模网站架构：Web加速器
 【面霸】面试ERP实施顾问的三招“必杀技”
数据库优化使用索引优化存储过程
 【備查】informix sql函数使用说明大全
 “8月3日我们要过男人节”
Asp.Net网站优化:数据库索引优化

原文地址：https://www.cnblogs.com/nanqiang/p/7650192.html

Copyright © 2011-2022 走看看