unicode, utf-8 - 走看看

zoukankan html css js c++ java

unicode, utf-8
unicode是字符集，为每一个「字符」分配一个唯一的 ID；Unicode编码通常是2个字节，占用存储空间。全部是英文的话，用Unicode编码比ASCII编码需要多一倍的存储空间

utf-8是编码规则，把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节。节省流量和硬盘

unicode=>utf-8:　　
u'中文'.encode('utf-8')　　#xe4xb8xadxe6x96x87
utf-8=>unicode
'xe4xb8xadxe6x96x87'.decode('utf-8) #中文
查看全文

相关阅读:
Hbase表的管理
 Hbase指定规则扫描表
 vim配置
 caogao
go on shell
实习总结
 shell 脚本
 hadoop实战
 awk使用
 java reflect

原文地址：https://www.cnblogs.com/YYRise/p/9037843.html

Copyright © 2011-2022 走看看