字符编码复习 - 走看看

zoukankan html css js c++ java

字符编码复习

内存中的都是unicode明文(二进制数据)

unicode把明文对应成一个二进制，utf8是把unicode的二进制再转成一个二进制

两种都是一种编码方式
unicode*（明文对应二进制）两个字节，六万多个状态，全世界
utf8:(二进制对应二进制)可变的(中文一般用三个字符，因为编程用中文的太少所以还是省空间)
为什么不将unicode直接存到磁盘，传输，因为utf8比unicode更节省空间

world打开文件的过程：你写上的字先进内存(unicode形式的二进制数据)，点保存(二进制的unicode按utf8再转成二进制)
保存到磁盘；打开文件的过程，把磁盘上的utf8转换成decode的unicode编码，然后到内存就能看了
所以你encode存的时候，跟decode打开的时候编码一定要一样
python解释器的#coding:utf8就是告诉我解释器，按utf8进行解码

python解释器的翻译是一行一行的解释

pthon2.x
1,str: bytes数据 str只是个名字 (print type时的显示)
2,unicode: unicode编码后的二进制数据 unicode也只是字名字

只要是Unicode就是encode操作，只要是bytes数据就是decode操作
python3完完全全把字节类型跟字符类型完全分开，混用会报错
python3.x
1，
2，

查看全文

相关阅读:
2018常用网站图片处理
 iOS判断当前时间是否处于某个时间段内
 iOS 页面跳转和返回，持续编写
 模板引擎-freemarker
HibernateTemplate使用注意点
 hibernate-注解及配置
 hibernate 异常
 javaEncode
eclipse 创建注释模板
 eclipse 和 javaClass

原文地址：https://www.cnblogs.com/wanchenxi/p/7900279.html

Copyright © 2011-2022 走看看