zoukankan      html  css  js  c++  java
  • 字符编码复习

    内存中的都是unicode明文(二进制数据)

    unicode把明文对应成一个二进制,utf8是把unicode的二进制再转成一个二进制

    两种都是一种编码方式
    unicode*(明文对应二进制)两个字节,六万多个状态,全世界
    utf8:(二进制对应二进制)可变的(中文一般用三个字符,因为编程用中文的太少所以还是省空间)
    为什么不将unicode直接存到磁盘,传输,因为utf8比unicode更节省空间

    world打开文件的过程:你写上的字先进内存(unicode形式的二进制数据),点保存(二进制的unicode按utf8再转成二进制)
    保存到磁盘;打开文件的过程,把磁盘上的utf8转换成decode的unicode编码,然后到内存就能看了
    所以你encode存的时候,跟decode打开的时候编码一定要一样
    python解释器的#coding:utf8就是告诉我解释器,按utf8进行解码

    python解释器的翻译是一行一行的解释


    pthon2.x
    1,str: bytes数据 str只是个名字 (print type时的显示)
    2,unicode: unicode编码后的二进制数据 unicode也只是字名字

    只要是Unicode就是encode操作,只要是bytes数据就是decode操作
    python3完完全全把字节类型跟字符类型完全分开,混用会报错
    python3.x
    1,
    2,

  • 相关阅读:
    NBU备份虚拟机高级选项virtual machine quiesce option
    find命令处理之exec与xargs区别
    python学习之列表
    vSphere 6.5密码正确不能登录解决方法
    Vmware vSphere P2V操作文档
    tomcat学习1架构理解
    telnet 退出命令
    敏捷软件开发
    数组、List和ArrayList的区别
    如何阅读一本书(感)
  • 原文地址:https://www.cnblogs.com/wanchenxi/p/7900279.html
Copyright © 2011-2022 走看看