zoukankan      html  css  js  c++  java
  • 编码问题

    一.编码的历史

    gbk  存了2万个 1995   中文是2个字节,英文为1个字节

    gb18030:  存了27000  2000年  中文是2个字节,英文为1个字节

    unicode:万国码(国际同一标准)之后又进行改进得到:1 utf-32  一个字符(无论中西)占4个字节

                             2 utf-16  一个字符占2个字节或以上

                             3 utf-8  ;一个英文用ASCII码存,一个中文占3个字节

    二.python机制的编码

    python2  默认是ASCII  

      更改方法:#--*--encoding=utf-8--*--

    python3  默认是Unicode

    encode  进行编码转换后返回bytes类型   【o-255】

    decode   在解码的同时,会把bytes类型转换为字符型

    三.编码间的转换

      都是通过unicde作为中间的桥梁,进行转换,任意编码到unicode是通过decode(解码),从Unicode到其他的编码是通过encode(编码)

  • 相关阅读:
    C++虚函数表解析(转)
    学习网址
    css 段落文字换行问题
    移动端fixed兼容问题
    半数集1
    汇编寄存器
    设计模式概述
    Vector用法介绍
    汇编PC硬件基本特征
    android 反编译总结
  • 原文地址:https://www.cnblogs.com/gjx1212/p/11665391.html
Copyright © 2011-2022 走看看