zoukankan      html  css  js  c++  java
  • encode和decode

    编码格式主要有:Unicode、utf-8、gbk、utf-16等
    unicode是utf-8、gbk等的父编码,所有子编码都可以转换成Unicode编码。然后转换成其他子编码。但是子编码之间是不可以进行转换的。(比如utf-8可以先转换成Unicode,然后再从Unicode转换成gbk;但是不能直接从utf-8转换成gbk)
    一、编码、解码
    python中用encode和decode来进行编码和解码:
    encode:将Unicode的编码转换成其他格式的编码
    如str1.encode('gbk'),表示将unicode编码的字符串转换成gbk 编码。 
     
    decode:将其他格式的编码转换成Unicode的编码格式
    str2.decode('gbk '),表示将gbk 编码的字符串转换成unicode编码。 
     
    二、判断字符串的的编码格式
    通过repr函数来查看变量给python看的形式,不同的编码格式,存储中文的结果不同,比如下面的例子。
     
    “测试test”,使用不同的编码格式的结果如下:
    unicode:'u6d4bu8bd5test'
    unicode一般是u开头,后边跟4位的数字或字母,1个u对应一个汉字
    utf-8:'xe6xb5x8bxe8xafx95test'
    utf-8一般是x开头,后面跟两位字母或数字,3个x代表一个汉字
    gbk:'xb2xe2xcaxd4test'
    gbk也是x开头,后面跟两位字母或数字,2个x代表一个汉字
     
    三、其他注意点
    1.python3默认编码改成了unicode,基本上不存在编码问题
  • 相关阅读:
    for, 类型转换和使用方法
    笔记,随时更改
    控制流程之while循环, for循环
    赋值,逻辑,运算符, 控制流程之if 判断
    常量,基本数据类型,输入输出,基本运算符
    介绍python由来, 安装python3.8.3 及其变量的定义, 小整数池
    数组去重多个条件
    vue 自定义指令
    截取指定名字的url参数
    常用的js
  • 原文地址:https://www.cnblogs.com/meitian/p/5153099.html
Copyright © 2011-2022 走看看