zoukankan      html  css  js  c++  java
  • 【Python 学习_第3周_字符编码】金角大王培训_第三周_字符编解码_心得及网上资料连接

    一、计算机编码简介

    编码是指示将信息从表示方法A转变为表示方法B,解码是编码的逆过程,信息通过编解码后,信息内容不变。

    针对计算机而言,编码就是将信息转为计算机可以识别的二进制0、1数字,而由于各国表示信息的方式不一致(如中文:汽车;美国: bus),因此各国产生了自己的编码规则,比较常用的是

    ASCII码:早期计算机编码,在内存占用1个字节(8bit),因此最多能表示256个符号,表示为英文字母和特殊符号。

    GBK编码:随着计算机在中国应用,国内编码经历gb2312 – gbk的演变,现应用较多的是GBK编码。GBK占2个字节。

    Unicode编码:由于各国采用自己的编码格式,标准组织制定了Unicode编码,兼容各种编码方式,因此又称万国码,占有2个字节。

    UTF-8编码:ASCII仅仅占用一个字节,而unicode编码同一为2个字节,为了节省存储空间,提高信息传输速度,产生utf-8编码,又称变字长编码,其中ASCII占1个字节,汉字占3个字节。

    注意:文件在硬盘存储的数据是通过某种编码方式编码的bytes字节串,在内存中的数据都是unicode。

    二、Python编码转换语句

    编解码间转换图

     

    从utf-8 转成 GBK Python3.x实现代码

    Utf8_to_gbk = 变量名.decode(‘utf-8’).encode(‘gbk’)

    gbk_to_utf8= 变量名.decode(‘gbk’).encode(‘utf-8’)

    三、网上资料

     博客园中发现将的比较好的链接 https://www.cnblogs.com/yuanchenqi/articles/5956943.html

  • 相关阅读:
    surfer插值方法及提取插值结果 转载
    Surfer的grd数据转换成gmt可用的grd数据方法
    Appium+Python3+ Android入门
    Flask入门的第一个项目
    测试报告模板
    火狐浏览器之伪造IP地址
    获取apk的签名信息
    初识kibana
    Fiddler模拟post四种请求数据
    Python-正则表达式
  • 原文地址:https://www.cnblogs.com/Finding-bugs/p/9246539.html
Copyright © 2011-2022 走看看