zoukankan      html  css  js  c++  java
  • 字符编码

    ascii码

    1981  gb2312
    1995  gbk 21003个汉字
    2000 gb18030
    unicode 16位(2字节) 65536
    utf-8 可变长:ascii用1个字节,欧洲的2个字节,东亚的用3个字节

    python2默认是ascii码(默认不支持中文)

    python3默认是utf8

    http://www.cnblogs.com/alex3714/articles/7550940.html

    示例:

    '''
    有如下字符串:n = "路飞学城"(编程题)

        - 将字符串转换成utf-8的字符编码的字节,再将转换的字节重新转换为utf-8的字符编码的字符串
        - 将字符串转换成gbk的字符编码的字节,再将转换的字节重新转换为utf-8的字符编码的字符串
    '''
    n = "路飞学城"
    # a = n.encode('utf8')
    # s = a.decode('utf8')
    #py3中默认是unicode,什么规则编码,解码必须对应,unicode是万国码,所以再使用utf8编解码一次,就可以达到需求
    a = n.encode('gbk')
    s = a.decode('gbk')
    b = s.encode('utf8')
    d = b.decode('utf8')
    print(a, s, b, d)

  • 相关阅读:
    递归
    匿名函数
    迭代器、可迭代对象、生成器
    日期
    大文件读写
    面向对象
    魔术方法
    进程与线程
    numpy常用函数
    shell编程
  • 原文地址:https://www.cnblogs.com/fmgao-technology/p/9033819.html
Copyright © 2011-2022 走看看