zoukankan      html  css  js  c++  java
  • python中英文字母和中文汉字所占的字节

    print(type('李杰'.encode('utf-8')))#<class 'bytes'>
    print(type('李杰'.encode('gbk')))#<class 'bytes'>
    print(len('李杰'.encode('utf-8')))#6
    print(len('李杰'.encode('gbk')))#4
    print(len(',。'.encode('gbk')))#4
    

     英文和符号:

    print(type('li'.encode('utf-8')))#<class 'bytes'>
    print(type('li'.encode('gbk')))#<class 'bytes'>
    print(len('li'.encode('utf-8')))#2
    print(len('li'.encode('gbk')))#2
    print(len(',.'.encode('gbk')))#2
    

      所以:

    utf-8编码:一个中文包含繁体字等于三个字节,一个英文字符等于一个字节。
    gbk编码:一个中文包含繁体字等于二个字节,一个英文字符等于一个字节。

     

  • 相关阅读:
  • 原文地址:https://www.cnblogs.com/wxcx/p/12692488.html
Copyright © 2011-2022 走看看