zoukankan      html  css  js  c++  java
  • Python 入门 之 编码

    1、编码初识

    (1)ASCII码 :256 个 英文1个字节,不支持中文

    (2)GBK(国标码) : 英文1个字节 中文两个字节

    (3)unicode (万国码):英文4个字节 中文4个字节

    (4)Utf-8 :最流行的编码集(密码本) 英文1个字节;欧洲2个字节;亚洲3个字节

    ​ Win – 编码gbk linux – 编码utf-8 mac – 编码utf-8

    2、编码进阶

    (1)编码:

    <1> ASCII码:

    ​ 支持:英文,数字,符号 1字节

    ​ 不支持:中文

    <2> GBK(国标):

    ​ 支持:英文,数字,符号 --- ASCII 1字节

    ​ 支持:中文 2字节

    <3> Unicode(万国码):

    ​ 支持:英文,数字,符号 ---ASSCII 4字节

    ​ 支持:欧洲 4字节

    ​ 支持:亚洲 4字节

    <4> Utf – 8:

    ​ 支持:英文,数字,符号 --- ASSCII 1字节

    ​ 支持:欧洲 2字节

    ​ 支持:亚洲 3字节

    <5> 字节名.encode(“utf-8”) # 编码

    s = "今天"      
    s1 = s.encode("utf-8")    # 编码
    print(s1)                 # b'xe4xbbx8axe5xa4xa9'
    

    <6> 字节名.decode(“utf-8”) # 解码

    s = "今天" 
    s1 = s.encode("utf-8")     # 编码
    s2 = s1.decode("utf-8")    # 解码
    print(s2)                  # '今天'
    
    # 用什么编码就要用什么解码
    

    Python3:默认编码 unicode
    Python2:默认编码 ASCII Python2不支持中文

    3、单位转换

    1字节 == 8位 (10101001)

    字节:存储和传输, 网络传输一定是字节

    1字节 == 8位 ( 1Bytes == 8bit )

    1B == 8b
    1KB == 1024 B
    1MB == 1024 KB
    1GB ==1024 MB
    1TB ==1024 GB
    1PB ==1024 TB
    1EB ==1024 PB
    
    天之涯,海之角,吾与money天荒地老。
  • 相关阅读:
    Extjs 4.0 Grid 数据绑定 json 分页 不分页
    [转]AS语言基础
    tig支持中文搜索
    LPC及MudOS简介(一)
    欢送2012
    存储器性能测试
    为什么go语言适合开发网游服务器端
    从一段代码里看FreeBSD与Linux内存分配的不同
    新的开始
    多语言协作与二进制交互
  • 原文地址:https://www.cnblogs.com/caiyongliang/p/11372838.html
Copyright © 2011-2022 走看看