zoukankan      html  css  js  c++  java
  • python基础之编码的定义和种类

    - 电脑将人类的语言转换成机器特有的语言,即编码进行存取,二进制数字。

    - 电脑将人类的语言转换成机器特有的语言,即编码进行存取,二进制数字。
    1. **ASCII 英文**,8个数字表示1个单位,一共有2**8个,可以表示所有的英文、数字及符号,8个数字为1个字节
    2. **unicode 万国语**,32个数字表示1个单位,共计有2**32个,目前还有很多空缺,32个数字为4个字节
    3. **utf-8**,  unicode的缩减版,unicode相比于ASCII优点是每个国家的文字都可以直接转译成编码,缺点是由于32个数字(即4个字节)表示1个单位,比较占用空间,在这个基础上,utf-8可以将unicode中未使用的0进行省略,但是只会每8位省略,中文3个字节
    # -*- coding:utf-8 -*-  # 使用这组编码可以让python2使用utf-8进行编码
    print("你好 世界")
    

      

    print"你好 世界"

    编码种类:

    • ASCII 英文 位数少 只有8位
    • unicode 万国码 可以统计世界上的所有语言,但是32位为一个单位, 由于较规整,一般用于内存计算
    • utf-8 万国码的压缩版,对万国码未用到的位数进行省略, 跟万国码比较节省空间,一般用于通信传输,节省流量 3个字节可以表示一个汉字
    • gb2312
    • gbk 两个字节,16个数字表示一个汉字

    字符串"中国人" 一个字符串= 三个字符= 9个字节(utf-8)=6个字节(GBK) (在没有定义编码的前提下,字节与字符没有关系)

    单位换算:

    ​ 1byte = 8 bit 任何编码 ,1个字节等于8个数字,数字指基本的二进制数字

    ​ 1KB = 1024byte

    ​ 1MB = 1024KB

    ​ 1GB = 1024 MB

    ​ 1TB = 1024 GB

    ​ 1PB = 1024 TB

     
  • 相关阅读:
    转发:前端新人少走弯路
    react 表单(受控组件和非受控组件)
    axios封装的拦截器的应用
    react与redux的一点心得(理解能力有限,蜗牛进度)
    redux一些自习时候自己写的的单词
    react路由的跳转和传参
    学以致用,react学习前奏准备阶段
    原型,原型链,给予原型和class的继承
    rpm安装和卸载
    .net项目发布到iis
  • 原文地址:https://www.cnblogs.com/sundy08/p/11792316.html
Copyright © 2011-2022 走看看