zoukankan      html  css  js  c++  java
  • ascii、unicode、utf-8、gbk

    字节码是一种中间状态(中间码)的二进制代码(文件)。需要直译器转译后才能成为机器码。

    1字节 = 8 位位(bit),数据存储是以“字节”(Byte)为单位,

    数据传输是以大多是以“位”(bit,又名“比特”)为单位,

    一个位就代表一个0或1(即一个二进制),

    二进制是构成存储器的最小单位,

    每8个位(bit,简写为b)组成一个字节(Byte,简写为B),

    字节是最小一级的信息单位

    utf-8编码:一个中文包含繁体字等于三个字节,一个英文字符等于一个字节。

    gbk编码:一个中文包含繁体字等于二个字节,一个英文字符等于一个字节。

    python2内容进行编码(默认ascii),而python3对内容进行编码的默认为utf-8。

    ascii 最多只能用8位来表示(一个字节),即:2**8 = 256,所以,ASCII码最多只能表示 256 个符号。

    unicode 万国码,任何一个字符==两个字节

    utf-8 万国码的升级版 一个中文字符==三个字节 英文是一个字节 欧洲的是 2个字节

    gbk 国内版本 一个中文字符==2个字节 英文是一个字节

    gbk 转 utf-8 需通过媒介 unicode

  • 相关阅读:
    100-days: twelve
    100-days: eleven
    100-days: ten
    [PKUWC 2018]随机算法
    [CTSC 2018]假面
    APIO 2018 游记
    CTSC 2018 游记
    [CQOI 2018]解锁屏幕
    [CQOI 2018]九连环
    [CQOI 2018]破解D-H协议
  • 原文地址:https://www.cnblogs.com/justblue/p/13022470.html
Copyright © 2011-2022 走看看