zoukankan      html  css  js  c++  java
  • 十,编码

    最基础的编码方式:二进制

      机器能够理解的编码方式只有二进制编码。

      所以一切的编程语言都要转换成二进制编码输入到cpu中执行

      8位二进制数字可以表示256个十进制数字。

      计算机中,每8位二进制数字就表示一个字节,是计算机存储的最小单位。bytes

      1024bytes = 1kb

      1024kb = 1mb

      1024mb = 1gb

      1024gb = 1tb

      pb

      eb

      zb

      yb

      bb

      等等

    Ascci码:只能表示英文大小写字母、数字和一些特殊标点和图形字符。

      由于断句问题,所有的ascci码都使用8位字符进行表示。如5位二进制数字前要用3位0进行填充。

      但是不支持英文字母以外的其他字符。

    中国自己的编码:GBK

      两个字节表示一个中文汉字,但是不能支持全部的中文汉字,只支持常用的7445

      使用16位二进制数字,也就是2个字节

    万国码:unicode

      每个字符都是用2个字节进行存储的。(???之前不是说是4个字节么???)

    万国码升级版:utf-8

      可以自动调整字节长度:

      原来表示ascii的字符只用1个字节就可以表示了。

      欧洲国家的文字使用2个字节表示

      中文使用3个字节表示

      

    如何在python2中调节编码?

      可以在首行添加#! -*- coding:utf-8 -*- 转换成为utf-8编码

      也可以使用#! encoding:utf-8  进行转换。

      但是必须添加到首行,放在文档中不好使。

      

      

  • 相关阅读:
    转发自lealii 的博客,如有侵权请通知删除
    SQL注入详解-转发
    IT实用技术资源整理
    JMeter-接口自动化之正则表达式关联
    转发自_destiny如有侵权请联系删除
    二元数组的最小值最大和
    连续区间和大于等于某个数(弱化版)
    独一无二的最小生成树
    牛客小白月赛19 弱版 C
    牛客 安徽大学新生赛 G
  • 原文地址:https://www.cnblogs.com/wanghanyao/p/10253390.html
Copyright © 2011-2022 走看看