zoukankan      html  css  js  c++  java
  • 十,编码

    最基础的编码方式:二进制

      机器能够理解的编码方式只有二进制编码。

      所以一切的编程语言都要转换成二进制编码输入到cpu中执行

      8位二进制数字可以表示256个十进制数字。

      计算机中,每8位二进制数字就表示一个字节,是计算机存储的最小单位。bytes

      1024bytes = 1kb

      1024kb = 1mb

      1024mb = 1gb

      1024gb = 1tb

      pb

      eb

      zb

      yb

      bb

      等等

    Ascci码:只能表示英文大小写字母、数字和一些特殊标点和图形字符。

      由于断句问题,所有的ascci码都使用8位字符进行表示。如5位二进制数字前要用3位0进行填充。

      但是不支持英文字母以外的其他字符。

    中国自己的编码:GBK

      两个字节表示一个中文汉字,但是不能支持全部的中文汉字,只支持常用的7445

      使用16位二进制数字,也就是2个字节

    万国码:unicode

      每个字符都是用2个字节进行存储的。(???之前不是说是4个字节么???)

    万国码升级版:utf-8

      可以自动调整字节长度:

      原来表示ascii的字符只用1个字节就可以表示了。

      欧洲国家的文字使用2个字节表示

      中文使用3个字节表示

      

    如何在python2中调节编码?

      可以在首行添加#! -*- coding:utf-8 -*- 转换成为utf-8编码

      也可以使用#! encoding:utf-8  进行转换。

      但是必须添加到首行,放在文档中不好使。

      

      

  • 相关阅读:
    [LeetCode]52. Bulls and Cows猜数字游戏
    [LeetCode]51. Ismorphic Strings同构字符串
    [LeetCode]50. Valid Anagram有效变位词
    [LettCode]49. Valid Sudoku有效数独
    [LeetCode]48. Word Pattern匹配模式
    Ubuntu 14.04中安装Sublime Text 3并使用SublimeClang插件
    [LeetCode]47. Integer to English Words整数的读法
    六度空间
    Saving James Bond
    列出图的连通集
  • 原文地址:https://www.cnblogs.com/wanghanyao/p/10253390.html
Copyright © 2011-2022 走看看