zoukankan      html  css  js  c++  java
  • Python的小数据池和编码解码

    1、小数据池

      代码块:  一个模块, 一个函数, 一个类, 甚至每一个command命令都是一个代码块. 一个文件也是一个代码块.而不需要创建一个新的数据. 这样会节省更多的内存区域.

          在cmd命令行执行python时,每一条代码就是一个代码块; 

             在pycharm中执行文件时,每一个.py文件就是一个代码块.

      is:  判断的是两者的内存地址是否一致.   print(id(变量))  ----> 查内存地址

      ==:  判断两者值是否一致.

      小数据池:  一种缓存机制, 可以快速地创建字符串对象, 以减少内存的浪费 (只针对整数, 字符串, bool). 

          在python中对-5到256之间的整数会被驻留在内存中, 并将一定规则的字符串缓存. 在使用时, 内存中只会创建一个给数据的对象, 保存在小数据池中. 当使用的时候直接从小数据池中获取对象的内存引用, 而不需要创建一个新的数据, 这样就会节省更多的内存区域.

          对于整数:  -5 到 256

          对于字符串: 只针对含有字母,数字,下划线式并且字符长度不大于20的字符串会缓存(汉字不会缓存).

    2、编码解码

      ASCII(含数字,字母和特殊字符) :  8位  1字节  

      gbk(国标码,含有6w多个汉字):    16位  2字节

      Unicode(万国码):         32位  4字节  (太长不适合传输和保存)

      utf-8(可变长度的unicode):       24位  英文1字节, 欧洲文字2字节, 中文3字节  (适合传输和保存)

      在python 3的内存中,用的是unicode, 在python 2中用的是ASCII.

      程序在运行的时候, 使用的是unicode编码方式, 因为unicode是万国码, 什么内容都可以进行显示, 在数据传输和存储时候, 则以 utf-8 的形式进行存储, 省内存.

      encode()和decode()

    1 bs = b'xc2xedxbbxafxccxda'    # GBK编码
    2 b = bs.decode("GBK")
    3 bss = b.encode("utf-8")
    4 print(bss)
    编码解码
  • 相关阅读:
    Java 中的 volatile 关键字
    Java 隐式锁
    导致并发程序出问题的根本原因是什么?
    BZOJ_2434_[Noi2011]阿狸的打字机_AC自动机+出栈入栈序+树状数组
    BZOJ_5368_[Pkusc2018]真实排名_组合数
    CF上的3道小题(2)
    BZOJ_4199_[Noi2015]品酒大会_后缀自动机
    BZOJ_4566_[Haoi2016]找相同字符_后缀自动机
    BZOJ_3172_[Tjoi2013]单词_后缀自动机
    BZOJ_3998_[TJOI2015]弦论_后缀自动机
  • 原文地址:https://www.cnblogs.com/bk9527/p/9843601.html
Copyright © 2011-2022 走看看