小数据池、代码块以及编码转换

zoukankan html css js c++ java

小数据池、代码块以及编码转换
一、代码块

Python程序是由代码块构造的。块是一个python程序的文本，他是作为一个单元执行的。

代码块：一个模块，一个函数，一个类，一个文件等都是一个代码块。

而作为交互方式输入的每个命令都是一个代码块。

什么叫交互方式？就是咱们在cmd中进入Python解释器里面，每一行代码都是一个代码块。

不同的代码块：
def func(): print(333) class A: name = 'alex'

虽然上面的缩进的内容都叫代码块，但是他不是python中严格定义的代码块。

for i in '12324545':
print(i)

交互模式下，每一行都是一个代码块
>>>i1 = 100 可以理解这一行在一个文件中
>>>i2 = 100 可以理解这一行在另一个文件中
　　

# 二、 id， is ==
name = 'alex' #赋值
print('alex' == 'alex') #数值相同
name = 'alex123'
print(id(name)) #2112772900544

# 在内存中id都是唯一的，如果两个变量指向的值的id相同，就证明他们在内存中是同一个。

# is判断的是两个变量的id值是否相同。
# 如果is是True， == 一定是True。反过来不一定成立
# 如果is是True， == 一定是True。反过来不一定成立 >>> i1 = 1000 >>> i2 = 1000 >>> print(i1 is i2) False >>> print(i1 == i2) True >>>
　　

# 三、小数据池（缓存机制，驻留机制）

小数据池的应用数据类型：整数，字符串，bool值

# 小数据池，python对内存做的一个优化：
# 他将 -5~256 之间的整数，以及一定规则的字符串，提前在内存中创建了池，容器。容器里固定的放了这些数。
指向的都是同一个内存地址
在交互器中
s1 = 100
s2 = 100
指向地址一致
与
s1 = 1000
s2 = 1000
指向地址不一致

为什么这么做:
1. 节省内存。
2. 提高性能与效率

代码块：
python在对于同一个代码块中的变量，初始化对象的命令中时，它会将变量与值的对应关系放到一个字典中
如果下面的代码在遇到初始化对象的命令时，它会先从字典中寻找，如果存在相同的值，他会复用，所以指向的都是同一个内存地址。
dic = {'name':alex@的内存地址}

python交互方式对于不同的代码块：初始化命令时，他会从小数据池中寻找。
name = 'alex@'
name1 = 'alex@'
1 #内存地址会变 2 3 # 小数据池指向同一地址 4 i1 = 100 5 i2 = 100 6 print(id(i1),id(i2)) 7 # pycharm 140708817920128 140708817920128 8 # 交互方式 140708990083200 140708990083200 9 10 11 # 同一代码块。pycharm指向的是同一地址，交互方式指向的不同地址。 12 i1 = 1000 13 i2 = 1000 14 print(id(i1),id(i2)) 15 #pycharm 2093897078224 2093897078224 16 #交互方式 1830950750224 1830950750096 17 18 19 # 不同代码块，地址不同 20 def func1(): 21 i = 1000 22 print(id(i)) # 2093927219472 23 24 def func2(): 25 i = 1000 26 print(id(i)) # 2093927219440 27 28 func1() 29 func2() 30 31 32 # 从小数据取得地址相同 33 def func1(): 34 i = 100 35 print(id(i)) # 140708817920128 36 37 def func2(): 38 i = 100 39 print(id(i)) # 140708817920128 40 41 func1() 42 func2()

小数据池代码块详解
编码以及转换关系

ASCII码：
A : 0100 0001 8位
中：0100 0001 0100 0001 16位

Unicode编码：
A：0100 0001 0100 0001 16位
中：0100 0001 0100 0001
升级
A：0100 0001 0100 0001 0100 0001 0100 0001 32位
中：0100 0001 0100 0001 0100 0001 0100 0001
浪费资源

UTF-8编码：
　　一个英文字符等于一个字节，一个中文（含繁体）等于三个字节。
A ：01000001 8位
欧：01000001 01000001 16位
中：01000001 01000001 01000001 24位

gbk：国标，只包含中文，英文（英文字母，数字，特殊字符）
A ： 01000001 8位
中文： 01000001 01000001 16位

1.编码之间不能互相识别。
2.网络传输，或着硬盘存储的010101，必须是以非Unicode编码方式得01010101

大环境python3.x：
　　str:内存（内部）编码方式位Unicode。
　　其他都是utf-8
　　bytes：python的基础数据类型之一，他和str相当于双胞胎，str拥有的所有方法，bytes类型都适用。

str与bytes区别：
英文字母：
　　str：
　　　　表现形式：s1 = 'alex'
　　　　内部编码方式：Unicode
　　bytes：
　　　　表现形式：b1 = b'alex'
　　　　内部编码方式：非Unicode
中文字母：
　　str：
　　　　表现形式：s1 = '太白'
　　　　内部编码方式：Unicode
　　bytes：
　　　　表现形式：b1 = b'xe5xa4xaaxe7x99xbd'
　　　　内部编码方式：非Unicode

如何使用：
如果你想将一部分内容（字符串）写入文件，或者通过网络socket传输传输，这样这部分内容（字符串）必须转化成bytes才可以进行。

bytes类型gbk能与utf-8相互转换，前提是英文字母，数字，特殊字符。因为他们引用的都是ASCII
str --> bytes encode编码 s1 = 'alex' b1 = s1.encode('utf-8') s2 = '太白' b2 = s2.encode('gbk') bytes --> str decode 解码 b1 = b'xccxabxb0xd7' #gbk的形式 s1 = b1.decode('gbk')
　　
查看全文

相关阅读:
JDBC遇到向ORACLE数据库表执行插入操作时，报错“列在此处不允许”
关于对称加密和非对称加密以及签名，认证和证书的理解
 .net framework 各版本区别
 数据库设计三大范式
 业务系统设计
 修改 Windows 服务器默认远程端口3389
iis读取不到本地证书问题提示已经导入成功
 HTTPS 建立连接的详细过程
 使用ServiceStack构建Web服务
 转-微信支付（公众号支付JSAPI）

原文地址：https://www.cnblogs.com/eaoo/p/9449105.html

小数据池、代码块以及编码转换

编码以及转换关系