鉴于对很多初学编程的小伙伴来说,对于赋值和深浅拷贝的用法有些疑问,所以我就结合python变量存储的特性从内存的角度来谈一谈赋值和深浅拷贝~~~
准备知识
一些基本的定义:
- 在Python中对象的赋值其实就是对象的引用。当创建一个对象,把它赋值给另一个变量的时候,python并没有拷贝这个对象,只是拷贝了这个对象的引用而已。
- 浅拷贝:拷贝了最外围的对象本身,内部的元素都只是拷贝了一个引用而已。也就是,把对象复制一遍,但是该对象中引用的其他对象我不复制
- 深拷贝:外围和内部元素都进行了拷贝对象本身,而不是引用。也就是,把对象复制一遍,并且该对象中引用的其他对象我也复制。
几个术语的解释
- 变量:是一个系统表的元素,拥有指向对象的连接空间
- 对象:被分配的一块内存,存储其所代表的值
- 引用:是自动形成的从变量到对象的指针
- 注意:类型(int类型,long类型(python3已去除long类型,只剩下int类型的数据))属于对象,不是变量
- 不可变对象:一旦创建就不可修改的对象,包括字符串、元组、数字
- 可变对象:可以修改的对象,包括列表、字典。
深浅拷贝的作用
- 减少内存的使用
- 以后在做数据的清洗、修改或者入库的时候,对原数据进行复制一份,以防数据修改之后,找不到原数据。
对于不可变对象的深浅拷贝
不可变对象类型(这个不可变对象类型里面不能包含可变对象类型,如元祖里面包含列表就不满足这个条件),没有被拷贝的说法,即便是用深拷贝,查看id的话也是一样的,如果对其重新赋值,也只是新创建一个对象,替换掉旧的而已。一句话就是,不可变类型,不管是深拷贝还是浅拷贝,地址值和拷贝后的值都是一样的。
数字、字符串等不可变数据类型
赋值
举个栗子:
n1 = 123123 n2 = n1 print(n1,n2) print(id(n1)) print(id(n2)) 输出结果: 123123 123123 1607915318992 1607915318992
在以上代码块当中,a2与a1所赋的值是一样的,都是数字123123。因为python有一个重用机制,对于同一个数字,python并不会开辟一块新的内存空间,而是维护同一块内存地址,只是将该数字对应的内存地址的引用赋值给变量a1和a2。所以根据输出结果,a1和a2其实对应的是同一块内存地址,只是两个不同的引用罢了。同样的,对于a2 = a1,其实效果等同于“a1 = 123123; a2 = 123123”,它也就是将a1指向123123的引用赋值给a2。字符串跟数字的原理雷同,如果把123123改成“abcabc”也是一样的。
结论:对于通过用 = 号赋值,数字和字符串在内存当中用的都是同一块地址。
浅拷贝
同样的栗子:
import copy # 使用浅拷贝需要导入copy模块 n1 = 123123 n3 = copy.copy(n1) # 使用copy模块里的copy()函数就是浅拷贝了 print(n1,n3) print(id(n1)) print(id(n3)) 输出结果: 123123 123123 2735567515344 2735567515344
通过使用copy模块里的copy()函数来进行浅拷贝,把a1拷贝一份赋值给a3,查看输出结果发现,a1和a3的内存地址还是一样。
结论:对于浅拷贝,数字和字符串在内存当中用的也是同一块地址。
深拷贝
再来一个栗子:
import copy n1 = 123123 n4 = copy.deepcopy(n1) # 深拷贝是用copy模块里的deepcopy()函数 print(n1,n4) print(id(n1)) print(id(n4)) 输出结果: 123123 123123 2545114525392 2545114525392
这个。。。还用说嘛,直接看结论>>>
结论:综上所述,对于数字和字符串的赋值、浅拷贝、深拷贝在内存当中用的都是同一块地址。
原理图:
字典、列表等可变数据类型
赋值
再举个栗子
n1 = {"k1": "wu", "k2": 123, "k3": ["alex", 678]} n2 = n1 # 赋值 print(n1,n2) print(id(n1)) print(id(n2)) n1['k1'] = 'c' n1['k3'][0] = 'd' print(n1,n2) print(id(n1)) print(id(n2)) 输出结果:
{'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]} {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]}
1867471875528
1867471875528
{'k1': 'c', 'k2': 123, 'k3': ['d', 678]} {'k1': 'c', 'k2': 123, 'k3': ['d', 678]}
1867471875528
1867471875528
我们的栗子当中用了一个字典n1,字典里面嵌套了一个列表,当我们把n1赋值给n2时,内存地址并没有发生变化,因为其实它也是只是把n1的引用拿过来赋值给n2而已(我们用了一个字典来举例,其他类型也是一样的)。正因为如此,当我们修改字典里面的数据时,n1和n2都会发生改变。
结论:对于赋值,字典、列表等其他类型用的内存地址不会变化。
浅拷贝
栗子走起
import copy n1 = {"k1": "wu", "k2": 123, "k3": ["alex", 678]} n3 = copy.copy(n1) # 浅拷贝 print(n1,n3) print("第一层字典的内存地址:") print(id(n1)) print(id(n3)) print("第二层嵌套的列表的内存地址:") print(id(n1["k3"])) print(id(n3["k3"])) n1['k1'] = 'tom' n1['k3'][0] = 'jack' print('***************') print(n1,n3) 输出结果: {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]} {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]} 第一层字典的内存地址: 1506727325128 1506727325200 第二层嵌套的列表的内存地址: 1506758960840 1506758960840 *************** {'k1': 'tom', 'k2': 123, 'k3': ['jack', 678]} {'k1': 'wu', 'k2': 123, 'k3': ['jack', 678]}
通过以上结果可以看出,进行浅拷贝时,我们的字典第一层n1和n3指向的内存地址已经改变了,但是对于第二层里的列表并没有拷贝,它的内存地址还是一样的。原理如下图:
结论:所以对于浅拷贝,字典、列表等类型,它们只拷贝第一层地址。
深拷贝
栗子:
import copy n1 = {"k1": "wu", "k2": 123, "k3": ["alex", 678]} n4 = copy.deepcopy(n1) # 深拷贝 print("第一层字典的内存地址:") print(id(n1)) print(id(n4)) print("第二层嵌套的列表的内存地址:") print(id(n1["k3"])) print(id(n4["k3"])) n1['k1'] = 'tom' n1['k3'][0] = 'jack' print(n1,n4)
输出结果:
{'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]} {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]}
第一层字典的内存地址:
1853270748616
1853271588800
第二层嵌套的列表的内存地址:
1853273351880
1853273350600
***************
{'k1': 'tom', 'k2': 123, 'k3': ['jack', 678]} {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]}
通过以上结果发现,进行深拷贝时,字典里面的第一层和里面嵌套的地址都已经变了。对于深拷贝,它会拷贝多层,将第二层的列表也拷贝一份,如果还有第三层嵌套,那么第三层的也会拷贝,但是对于里面的最小元素,比如数字和字符串,这里就是“wu”,123,“alex”,678之类的,按照python的机制,它们会共同指向同一个位置,它的内存地址是不会变的。原理如下图:
结论:对于深拷贝,字典、列表等类型,它里面嵌套多少层,就会拷贝多少层出来,但是最底层的数字和字符串地址不变,是一样的。
PS:
对于元祖来说,如果他里面的元素都是不可变类型的元素,那么不论是赋值,浅拷贝还是深拷贝,他们的id都是一样的(不仅整个元祖的id是一样的,里面每一个元素的id都是一样的)。但是如果元祖里面的元素有可变元素,如列表字典等,那么对于赋值和浅拷贝来说,id仍然还是一样的(不仅整个元祖的id是一样的,里面每一个元素的id都是一样的);对于深拷贝来说,元祖的id和列表字典的id是不一样的,但是对于最底层的数字,字符串地址还是一样的。