zoukankan      html  css  js  c++  java
  • Python中的赋值与深浅拷贝

      鉴于对很多初学编程的小伙伴来说,对于赋值和深浅拷贝的用法有些疑问,所以我就结合python变量存储的特性从内存的角度来谈一谈赋值和深浅拷贝~~~

    准备知识

    一些基本的定义:

    • 在Python中对象的赋值其实就是对象的引用。当创建一个对象,把它赋值给另一个变量的时候,python并没有拷贝这个对象,只是拷贝了这个对象的引用而已。
    • 浅拷贝:拷贝了最外围的对象本身,内部的元素都只是拷贝了一个引用而已。也就是,把对象复制一遍,但是该对象中引用的其他对象我不复制
    • 深拷贝:外围和内部元素都进行了拷贝对象本身,而不是引用。也就是,把对象复制一遍,并且该对象中引用的其他对象我也复制。

    几个术语的解释

    • 变量:是一个系统表的元素,拥有指向对象的连接空间
    • 对象:被分配的一块内存,存储其所代表的值
    • 引用:是自动形成的从变量到对象的指针
    • 注意:类型(int类型,long类型(python3已去除long类型,只剩下int类型的数据))属于对象,不是变量
    • 不可变对象:一旦创建就不可修改的对象,包括字符串、元组、数字
    • 可变对象:可以修改的对象,包括列表、字典。

    深浅拷贝的作用

    • 减少内存的使用 
    • 以后在做数据的清洗、修改或者入库的时候,对原数据进行复制一份,以防数据修改之后,找不到原数据。

    对于不可变对象的深浅拷贝

      不可变对象类型(这个不可变对象类型里面不能包含可变对象类型,如元祖里面包含列表就不满足这个条件),没有被拷贝的说法,即便是用深拷贝,查看id的话也是一样的,如果对其重新赋值,也只是新创建一个对象,替换掉旧的而已。一句话就是,不可变类型,不管是深拷贝还是浅拷贝,地址值和拷贝后的值都是一样的。

    数字、字符串等不可变数据类型

    赋值

    举个栗子:

    n1 = 123123
    n2 = n1
    print(n1,n2)
    print(id(n1))
    print(id(n2))
    
    输出结果:
    123123 123123
    1607915318992
    1607915318992

      在以上代码块当中,a2与a1所赋的值是一样的,都是数字123123。因为python有一个重用机制,对于同一个数字,python并不会开辟一块新的内存空间,而是维护同一块内存地址,只是将该数字对应的内存地址的引用赋值给变量a1和a2。所以根据输出结果,a1和a2其实对应的是同一块内存地址,只是两个不同的引用罢了。同样的,对于a2 = a1,其实效果等同于“a1 = 123123; a2 = 123123”,它也就是将a1指向123123的引用赋值给a2。字符串跟数字的原理雷同,如果把123123改成“abcabc”也是一样的。

    结论:对于通过用 = 号赋值,数字和字符串在内存当中用的都是同一块地址。

    浅拷贝

    同样的栗子:

    import copy  # 使用浅拷贝需要导入copy模块
    
    n1 = 123123
    n3 = copy.copy(n1)  # 使用copy模块里的copy()函数就是浅拷贝了
    print(n1,n3)
    print(id(n1))
    print(id(n3))
    
    输出结果:
    123123 123123
    2735567515344
    2735567515344

      通过使用copy模块里的copy()函数来进行浅拷贝,把a1拷贝一份赋值给a3,查看输出结果发现,a1和a3的内存地址还是一样。

    结论:对于浅拷贝,数字和字符串在内存当中用的也是同一块地址。

    深拷贝

    再来一个栗子:

    import copy
    
    n1 = 123123
    n4 = copy.deepcopy(n1)  # 深拷贝是用copy模块里的deepcopy()函数
    print(n1,n4)
    print(id(n1))
    print(id(n4))
    
    输出结果:
    123123 123123
    2545114525392
    2545114525392

      这个。。。还用说嘛,直接看结论>>>

    结论:综上所述,对于数字和字符串的赋值、浅拷贝、深拷贝在内存当中用的都是同一块地址。

    原理图:

    字典、列表等可变数据类型

    赋值

    再举个栗子

    n1 = {"k1": "wu", "k2": 123, "k3": ["alex", 678]}
    n2 = n1  # 赋值
    print(n1,n2)
    print(id(n1))
    print(id(n2))
    n1['k1'] = 'c'
    n1['k3'][0] = 'd'
    print(n1,n2)
    print(id(n1))
    print(id(n2))
    
    输出结果:

    {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]} {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]}
    1867471875528
    1867471875528
    {'k1': 'c', 'k2': 123, 'k3': ['d', 678]} {'k1': 'c', 'k2': 123, 'k3': ['d', 678]}
    1867471875528
    1867471875528

     

       我们的栗子当中用了一个字典n1,字典里面嵌套了一个列表,当我们把n1赋值给n2时,内存地址并没有发生变化,因为其实它也是只是把n1的引用拿过来赋值给n2而已(我们用了一个字典来举例,其他类型也是一样的)。正因为如此,当我们修改字典里面的数据时,n1和n2都会发生改变。

      结论:对于赋值,字典、列表等其他类型用的内存地址不会变化。

    浅拷贝

    栗子走起

    import copy
    
    n1 = {"k1": "wu", "k2": 123, "k3": ["alex", 678]}
    n3 = copy.copy(n1)  # 浅拷贝
    print(n1,n3)
    print("第一层字典的内存地址:")
    print(id(n1))
    print(id(n3))
    print("第二层嵌套的列表的内存地址:")
    print(id(n1["k3"]))
    print(id(n3["k3"]))
    n1['k1'] = 'tom'
    n1['k3'][0] = 'jack'
    print('***************')
    print(n1,n3)
    
    
    输出结果:
    {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]} {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]}
    第一层字典的内存地址:
    1506727325128
    1506727325200
    第二层嵌套的列表的内存地址:
    1506758960840
    1506758960840
    ***************
    {'k1': 'tom', 'k2': 123, 'k3': ['jack', 678]} {'k1': 'wu', 'k2': 123, 'k3': ['jack', 678]}

      通过以上结果可以看出,进行浅拷贝时,我们的字典第一层n1和n3指向的内存地址已经改变了,但是对于第二层里的列表并没有拷贝,它的内存地址还是一样的。原理如下图:  

       结论:所以对于浅拷贝,字典、列表等类型,它们只拷贝第一层地址。

    深拷贝

    栗子:

    import copy
    
    n1 = {"k1": "wu", "k2": 123, "k3": ["alex", 678]}
    n4 = copy.deepcopy(n1)  # 深拷贝
    print("第一层字典的内存地址:")
    print(id(n1))
    print(id(n4))
    print("第二层嵌套的列表的内存地址:")
    print(id(n1["k3"]))
    print(id(n4["k3"]))
    n1['k1'] = 'tom'
    n1['k3'][0] = 'jack'
    print(n1,n4)
    
    输出结果:
    {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]} {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]}
    第一层字典的内存地址:
    1853270748616
    1853271588800
    第二层嵌套的列表的内存地址:
    1853273351880
    1853273350600
    ***************
    {'k1': 'tom', 'k2': 123, 'k3': ['jack', 678]} {'k1': 'wu', 'k2': 123, 'k3': ['alex', 678]}

      通过以上结果发现,进行深拷贝时,字典里面的第一层和里面嵌套的地址都已经变了。对于深拷贝,它会拷贝多层,将第二层的列表也拷贝一份,如果还有第三层嵌套,那么第三层的也会拷贝,但是对于里面的最小元素,比如数字和字符串,这里就是“wu”,123,“alex”,678之类的,按照python的机制,它们会共同指向同一个位置,它的内存地址是不会变的。原理如下图:

     结论:对于深拷贝,字典、列表等类型,它里面嵌套多少层,就会拷贝多少层出来,但是最底层的数字和字符串地址不变,是一样的。

    PS:

      对于元祖来说,如果他里面的元素都是不可变类型的元素,那么不论是赋值,浅拷贝还是深拷贝,他们的id都是一样的(不仅整个元祖的id是一样的,里面每一个元素的id都是一样的)。但是如果元祖里面的元素有可变元素,如列表字典等,那么对于赋值和浅拷贝来说,id仍然还是一样的(不仅整个元祖的id是一样的,里面每一个元素的id都是一样的);对于深拷贝来说,元祖的id和列表字典的id是不一样的,但是对于最底层的数字,字符串地址还是一样的。

  • 相关阅读:
    C#规范整理·异常与自定义异常
    C#规范整理·资源管理和序列化
    C#规范整理·泛型委托事件
    C#规范整理·集合和Linq
    <抽象工厂>比<工厂方法>多了啥(区别)
    <工厂方法>比<简单工厂>多了啥(区别)
    Unable to start Ocelot because either a ReRoute or GlobalConfiguration
    MySQL服务安装
    mysql登录报错“Access denied for user 'root'@'localhost' (using password: YES”)的处理方法
    使用博客系统发生_STORAGE_WRITE_ERROR_错误
  • 原文地址:https://www.cnblogs.com/wusir66/p/10092299.html
Copyright © 2011-2022 走看看