前言
Python作为一门高级语言,与C/C++还是有很大的不同。关于赋值、切片、浅拷贝和深拷贝这一块,其实很多人对其不是很了解的,这就很容易在某些代码中出现意想不到的结果,同时也会很难找到原因。本文将讲述这几类情况的区别以及使用,尽可能通俗易懂,不会涉及到底层的实现原理。
本文所有代码的执行环境如下:
操作系统:Window10
Python版本:Python 3.7.0
执行方式:CMD窗口+Python解释器的命令交互模式
赋值、切片、拷贝
本文使用is
运算符来判断对象间的唯一身份标识,也就是id是否相同,is
也叫同一性运算符
赋值
赋值就是我们通过=
把一个变量的值赋给另一变量,相当于引用,这里的赋值又可以分为几类
赋值:不可变对象的赋值(在缓存范围内)
为了增加程序的运行效率,Python3的解析器中实现了整型数字和字符串缓存的机制,
- 整型数字的缓存范围为[-5, 256],即变量值相等且在[-5, 20]范围内的所有变量都是同一个对象(这个是有争议的,有文章说是[-5, 无穷大],但我实测是[-5, 256])
- 字符串默认缓存长度4096,即变量值相等且长度在4096以内的所有字符串变量是同一个对象,(这个是有争议的,很多文章说是缓存20位,但我实测是长度4096)
1 | # 字符串赋值 |
赋值:不可变对象的赋值(不在缓存范围内)
1 | # 字符串赋值 |
赋值:可变对象的赋值
这种情况相当于完全引用,“比浅拷贝还要浅拷贝”,这里举个例,假定list_a为列表,把list_a赋值给list_b,只要不是重新赋值list_a或list_b(list_a=xxx或list_b=yyy)操作,无论是通过list_a还是通过list_b来操作列表(增、删、改…),另一个对象也会随之改变(即list_a和list_b在没有重新执行赋值操作时,将一直是同一个对象)
1 | list_a = list_b = [1, 2, 3] # 相当于 list_a = [1, 2, 3] 和 list_b = list_a 这两条语句 |
切片
切片就是从某个对象中抽取部分的操作,切片操作得到的对象和原对象是不同的对象,但其子元素有可能是同一对象,这里分为几种情况说明,切片相当于浅拷贝
切片:对“是不可变对象的子元素“的修改或增删操作不会影响另一对象
1 | list_a = [1, 2, 3, 4] |
切片:对“是可变对象的子元素“的操作会影响另一对象
1 | list_a = [1, 2, [3], 4] # 和上面不同在于list_a[2]是一个可变对象 |
拷贝
相对于上面的赋值和切片,这里所说的拷贝的是通过copy模块进行拷贝操作
浅拷贝
浅拷贝使用copy.copy(source)方法实现(某些对象本身会提供copy方法,如list.copy),拷贝出来的对象和原对象有可能是同一对象,如果拷贝的对象是可变对象,其子元素有可能是同一对象
一、对不可变对象进行浅拷贝,相当于深拷贝,类似于赋值操作,请参考上面的赋值说明,与赋值不同的是,这里拷贝得到的的对象和原对象是同一对象
1 | import copy |
二、对可变对象进行浅拷贝,相当于完全切片,得到的对象和原对象是不同的对象,但其子元素有可能是同一对象
1 | import copy |
深拷贝
深拷贝使用copy.deepcopy(source)方法实现,拷贝出来的对象和原对象有可能是同一对象,如果拷贝的对象是可变对象,其子元素也有可能是同一对象,但总的来说,这两个对象完全没关系(无论是本身还是其子对象都完全没有关联),操作一个不会影响到另一个
不可变对象的深拷贝
1 | import copy |
可变对象的深拷贝
1 | import copy |