第六章 与对象的深入交往
6.1 一切皆对象
1.运算符
·_add_()是特殊方法,这个方法定义了“+”运算符对于list对象的意义,两个list对象相加时,会进行合并列表的操作。
·其他:
·这些运算相关的特殊方法还能改变执行运算的方式。我们可以创建一个列表的子类,通过增加__sub__()方法,来添加定义。
2.元素引用
·列表中元素的引用也用到了__getitem__()方法,如li=[1, 2, 3, 4,] print(2) #打印出3
实际上是调用了__getitem__()方法。li=[1, 2, 3, 4,] print(li.__getitem__(2)),就是从列表中引用第四个元素。
·此外,还有类似的:
3.内置函数的实现
与运算符类似,许多内置函数也都是调用对象的特殊方法。
eg:Len([1,2,3]) #返回表中元素的总数 实际上:[1,2,3].__len__()
其他:
6.2 属性管理
1.属性覆盖的背后
·一个类或对象所拥有的属性,会记录在__dict__中。这个__dict__是一个词典,键为属性名,对应的值为某个属性。Python在寻找对象时,会按照继承关系依次寻找__dict__。
·排列的顺序是按照summer对象的亲近关系排列的。首先,第一部分是summer对象自身的属性,也就是所定义的age:2;第二部分是chicken类的属性,比如fly和__init__()(这是一个构造方法,一般用于直接初始化一个对象,同时对里面的参数进行赋值);第三部分为bird的属性,比如feather;最后一个部分属于object类,有诸如__doc__之类的属性。
·也就是说,对象的属性是分层管理的,对象summer所接触到的所有属性,分别是summer/Chicken/Bird/object这四层。Python会一层层向下遍历,直到找到那个属性。
·某个属性可能在不同层被重复定义,Python在向下遍历时,会选取先遇到的那个属性。
·如果进行赋值,那么Python就不会分层深入查找了。
·我们可以不依赖继承关系,直接去修改某个祖先的属性。
2.特征
·Python为我们提供了多种即时生成属性的方法,其中一种称为特性(property)。特性是特殊的属性。
例子:为chicken类添加一个是否成年的属性
·property()最多可以加载四个参数,前三个参数为函数,分别用于设置获取、修改和删除特性,最后一个参数为特性的文档,可以为一个字符串,起说明作用。
3.__getattr__()方法
·__getattr__(self,name)可用于查询即时生成的属性。当我们调用一个属性时,如果通过__dict__机制无法找到该属性,那么Python就会调用对象的__getattr__()方法,来即时生成该属性。
__getattr__()只能用于查询不在__dict__系统中的属性。
__setattr__(self, name, value)和__delattr__(self, name)可用于修改和删除属性。它们的应用面更广,可用于任意属性。
6.3 你是风儿,我是沙
1.动态类型
·Python的变量不需要声明,在赋值时,变量可以重新赋值为其他任意值。这就是动态类型的体现。
·通过内置函数id(),我们能查看到引用指向的是哪个对象。
a=1 print(id(1)) print( id(a))
a=3 print(id(a)) a="at" print(id(a))
·除了直接打印id以外,我们还可以用is运算来判断两个引用是否指向同一个对象。对于小的整数和短字符串来说,Python会缓存这些对象,而不是频繁地建立和销毁它们。
eg:a=3 b=3 print(a is b ) #打印:True
2.可变与不可变对象
·注意引用的指向与赋值。
·特别注意:
这种情况的实际上表示的是我们通过list1[0]改变了列表里面的元素对象,并没有改变列表对象,list1和list2还是原来那个list1和list2。
·如果通过元素引用改变了某个元素,那么列表对象自身会发生改变(in-place change),称为可变对象(Mutable Object);但之前的整数、浮点数和字符串,则不能改变对象本身,赋值最多只能改变引用的指向,称为不可变对象(Immutable Object)。
3.从动态类型看函数的参数传递
当我们调用函数f时,a作为数据传递给函数,因此x会指向a所指向的对象。
如果传递的是可变对象:
6.4 内存管理
1.引用管理
·语言的内存管理是语言设计的一个重要方面。对象内存管理是基于对引用的管理。我们可以用标准库中sys包中的getrefcount()来查看某个对象的引用次数。
·因为参数传递实际上是创建了一个临时的引用,所以getrefcount()的结果会比期望多1.
如a = [1, 2, 3]中,a的引用计数是2,b = a,b的引用计数是3。
2.对象引用对象
如a = [1,2,3],b = [a, a],则a的引用计数是4。
·两个对象或者单个对象可能相互引用,这样就构成了引用环(Reference Cycle)。引用环会给垃圾回收机制带来很大麻烦。
3.垃圾回收
·垃圾回收机制就是当无用的对象达到一定条件时,需要对无用的对象进行垃圾回收以释放内存,其原理是某个对象的引用计数降为0,即没有任何引用指向该对象时,它就成为了要被回收的垃圾。
·当python运行时,会记录分配对象(Object Allocation)和取消分配对象(Object Deallocation)的次数,当两者的差值高于某个阈值时,垃圾回收机制会启动,可以通过gc模块的get_threshold()方法,查看该阈值:
import gc
print(gc.get_threshold()) #返回(700,10,10)
·后面的两个10是与分代回收相关的阈值。可以通过gc中的set_threshold()方法重新设置。也可以用gc_collect()。
·分代回收也是python回收的一种策略,该策略的基本假设是:存活时间越久的对象,越不可能在后面的程序中变成垃圾。
·python将所有对象按存活时间分为0,1,2三代,最新的对象为0代,0代的对象经过一定次数的回收后,存活下来的对象会进入1代,python对0代和1代的对象进行回收,如此类推。这里的“一定次数”就是上图的两个10,表示每10次0代垃圾回收,会配合1次1代的垃圾回收,而每10次1代的垃圾回收,才会有1次2代的垃圾回收。对于垃圾回收机制的阈值,我们可以用set_threshold()来调整。
4.孤立的引用环
·如果组成引用环的两个对象的引用计数都没有降到0,python不会对它进行正常的回收。
·为了回收这样的引用环:复制每个对象的引用计数,记为gc_ref,每个对象i,该计数为gc_ref_i。python开始遍历所有对象i。当遍历到每个对象i所引用的对象j时,将相应的gc_ref_ j减少1。这样,没用的对象最终的计数会变为0而被当成垃圾回收,其它未变成0的则继续被python使用。