面向对象与面向过程
参考链接:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/0014318645694388f1f10473d7f416e9291616be8367ab5000
面向对象编程——Object Oriented Programming,简称OOP,是一种程序设计思想。OOP把对象作为程序的基本单元,一个对象包含了数据和操作数据的函数。
在程序设计上表现的不同:
面向过程的程序设计把计算机程序视为一系列的命令集合,即一组函数的顺序执行。为了简化程序设计,面向过程把函数继续切分为子函数,即把大块函数通过切割成小块函数来降低系统的复杂度。
面向对象的程序设计把计算机程序视为一组对象的集合,而每个对象都可以接收其他对象发过来的消息,并处理这些消息,计算机程序的执行就是一系列消息在各个对象之间传递。
在Python中,所有的数据类型都可视为对象,自定义数据类型就对应于面向对象中类的概念
接下来作者举了一个处理学生成绩的 例子来说明面向对象和面向过程中的不同
面向过程
#使用dict来表示一个学生的成绩 std1 = { 'name': 'Michael', 'score': 98 } std2 = { 'name': 'Bob', 'score': 81 } #而处理学生的成绩交给函数来实现 def print_score(std): print('%s: %s' % (std['name'], std['score']))
面向对象
而采用面向对象的设计思想,我们首先考虑的不应该时程序的执行流程,而是Student这种数据类型应该被视为一个对象,这个对象拥有name和scroe两种属性(Property),如果要打印一个学生的成绩,必须先创建出这个学生的对象。然后,给对象发送一个print_scroe的消息,让对象自己把自己的数据打印出来。
class Student(object): def __init__(self,name,score): self.name=name self.score=score def print_score(self):#方法里必须有self print('姓名:%s,成绩:%s'%(self.name,self.score))
给对象发消息就是调用对象对应的关联函数,我们称为对象的方法(Method)。面向对象的程序写出来就像:
bart=Student('Macle',58) bart.print_score()
面向对象的设计思想是从自然界中来的,因为在自然界中,类(Class)和实例(Instance)的概念是很自然的。
Class是一种抽象概念,比如我们定义的Class——Student,是指学生这个概念,而实例(Instance)则是一个个具体的Student,比如,Bart Simpson和Lisa Simpson是两个具体的Student。
所以,面向对象的设计思想是抽象出Class,根据Class创建Instance。面向对象的抽象程度又比函数要高,因为一个Class既包含数据,又包含操作数据的方法。
补充
*)对于 在创建类的实例 参数的问题。
class Data: #待排序数据尺寸 data_count=16 def __init__(self,*value): if not value: self.value=2 self.set_color() else: self.value=value self.set_color() def set_color(self,rgba=None):#先测验这里的None#觉得赋值之后就像是默认参数一样的意思,假如给他传了参数还是能够接受的#只关注这里,不要关注别地方写的代码是否有错 if not rgba: rgba=(0, 1-self.value/(self.data_count*2), self.value/(self.data_count*2)+0.5, 1) self.rgba=rgba if __name__ == "__main__": d=Data() #d.value=3 #d.set_color() a=Data() a.set_color((0,0,1,1)) print(d.value,d.rgba) print(a.value,a.rgba) #结果 2 (0, 0.9375, 0.5625, 1) 2 (0, 0, 1, 1)
类和实例
参考链接:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001431864715651c99511036d884cf1b399e65ae0d27f7e000
首先解决了我的一个疑惑:点出来的属性怎么定义(这里定义的实例属性,类(Class)属性的定义方法看下面,答案是直接定义。使用self点出来的,并且可以给实例绑定属性
class Student(object): pass if __name__=='__main__': bart=Student() bart.name="可以随便为实例绑定未在类中定义的属性" print(bart.name) #输出 可以随便为实例绑定未在类中定义的属性
第二个疑惑,__init__的作用是什么:
由于类可以起到模板的作用,因此,可以在创建实例的时候,把一些我们认为必须绑定的属性强制填写进去。通过定义一个特殊(他大概特殊在创建实例的时候是自动执行的)的__init__
方法,在创建实例的时候,就把name
,score
等属性绑上去:
class Student(object): def __init__(self, name, score): self.name = name self.score = score
使用 __init__ 必须要注意一些:
注意到 __init__ 方法的第一个参数永远是 self ,表示创建的实例本身,因此,在 __init__ 方法内部,就可以把各种属性绑定到 self ,即绑定到实例本身。
有了 __init__ 方法,在创建实例的时候,就不能传入空的参数了,必须传入与 __init__ 方法匹配的参数,但 self 不需要传,Python解释器自己会把实例变量传进去:
>>> bart = Student('Bart Simpson', 59)#这就是调用了,不用传递self >>> bart.name 'Bart Simpson' >>> bart.score 59
在类中定义函数与平常定义函数只有一点不同,那就是:第一个参数永远是实例变量 self ,并且,调用时,不用传递该参数。(看上面代码)除此之外,类的方法和普通函数没有什么区别,所以,你仍然可以用默认参数、可变参数、关键字参数和命名关键字参数。
数据封装
通过作者的讲解,我觉得数据封装的意义就是在于把一些对数据的操作放在类里面,交给一些函数去完成,这些封装数据的函数是和类本身是关联起来的,我们称之为类的方法:
class Student(object): def __init__(self, name, score): self.name = name self.score = score def print_score(self):#self表示操作的对象是实例本身 print('%s: %s' % (self.name, self.score))
怎么使用:
要定义一个方法,除了第一个参数是 self 外,其他和普通函数一样。要调用一个方法,只需要在实例变量上直接调用,除了 self 不用传递,其他参数正常传入:
>>> bart.print_score() Bart Simpson: 59
这样一来,创建实例需要给出 name 和 score ,而类似如何打印,都是在 Student 类的内部定义的,这些数据和逻辑被“封装”起来了
封装的另一个好处是可以给 Student 类增加新的方法,比如 get_grade :(为什么说是封装的好处呢?因为封装可能是代表一种思想,把对数据的操作定义在类里面,而受这种思想的影响,就把操作定义在类里面)
结论:
类是创建实例的模板,而实例则是一个一个具体的对象,各个实例拥有的数据都互相独立,互不影响;
方法就是与实例绑定的函数,和普通函数不同,方法可以直接访问实例的数据;
通过在实例上调用方法,我们就直接操作了对象内部的数据,但无需知道方法内部的实现细节。
和静态语言不同,Python允许对实例变量绑定任何数据,也就是说,对于两个实例变量,虽然它们都是同一个类的不同实例,但拥有的变量名称都可能不同:
>>> bart = Student('Bart Simpson', 59) >>> lisa = Student('Lisa Simpson', 87) >>> bart.age = 8#这里就是对实例变量(bart)绑定任何数据的一个例子,因为age原本是student类里没有的 >>> bart.age 8 >>> lisa.age#它们都是同一个类的不同实例,但拥有的变量名称都可能不同(因为bart绑定了嘛) Traceback (most recent call last): File "<stdin>", line 1, in <module> AttributeError: 'Student' object has no attribute 'age'
访问限制
参考链接:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/0014318650247930b1b21d7d3c64fe38c4b5a80d4469ad7000
在Class内部,可以有属性和方法,而外部代码可以通过直接调用实例变量的方法来操作数据,这样,就隐藏了内部的复杂逻辑。但是,从前面Student类的定义来看,外部代码还是可以自由地修改一个实例的 name 、 score 属性:
>>> bart = Student('Bart Simpson', 59) >>> bart.score 59 >>> bart.score = 99 >>> bart.score 99
如果要让内部属性不被外部访问,可以把属性的名称前加上两个下划线__
,(注意只在前面加)在Python中,实例的变量名如果以__
开头,就变成了一个私有变量(private),只有内部可以访问,外部不能访问(其实任然可以,见后面),所以,我们把Student类改一改:
class Student(object): def __init__(self, name, score): self.__name = name self.__score = score def print_score(self): print('%s: %s' % (self.__name, self.__score))
改完后,对于外部代码来说,没什么变动,但是已经无法从外部访问实例变量 .__name
和实例变量 .__score
了:
>>> bart = Student('Bart Simpson', 59) >>> bart.__name Traceback (most recent call last): File "<stdin>", line 1, in <module> AttributeError: 'Student' object has no attribute '__name'
至此,我们已经通过定义私有变量来避免对变量直接操作,但是还是有修改的需求的,所以作者给出了解决办法和为什么非得这样绕了一圈来完成修改的功能:
如果外部代码要获取name和score怎么办?可以给Student类增加 get_name 和 get_score 这样的方法:
class Student(object): ... def get_name(self): return self.__name def get_score(self): return self.__score
如果又要允许外部代码修改score怎么办?可以再给Student类增加 set_score 方法:
class Student(object): ... def set_score(self, score): self.__score = score#注意这里要加个下划线
为什么要定义一个方法大费周折?因为在方法中,可以对参数做检查(所以只需要在set中做这些),避免传入无效的参数:
class Student(object): ... def set_score(self, score): if 0 <= score <= 100: self.__score = score# else: raise ValueError('bad score')
注意:
Python本身没有任何机制阻止你干坏事,一切全靠自觉。比如
双下划线开头的实例变量是不是一定不能从外部访问呢?其实也不是。不能直接访问 __name 是因为Python解释器对外把 __name 变量改成了 _Student__name ,所以,仍然可以通过 _Student__name 来访问 __name 变量:
>>> bart._Student__name 'Bart Simpson'
但是强烈建议你不要这么干,因为不同版本的Python解释器可能会把 __name 改成不同的变量名。
另外:
在Python中,变量名类似__xxx__
的,也就是以双下划线开头,并且以双下划线结尾的,是特殊变量,特殊变量是可以直接访问的,不是private变量,所以,不能用 __name__ 、 __score__ 这样的变量名。
有些时候,你会看到以一个下划线开头的实例变量名,比如 _name ,这样的实例变量外部是可以访问的,但是,按照约定俗成的规定,当你看到这样的变量时,意思就是,“虽然我可以被访问,但是,请把我视为私有变量,不要随意访问”。
作者也列出了一些错误写法:
>>> bart = Student('Bart Simpson', 59) >>> bart.get_name() 'Bart Simpson' >>> bart.__name = 'New Name' # 设置__name变量! >>> bart.__name 'New Name'
表面上看,外部代码“成功”地设置了 __name 变量,但实际上这个 __name 变量和class内部的 __name 变量不是一个变量!内部的 __name 变量已经被Python解释器自动改成了 _Student__name ,而外部代码给bart
新增了一个 __name 变量。不信试试:
>>> bart.get_name() # get_name()内部返回self.__name 'Bart Simpson'
继承和多态
参考链接:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001431865288798deef438d865e4c2985acff7e9fad15e3000
在OOP程序设计中,当我们定义一个class的时候,可以从某个现有的class继承,新的class称为子类(Subclass),而被继承的class称为基类、父类或超类(Base class、Super class)。
怎样定义子类呢?
class Dog(Animal):#指定父类为Animal pass class Cat(Animal): pass
定义父类
#父类注意是object,可以省略不写 class Animal(object): def run(self): print('Animal is running...') #还可以这样定义 class Animal: def run(self): print('Animal is running...')
继承有什么好处?最大的好处是子类获得了父类的全部功能。
由于 Animial 实现了 run() 方法,因此, Dog 和 Cat 作为它的子类,什么事也没干,就自动拥有了 run() 方法:
dog = Dog() dog.run() cat = Cat() cat.run()
当然,也可以对子类增加一些方法和修改一些方法,比如Dog类:
class Dog(Animal): def run(self): print('Dog is running...')#重写了 def eat(self): print('Eating meat...')
当子类和父类都存在相同的 run() 方法时,我们说,子类的 run() 覆盖了父类的 run() ,在代码运行的时候,总是会调用子类的 run() 。这样,我们就获得了继承的另一个好处:多态。
多态
多态不仅仅是子类可以有很多种,而且方法会自动根据不同的子类调用不同的方法
我们定义一个class的时候,我们实际上就定义了一种数据类型。我们定义的数据类型和Python自带的数据类型,比如str、list、dict没什么两样:
作者使用 isinstance 来说明类(Class)也是数据类型
a = list() # a是list类型 b = Animal() # b是Animal类型 c = Dog() # c是Dog类型 #判断他们是否相同 >>> isinstance(a, list) True >>> isinstance(b, Animal) True >>> isinstance(c, Dog) True #最重要的是 >>> isinstance(c, Animal) True
补充
isinstance(2,(int,str))还可以这样
所以,在继承关系中,如果一个实例的数据类型是某个子类,那它的数据类型也可以被看做是父类。但是,反过来就不行:
>>> b = Animal() >>> isinstance(b, Dog) False
接下来作者为了将多态的好处呈现的更清晰,举了一个例子,
说明了新增(注意是新增)一个 Animal 的子类,不必对 run_twice() 做任何修改,实际上,任何依赖 Animal 作为参数的函数或者方法都可以不加修改地正常运行,原因就在于多态。
还有这个函数的定义方式
def run_twice(animal):#注意这里的animal代表的形参,跟名为Animal的类(Class)没有任何关系 animal.run()#并不是直接用self animal.run()
调用方式
>>> run_twice(Cat())#说明不是在类里面定义的 Cat is running... Cat is running...
多态的威力与好处
不需要确切的知道它的子类型
开闭原则、鸭子类型
你会发现,新增一个Animal的子类,不必对run_twice()做任何修改,实际上,任何依赖Animal作为参数的函数或者方法都可以不加修改地正常运行,原因就在于多态。
多态的好处就是,当我们需要传入Dog、Cat、Tortoise……时,我们只需要接收Animal类型就可以了,因为Dog、Cat、Tortoise……都是Animal类型,然后,按照Animal类型进行操作即可。由于Animal类型有run()方法,因此,传入的任意类型,只要是Animal类或者子类,就会自动调用实际类型的run()方法,这就是多态的意思:
对于一个变量,我们只需要知道它是Animal类型,无需确切地知道它的子类型,就可以放心地调用run()方法,而具体调用的run()方法是作用在Animal、Dog、Cat还是Tortoise对象上,由运行时该对象的确切类型决定,这就是多态真正的威力:调用方只管调用,不管细节,而当我们新增一种Animal的子类时,只要确保run()方法编写正确,不用管原来的代码是如何调用的。这就是著名的“开闭”原则:
对扩展开放:允许新增Animal子类;
对修改封闭:不需要修改依赖Animal类型的run_twice()等函数。
静态语言 vs 动态语言
对于静态语言(例如Java)来说,如果需要传入 Animal 类型,则传入的对象必须是 Animal 类型或者它的子类,否则,将无法调用 run() 方法。
对于Python这样的动态语言来说,则不一定需要传入 Animal 类型。我们只需要保证传入的对象有一个 run() 方法就可以了:
这就是动态语言的“鸭子类型”,它并不要求严格的继承体系,一个对象只要“看起来像鸭子,走起路来像鸭子”,那它就可以被看做是鸭子。放到这里就是,如果你实现了一个run(即run_twice()里调用的run( ) )方法,你就是一个鸭子
class Timer(object): def run(self): print('other class') #调试 run_twice(Timer()) None other class other class
比如:Python的“file-like object“就是一种鸭子类型。对真正的文件对象,它有一个 read() 方法,返回其内容。但是,许多对象,只要有 read() 方法,都被视为“file-like object“。许多函数接收的参数就是“file-like object“,你不一定要传入真正的文件对象,完全可以传入任何实现了 read() 方法的对象。
结论:
继承可以把父类的所有功能都直接拿过来,这样就不必重零做起,子类只需要新增自己特有的方法,也可以把父类不适合的方法覆盖重写。
动态语言的鸭子类型特点决定了继承不像静态语言那样是必须的。
获取和设置对象信息
参考链接:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001431866385235335917b66049448ab14a499afd5b24db000
补充:
获取当前实例所属类的类名
self.__class__.__name__
使用type()
基本类型都可以用type()
判断
如果一个变量指向函数或者类,也可以用type()
判断:
>>> type(abs) <class 'builtin_function_or_method'> >>> type(a) <class '__main__.Animal'>
但是type()
函数返回的是对应的Class类型。如果我们要在if
语句中判断,就需要比较两个变量的type类型是否相同(因为需要布尔值):
>>> type(123)==type(456) True >>> type(123)==int True
判断基本类型、判断函数对象:
上面说了判断基本数据类型可以直接写int
,str
等,但如果要判断一个对象是否是函数怎么办?可以使用types
模块中定义的常量:
>>> import types >>> def fn(): ... pass ... >>> type(fn)==types.FunctionType True >>> type(abs)==types.BuiltinFunctionType True >>> type(lambda x: x)==types.LambdaType True >>> type((x for x in range(10)))==types.GeneratorType True
使用isinstance()
对于class的继承关系来说,使用type()
就很不方便。我们要判断class的类型,可以使用函数。
继承关系是:
object -> Animal -> Dog -> Husky
isinstance()
就可以告诉我们,一个对象是否是某种类型。先创建3种类型的对象:
>>> a = Animal() >>> d = Dog() >>> h = Husky()
然后判断
>>> isinstance(h, Husky) True >>> isinstance(h, Dog) True
由于Husky是从Dog继承下来的,所以,h
也还是Dog类型。换句话说,isinstance()
判断的是一个对象是否是该类型本身,或者位于该类型的父继承链上。不是子链
能用type()
判断的基本类型也可以用isinstance()
判断:
>>> isinstance('a', str)
True
>>> isinstance(123, int)
True
>>> isinstance(b'a', bytes)
True
并且还可以判断一个变量是否是某些类型中的一种:
>>> isinstance([1, 2, 3], (list, tuple))#可以判断是否是list或者tuple True >>> isinstance((1, 2, 3), (list, tuple)) True
#所以: 总是优先使用 isinstance() 判断类型,可以将指定类型及其子类“一网打尽”。
使用dir()
如果要获得一个对象的所有属性和方法,可以使用 dir() 函数,它返回一个包含字符串的list,比如,获得一个str对象的所有属性和方法:
>>> dir('ABC') ['__add__', '__class__',..., '__subclasshook__', 'capitalize', 'casefold',..., 'zfill']
类似__xxx__
的属性和方法在Python中都是有特殊用途的,比如__len__
方法返回长度。在Python中,如果你调用 len() 函数试图获取一个对象的长度,实际上,在 len() 函数内部,它自动去调用该对象的 __len__() 方法,所以,下面的代码是等价的:
>>> len('ABC') 3 >>> 'ABC'.__len__() 3
所以,我们自己写的类,如果也想用 len(myObj) 的话,就自己写一个 __len__() 方法:
>>> class MyDog(object): ... def __len__(self): ... return 100 ... >>> dog = MyDog() >>> len(dog) 100
仅仅把属性和方法列出来是不够的,配合 getattr() 、 setattr() 以及 hasattr() ,(这个都是定义好的)我们可以直接操作一个对象的状态:
>>> class MyObject(object): ... def __init__(self): ... self.x = 9 ... def power(self): ... return self.x * self.x ... >>> obj = MyObject()
紧接着,可以测试该对象的属性:
>>> hasattr(obj, 'x') # 有属性'x'吗? True >>> obj.x 9 >>> hasattr(obj, 'y') # 有属性'y'吗? False >>> setattr(obj, 'y', 19) # 设置一个属性'y'#对父类设置后,子类也会立即拥有这个新属性 >>> hasattr(obj, 'y') # 有属性'y'吗? True >>> getattr(obj, 'y') # 获取属性'y' 19 >>> obj.y # 获取属性'y' 19
如果试图获取不存在的属性,会抛出AttributeError的错误
可以传入一个default参数,如果属性不存在,就返回默认值:
>>> getattr(obj, 'z', 404) # 获取属性'z',如果不存在,返回默认值404 404
也可以获得对象的方法:#对方法没有set,其他的get和has与’属性‘一样
>>> hasattr(obj, 'power') # 有属性'power'吗? True >>> getattr(obj, 'power') # 获取属性'power' <bound method MyObject.power of <__main__.MyObject object at 0x10077a6a0>> >>> fn = getattr(obj, 'power') # 获取属性'power'并赋值到变量fn >>> fn # fn指向obj.power <bound method MyObject.power of <__main__.MyObject object at 0x10077a6a0>>#怎样传入参数呢,大概和别的一样 >>> fn() # 调用fn()与调用obj.power()是一样的 81
删除实例的属性
del dog1.name
尝试为实例、类绑定方法
>>> def set_age(self, age): # 定义一个函数作为实例方法#注意也要有self,和在类内定义一样 ... self.age = age ... >>> from types import MethodType >>> s.set_age = MethodType(set_age, s) # 给实例绑定一个方法 >>> s.set_age(25) # 调用实例方法 >>> s.age # 测试结果 25 #为类绑定方法 >>> Student.set_score = set_score
总结:
通过内置的一系列函数,我们可以对任意一个Python对象进行剖析,拿到其内部的数据。要注意的是,只有在不知道对象信息的时候,我们才会去获取对象信息。如果可以直接写:
sum = obj.x + obj.y
#就不要写:
sum = getattr(obj, 'x') + getattr(obj, 'y')
一个正确的用法的例子如下:
def readImage(fp): if hasattr(fp, 'read'): return readData(fp) return None
假设我们希望从文件流fp中读取图像,我们首先要判断该fp对象是否存在read方法,如果存在,则该对象是一个流,如果不存在,则无法读取。 hasattr() 就派上了用场。
请注意,在Python这类动态语言中,根据鸭子类型,有 read() 方法,不代表该fp对象就是一个文件流,它也可能是网络流,也可能是内存中的一个字节流,但只要 read() 方法返回的是有效的图像数据,就不影响读取图像的功能。
类的属性和实例属性
由于Python是动态语言,根据类创建的实例可以任意绑定属性。
前面已经介绍过,给实例绑定属性可以通过__init__里的self变量,也可以通过实例变量
class Student(object): def __init__(self, name):#在创建实例的时候,初始化中 self.name = name s = Student('Bob') s.score = 90#通过已经创建的实例变量
如果类需要一个属性,那么可以直接在类中定义,这个属性归类所有,但是所有该类的实例都可以访问到
class Student(object): name = 'Student' >>> s = Student() # 创建实例s >>> print(s.name) # 打印name属性,因为实例并没有name属性,所以会继续查找class的name属性 Student >>> print(Student.name) # 打印类的name属性 Student >>> s.name = 'Michael' # 给实例绑定name属性 >>> print(s.name) # 由于实例属性优先级比类属性高,因此,它会屏蔽掉类的name属性 Michael >>> print(Student.name) # 但是类属性并未消失,用Student.name仍然可以访问 Student >>> del s.name # 如果删除实例的name属性 >>> print(s.name) # 再次调用s.name,由于实例的name属性没有找到,类的name属性就显示出来了 Student
创建的类属性可以通过类名来访问
class Student(object): count = 0 def __init__(self, name): self.name = name Student.count+=1
所以千万不要对类属性和实例属性使用相同的名字,因为由于优先级的问题,实例属性会屏蔽掉所属类的属性,但是删除实例属性后,却任然有类属性供访问。