1 内建函数(__xxx__)
背景:为什么要有这种带下划线的内建函数,个人认为这种内建函数开放了很多Python的特殊用法,只要详尽掌握,就会理解平时用到的数据结构是复写了什么方法,自己也可以写出类似set,dqueue,dict,list的数据类型方法。
1.1 类似字典的操作方式,__getitem__,__setitem__,__delitem__
我们熟悉的字典是可以像如下方式操作赋值取值:
d = dict() d["a"] = 1 d["b"] = 2 print d del d["a"] print d
其实像这种赋值方式就是复写了__setitem__,__getitem__,__delitem__请见如下类
class TestDict(object): def __getitem__(self,key): return self.__dict__.get(key) def __setitem__(self,key,value): self.__dict__[key] = value def __delitem__(self,key): self.__dict__.pop(key) td = TestDict() td["a"] = 1 td["b"] = 2 print td["a"] print td.__dict__ del td["a"] print td.__dict__
为了更加灵活,如上代码也可以在对象执行赋值方法(__init__)的时候声明个变量d = dict(),然后对这个变量进行赋值和取值操作也可以模拟上面的操作。
1.2 __new__和__init__
__new__: 在类实例化的时候调用,用来创建实例,如果不返回实例那么__init__将不会执行,第一个参数是class对象,在创建实例的时候需要有返回值
__init__: 在初始化实例的时候调用,比如说实例属性赋值,第一个参数是实例对象,一般都重写__init__方法,在执行的时候不需要返回值
class TestNew(object): def __new__(cls, *args, **kwargs): print '__new__ called.' return super(TestNew,cls).__new__(cls,*args,**kwargs) def __init__(self): print '__init__ called.' self.a = 1 tn = TestNew() print tn.a
可以用__new__来实现单例模式
class Singleton(object): def __new__(cls): # 关键在于这,每一次实例化的时候,我们都只会返回这同一个instance对象 if not hasattr(cls, 'instance'): cls.instance = super(Singleton, cls).__new__(cls) return cls.instance obj1 = Singleton() obj2 = Singleton() obj1.attr1 = 'value1' print obj1.attr1, obj2.attr1 print obj1 is obj2
Tips: 单例模式有很多种实现方式,也可以通过类变量+静态方法的方式实现。
可以通过重载__new__来实现很多创建实例时的功能。
1.3 __iter__,next(python2),__next__(python3)
__iter__: 复写这个函数的对象是可迭代对象
next/__next__: 复写这个函数的对象都是一个迭代器
class TestIterNext(object): def __init__(self,data=1): self.data = data def next(self): if self.data > 5: raise StopIteration else: self.data+=1 return self.data def __iter__(self): print "iter" return self
当for循环去迭代tin = TestIterNext()对象的时候第一步会去看__iter__是否返回一个生成器(generator),如果返回的是对象本身才会去执行next函数。
1.4 __call__
把一个类实例的对象当做函数一样调用就是复写了__call__方法,如下:
class TestCall(object): def __call__(self): print "call it" tc = TestCall() tc()
复写__call__方法大多数用在装饰器类中(第5章)和继承Type类(第3章)的时候。
1.5 __repr__,__str__
__repr__和__str__没有太大区别,在Python交互模式下才能发现。复写改方法后输出对象就是按照该方法里的内容进行输出。在类里可以这样用__repr__ = __str__
1.6 __all__
可用于模块导入时限制,,当我们from module import *的时候这个__all__就起作用了,__all__=["bar","sar"] ,[]里定义函数或者变量类等,有些模块内部一些函数不对外开放,此时把一些对外开放的函数变量放入到__all__里就可以了,这样避免了一些多余的导入。如果在__init__.py里定义则在导入模块的时候只导入__all__里定义的各个文件,此时无法定义到文件里具体哪个类或方法,如果需要细化则需要在具体的类里写入__all__。如果是from module import Test这种使用不受__all__限制
1.7 __setattr__,__getattr__,__delattr__
__setattr__: 对变量赋值时调用。
__getattr__:默认查找对象属性是在一个字典里(__dict__),这里没有要查找的对象则去__getattr__方法里查找,如果我们复写__getattr__则可以根据实际需求来返回值。
__delattr__:删除属性时调用。
class TestAttr(object): def __init__(self): self.name = "abc" def __getattr__(self, item): print "item:" + str(item) print "getattr" return 10 def __setattr__(self, *args, **kwargs): print "set attr" object.__setattr__(self,*args,**kwargs) def __delattr__(self, *args, **kwargs): print "delete attr" object.__delattr__(self,*args, **kwargs) ta = TestAttr() print ta.__dict__ print ta.names del ta.name print ta.__dict__
1.8 __le__,__lt__,__ge__,__gt__,__ne__,__eq__
一个对象和另一个对象比较大小,返回的并不一定是True和False,返回值有可能是我们定义的任何值,这里就是复写上面这些方法。如下:
class TestCompare(object): def __lt__(self, other): return "aaa" t = TestCompare() print t<1
这里打印出的就不是True和False,打印的是我们再复写的方法里定义的"aaa",其实有一些常用的orm,比如说sqlalchemy里查询条件可以这样写
g.pg_db.query(Company.id).filter(Company.level_id == level)
这里的Company.level_id == level返回的就是筛选条件,因为对Company的level_id对象复写了__eq__
1.9 __slots__
优点:
1,更快的属性访问速度
2,减少内存消耗
每个类里都维护一个字典__dict__,这个字典维护了对象的所有属性,但如果成千上万个对象则就会创建很多个__dict__来存放对象属性,为了性能我们可以不用Python帮我们维护这个字典。此时我们在类里定义__slots__ = ["name","age"]的时候就表示禁用了__dict__,并限定name和age为类的属性(类里只能有name和age属性),这样做的好处能大大节省内存开支,对象越多节省的就越多,大概能节省40%以上。
class TestSlots(object): __slots__ = ["name","age"] def __init__(self, name, age): self.name = name self.age = age ts = TestSlots("a",1) ts.name = 1 print ts.name
2.0 __metaclass__
在理解元类之前,你需要先掌握Python中的类。Python中类的概念借鉴于Smalltalk,这显得有些奇特。在大多数编程语言中,类就是一组用来描述如何生成一个对象的代码段。在Python中这一点仍然成立
元类是什么?
但就元类本身而言,它们其实是很简单的:
1) 拦截类的创建
2) 修改类
3) 返回修改之后的类
但是,Python中的类还远不止如此。类同样也是一种对象。是的,没错,就是对象。只要你使用关键字class,Python解释器在执行的时候就会创建一个对象。下面的代码段:
class ObjectCreator(object): pass
将在内存中创建一个对象,名字就是ObjectCreator。这个对象(类)自身拥有创建对象(类实例)的能力,而这就是为什么它是一个类的原因。但是,它的本质仍然是一个对象,于是乎你可以对它做如下的操作:
1) 你可以将它赋值给一个变量
2) 你可以拷贝它
3) 你可以为它增加属性
4) 你可以将它作为函数参数进行传递
下面是示例:
print ObjectCreator # 你可以打印一个类,因为它其实也是一个对象 def echo(o): print o echo(ObjectCreator) # 你可以将类做为参数传给函数 print hasattr(ObjectCreator, 'new_attribute') ObjectCreator.new_attribute = 'foo' # 你可以为类增加属性 print hasattr(ObjectCreator, 'new_attribute') print ObjectCreator.new_attribute ObjectCreatorMirror = ObjectCreator # 你可以将类赋值给一个变量 print ObjectCreatorMirror()
动态地创建类
因为类也是对象,你可以在运行时动态的创建它们,就像其他任何对象一样。首先,你可以在函数中创建类,使用class关键字即可。
def choose_class(name): if name == 'foo': class Foo(object): pass return Foo # 返回的是类,不是类的实例 else: class Bar(object): pass return Bar MyClass = choose_class('foo') print MyClass # 函数返回的是类,不是类的实例>>> print MyClass() # 你可以通过这个类创建类实例,也就是对象 # <__main__.foo object="" at="" 0x89c6d4c="">
但这还不够动态,因为你仍然需要自己编写整个类的代码。由于类也是对象,所以它们必须是通过什么东西来生成的才对。当你使用class关键字时,Python解释器自动创建这个对象。但就和Python中的大多数事情一样,Python仍然提供给你手动处理的方法。还记得内建函数type吗?这个古老但强大的函数能够让你知道一个对象的类型是什么,就像这样:
print type(1) print type("1") print type(ObjectCreator) print type(ObjectCreator())
这里,type有一种完全不同的能力,它也能动态的创建类。type可以接受一个类的描述作为参数,然后返回一个类。(我知道,根据传入参数的不同,同一个函数拥有两种完全不同的用法是一件很傻的事情,但这在Python中是为了保持向后兼容性)
type可以像这样工作:
type(类名, 父类的元组(针对继承的情况,可以为空),包含属性的字典(名称和值))
比如下面的代码:
class MyShinyClass(object): pass MyShinyClass = type('MyShinyClass', (), {}) # 返回一个类对象 print MyShinyClass print MyShinyClass() # 创建一个该类的实例 # <__main__.myshinyclass object="" at="" 0x8997cec="">
你会发现我们使用“MyShinyClass”作为类名,并且也可以把它当做一个变量来作为类的引用。类和变量是不同的,这里没有任何理由把事情弄的复杂。
type 接受一个字典来为类定义属性,因此
class Foo(object): bar = True # 可以翻译为: Foo = type('Foo', (), {'bar':True})
为类增加方法。只需要定义一个有着恰当签名的函数并将其作为属性赋值就可以了。
def echo_bar(self): print self.bar FooChild = type('FooChild', (Foo,), {'echo_bar': echo_bar}) hasattr(Foo, 'echo_bar') False hasattr(FooChild, 'echo_bar') True my_foo = FooChild() my_foo.echo_bar() True
你可以看到,在Python中,类也是对象,你可以动态的创建类。这就是当你使用关键字class时Python在幕后做的事情,而这就是通过元类来实现的。
到底什么是元类
元类就是用来创建类的“东西”。你创建类就是为了创建类的实例对象,不是吗?但是我们已经学习到了Python中的类也是对象。好吧,元类就是用来创建这些类(对象)的,元类就是类的类,你可以这样理解为:
MyClass = MetaClass()
MyObject = MyClass()
你已经看到了type可以让你像这样做:
MyClass = type('MyClass', (), {})
这是因为函数type实际上是一个元类。type就是Python在背后用来创建所有类的元类。现在你想知道那为什么type会全部采用小写形式而不是Type呢?好吧,我猜这是为了和str保持一致性,str是用来创建字符串对象的类,而int是用来创建整数对象的类。type就是创建类对象的类。你可以通过检查__class__属性来看到这一点。Python中所有的东西,注意,我是指所有的东西——都是对象。这包括整数、字符串、函数以及类。它们全部都是对象,而且它们都是从一个类创建而来。
>>> age = 35 >>> age.__class__ >>> name = 'bob' >>> name.__class__ >>> def foo(): pass >>>foo.__class__ >>> class Bar(object): pass >>> b = Bar() >>> b.__class__
现在,对于任何一个__class__的__class__属性又是什么呢?
>>> a.__class__.__class__ >>> age.__class__.__class__ >>> foo.__class__.__class__ >>> b.__class__.__class__
因此,元类就是创建类这种对象的东西。如果你喜欢的话,可以把元类称为“类工厂”(不要和工厂类搞混了:D) type就是Python的内建元类,当然了,你也可以创建自己的元类。
metaclass__属性
你可以在写一个类的时候为其添加__metaclass__属性。
class Foo(object): __metaclass__ = something… […]
如果你这么做了,Python就会用元类来创建类Foo。小心点,这里面有些技巧。你首先写下class Foo(object),但是类对象Foo还没有在内存中创建。Python会在类的定义中寻找__metaclass__属性,如果找到了,Python就会用它来创建类Foo,如果没有找到,就会用内建的type来创建这个类。把下面这段话反复读几次。当你写如下代码时 :
class Foo(Bar): pass
Python做了如下的操作:
Foo中有__metaclass__这个属性吗?如果是,Python会在内存中通过__metaclass__创建一个名字为Foo的类对象(我说的是类对象,请紧跟我的思路)。如果Python没有找到__metaclass__,它会继续在Bar(父类)中寻找__metaclass__属性,并尝试做和前面同样的操作。如果Python在任何父类中都找不到__metaclass__,它就会在模块层次中去寻找__metaclass__,并尝试做同样的操作。如果还是找不到__metaclass__,Python就会用内置的type来创建这个类对象。
现在的问题就是,你可以在__metaclass__中放置些什么代码呢?答案就是:可以创建一个类的东西。那么什么可以用来创建一个类呢?type,或者任何使用到type或者子类化type的东东都可以。
自定义元类
元类的主要目的就是为了当创建类时能够自动地改变类。通常,你会为API做这样的事情,你希望可以创建符合当前上下文的类。假想一个很傻的例子,你决定在你的模块里所有的类的属性都应该是大写形式。有好几种方法可以办到,但其中一种就是通过在模块级别设定__metaclass__。采用这种方法,这个模块中的所有类都会通过这个元类来创建,我们只需要告诉元类把所有的属性都改成大写形式就万事大吉了。
幸运的是,__metaclass__实际上可以被任意调用,它并不需要是一个正式的类(我知道,某些名字里带有‘class’的东西并不需要是一个class,画画图理解下,这很有帮助)。所以,我们这里就先以一个简单的函数作为例子开始。
# 元类会自动将你通常传给‘type’的参数作为自己的参数传入
def upper_attr(future_class_name, future_class_parents, future_class_attr): '''返回一个类对象,将属性都转为大写形式''' # 选择所有不以'__'开头的属性 attrs = ((name, value) for name, value in future_class_attr.items() if not name.startswith('__')) # 将它们转为大写形式 uppercase_attr = dict((name.upper(), value) for name, value in attrs) # 通过'type'来做类对象的创建 return type(future_class_name, future_class_parents, uppercase_attr) __metaclass__ = upper_attr # 这会作用到这个模块中的所有类 class Foo(object): # 我们也可以只在这里定义__metaclass__,这样就只会作用于这个类中 bar = 'bip' print hasattr(Foo, 'bar') # 输出: False print hasattr(Foo, 'BAR') # 输出:True f = Foo() print f.BAR # 输出:'bip'
现在让我们再做一次,这一次用一个真正的class来当做元类。
# 请记住,'type'实际上是一个类,就像'str'和'int'一样 # 所以,你可以从type继承 class UpperAttrMetaClass(type): # __new__ 是在__init__之前被调用的特殊方法 # __new__是用来创建对象并返回之的方法 # 而__init__只是用来将传入的参数初始化给对象 # 你很少用到__new__,除非你希望能够控制对象的创建 # 这里,创建的对象是类,我们希望能够自定义它,所以我们这里改写__new__ # 如果你希望的话,你也可以在__init__中做些事情 # 还有一些高级的用法会涉及到改写__call__特殊方法,但是我们这里不用 def __new__(upperattr_metaclass, future_class_name, future_class_parents, future_class_attr): attrs = ((name, value) for name, value in future_class_attr.items() if not name.startswith('__')) uppercase_attr = dict((name.upper(), value) for name, value in attrs) return type(future_class_name, future_class_parents, uppercase_attr) 但是,这种方式其实不是OOP。我们直接调用了type,而且我们没有改写父类的__new__方法。现在让我们这样去处理: class UpperAttrMetaclass(type): def __new__(upperattr_metaclass, future_class_name, future_class_parents, future_class_attr): attrs = ((name, value) for name, value in future_class_attr.items() if not name.startswith('__')) uppercase_attr = dict((name.upper(), value) for name, value in attrs) # 复用type.__new__方法 # 这就是基本的OOP编程,没什么魔法 return type.__new__(upperattr_metaclass, future_class_name, future_class_parents, uppercase_attr)
你可能已经注意到了有个额外的参数upperattr_metaclass,这并没有什么特别的。类方法的第一个参数总是表示当前的实例,就像在普通的类方法中的self参数一样。当然了,为了清晰起见,这里的名字我起的比较长。但是就像self一样,所有的参数都有它们的传统名称。因此,在真实的产品代码中一个元类应该是像这样的:
class UpperAttrMetaclass(type): def __new__(cls, name, bases, dct): attrs = ((name, value) for name, value in dct.items() if not name.startswith('__') uppercase_attr = dict((name.upper(), value) for name, value in attrs) return type.__new__(cls, name, bases, uppercase_attr) 如果使用super方法的话,我们还可以使它变得更清晰一些,这会缓解继承(是的,你可以拥有元类,从元类继承,从type继承) class UpperAttrMetaclass(type): def __new__(cls, name, bases, dct): attrs = ((name, value) for name, value in dct.items() if not name.startswith('__')) uppercase_attr = dict((name.upper(), value) for name, value in attrs) return super(UpperAttrMetaclass, cls).__new__(cls, name, bases, uppercase_attr)
用元类实现单例模式
class Singleone(type): def __init__(cls, name,bases,dct): super(Singleone, cls).__init__(name,bases,dct) cls._instance = None def __call__(cls, *args, **kwargs): if cls._instance is None: cls._instance = super(Singleone,cls).__call__(*args,**kwargs) return cls._instance class One(object): __metaclass__ = Singleone def __init__(self,*args, **kwargs): self.name = args[0] o = One("a") print o.name b = One("b") print b.name
执行步骤从上到下当执行用Singleone创建One类,One = Singleone(...),当实例化Singleone的时候执行其内部的__init__()方法,代码
继续解析到o = One("a")的时候示例化了One类,相当于Singleone()(),此时执行Singleone里面的__call__方法,在call方法里需要有
返回值。也可以在__call__里主动实例化(__new__)One并调用里面的__init__方法。
就是这样,除此之外,关于元类真的没有别的可说的了。使用到元类的代码比较复杂,这背后的原因倒并不是因为元类本身,而是因为你通常会使用元类去做一些晦涩的事情,依赖于自省,控制继承等等。确实,用元类来搞些“黑暗魔法”是特别有用的,因而会搞出些复杂的东西来。
为什么要用metaclass类而不是函数?
由于__metaclass__可以接受任何可调用的对象,那为何还要使用类呢,因为很显然使用类会更加复杂啊?这里有好几个原因:
1) 意图会更加清晰。当你读到UpperAttrMetaclass(type)时,你知道接下来要发生什么。
2) 你可以使用OOP编程。元类可以从元类中继承而来,改写父类的方法。元类甚至还可以使用元类。
3) 你可以把代码组织的更好。当你使用元类的时候肯定不会是像我上面举的这种简单场景,通常都是针对比较复杂的问题。将多个方法归总到一个类中会很有帮助,也会使得代码更容易阅读。
4) 你可以使用__new__, __init__以及__call__这样的特殊方法。它们能帮你处理不同的任务。就算通常你可以把所有的东西都在__new__里处理掉,有些人还是觉得用__init__更舒服些。
5) 哇哦,这东西的名字是metaclass,肯定非善类,我要小心!
“元类就是深度的魔法,99%的用户应该根本不必为此操心。如果你想搞清楚究竟是否需要用到元类,那么你就不需要它。那些实际用到元类的人都非常清楚地知道他们需要做什么,而且根本不需要解释为什么要用元类。” —— Python界的领袖 Tim Peters
元类的主要用途是创建API。一个典型的例子是Django ORM。它允许你像这样定义:
class Person(models.Model): name = models.CharField(max_length=30) age = models.IntegerField()
这并不会返回一个IntegerField对象,而是会返回一个int,甚至可以直接从数据库中取出数据。这是有可能的,因为models.Model定义了__metaclass__, 并且使用了一些魔法能够将你刚刚定义的简单的Person类转变成对数据库的一个复杂hook。Django框架将这些看起来很复杂的东西通过暴露出一个简单的使用元类的API将其化简,通过这个API重新创建代码,在背后完成真正的工作。
结语
首先,你知道了类其实是能够创建出类实例的对象。好吧,事实上,类本身也是实例,当然,它们是元类的实例。
Python中的一切都是对象,它们要么是类的实例,要么是元类的实例,除了type。type实际上是它自己的元类,在纯Python环境中这可不是你能够做到的,这是通过在实现层面耍一些小手段做到的。其次,元类是很复杂的。对于非常简单的类,你可能不希望通过使用元类来对类做修改。你可以通过其他两种技术来修改类:
1) Monkey patching 2) class decorators
当你需要动态修改类时,99%的时间里你最好使用上面这两种技术。当然了,其实在99%的时间里你根本就不需要动态修改类
2 私有变量(__xx)
python类里的私有变量就是前面加两个下划线这样用,但是这只是在使用上的私有变量,不像Java那种只能通过内部函数修改,python的私有变量可以通过 对象._类名__参数来从外部引用。
3 type
请查看 1.20
4 推导式
推导式又称解析式,有三种
1,列表推导式
multiples = [ i for i in range(30) if i % 3 is 0 ]
2,字典推导式
mcase = {"a":10,"b":2,"c":3}
{k:v for k,v in mcase.items()}
3,集合推导式
其实大括号里扩着的就是集合(set),例:
{"a","b",1}
squared = {x*2 for x in [1,2,3]}
5 装饰器(@decorate)
装饰器是python特色代表之一,非常好用,先介绍一下如何用装饰器。
函数是可以返回函数的
def hi(name="yasoob"): def greet(): return "in greet() function" def welcome(): return "in welcome() function" if name == "yasoob": return greet else: return welcome a = hi() print a <function greet at 0x1e08410>
在if/else里面我们返回greet和welcome,而不是greet()和welcome(),为什么? 是因为当把小括号放到后面的时候这个函数就会执行,如果不放小括号这个函数就可以到处传递,并且可以赋给变量而不去执行。
将函数作为参数传递给另一个函数
def hi(): return "hi yasoob" def doSomethingBefore(func): print "I am doing something before" print (func()) doSomethingBefore(hi)
输出:
I am doing something before
hi yasoob
装饰器就是在一个函数前后执行代码
上个例子里我们相当于创建了装饰器,现在我们稍加修改并编写一个更有用的程序。
def a_new_decorator(a_func): def wrapTheFunction(): print "I am doing some before" a_func() print "I am doing some after" return wrapTheFunction def a_function_requiring_decoration(): print "I am in the function" a_function_requiring_decoration = a_new_decorator(a_function_requiring_decoration) a_function_requiring_decoration()
明白了吗? 这正是python装饰器做的事情,它们封装一个函数,并且用这样或者那样的方式修改它的行为,现在你可能疑惑,我们的代码里并没有使用@符号?那只是一个简短的方式来生成一个被装饰的函数。请见如下例子
@a_new_decorator def a_function_requiring_decoration(): print "I am in the function" a_function_requiring_decoration()
现在对装饰器的理解差不多了吧!但如果我们运行如下代码会存在一个问题:
print(a_function_requiring_decoration.__name__) 输出:wrapTheFunction
这并不是我们想要看到的,我们想看到的是a_function_requiring_decoration,这里的函数被wrapTheFunction替代了,它重写了我们函数的名字和注释文档(docstring)。幸运的是python提供给我们一个简单的函数来解决这个问题
from functools import wraps def a_new_decorator(a_func): @wraps(a_func) def wrapTheFunction(): print "I am doing some before" a_func() print "I am doing some after" return wrapTheFunction
下面我们看一下蓝本规范:
from functools import wraps def decorator_name(f): @wraps(f) def decorated(*args, **kwargs): if not can_run: return "Function will not run" return f(*args, **kwargs) return decorated @decorator_name def func(): return "Function is running" can_run = True print(func()) can_run = False print(func())
注意:@wraps接受一个函数来进行装饰,并加入了复制函数名称,注释文档,参数列表等等的功能。这可以让我们在装饰器里面访问在装饰器之前的函数的属性。
装饰器的使用场景:
授权(Authorization)
装饰器能有助于检查某个人是否被授权去使用一个web应用的端点(endpoint)。它们被大量使用于Flask和Django框架中。这里是一个例子来使用基于装饰器的授权:
from functools import wraps def requires_auth(f): @wraps(f) def decorated(*args, **kwargs): auth = request.authorization if not auth or not check_auth(auth.username,auth.password): authenticate() return f(*args,**kwargs) return decorated
日志(Logging)
from functools import wraps def logit(func): @wraps(func) def with_logging(*args, **kwargs): print(func.__name__ + " was called") return func(*args, **kwargs) return with_logging @logit def addition_func(x): return x+x addition_func(2)
在函数中嵌入装饰器
我们回到日志的例子,并创建一个包裹函数,能让我们指定一个用于输出的日志文件。
from functools import wraps def logit(logfile='out.log'): def logging_decorator(func): @wraps(func) def wrapped_function(*args, **kwargs): log_string = func.__name__ + " was called" print(log_string) with open(logfile, 'wb') as f: f.write(log_string + ' ') return func(*args, **kwargs) return wrapped_function return logging_decorator @logit def myfunc(): pass
装饰器类
现在我们有了能用于正式环境的logit装饰器,但当我们的应用的某些部分还比较脆弱时,异常也许是需要更紧急关注的事情。比方说有时候你只想打日志到一个文件,而有时你想把引起你注意的问题发送到一个email,同事也保留日志,留个记录。这是一个使用继承的场景,但目前为止我们只看到过用来构建装饰器的函数。
The lucky is! 类也可以构建装饰器,现在我们用类重新构建logit
class logit(object): def __init__(self, logfile='out.log'): self.logfile = logfile def __call__(self, func): @wraps(func) def wrapped_function(*args, **kwargs): log_string = func.__name__ + " was called" print(log_string) with open(self.logfile, 'wb') as f: f.write(log_string + ' ') self.notify() return func(*args,**kwargs) return wrapped_function def notify(self): # 可以做一些其它行为 pass @logit() def my_func(): pass
现在我们给logit创建子类,来添加email等功能
class email_logit(logit): def __init__(self, email='admin@123.com', *args, **kwargs): self.email = email super(email_logit, self).__init__(*args, **kwargs) def notify(self): # 发送一封email pass
从现在起,@email_logit会在logit基础上多发送一封邮件。
注意:从以上方法中我们就可以发现__call__这种用法的好处,它在装饰器类和新写元类的时候起到了很大作用。
6 容器
python附带一个模块,它包含许多容器数据类型,名字叫做collections。我们将讨论它的作用和用法。
defaultdict:
defaultdict不需要检查key是否存在,我们一般这样用
from collections import defaultdict ddl = defaultdict(list) ddl["x"].append(1) print ddl ddd = defaultdict(dict) ddd["x"]["a"] = 1 print ddd defaultdict(<type 'list'>, {'x': [1]}) defaultdict(<type 'dict'>, {'x': {'a': 1}})
Counter
counter是一个计数器,帮助我们对某项数据做统计。
from collections import Counter c = Counter("aaaabbbc") print c d = {"a":1,"b":2,"c":3} c = Counter( k for k,v in d.items()) print c
还可以用counter来统计一个文件
此处没有弄明白,需要后期补上
deque
deque提供了一个双向队列,可以从头尾两端添加或删除元素,类似于list
from collections import deque dl = deque(range(5)) print dl dl.popleft() print dl dl.pop() print dl dl.extendleft([-10]) print dl dl.extend([10]) print dl
输出:
deque([0, 1, 2, 3, 4]) deque([1, 2, 3, 4]) deque([1, 2, 3]) deque([-10, 1, 2, 3]) deque([-10, 1, 2, 3, 10])
deque也可以限制列表的大小,先进先出
dl = deque(maxlen=2) dl.append(1) dl.append(2) print dl dl.append(3) print dl
输出
deque([1, 2], maxlen=2)
deque([2, 3], maxlen=2)
namedtuple(命名元组)
正常访问一个元组和访问list一样,都是通过下标来访问,命名元组可以提供类似于字典的访问方式,和tuple一样不可变。
from collections import namedtuple Animal = namedtuple('Animal','name age type') perry = Animal(name='perry',age=10,type='cat') print perry print perry.name
一个命名元组需要两个参数,他们是元组名称和字段名称。在上面的例子中,我们的元组名称是Animal,字段名称是'name,age,type'。
namedtuple让你的元组变得自文档了。不必使用证书索引来访问一个命名元组,这让代码更易于维护。
而且,namedtuple的每个实例没有对象字典(__dict__),所以它们更轻量,与普通的元组相比,并不需要更多的内存,这使他们比字典更快。
然而,要记住它仍然是一个元组,属性在namedtuple中是不可变的,所以下面的代码不行:
perry.age = 10
命名元组(namedtuple)向后兼容元组,所以用下标访问也是可以的
print perry[0]
命名元组支持多态,可以转换为字典
print (perry._asdict())
7 上下文
上下文管理器允许你在需要的时候,精确的分配和释放资源。
使用上下文管理器最广泛的案例就是with语句。想象一下你有个需要结对执行的操作,然后还要在中间放置一段代码。
上下文管理器就是专门让你做这种事情的,举个例子:
with open('some_file', 'wb') as f: f.write("fuck u!")
上面这段代码打开了一个文件,往里面写入了一些数据,然后关闭该文件。如果在往文件里写数据的时候发生异常,它也会尝试去关闭文件。上面的代码与下面的是等价的。
file = open('some_file', 'wb') try: file.write("funck u !") finally: file.close()
当与第一个例子比较的时候,有很多样板代码(boilerplate code)被消掉了。这就是with语句的主要优势,它确保我们的文件会被关闭,而不用关注嵌套代码如何退出。
上下文的又一用例就是资源的加锁与解锁,以及关闭已经打开的文件(就像上面的例子)
下面让我们自己实现一下上下文管理器
一个上下文管理器的类,最起码要定义__enter__,__exit__方法。
class File(object): def __init__(self,file_name, method): self.file_obj = open(file_name, method) def __enter__(self): return self.file_obj def __exit__(self, exc_type, exc_val, exc_tb): self.file_obj.close() with File('demo.txt', 'wb') as f: f.write('Hello')
我们的__exit__函数接受三个参数。这些参数对于每个上下文管理器类中的__exit__方法都是必须得,我们来谈谈在底层都发生了什么。
1,with语句先暂存了File类的__exit__方法
2,然后它调用File类的__enter__方法
3,__enter__方法返回打开文件对象
4,打开的文件对象被传递给 f
5,使用write来写文件
6,调用之前暂存的__exit__
7,__exit__关闭了文件
处理异常
我们目前还没有谈到__exit__方法的这三个参数,exc_type,exc_val,exc_tb,在with以下部分如果发生异常,python会将异常的type,value和traceback传递给__exit__方法。
它让__exit__方法来决定如何关闭文件以及是否需要其他步骤,如果没有异常这三个参数的值为None
class File(object): def __init__(self,file_name, method): self.file_obj = open(file_name, method) def __enter__(self): return self.file_obj def __exit__(self, exc_type, exc_val, exc_tb): print exc_val self.file_obj.close() return True with File('demo.txt', 'wb') as f: f.write_function('Hello')
当发生异常的时候with语句会采取如下步骤:
1,它把异常的type,value,traceback传递给__exit__方法
2,它让__exit__方法来处理异常
3,如果__exit__返回的是True,那么这个异常就优雅的处理了
4,如果__exit__返回的是除了True以外的其它值,那么这个异常会被抛出
基于装饰器和生成器来实现上下文管理
python有个contextlib专门用于这个,我们可以使用一个生成器函数来实现一个上下文管理器,而不是使用一个类。
from contextlib import contextmanager @contextmanager def open_file(name): f = open(name,'w') yield f f.close() with open_file('aaa.log') as of: of.write("fuck u!")
这块我个人用得比较少,因为内部也是通过__enter__和__exit__来实现的。
8 继承
9 生成器,迭代器,可迭代对象
10 自省
11 闭包
12 反射
13 推导式
14 C扩展
15 函数缓存
16 Flask上下文
18 多线程,多进程,协程
20 socket和socketserver
21 yield
22 进程间通讯
23 进程内存共享
24 Python实现冒泡法排序
25 对象
26 继承
io多路复用
27 动态加载
Python 模块动态加载技术
C 语言中可以使用 dlopen,dlsym 和 dlclose 让程序在运行过程中按需加载和卸载动态库。Python 也支持这种方式,使用模块动态加载技术,我们可以把程序的配置文件写成可运行的 python 程序,在程序运行过程中可以动态去更新配置。当然也可以将 python 脚本作为业务逻辑加载到正在运行的主程序中,而不用重启服务。
作者在个人项目 pyed 中使用了这种技术,本文对个人研究和使用这种技术的一个总结。如有问题,欢迎大家讨论。
在 Python 中执行代码
python 提供了 exec 用于在程序中执行一段 python 代码,官方说明:
exec_stmt ::= "exec" or_expr ["in" expression ["," expression]]
该语句可以使用 exec() 函数进行替代。来看一个简单的例子:
>>> exec "print('Hello World')" Hello World >>>
这种使用方式,在程序中其实作用不大,我们使用动态加载,一般是希望将一个模块中的某个变量或函数按需引入到正在执行的程序中,而不仅仅是去执行一下,打印一句 “Hello World”,exec 中的 in 解决了这个问题。
in 的作用是将执行代码中的变量,函数或者类放入到一个字典中,这里再来看一个例子:
>>> exec "a=100" in tmp >>> print tmp {'__builtins__': ..., 'a': 100} >>>
上面的语句等效于:
exec("a=100", tmp)
执行结果中,tmp 除了我们给定的一个 a 变量,赋值为 100 外,还有一个 __builtins__ 成员,内容很多,这里使用 … 替代了实际的内容。如果要访问 a 的值,只需要像操作字典一样就行了:
>>> print tmp["a"] 100 >>>
简单的模块加载
简单模块加载库
按照上面的思路,我们构造了一个模块
import traceback class loader(object): def __init__(self): pass def load(self, path): try: tmp = {} exec open(path).read() in tmp return tmp except: print("Load module [path %s] error: %s" % (path, traceback.format_exc())) return None
加载配置文件
有一个配置文件 test.conf:
$ cat test.conf addr="127.0.0.1" port=2539 $
使用以下代码加载它:
load = loader() m = load.load("test.conf") addr = m["addr"] port = m["port"] print addr + ":" + str(port)
执行结果:
$ python loader.py 127.0.0.1:2539 $
加载和执行函数
如果要执行加载模块(test.py)中的函数:
def greeting(name): print "Hello", name
使用以下代码加载它:
load = loader() m = load.load("test.py") func = m["greeting"] func("World")
执行结果:
$ python loader.py
Hello World
$
加载和使用模块中的类
按照上面的思路,如果加载的模块是一个类,其实调用方式也是大同小异的。
修改 test.py
class test(object): def __init__(self): pass def greeting(self, name): print "Hello", name
使用以下代码加载它:
load = loader() m = load.load("test.py") c = m["test"] print c print dir(c) t = c() t.greeting("World")
执行结果:
$ python loader.py <class 'test'> ['__class__', '__delattr__', '__dict__', '__doc__', '__format__', '__getattribute__', '__hash__', '__init__', '__module__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'greeting'] Hello World $
从上面可以看到 m[“test”] 是一个 class 类型,我们可以使用它创建类的实例,并调用实例方法
加载的模块引入了其它模块
如果在加载的模块中导入了其它模块,调用方法也是不变的。我们引入一个 test1,继承上例中的 test:
from test import test class test1(test): def __init__(self): test.__init__(self)
使用以下代码加载它:
load = loader() m = load.load("subtest.py") c = m["test1"] print c print dir(c) t = c() t.greeting("World")
执行结果:
$ python loader.py <class 'test1'> ['__class__', '__delattr__', '__dict__', '__doc__', '__format__', '__getattribute__', '__hash__', '__init__', '__module__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'greeting'] Hello World $
改进模块加载
上一节介绍了使用 exec … in … 的方式动态去加载模块。完成后可以直接使用返回的字典,访问模块中的变量,函数和类。但是从习惯上,我们更习惯使用模块去调用模块中的变量,函数和类,按此思路,我们对前面的模块加载器进行修改。
新的模块加载器
import traceback, types class loader(object): def __init__(self): pass def load(self, name, path): try: m = types.ModuleType(name) exec open(path).read() in m.__dict__ return m except: print("Load module [path %s] error: %s" % (path, traceback.format_exc())) return None
这里使用 types.ModuleType 来构造一个模块 m,将 exec 生成的字典放入到 m.__dict__。这样就生成了一个简单的模块
使用新的模块加载器
待加载的模块:
def test(): s = 0 for i in range(1000000): s += i print s
执行逻辑:
load = loader() m = load.load("test", "test.py") print m print m.__dict__ m.test()
执行结果:
$ python loader.py <module 'test' (built-in)> {'__builtins__': ..., '__name__': 'test', 'test': <function test at 0x1007f7398>, '__doc__': None} 499999500000 $
从执行结果,我们可以看到使用新的模块加载器,我们得到的是一个 module 类型的实例,其 __dict__ 中包含了 test 函数,我们可以直接使用 m.test() 调用该函数