前部分转自:
https://www.cnblogs.com/Tsukasa/p/6613934.html
通过列表list生成器,我们可以直接创建一个列表
|
1
2
3
|
>>> x = list(range(1,11))>>> x[1, 2, 3, 4, 5, 6, 7, 8, 9, 10] |
但是,受到内存的限制,列表的容量是有限的,而且创建一个包含100万1个亿的列表时候,不仅会占用很大的储存空间,如果有事我们只要访问前面几个元素,那后面大多数元素都白白浪费了。而且运作效率低下。
如果列表元素可以按某种算法推算出来,那我们是否可以在循环的过程中不断推算出后面的元素呢?这样就不必要创建一个完整的list列表了,从而提升程序的效率。在python中,这种一边循环一边计算的机制,称为生成器generator
要创建一个generator,有很多方法:
第一种方法很简单,就是只要把一个列表生成试的 [ ] 改成 ( ) 就可以创建一个generator:
|
1
2
3
4
5
6
|
>>> l = [x * x for x in range(10)]>>> l[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]>>> g = (x * x for x in range(10))>>> g<generator object <genexpr> at 0x00000000035BC410> |
L 是一个list, 而 G 是一个generator:它们在创建时候最基本的不同就list是 [ ] ,而generator是 ( ) 。
我们可以直接打印出list的全部元素,但是怎么打印出generator的全部元素呢?
|
1
2
|
>>> g<generator object <genexpr> at 0x00000000035BC410> |
如果要一个个打印出来,可以通过next()函数来获得generator的下一个返回值。
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
|
>>> next(g)0>>> next(g)1>>> next(g)4>>> next(g)9>>> next(g)16>>> next(g)25>>> next(g)36>>> next(g)49>>> next(g)64>>> next(g)81>>> next(g)Traceback (most recent call last): File "<pyshell#18>", line 1, in <module> next(g)StopIteration |
generator保存的是算法,每次调用 next(g)的时候才会计算 g 的下一个元素值,直到计算到最后一个元素,没有下一个元素时,会返回stopIteration的错误。
当然,上面这种不停调用next (g)这种方法实在是太繁琐了,正确的方法是使用for循环,因为generator也是一个可迭代对象:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
>>> g = (x * x for x in range(10))>>> for n in g:... print(n)... 0149162536496481 |
jieba的cut_for_search输出可以按:
seg_list = jieba.cut_for_search("你好明天")
print(",".join(seg_list)) seglist 为generator