在python中,一个迭代器对象需要实现两个基本方法:__next__()
和__inter__()
。
__iter__()
方法返回一个特殊的迭代器对象, 这个迭代器对象实现了__next__()
方法并通过 StopIteration
异常标识迭代的完成。
__next__()
方法需要返回下一个迭代器对象。在 __next__()
方法中我们可以设置在完成指定循环次数后触发 StopIteration
异常来结束迭代:
# 创建一个返回数字的迭代器,初始值为 1,逐步递增 1, 上限为5
class MyNumbers:
def __iter__(self):
self.a = 1
return self
def __next__(self):
x = self.a
self.a += 1
if x <= 5:
return x
else:
raise StopIteration
迭代器可以通过iter()
和next()
调用,也可以在for...in...
中使用:
myclass = MyNumbers()
myiter = iter(myclass)
print(next(myiter))
print(next(myiter))
for i in myclass:
print(i)
打印结果:
1
2
1
2
3
4
5
下面这段代码,是实际项目中,一个用来实现sql分页查询的迭代器:
class MssqlPagedQuery:
def __init__(self, query_sql, mssql_connector, page_size):
self.paged_query_sql = query_sql + " offset {offset} rows fetch next {page_size} rows only"
self.page_size = page_size
self.page_index = 1
self.mssql_connector = mssql_connector
def __next__(self):
offset = (self.page_index - 1) * self.page_size
results = self.mssql_connector.query(self.paged_query_sql.format(offset=offset, page_size=self.page_size))
if results:
self.page_index += 1
return results
else:
raise StopIteration
def __iter__(self):
return self
使用时:
for results in MssqlPagedQuery(query_sql, self.mssql_connector, page_size=page_size):
items = []
for item in tqdm(results):
items.append(get_sync_data(item, insert_sql))
self.mysql_connector.execute_sql_for_batch(insert_sql, tuple(items))
生成器
讲了迭代器,顺便再简单提一下生成器。在 Python 中,使用了 yield
的函数被称为生成器(generator)。跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作。
在调用生成器运行的过程中,每次遇到 yield
时函数会暂停并保存当前所有的运行信息,返回 yield
的值, 并在下一次执行 next()
方法时从当前位置继续运行。
下面这个实例使用 yield 实现斐波那契数列:
import sys
def fibonacci(n): # 生成器函数 - 斐波那契
a, b, counter = 0, 1, 0
while True:
if (counter > n):
return
yield a
a, b = b, a + b
counter += 1
f = fibonacci(10) # f 是一个迭代器,由生成器返回生成
while True:
try:
print (next(f), end=" ")
except StopIteration:
sys.exit()
打印结果:
0 1 1 2 3 5 8 13 21 34 55