首先理解几个概念,迭代、可迭代对象、迭代器。
1. 迭代器
- 迭代(Iteration):按顺序访问线性结构中的每一项
- 可迭代对象(Iterable):定义了_iter_方法的对象即为可迭代对象。一般可作用于for循环的对象均为可迭代对象。
- 判断对象是否可迭代:from collections import Iterable isinstance(obj, Iterable)
# 可迭代对象Iterable
num = [10, 20, 30]
from collections import Iterable
isinstance(num, Iterable)
# 执行结果
True
- 迭代器(Iterator):具有__iter__方法(返回一个具有__next__方法的对象)、__next__()方法的对象即为迭代器。是一个不断生成下一个值的惰性计算序列。占用空间较小。
- 判断对象是否为迭代器:from collections import Iterator isinstance(obj, Iterator)
# 自定义实现可迭代对象:内部定义了__iter__方法
from collections import Iterable
class Classmate(object):
def __iter__(self):
pass
classmate = Classmate()
isinstance(classmate, Iterable)
# 执行结果
True
- 可使用iter()函数将一个可迭代对象转变为迭代器
# 可迭代对象转换为迭代器
num_list = [1, 2, 3, 4]
num_iterator = iter(num_list)
print(type(num_iterator))
# 执行结果
<class 'list_iterator'>
-
for循环迭代的后台机制:
- 判断对象是否可迭代
- 若为可迭代对象,利用iter()函数生成一个迭代器对象(自动调用对象的_iter_方法得到一个返回值:迭代器)
- 利用next()函数_next_()方法不断访问对象的下一个值
- 内部自动处理Stopiteration异常,出现该异常自动停止迭代。
自定义实现迭代器:斐波那契数列
# 自定义实现迭代器:斐波那契数列
from collections import Iterator
class Fib(object):
def __init__(self, num):
self.num = num
self.current_num = 0
self.a = 0
self.b = 1
def __iter__(self):
return self
def __next__(self):
if self.current_num < self.num:
self.a, self.b = self.b, self.a + self.b
self.current_num += 1
return self.a
else:
raise StopIteration
fib = Fib(10)
print(isinstance(fib, Iterator))
for num in fib:
print(num)
2. 生成器
生成器均为迭代器
生成器提供延迟操作:需要的时候生成结果,而不是立即产生结果(内存占用较少)
- 生成器表达式:类似于列表推导式,但按需产生结果的一个对象,而不是一次构建整个结果列表
# 生成器表达式
squares = (x for x in range(3))
print(type(squares))
# print(next(squares))
# print(next(squares))
# print(next(squares))
# print(next(squares)) # 此处会抛出Stopiteration异常
for x in squares: # for循环会自动处理Stopiteration异常
print(x)
- 生成器函数:使用yield语句而不是return语句返回结果,yield语句执行一次返回一个结果
# 生成器函数
def test(num):
for x in range(num):
yield x
num_iterator = test(10)
print(type(num_iterator))
print(list(num_iterator))
# 执行结果
<class 'generator'>
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
3. 总结
迭代器是一个惰性计算序列,占用空间较小。生成器本身也为迭代器。与列表区别,列表存储的是数据列表,生成器存储的是生成元素的方法。
-
使用了yield关键字的函数不再是函数,而是生成器。yield关键字有两点作用:
- 保存当前运行状态(断点),然后暂停执行,即将生成器(函数)挂起
- 将yield关键字后面表达式的值作为返回值返回,此时可以理解为起到了return的作用
可以使用next()函数让生成器从断点处继续执行,即唤醒生成器(函数)
Python3中的生成器可以使用return返回最终运行的返回值,而Python2中的生成器不允许使用return返回一个返回值(即可以使用return从生成器中退出,但return后不能有任何表达式)。