16、Python 教程 - 迭代器与生成器 | DDKK.COM 弟弟快看

1 迭代器

迭代

我们知道 Python 中有一些对象可以通过 for 来循环遍历，比如：列表、元组、字符等，以字符串为例，如下所示：

for i in 'Hello':
    print(i)

执行结果：

H
e
l
l
o

这个遍历过程就是迭代。

可迭代对象

可迭代对象需具有 __iter__() 方法，它们均可使用 for 循环遍历，我们可以使用 isinstance() 方法来判断一个对象是否为可迭代对象，看下示例：

from collections import Iterable
print(isinstance('abc', Iterable))
print(isinstance({
     1, 2, 3}, Iterable))
print(isinstance(1024, Iterable))

执行结果：

True
True
False

迭代器

迭代器需要具有 __iter__() 和 __next__() 两个方法，这两个方法共同组成了迭代器协议，通俗来讲迭代器就是一个可以记住遍历位置的对象，迭代器一定是可迭代的，反之不成立。

iter()：返回迭代器对象本身
next()：返回下一项数据

迭代器对象本质是一个数据流，它通过不断调用 __next__() 方法或被内置的 next() 方法调用返回下一项数据，当没有下一项数据时抛出 StopIteration 异常迭代结束。上面我们说的 for 循环语句的实现便是利用了迭代器。

我们试着自己来实现一个迭代器，如下所示：

class MyIterator:
    def __init__(self):
        self.s = '程序之间'
        self.i = 0
    def __iter__(self):
        return self
    def __next__(self):
        if self.i < 4:
            n = self.s[self.i]
            self.i += 1
            return n
        else:
            raise StopIteration
mi = iter(MyIterator())
for i in mi:
    print(i)

输出结果：

程
序
之
间

2 生成器

生成器是用来创建迭代器的工具，其写法与标准函数类似，不同之处在于返回时使用 yield 语句，关于 yield ，我们在使用 Scrapy 爬取去哪儿网景区信息中已经作了一些介绍，我们再来熟悉一下：

yield 是一个关键字，作用和 return 差不多，差别在于 yield 返回的是一个生成器（在 Python 中，一边循环一边计算的机制，称为生成器），它的作用是：有利于减小服务器资源，在列表中所有数据存入内存，而生成器相当于一种方法而不是具体的信息，用多少取多少，占用内存小。

生成器的创建方式有很多种，比如：使用 yield 语句、生成器表达式（可以简单的理解为是将列表的 [] 换成了 ()，特点是更加简洁，但不够灵活）。看下示例：

示例 1

def reverse(data):
    for i in range(len(data)-1, -1, -1):
        yield data[i]
for char in reverse('Hello'):
    print(char)

执行结果：

o
l
l
e
H

示例 2

# 列表
lis = [x*x for x in range(5)]
print(lis)
# 生成器
gen = (x*x for x in range(5))
for g in gen:
    print(g)

执行结果：

[0, 1, 4, 9, 16]
0
1
4
9
16