[关闭]
@SuHongjun 2020-11-17T08:05:24.000000Z 字数 6250 阅读 353

Python-Day 16:函数--中级知识2-生成器

Python 2020春季学期


列表推导式/列表生成式

每个列表推导式都在 for 之后跟一个表达式,然后有零到多个 for 或 if 子句。

  1. >>> vec = [2, 4, 6]
  2. >>> [3*x for x in vec] #例1
  3. [6, 12, 18]
  4. >>> [[x, x**2] for x in vec] #例2
  5. [[2, 4], [4, 16], [6, 36]]
  6. >>> freshfruit = [' banana', ' loganberry ', 'passion fruit '] #例3
  7. >>> [weapon.strip() for weapon in freshfruit]
  8. ['banana', 'loganberry', 'passion fruit']
  9. >>> [3*x for x in vec if x > 3] #例4,用 if 子句作为过滤器:
  10. [12, 18]
  11. >>> [3*x for x in vec if x < 2] #例5
  12. []
  13. >>> L = ['Hello', 'World', 'IBM', 'Apple']
  14. >>> [s.lower() for s in L] #例6
  15. ['hello', 'world', 'ibm', 'apple']
  16. #列表推导式可以使用复杂表达式或嵌套函数:
  17. >>> [str(round(355/113, i)) for i in range(1, 6)] #例7
  18. ['3.1', '3.14', '3.142', '3.1416', '3.14159']
  19. >>> [m + n for m in 'ABC' for n in 'XYZ'] #还可以使用两层及以上的循环
  20. ['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ'] #例8
  21. >>> [x if x % 2 == 0 else -x for x in range(1, 11)] #例9
  22. [-1, 2, -3, 4, -5, 6, -7, 8, -9, 10]
  23. #在一个列表生成式中,for前面的if ... else是表达式,而for后面的if是过滤条件,不能带else。

for循环其实可以同时使用两个甚至多个变量,比如dict的items()可以同时迭代key和value:

  1. >>> d = {'x': 'A', 'y': 'B', 'z': 'C' }
  2. >>> for k, v in d.items():
  3. ... print(k, '=', v)
  4. ...
  5. y = B
  6. x = A
  7. z = C
  8. #列表生成式也可以使用两个变量来生成list:
  9. >>> d = {'x': 'A', 'y': 'B', 'z': 'C' }
  10. >>> [k + '=' + v for k, v in d.items()] #例10
  11. ['y=B', 'x=A', 'z=C']

字典生成式

类似于列表推导式,不过外面换成 { },for 之前以key:value的形式出现

  1. >>> {i: i**2 for i in range(10)} #例1
  2. {0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}
  3. >>> {x:x*x if x % 2 == 0 else -x for x in range(1, 11)} #例2
  4. {1: -1, 2: 4, 3: -3, 4: 16, 5: -5, 6: 36, 7: -7, 8: 64, 9: -9, 10: 100}

生成器 generator

通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。
要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:

  1. >>> L = [x * x for x in range(10)]
  2. >>> L
  3. [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
  4. >>> g = (x * x for x in range(10))
  5. >>> g
  6. <generator object <genexpr> at 0x1022ef630>

创建L和g的区别仅在于最外层的[ ]和( ),L是一个list,而g是一个generator。
我们可以直接打印出list的每一个元素,但我们怎么打印出generator的每一个元素呢?
如果要一个一个打印出来,可以通过next()函数获得generator的下一个返回值:

  1. >>> next(g)
  2. 0
  3. >>> next(g)
  4. 1
  5. >>> next(g)
  6. 4
  7. >>> next(g)
  8. 9
  9. >>> next(g)
  10. 16
  11. >>> next(g)
  12. 25
  13. >>> next(g)
  14. 36
  15. >>> next(g)
  16. 49
  17. >>> next(g)
  18. 64
  19. >>> next(g)
  20. 81
  21. >>> next(g)
  22. Traceback (most recent call last):
  23. File "<stdin>", line 1, in <module>
  24. StopIteration

我们讲过,generator保存的是算法,每次调用next(g),就计算出g的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误。
当然,上面这种不断调用next(g)实在是太变态了,正确的方法是使用for循环,因为generator也是可迭代对象:

  1. >>> g = (x * x for x in range(10))
  2. >>> for n in g:
  3. ... print(n)
  4. ...
  5. 0
  6. 1
  7. 4
  8. 9
  9. 16
  10. 25
  11. 36
  12. 49
  13. 64
  14. 81

所以,我们创建了一个generator后,基本上永远不会调用next(),而是通过for循环来迭代它,并且不需要关心StopIteration的错误。
generator非常强大。如果推算的算法比较复杂,用类似列表生成式的for循环无法实现的时候,还可以用函数来实现。
比如,著名的斐波拉契数列(Fibonacci),除第一个和第二个数外,任意一个数都可由前两个数相加得到:
1, 1, 2, 3, 5, 8, 13, 21, 34, ...
斐波拉契数列用列表生成式写不出来,但是,用函数把它打印出来却很容易:

  1. def fib(max):
  2. n, a, b = 0, 0, 1
  3. while n < max:
  4. print(b,end=' ') # 实际应该为print(b)
  5. a, b = b, a + b #注意这个赋值语句
  6. n = n + 1
  7. return 'done'
  8. fib(10)
  9. #1 1 2 3 5 8 13 21 34 55

上面的函数和generator仅一步之遥。要把fib函数变成generator,只需要把print(b)改为yield b就可以了:

  1. def fib(max):
  2. n, a, b = 0, 0, 1
  3. while n < max:
  4. yield b #生成器的关键
  5. a, b = b, a + b
  6. n = n + 1
  7. return 'done'
  1. >>> f = fib(6)
  2. >>> f
  3. <generator object fib at 0x104feaaa0>

这里,最难理解的就是generator和函数的执行流程不一样。函数是顺序执行,遇到return语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行时从上次返回的yield语句处继续执行。
举个简单的例子,定义一个generator,依次返回数字1,3,5:

  1. def odd():
  2. print('step 1')
  3. yield 1
  4. print('step 2')
  5. yield(3)
  6. print('step 3')
  7. yield(5)

调用该generator时,首先要生成一个generator对象,然后用next()函数不断获得下一个返回值:

  1. >>> o = odd()
  2. >>> next(o)
  3. step 1
  4. 1
  5. >>> next(o)
  6. step 2
  7. 3
  8. >>> next(o)
  9. step 3
  10. 5
  11. >>> next(o)
  12. Traceback (most recent call last):
  13. File "<stdin>", line 1, in <module>
  14. StopIteration

可以看到,odd不是普通函数,而是generator,在执行过程中,遇到yield就中断,下次又继续执行。执行3次yield后,已经没有yield可以执行了,所以,第4次调用next(o)就报错。

一个简单的生成器:

  1. def g1():
  2. for i in range(1,6):
  3. yield (i)

一个简单的无限序列的生成器:

  1. def g1():
  2. i = 1
  3. while True:
  4. yield (i)
  5. i+=1
  1. def g1():
  2. for i in range(1,6):
  3. yield (i)
  4. def g2():
  5. i = 1
  6. while True:
  7. yield (i)
  8. i+=1
  9. for i in g2():
  10. if i<100:
  11. print(i)
  12. else:
  13. break

回到fib的例子,我们在循环过程中不断调用yield,就会不断中断。当然要给循环设置一个条件来退出循环,不然就会产生一个无限数列出来。

同样的,把函数改成generator后,我们基本上从来不会用next()来获取下一个返回值,而是直接使用for循环来迭代:

  1. >>> for n in fib(6):
  2. ... print(n)
  3. ...
  4. 1
  5. 1
  6. 2
  7. 3
  8. 5
  9. 8
  1. def fib(max): #有限系列的斐波那契数列生成器
  2. n, a, b = 0, 0, 1
  3. while n < max:
  4. yield b #生成器的关键
  5. a, b = b, a + b
  6. n = n + 1
  7. return 'done'
  8. for i in fib(10): #对有限系列的斐波那契数列生成器使用
  9. print(i,end=' ')
  10. print('')
  11. def fib2(): #无限系列的斐波那契数列生成器
  12. a,b = 0,1
  13. while True:
  14. yield b
  15. a,b = b,a+b
  16. for i in fib2(): #对无限系列的斐波那契数列生成器使用
  17. print(i,end=' ')

但是用for循环调用generator时,发现拿不到generator的return语句的返回值。如果想要拿到返回值,必须捕获StopIteration错误,返回值包含在StopIteration的value中:

  1. >>> g = fib(6)
  2. >>> while True:
  3. ... try:
  4. ... x = next(g)
  5. ... print('g:', x)
  6. ... except StopIteration as e:
  7. ... print('Generator return value:', e.value)
  8. ... break
  9. ...
  10. g: 1
  11. g: 1
  12. g: 2
  13. g: 3
  14. g: 5
  15. g: 8
  16. Generator return value: done

延申内容:

1、带有yield关键字的函数自动变成生成器
2、生成器被调用时不会立即执行

  1. def func(n):
  2. for i in range(0, n):
  3. print('func: ', i)
  4. yield i
  5. f = func(10)
  6. #程序没有任何输出

结论:
1、对于生成器,当调用函数next(generator)时,将获得生成器yield后面表达式的值;
2、当生成器已经执行完毕时,再次调用next函数,生成器会抛出StopIteration异常
扩展:
1、当生成器内部执行到return语句时,自动抛出StopIteration异常,return的值将作为异常的解释
2、外部可以通过generator.close()函数手动关闭生成器,此后调用next或者send方法将抛出异常

next与send函数

next函数与send函数很相似,都能获得生成器的下一个yield后面表达式的值,不同的是send函数可以向生成器传参:

  1. import time
  2. def func(n):
  3. for i in range(0, n):
  4. arg = yield i
  5. print(m,i,'func:', arg)
  6. m=0
  7. f = func(10) #这里并不会执行func()
  8. while True:
  9. print(m,'main:', next(f))
  10. m +=1
  11. print(m,'main:', f.send(100))
  12. m +=1
  13. time.sleep(1)
  14. #------
  15. 0 main: 0
  16. 1 0 func: 100
  17. 1 main: 1
  18. 2 1 func: None
  19. 2 main: 2
  20. 3 2 func: 100
  21. 3 main: 3
  22. 4 3 func: None
  23. 4 main: 4
  24. 5 4 func: 100
  25. 5 main: 5
  26. 6 5 func: None
  27. 6 main: 6
  28. 7 6 func: 100
  29. 7 main: 7
  30. 8 7 func: None
  31. 8 main: 8
  32. 9 8 func: 100
  33. 9 main: 9
  34. 10 9 func: None
  35. Traceback (most recent call last):
  36. File "E:/Dev/智慧路灯/有人串口服务器/p1.py", line 10, in <module>
  37. print(m,'main:', next(f))
  38. StopIteration
  39. '''
  40. 程序首先调用next函数,使得生成器执行到第4行的时候,把i的值0作为next函数的返回值返回,程序输出main:0,然后生成器暂停。程序往下调用send(100)函数,
  41. 生成器从第四行继续执行,send函数的参数100作为yield的返回值,并赋值给arg,然后得到func:100的输出。
  42. 简单的说,send函数使得yield关键字拥有了返回值返回给它的左值。
  43. '''
  1. #常见错误
  2. import time
  3. def func(n):
  4. for i in range(0, n):
  5. arg = yield i
  6. print('func:', arg)
  7. f = func(10)
  8. while True:
  9. print('main:', f.send(100))
  10. time.sleep(1)
  11. #-----------------
  12. Traceback (most recent call last):
  13. File "E:/Dev/智慧路灯/有人串口服务器/p1.py", line 9, in <module>
  14. print('main:', f.send(100))
  15. TypeError: can't send non-None value to a just-started generator
  16. '''
  17. 错误说明显示:不能将一个非None的值传给初始的生成器。
  18. 从上面的测试,我们知道,当调用send函数前,生成器内部应该执行到yield所在的语句并暂停。而在这次的测试中,我们从一开始就调用send并传了一个参数,
  19. 程序报错误。
  20. '''

因此,在调用带非空参数的send函数之前,我们应该使用next(generator)或者send(None)使得生成器执行到yield语句并暂停:

  1. import time
  2. def func(n):
  3. for i in range(0, n):
  4. arg = yield i
  5. print('func:', arg)
  6. f = func(5)
  7. print('main:', f.send(None))
  8. while True:
  9. print('main:', f.send(100))
  10. time.sleep(1)
  11. #----------------
  12. main: 0
  13. func: 100
  14. main: 1
  15. func: 100
  16. main: 2
  17. func: 100
  18. main: 3
  19. func: 100
  20. main: 4
  21. func: 100
  22. Traceback (most recent call last):
  23. File "E:/Dev/智慧路灯/有人串口服务器/p1.py", line 10, in <module>
  24. print('main:', f.send(100))
  25. StopIteration
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注