@SuHongjun
2020-11-17T08:05:24.000000Z
字数 6250
阅读 353
Python
2020春季学期
每个列表推导式都在 for 之后跟一个表达式,然后有零到多个 for 或 if 子句。
>>> vec = [2, 4, 6]
>>> [3*x for x in vec] #例1
[6, 12, 18]
>>> [[x, x**2] for x in vec] #例2
[[2, 4], [4, 16], [6, 36]]
>>> freshfruit = [' banana', ' loganberry ', 'passion fruit '] #例3
>>> [weapon.strip() for weapon in freshfruit]
['banana', 'loganberry', 'passion fruit']
>>> [3*x for x in vec if x > 3] #例4,用 if 子句作为过滤器:
[12, 18]
>>> [3*x for x in vec if x < 2] #例5
[]
>>> L = ['Hello', 'World', 'IBM', 'Apple']
>>> [s.lower() for s in L] #例6
['hello', 'world', 'ibm', 'apple']
#列表推导式可以使用复杂表达式或嵌套函数:
>>> [str(round(355/113, i)) for i in range(1, 6)] #例7
['3.1', '3.14', '3.142', '3.1416', '3.14159']
>>> [m + n for m in 'ABC' for n in 'XYZ'] #还可以使用两层及以上的循环
['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ'] #例8
>>> [x if x % 2 == 0 else -x for x in range(1, 11)] #例9
[-1, 2, -3, 4, -5, 6, -7, 8, -9, 10]
#在一个列表生成式中,for前面的if ... else是表达式,而for后面的if是过滤条件,不能带else。
for循环其实可以同时使用两个甚至多个变量,比如dict的items()可以同时迭代key和value:
>>> d = {'x': 'A', 'y': 'B', 'z': 'C' }
>>> for k, v in d.items():
... print(k, '=', v)
...
y = B
x = A
z = C
#列表生成式也可以使用两个变量来生成list:
>>> d = {'x': 'A', 'y': 'B', 'z': 'C' }
>>> [k + '=' + v for k, v in d.items()] #例10
['y=B', 'x=A', 'z=C']
类似于列表推导式,不过外面换成 { },for 之前以key:value的形式出现
>>> {i: i**2 for i in range(10)} #例1
{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}
>>> {x:x*x if x % 2 == 0 else -x for x in range(1, 11)} #例2
{1: -1, 2: 4, 3: -3, 4: 16, 5: -5, 6: 36, 7: -7, 8: 64, 9: -9, 10: 100}
通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。
要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:
>>> L = [x * x for x in range(10)]
>>> L
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
>>> g = (x * x for x in range(10))
>>> g
<generator object <genexpr> at 0x1022ef630>
创建L和g的区别仅在于最外层的[ ]和( ),L是一个list,而g是一个generator。
我们可以直接打印出list的每一个元素,但我们怎么打印出generator的每一个元素呢?
如果要一个一个打印出来,可以通过next()函数获得generator的下一个返回值:
>>> next(g)
0
>>> next(g)
1
>>> next(g)
4
>>> next(g)
9
>>> next(g)
16
>>> next(g)
25
>>> next(g)
36
>>> next(g)
49
>>> next(g)
64
>>> next(g)
81
>>> next(g)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
我们讲过,generator保存的是算法,每次调用next(g),就计算出g的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误。
当然,上面这种不断调用next(g)实在是太变态了,正确的方法是使用for循环,因为generator也是可迭代对象:
>>> g = (x * x for x in range(10))
>>> for n in g:
... print(n)
...
0
1
4
9
16
25
36
49
64
81
所以,我们创建了一个generator后,基本上永远不会调用next(),而是通过for循环来迭代它,并且不需要关心StopIteration的错误。
generator非常强大。如果推算的算法比较复杂,用类似列表生成式的for循环无法实现的时候,还可以用函数来实现。
比如,著名的斐波拉契数列(Fibonacci),除第一个和第二个数外,任意一个数都可由前两个数相加得到:
1, 1, 2, 3, 5, 8, 13, 21, 34, ...
斐波拉契数列用列表生成式写不出来,但是,用函数把它打印出来却很容易:
def fib(max):
n, a, b = 0, 0, 1
while n < max:
print(b,end=' ') # 实际应该为print(b)
a, b = b, a + b #注意这个赋值语句
n = n + 1
return 'done'
fib(10)
#1 1 2 3 5 8 13 21 34 55
上面的函数和generator仅一步之遥。要把fib函数变成generator,只需要把print(b)改为yield b就可以了:
def fib(max):
n, a, b = 0, 0, 1
while n < max:
yield b #生成器的关键
a, b = b, a + b
n = n + 1
return 'done'
>>> f = fib(6)
>>> f
<generator object fib at 0x104feaaa0>
这里,最难理解的就是generator和函数的执行流程不一样。函数是顺序执行,遇到return语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行时从上次返回的yield语句处继续执行。
举个简单的例子,定义一个generator,依次返回数字1,3,5:
def odd():
print('step 1')
yield 1
print('step 2')
yield(3)
print('step 3')
yield(5)
调用该generator时,首先要生成一个generator对象,然后用next()函数不断获得下一个返回值:
>>> o = odd()
>>> next(o)
step 1
1
>>> next(o)
step 2
3
>>> next(o)
step 3
5
>>> next(o)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
可以看到,odd不是普通函数,而是generator,在执行过程中,遇到yield就中断,下次又继续执行。执行3次yield后,已经没有yield可以执行了,所以,第4次调用next(o)就报错。
一个简单的生成器:
def g1():
for i in range(1,6):
yield (i)
一个简单的无限序列的生成器:
def g1():
i = 1
while True:
yield (i)
i+=1
def g1():
for i in range(1,6):
yield (i)
def g2():
i = 1
while True:
yield (i)
i+=1
for i in g2():
if i<100:
print(i)
else:
break
回到fib的例子,我们在循环过程中不断调用yield,就会不断中断。当然要给循环设置一个条件来退出循环,不然就会产生一个无限数列出来。
同样的,把函数改成generator后,我们基本上从来不会用next()来获取下一个返回值,而是直接使用for循环来迭代:
>>> for n in fib(6):
... print(n)
...
1
1
2
3
5
8
def fib(max): #有限系列的斐波那契数列生成器
n, a, b = 0, 0, 1
while n < max:
yield b #生成器的关键
a, b = b, a + b
n = n + 1
return 'done'
for i in fib(10): #对有限系列的斐波那契数列生成器使用
print(i,end=' ')
print('')
def fib2(): #无限系列的斐波那契数列生成器
a,b = 0,1
while True:
yield b
a,b = b,a+b
for i in fib2(): #对无限系列的斐波那契数列生成器使用
print(i,end=' ')
但是用for循环调用generator时,发现拿不到generator的return语句的返回值。如果想要拿到返回值,必须捕获StopIteration错误,返回值包含在StopIteration的value中:
>>> g = fib(6)
>>> while True:
... try:
... x = next(g)
... print('g:', x)
... except StopIteration as e:
... print('Generator return value:', e.value)
... break
...
g: 1
g: 1
g: 2
g: 3
g: 5
g: 8
Generator return value: done
1、带有yield关键字的函数自动变成生成器
2、生成器被调用时不会立即执行
def func(n):
for i in range(0, n):
print('func: ', i)
yield i
f = func(10)
#程序没有任何输出
结论:
1、对于生成器,当调用函数next(generator)时,将获得生成器yield后面表达式的值;
2、当生成器已经执行完毕时,再次调用next函数,生成器会抛出StopIteration异常
扩展:
1、当生成器内部执行到return语句时,自动抛出StopIteration异常,return的值将作为异常的解释
2、外部可以通过generator.close()函数手动关闭生成器,此后调用next或者send方法将抛出异常
next函数与send函数很相似,都能获得生成器的下一个yield后面表达式的值,不同的是send函数可以向生成器传参:
import time
def func(n):
for i in range(0, n):
arg = yield i
print(m,i,'func:', arg)
m=0
f = func(10) #这里并不会执行func()
while True:
print(m,'main:', next(f))
m +=1
print(m,'main:', f.send(100))
m +=1
time.sleep(1)
#------
0 main: 0
1 0 func: 100
1 main: 1
2 1 func: None
2 main: 2
3 2 func: 100
3 main: 3
4 3 func: None
4 main: 4
5 4 func: 100
5 main: 5
6 5 func: None
6 main: 6
7 6 func: 100
7 main: 7
8 7 func: None
8 main: 8
9 8 func: 100
9 main: 9
10 9 func: None
Traceback (most recent call last):
File "E:/Dev/智慧路灯/有人串口服务器/p1.py", line 10, in <module>
print(m,'main:', next(f))
StopIteration
'''
程序首先调用next函数,使得生成器执行到第4行的时候,把i的值0作为next函数的返回值返回,程序输出main:0,然后生成器暂停。程序往下调用send(100)函数,
生成器从第四行继续执行,send函数的参数100作为yield的返回值,并赋值给arg,然后得到func:100的输出。
简单的说,send函数使得yield关键字拥有了返回值返回给它的左值。
'''
#常见错误
import time
def func(n):
for i in range(0, n):
arg = yield i
print('func:', arg)
f = func(10)
while True:
print('main:', f.send(100))
time.sleep(1)
#-----------------
Traceback (most recent call last):
File "E:/Dev/智慧路灯/有人串口服务器/p1.py", line 9, in <module>
print('main:', f.send(100))
TypeError: can't send non-None value to a just-started generator
'''
错误说明显示:不能将一个非None的值传给初始的生成器。
从上面的测试,我们知道,当调用send函数前,生成器内部应该执行到yield所在的语句并暂停。而在这次的测试中,我们从一开始就调用send并传了一个参数,
程序报错误。
'''
因此,在调用带非空参数的send函数之前,我们应该使用next(generator)或者send(None)使得生成器执行到yield语句并暂停:
import time
def func(n):
for i in range(0, n):
arg = yield i
print('func:', arg)
f = func(5)
print('main:', f.send(None))
while True:
print('main:', f.send(100))
time.sleep(1)
#----------------
main: 0
func: 100
main: 1
func: 100
main: 2
func: 100
main: 3
func: 100
main: 4
func: 100
Traceback (most recent call last):
File "E:/Dev/智慧路灯/有人串口服务器/p1.py", line 10, in <module>
print('main:', f.send(100))
StopIteration