python基础

@lgh-dev 2018-01-13T08:35:21.000000Z 字数 4955 阅读 824

python

数据类型

整型
整数和浮点数在计算机内部存储的方式是不同的，整数运算永远是精确的（除法难道也是精确的？是的！），而浮点数运算则可能会有四舍五入的误差
浮点型
浮点数也就是小数，之所以称为浮点数，是因为按照科学记数法表示时，一个浮点数的小数点位置是可变的；
字符串
字符串是以单引号'或双引号"括起来的任意文本,Python还允许用r''表示''内部的字符串默认不转义, 允许用'''...'''的格式表示多行内容
布尔值类型
一个布尔值只有True、False两种值，要么是True，要么是False; 布尔值可以用and、or、not运算
空值
空值是Python里一个特殊的值，用None表示。None不能理解为0，因为0是有意义的，而None是一个特殊的空值

list

是一种有序的集合，可以随时天假和删除其中的元素.
常用方法:len(), append(), insert(position,content), pop(i='');
tuple

元组：tuple，tuple和list非常类似，但是tuple一旦初始化就不能修改；
只有1个元素的tuple定义时必须加一个逗号,，来消除歧义;
tuple所谓的“不变”是说，tuple的每个元素，指向永远不变;
list和tuple是Python内置的有序集合，一个可变，一个不可变。根据需要来选择使用它们

dict [字典类型]

1、dict全称dictionary，在其他语言中也称为map，使用键-值（key-value）存储，具有极快的查找速度;
2、要避免key不存在的错误，有两种办法，一是通过in判断key是否存在;
3、二是通过dict提供的get()方法，如果key不存在，可以返回None，或者自己指定的value;
和list比较，dict有以下几个特点：
1、查找和插入的速度极快，不会随着key的增加而变慢；
2、需要占用大量的内存，内存浪费多。
dict可以用在需要高速查找的很多地方，在Python代码中几乎无处不在，正确使用dict非常重要，需要牢记的第一条就是dict的key必须是不可变对象;
通过key计算位置的算法称为哈希算法（Hash）
set 类型

set和dict类似，也是一组key的集合，但不存储value。由于key不能重复，所以，在set中，没有重复的key;
要创建一个set，需要提供一个list作为输入集合;
set可以看成数学意义上的无序和无重复元素的集合，因此，两个set可以做数学意义上的交集、并集等操作;
set和dict的唯一区别仅在于没有存储对应的value，但是，set的原理和dict一样，所以，同样不可以放入可变对象，因为无法判断两个可变对象是否相等，也就无法保证set内部“不会有重复元素”

不可变对象

对于不变对象来说，调用对象自身的任意方法，也不会改变该对象自身的内容。相反，这些方法会创建新的对象并返回，这样，就保证了不可变对象本身永远是不可变的
循环
range()函数可以声称一个从0开始的整数序列,list函数转换为list，如list(range(5));
break语句可以在循环过程中直接退出循环，而continue语句可以提前结束本轮循环，并直接开始下一轮循环。这两个语句通常都必须配合if语句使用

变量

这种变量本身类型不固定的语言称之为动态语言，与之对应的是静态语言。静态语言在定义变量时必须指定变量类型，如果赋值的时候类型不匹配，就会报错

常量

所谓常量就是不能变的变量
python中有两种除法，/除法结果是浮点数，即使整除
//成为地板除，整数的地板除//永远是整数，即使除不尽

字符串和编码

对于单个字符的编码，Python提供了ord()函数获取字符的整数表示，chr()函数把编码转换为对应的字符
Python的字符串类型是str，在内存中以Unicode表示，一个字符对应若干个字节。如果要在网络上传输，或者保存到磁盘上，就需要把str变为以字节为单位的bytes
以Unicode表示的str通过encode()方法可以编码为指定的bytes,如果我们从网络或磁盘上读取了字节流，那么读到的数据就是bytes。要把bytes变为str，就需要用decode()方法
len()函数计算的是str的字符数，如果换成bytes，len()函数就计算字节数
%运算符就是用来格式化字符串的。在字符串内部，%s表示用字符串替换，%d表示用整数替换，有几个%?占位符，后面就跟几个变量或者值，顺序要对应好。如果只有一个%?，括号可以省略

函数

python 常见的一些内置函数: https://docs.python.org/3/library/functions.html

函数名其实就是指向一个函数对象的引用，完全可以把函数名赋给一个变量，相当于给这个函数起了一个“别名”

如果想定义一个什么事也不做的空函数，可以用pass语句;

调用函数时，如果参数个数不对，Python解释器会自动检查出来，并抛出TypeError;

Python的函数返回多值其实就是返回一个tuple，但写起来更方便,在语法上，返回一个tuple可以省略括号，而多个变量可以同时接收一个tuple，按位置赋给对应的值

函数参数

函数参数类型

位置参数，默认参数，可变参数，关键字参数,命名关键词参数
定义默认参数是要牢记一点，默认参数必须指向不变的对象，否则每次调用的时候，默认参数的内容就改变了，比如如下函数定义,

def add_end(L = [] ):
    L.append('END')
    return L
可以改为如下:
def add_end(L=None):
    if L is None:
        L = []
    L.append('END')
    return L

因为不变对象一旦创建，对象内部的数据就不能修改，这样就减少了由于修改数据导致的错误。此外，由于对象不变，多任务环境下同时读取对象不需要加锁，同时读一点问题都没有。我们在编写程序时，如果可以设计一个不变对象，那就尽量设计成不变对象。

Python允许你在list或tuple前面加一个*号，把list或tuple的元素变成可变参数传进去

可变参数允许你传入0个或任意个参数，这些可变参数在函数调用时自动组装为一个tuple。而关键字参数允许你传入0个或任意个含参数名的参数，这些关键字参数在函数内部自动组装为一个dict

和关键字参数**kw不同，命名关键字参数需要一个特殊分隔符，后面的参数被视为命名关键字参数

使用命名关键字参数时，要特别注意，如果没有可变参数，就必须加一个作为特殊分隔符。
如果缺少，Python解释器将无法识别位置参数和命名关键字参数

函数组合参数定义的顺序必须是：必选参数、默认参数、可变参数、命名关键字参数和关键字参数

递归函数

尾递归是指，在函数返回的时候，调用自身本身，并且，return语句不能包含表达式。这样，编译器或者解释器就可以把尾递归做优化，使递归本身无论调用多少次，都只占用一个栈帧，不会出现栈溢出的情况

使用递归函数的优点是逻辑简单清晰，缺点是过深的调用会导致栈溢出。

切片

L[0:3]表示，从索引0开始取，直到索引3为止，但不包括索引3。即索引0，1，2，正好是3个元素;
如果第一个索引是0，还可以省略

字符串'xxx'也可以看成是一种list，每个元素就是一个字符。因此，字符串也可以用切片操作，只是操作结果仍是字符串

迭代

当我们使用for循环时，只要作用于一个可迭代对象，for循环就可以正常运行，而我们不太关心该对象究竟是list还是其他数据类型
那么，如何判断一个对象是可迭代对象呢？方法是通过collections模块的Iterable类型判断

>>> from collections import Iterable
>>> isinstance('abc', Iterable)
True
>>> isinstance([1,2,3], Iterable)
True
>>> isinstance(1, Iterable)
False

Python内置的enumerate函数可以把一个list变成索引-元素对，这样就可以在for循环中同时迭代索引和元素本身

列表生成式

而列表生成式则可以用一行语句代替循环生成上面的list

>>> [x * x for x in range(1, 11)]
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

for循环后面还可以加上if判断，这样我们就可以筛选出仅偶数的平方：

>>> [x * x for x in range(1, 11) if x % 2 == 0]
[4, 16, 36, 64, 100]

还可以使用两层循环，可以生成全排列:

>>> [m + n for m in 'ABC' for n in 'XYZ']
['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']

for循环其实可以同时使用两个甚至多个变量，比如dict的items()可以同时迭代key和value
因此，列表生成式也可以使用两个变量来生成list

>>> d = {'x': 'A', 'y': 'B', 'z': 'C' }
>>> [k + '=' + v for k, v in d.items()]
['y=B', 'x=A', 'z=C']

生成器

通过列表生成式，我们可以直接创建一个列表。但是，受到内存限制，列表容量肯定是有限的。而且，创建一个包含100万个元素的列表，不仅占用很大的存储空间，如果我们仅仅需要访问前面几个元素，那后面绝大多数元素占用的空间都白白浪费了

在Python中，这种一边循环一边计算的机制，称为生成器：generator

如果一个函数定义中包含yield关键字，那么这个函数就不再是一个普通函数，而是一个generator

最难理解的就是generator和函数的执行流程不一样。函数是顺序执行，遇到return语句或者最后一行函数语句就返回。而变成generator的函数，在每次调用next()的时候执行，遇到yield语句返回，再次执行时从上次返回的yield语句处继续执行

def odd():
    print('step 1')
    yield 1
    print('step 2')
    yield(3)
    print('step 3')
    yield(5)
>>> o = odd()
>>> next(o)
step 1
1
>>> next(o)
step 2
3
>>> next(o)
step 3
5
>>> next(o)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

用for循环调用generator时，发现拿不到generator的return语句的返回值。如果想要拿到返回值，必须捕获StopIteration错误，返回值包含在StopIteration的value中
generator的工作原理，它是在for循环的过程中不断计算出下一个元素，并在适当的条件结束for循环。对于函数改成的generator来说，遇到return语句或者执行到函数体最后一行语句，就是结束generator的指令，for循环随之结束

迭代器

直接作用于for循环的数据类型有以下几种：
一类是集合数据类型，如list、tuple、dict、set、str等；
一类是generator，包括生成器和带yield的generator function
这些可以直接作用于for循环的的对象统称为可迭代对象: Iterable
可以被next()函数调用并不断返回下一个值的对象称为迭代器：Iterator

生成器都是Iterator对象，但list、dict、str虽然是Iterable，却不是Iterator。
把list、dict、str等Iterable变成Iterator可以使用iter()函数；

Python的Iterator对象表示的是一个数据流，Iterator对象可以被next()函数调用并不断返回下一个数据，直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列，但我们却不能提前知道序列的长度，只能不断通过next()函数实现按需计算下一个数据，所以Iterator的计算是惰性的，只有在需要返回下一个数据时它才会计算。

python基础

数据类型

变量

常量

字符串和编码

函数

函数参数

递归函数

切片

迭代

列表生成式

生成器

迭代器

内容目录

选择主题