@wuxin1994 2017-10-05T04:49:33.000000Z 字数 1292 阅读 1554

范数

math

什么是范数

范数是一种强化了的距离概念。他在定义上比距离多了一条数乘的运算法则。
数学上，范数包括向量范数和矩阵范数。向量范数表征向量空间中向量的大小，矩阵范数表征矩阵引起变化的大小。一种非严密的解释就是，对应向量范数，向量空间中的向量都是有大小的，这个大小如何度量，就是用范数来度量的，不同的范数都可以来度量这个大小。对于矩阵范数，已知AX=B，可以将向量X变化为B，而矩阵范数就是来度量这个变化大小的。

L-P范数

L-P范数不是一个范数，而是一组范数。定义如下：

$L_p = \sqrt[p]{\sum_{i=1}^n x_i^p}, x=(x_1,x_2,...,x_n)$

L0范数

上式中，当p=0时，就是L0范数。L0范数并不是一个真正的范数，它主要用来度量向量中非零元素的个数。L-0的定义为：

$||x|| = \sqrt[0]{\sum_1^n{x_i^0}},x=(x_1,x_2,...,x_n)$
其优化问题为：

$min||x||_0 \\ s.t. Ax=b$
在实际应用中，由于L0范数本身不容易有一个好的数学表示形式，给出上面问题的形式化表示是一个很难的问题，故被人认为是一个NP难问题。所以在实际情况中，L0的最优问题会被放宽到L1或L2下的最优化。

L-1范数

L1范数是我们经常见到的一种范数，它的定义如下：

$||x||_1=\sum_i{|x_i|}$
表示向量x中非零元素的绝对值之和。
L1范数有许多别称，比如曼哈顿距离，最小绝对误差等等。使用L1范数可以度量两个向量间的差异，如绝对误差和（Sum of Absolute Difference）：

$SAD(x_1,x_2) = \sum_i{|x_{1i}-x_{2i}|}$
对于L1范数，他的优化问题如下：

$min||x||_1 \\ s.t. Ax = b$
由于L1范数的天然性质，对L1优化的解是一个稀疏解，因此L1范数也被叫做稀疏规则算子。通过L1可以实现特征的稀疏，去掉一些没有信息的特征，例如在对用户的电影爱好做分类的时候，用户有100个特征，可能只有十几个特征是对分类有用的，大部分特征如身高体重等可能都是无用的，利用L1范数就可以过滤掉。

L2范数

我们来度量欧式距离的就是一种L2范数，它的定义如下：

$||x||_2 = \sqrt{\sum_i{x_i^2}}$
表示向量元素的平方和再开平方。
L2也可以用来度量两个向量之间的差异，如平方差和（Sum of Squared Difference）：

$SSD(x_1,x_2) = \sum_i{(x_{1i}-x_{2i})^2}$
对于L2范数，它的优化问题如下：

$min||x||_2\\s.t. Ax = b$
L2范数通常会被用来做优化目标的正则化项，防止模型为了迎合训练集而过于复杂造成过拟合的情况，从而提高模型的泛化能力。

L-∞范数

当P=∞时，也就是L-∞范数，它主要被用来度量向量元素的最大值。用上面的L-P定义可以得到的L∞的定义为：

$||x||_∞ = \sqrt[∞]{\sum_1^n{x_i^∞}},x=(x_1,x_2,...,x_n)$
通常情况下，大家用的都是：

$||x||_∞ = max(|x_i|)$
来表示L-∞范数。