[关闭]
@lunar 2016-06-08T08:36:28.000000Z 字数 4638 阅读 3492

ch6 正交性和最小二乘法 ‘线性代数及其应用笔记’

具体数学


6.1 内积,长度和正交性

内积

如果u和v是空间中的向量,可以将u和v作为矩阵,我们将一个不加括号的实数,如称为u和v的内积,并记作。内积又称点积。

内积运算满足

向量长度
向量v的长度(范数)是非负数
且有

将某向量除以自身长度的过程叫做单位化,,u和v方向相同。
向量距离
u和v距离,

正交向量
两条直线几何上垂直当且仅当从u到v和从u到-v的距离相等。
那么容易得出空间上向量互相垂直(或者说线性代数中的术语正交)的条件。

定义:如果那么两个向量u和v正交。

正交充要条件(毕达哥拉斯定理)

正交补
如果向量z和子空间W中任意向量都正交,则称z正交于W。与子空间W正交的向量z的全体组成集合称为W的正交补,记作

正交补有如下性质:
1. 向量x属于的充要条件是x与W的任一向量都正交。
2. 的一个子空间

6.2 正交集


向量集合中任意两个不同向量都正交的集合叫做正交集。

空间中非零向量构成的正交集,那么S是线性无关集,因此构成所生成的子空间S的一组基。

把正交和基搅和到一起给出一个正交基的定义,中子空间W的一个正交基是W的一个基,且是正交基。

之前已经有基了呀,为啥还要搞一个基,这是因为正交基比较优越,线性组合中的权值比较容易计算。(比如笛卡尔坐标基),它有这样的性质:假设中子空间W正交基,那么对于W中每个中的权值可以由

计算得出。正交基单位化后称为单位正交基

下面是一个几何解释:正交投影
对于中一个非零向量u,对一个向量y进行分解使,其中,z和u正交。称为y在u上的正交投影,z称为y垂直u的分量。 容易得到

定理

其实就是说,单位正交列构成的矩阵U代表的变换保持长度和正交性。

哦哦对咯,如果U是方阵的话,显然U可逆,,这样的U就叫做正交矩阵。

6.3 正交投影

我们把上面提到的正交分解拓展到子空间。
正交分解定理

若W是的一个子空间,那么中每一个向量y可以唯一的表示为


此处
如果是W的任意正交基,那么有

就称为y在W上的正交投影。

正交投影有一个性质,称为最佳逼近定理:

假设W是一个子空间,y是的任意向量,在W上正交投影,那么是W中最接近的点,也就是对于任意异于而又属于W的,



当W的基是单位正交基时,计算可以被简化。令为子空间W的单位正交基,则y在W上的投影为

6.4 格拉姆-施密特方法

格拉姆-是米他方法是对中任何非零子空间,构造(标准)正交基的简单算法。
步骤
中子空间的一个基,定义

QR分解

如果矩阵A的列线性无关,那么A可以分解为A=QR,其中Q是一个矩阵,其列形成Col A的一个标准正交基,R是一个的上三角可逆矩阵且在对角线上的元素为正数。

其中的Q可以用格拉姆-施密特方法加上单位化求解,因为R可逆(6.4.19习题证明),所以其对角线上不可能为0,所以如果是负数的话可以可以通过行变换改变正负(同时相应改变Q的某些元素正负值),所以R的对角线上元素可以全为正数。

6.5 最小二乘问题

在求解方程组时,解可能不存在但又需要求解,最好的 办法是去去寻找使尽可能接近。一般的最小二乘问题就是去找出使尽量小的
定义

如果矩阵A和向量b属于,的最小二乘解是中的使得

对于所有成立。

易知无论如何选择x,Ax都属于列空间ColA。所以我们可以应用6.3中的最佳逼近定理于ColA空间。


那么就有,然后就可以解出了。

可是这样还要求b的投影好麻烦,这里有个等价表述(证明见p359):
定理 方程的最小二乘解集合法方程的非空解集一致。

呀,太棒了,那就不用管要先求正交基啊再求b的投影巴拉巴拉,直接解法方程就好啦。解方程有时会发现会有多个解,咦?正交投影应该是唯一的啊,为啥会有多个解呢? -_-||你傻呀。。是唯一的,但是可以有好多解啊。

那啥时候只有一个解呢?
再一个定理 矩阵可逆的充分必要条件是:A的列是线性无关的。在这种情况下,方程有唯一的最小二乘解

有时需要知道解的误差,即最小二乘误差:b到距离

另一种算法,当我们发现的列正交时,即的列就是的正交基,那么求的正交投影很方便,那么我们可以把投影算出来,然后求解方程

有时在求解出现的小误差会导致出现大误差,那么在A的列线性无关情况下,我们利用QR分解可以更可靠的求出。

本节最后一个定理啦 对于有着线性无关列的矩阵A,对A做QR分解(忘了QR分解,滚回去看),那么对于每一个都有唯一的最小二乘解

6.6 线性模型中的应用

最小二乘直线
对于线性方程,给定点列,确定参数,使直线尽可能靠近这些点。(●▼●;),不就是线性回归嘛。。)
至于度量接近程度,最常见的选择是余差平方之和(因为算起来简单)。那么我们将方程写为
这里好像很熟悉。。这不就是前一节里的的最小二乘解嘛,换了个马甲而已。那么这里求(线性)回归系数就可以用到之前的方法了。
一般线性模型
引入余差向量后将方程记作


具有这种形式的方程就叫线性模型,一旦X和y被确定,使最小化相当于之前找最小二乘解。

其他曲线
当数据拟合的曲线明显不是直线时,我们也可以用最小二乘拟合来拟合其他曲线,如三次幂的话如下:
00.png-22.6kB

多重回归
若一个实验包含两个(或多个)独立变量和一个函数变量例如:


当然也可以是高次幂的,这里以u和v的一次幂为例。 这种最小二乘拟合称为趋势曲面
一般形式为

这中问题和前面的简单回归模型有着一样的抽象形式,如下:55.png-32.5kB
无论多少变量,我们依然可以得到最小二乘解

6.7 内积空间

好题解析

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注