[关闭]
@Rookie-FCB 2018-03-12T05:18:42.000000Z 字数 1442 阅读 244

CS229_4-最小二乘法概率解释

CS229


最小二乘法的概率解释

为什么在线性回归问题中我们选择最小二乘法定义代价函数?本小节将就这一问题进行讨论。

首先,我们假设对于每一个样本实例,特征变量和目标值的关系如下:

其中,表示误差。

让我们进一步假设误差服从正态分布(也称为高斯分布),即。因此,误差为独立同分布(Independent and Identical Distribution,IID)。

当给定参数时,目标值也服从正态分布,即

注:之间为分号,表示为已知变量。

又因为似然函数(Likelihood Function)如下:

其中,表示一个长度为训练集大小的向量,表示维度为训练集数*特征变量数的矩阵。

将上述结论带入似然函数可得:

为了计算出参数,我们采用极大似然估计。为了便于计算,我们可将上式转变为最大化对数似然。

因此,我们不难发现最大化对数似然,实际上在最小化

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注