@Rookie-FCB
2018-03-12T05:18:42.000000Z
字数 1442
阅读 244
CS229
为什么在线性回归问题中我们选择最小二乘法定义代价函数?本小节将就这一问题进行讨论。
首先,我们假设对于每一个样本实例,特征变量和目标值的关系如下:
其中,表示误差。
让我们进一步假设误差服从正态分布(也称为高斯分布),即。因此,误差为独立同分布(Independent and Identical Distribution,IID)。
当给定参数和时,目标值也服从正态分布,即。
注:与之间为分号,表示为已知变量。
又因为似然函数(Likelihood Function)如下:
其中,表示一个长度为训练集大小的向量,表示维度为训练集数*特征变量数的矩阵。
将上述结论带入似然函数可得:
为了计算出参数,我们采用极大似然估计。为了便于计算,我们可将上式转变为最大化对数似然。
因此,我们不难发现最大化对数似然,实际上在最小化。