@xuchongfeng
2018-01-08T13:40:58.000000Z
字数 1116
阅读 137
机器学习 logistic-regression maximum-entropy
逻辑斯蒂回归和最大熵模型都是对数线性模型。
设是连续随机变量,服从逻辑斯蒂分布是指具有下列分布函数和密度函数:
为位置参数,为形状参数
定义:二项逻辑斯蒂回归模型是如下的条件分布:
将权值向量和输入向量加以扩充,仍记作,即,则
一个事件的几率是指事件发生的概率和事件不发生的概率的比值。
采用最大似然估计法
使用梯度下降,或者拟牛顿法进行求解。
最大熵原理可以表述为在满足约束条件的模型集合中选取熵最大的模型。
假设离散型随机变量的概率分布为,则其熵为
对于给定的训练数据集以及特征函数,最大熵模型的学习等价于约束最优化问题:
