[关闭]
@haoqiang 2018-02-27T05:53:03.000000Z 字数 2402 阅读 60

逻辑回归

机器学习


1. Sigmoid 函数

g(z)=11+ez

g(z)=g(z)(1g(z))


2. 假设函数

hθ(x)=g(θTx)=11+eθTx

逻辑回归将线性回归的预测值转换成范围是(0,1)的概率值,主要用于二分类。

P(y=1|x;θ)P(y=0|x;θ)=hθ(x)=1hθ(x)=hθ(x)

输出Y对数几率是输入x的线性函数:

logP(y=1|x;θ)P(y=0|x;θ)=θTx

分离超平面θTx=0


3. 损失函数

J(θ)=1mi=1m[y(i)loghθ(x(i))+(1y(i))log(1hθ(x(i)))]

y(i)为真实类别0或1,hθ(x(i))为类别1的预测概率。


4. 梯度下降法

更新第jθ

θj:=θjαθjJ(θ)

θjJ(θ)=1mi=1m(hθ(x(i))y(i))x(i)j


5. 用极大似然估计推导损失函数

综合表示条件概率:

P(y|x;θ)=hθ(x)y(1hθ(x))1y

似然函数:

L(θ)=i=1mP(y(i)|x(i);θ)=i=1mhθ(x(i))y(i)(1hθ(x(i)))1y(i)

对数似然函数:

l(θ)=logL(θ)=i=1m[y(i)loghθ(x(i))+(1y(i))log(1hθ(x(i)))]

J(θ)=1ml(θ)

将最大化l(θ)转化为最小化J(θ)


6. 正则化

J(θ)=1mi=1m[y(i)loghθ(x(i))+(1y(i))log(1hθ(x(i)))]+λ2mj=1nθ2j

梯度下降
j=0时,即偏置:

θ0:=θ0α1mi=1m(hθ(x(i))y(i))x(i)0

j>0时,即权重:

θj:=θjα[1mi=1m(hθ(x(i))y(i))x(i)j+λmθj]


7. 多分类

P(Y=k|x)=eθTkx1+K1k=1eθTkx,(k=1,2,...,K1)

P(Y=K|x)=11+K1k=1eθTkx

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注