[关闭]
@Libaier 2016-07-25T07:56:56.000000Z 字数 1029 阅读 1683

感知机

分类 有监督学习


主要思想

在机器学习中,感知机(perceptron)是二分类的线性分类模型,属于监督学习算法。输入为实例的特征向量,输出为实例的类别(取+1和-1)。感知机对应于输入空间中将实例划分为两类的分离超平面。感知机旨在求出该超平面,为求得超平面导入了基于误分类的损失函数,利用随机梯度下降法 对损失函数进行最优化。感知机的学习算法具有简单而易于实现的优点,分为原始形式和对偶形式。感知机预测是用学习得到的感知机模型对新的实例进行预测的,因此属于判别模型。

产生背景

感知器(英语:Perceptron)是Frank Rosenblatt在1957年就职于Cornell航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络。它可以被视为一种最简单形式的前馈神经网络,是一种二元线性分类器。

应用场景

核心理解

使用一个超平面将特征空间化为两部分。

主要推导

M为误分点的集合,感知机的优化目标是求解如下函数:


损失函数对应误分点到分离超平面的总距离。

求梯度


使用随机梯度下降每次选一个样本点做更新

求解算法

线性可分:随机梯度下降,每次选取一个错误用例修改
线性不可分:使用pocket算法,考虑所有数据

伪代码

  1. 这里假设数据线性可分
  2. 输入:数据集D(N个样本)
  3. 过程:
  4. 随机初始化w,b
  5. do
  6. 随机选取一个样本点
  7. if(这个样本点被误分)
  8. 使用上文推导中的公式更新wb
  9. until 所有样本被正确分类
  10. 输出:训练好的sign(wx+b)感知机函数

复杂度分析

时间复杂度:如果数据线型可分,一定会在有限次收敛,如果线性不可分,会出现震荡

大数据下改进

to be done...

评价

算法改进

参考资料

  1. wiki

  2. 机器学习常见算法个人总结

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注