@zhouyy 2017-02-08T02:49:50.000000Z 字数 486 阅读 572

基础

<ML实战>

开发机器学习应用程序的步骤

1、收集数据。exp：网络爬虫从RSS反馈或API中得到信息设备数据公开数据
2、准备输入数据。
3、分析输入数据。
4、训练算法
5、测试算法
6、使用算法。转化为应用程序

何为机器学习

1、分类
决定使用某个机器算法进行分类后，首先要做的是算法训练，即学习如何分类。
通常我们为算法输入大量已分类数据作为训练样本的训练集
为了测试算法的效果，通常使用两套独立的样本集：
训练数据和测试数据
当鸟类分类程序经测试满足进度要求工作称之为知识表示。知识表示可以采用规则集的形式，也可以采用概率分布的形式。
2、回归
预测数值型数据-数据拟合曲线
分类和回归属于监督学习，因为算法必须知道预测什么。
与之相对的无监督学习，此类数据没有类别信息，也不会给定目标值。在无监督学习中，将数据集合分成类似对象组成的多个类称之为聚类；将寻找描述数据统计值的过程称之为密度估计。
3、如何选择合适的算法

如果目标变量是离散型，如是/否，红黄黑，则可以选择分类器算法；如果目标是连续型的数值0.0~100.0等，则需要选择回归算法。

4、NumPy数据库
from numpy import *

内容目录

- - English 15
  - 2016-4-26
  - 2016-4-20
  - 2016-4-8
  - 2016-04-01
  - 2016-3-25
  - 2016-3-23
  - 2016-3-21
  - 2016-3-11
  - 2016-3-9
  - 2016-3-7
  - 2016-3-3
  - 2016-2-23
  - 2016-2-19
  - 2016-2-16
  - prase 2016/2/5
- - SQL 1
  - SQL Server
- - Visualization 1
  - Data Visualization Resources
- - astack 3
  - Power BI
  - Getting started with Azure Resource Manager-WP
  - wp-introducing_azure_stack
- - azure 6
  - 1.1 Azure Website with PS
  - Azure Availability Set vs Affinity Group
  - 5.1 Azure DNS
  - 1.2 Configure website-Application Settings
  - PowerShell登录Azure
  - 构建VM
- - backend 2
  - nginx upload
  - nginx
- - book 4
  - OReilly Machine Learning
  - 基础
  - 第二章软件测试开发工程师
  - 第一章 google软件测试介绍<Google软件测试之道>
- - css 2
  - Bootstrap
  - Positioning elements
- - d3 1
  - d3资料
- - echart 5
  - 在option中使用map
  - 字符串模板
  - 联动异步
  - echart渐变效果设置
  - vchart地图
- - html 3
  - 解决windows npm安装bootstrap 4 报错问题
  - html导入
  - Capturing Audio & Video in HTML5
- - job 9
  - MCSA: Data Science
  - 经验
  - 万达飞凡技术研究院
  - 上汽集团人工智能
  - 蚂蚁金服图像技术算法
  - 奇瑞捷豹路虎采购
  - 爱奇艺广告算法推荐算法
  - 英文面试
  - 证书
- - js 6
  - Json
  - 安装D3及启动服务器
  - TypeScript
  - somefunc
  - json
  - function
- - linux 4
  - CPU 出现soft lockup的解决办法
  - lrzsz
  - linux cmd
  - iptables
- - powerbi 1
  - DAX 和双向白皮书
- - python 4
  - 爬虫
  - 帖子
  - python notebook安装
  - 利用python进行数据分析
- - term 12
  - Erasure Coding（纠删码）
  - 防火墙和安全组的区别
  - openstack相关概念
  - 签名密钥和加密密钥
  - trunk
  - NFS （网络文件系统）
  - 虚拟局域网 VLAN
  - RPC
  - 分布式数据库及其技术
  - 存储
  - 网络存储结构
  - object,block,file system
- - to-do 1
  - 2017-02-14
- - tool 3
  - lrzsz
  - linux cmd
  - sublime Text3之Emmet插件
- - vue 9
  - Events 和 Vuex
  - axios封装
  - axios的this问题
  - extend/component/mixins/plugin
  - Vue v2.4中新增的\$attrs及\$listeners属性使用教程
  - 在vue项目中使用echarts
  - 组件
  - 理解虚拟dom
  - 第一篇初识vue
- - web-pro 1
  - 编码规范
- - webpack 4
  - 加载图片
  - 配置
  - 使用 Loader Plugin DevServer
  - webpack集成第三方js库
- - 会议纪要 3
  - ＨＲ培训
  - 科技创新
  - openstack培训内容
- - 搜索咨询 7
  - link
  - 如何通过互联网收集竞争情报？
  - 竞争情报需求分析
  - 技术预研
  - 如何阐述清楚你所研究的行业
  - 如何研究透一家公司
  - 行业分析的意义
- - 杂烩 2
  - 开源项目学习方法
  - 杂烩
- - 未分类 1
  - centos安装node git
- 以下【标签】将用于标记这篇文稿：
选择主题
- 经典白
- 护眼黄
- 薄荷绿
- 东京夜
- 经典黑

添加新批注

在作者公开此批注前，只有你和作者可见。

私有
公开
删除

回复批注