@rianusr
2019-08-13T02:06:49.000000Z
字数 562
阅读 7690
第六章:机器学习01:特征工程--01特征构造与提取
06-机器学习
1 特征构造

1.2 特征工程在机器学习流程中的位置

1.3 特征工程的重要性

1.4 特征工程具体作用举例--客户画像

1.5 什么是好的特征?--少而精!
- 模型更简单:同样的模型精度选择更简单的模型
- 模型更精准:好的特征是数据中抽取出来的对预测结果最有用的信息
1.6 特征工程课程安排

2 特征构造的常用方法
2.1 文本数据的提取--词袋模型

2.2 图像数据的特征提取
- 图像构成:像素+颜色(RGB,每个通道0~255)
- 图像的每个像素点:RGB的值
2.3 用户行为特征的提取

- 金融领域,用户交易数据
- 提取最近一次消费时间、消费频率、总的购买金额
- 购买商品类型、价格
2.4 用户画像特征

2.5 特征提取的总结:
- 特征设计时需要与目标高度相关,应考虑以下三个问题:
- 这个特征对于目标是否有用?
- 如果有用,这个特征重要程度如何?
- 这个特征的信息是否在其他的特征上体现过?
- 特征设计需要一定的领域知识、直觉和数学知识
- 初始提取特征后还需要进行特征转换处理后,再进入算法模型
- 特征设计和提取需要不断进行反复的迭代验证,需要大量时间
3 用户RFM行为特征提取
3.1 RFM指标

3.2 RFM五等分法

3.3 RFM应用价值:用户细分

3.4 RFM应用价值:用户价值及营销响应评估

3.5 RFM指标的计算.png
