@rianusr
2019-08-13T10:06:49.000000Z
字数 562
阅读 7373
第六章:机器学习01:特征工程--01特征构造与提取
06-机器学习
1 特征构造
![image_1cev8h29u1olq19iq16rqm1gbr59.png-248.3kB](http://static.zybuluo.com/rianusr/q4x9hlgs1t8n6ekkttirvwxn/image_1cev8h29u1olq19iq16rqm1gbr59.png)
1.2 特征工程在机器学习流程中的位置
![image_1ceqii5bh1lqabb9t2po5s66a9m.png-119.1kB](http://static.zybuluo.com/rianusr/k185x07pf911bn0xlsulxged/image_1ceqii5bh1lqabb9t2po5s66a9m.png)
1.3 特征工程的重要性
![特征工程的重要性.png-230.7kB](http://static.zybuluo.com/rianusr/29x1zk7qmf2crz89awzkbsb2/%E7%89%B9%E5%BE%81%E5%B7%A5%E7%A8%8B%E7%9A%84%E9%87%8D%E8%A6%81%E6%80%A7.png)
1.4 特征工程具体作用举例--客户画像
![特征工程具体作用举例.png-359.7kB](http://static.zybuluo.com/rianusr/uz94xgjf06evyd1wovqlew6q/%E7%89%B9%E5%BE%81%E5%B7%A5%E7%A8%8B%E5%85%B7%E4%BD%93%E4%BD%9C%E7%94%A8%E4%B8%BE%E4%BE%8B.png)
1.5 什么是好的特征?--少而精!
- 模型更简单:同样的模型精度选择更简单的模型
- 模型更精准:好的特征是数据中抽取出来的对预测结果最有用的信息
1.6 特征工程课程安排
![特征工程的具体内容.png-414.6kB](http://static.zybuluo.com/rianusr/he0w3k9fv7zzar4via3br9j9/%E7%89%B9%E5%BE%81%E5%B7%A5%E7%A8%8B%E7%9A%84%E5%85%B7%E4%BD%93%E5%86%85%E5%AE%B9.png)
2 特征构造的常用方法
2.1 文本数据的提取--词袋模型
![image_1ceqjp1jh2tf1nvg8m41hejl8cp.png-79.1kB](http://static.zybuluo.com/rianusr/oxublzeu1j77zpavehz2mjvd/image_1ceqjp1jh2tf1nvg8m41hejl8cp.png)
2.2 图像数据的特征提取
- 图像构成:像素+颜色(RGB,每个通道0~255)
- 图像的每个像素点:RGB的值
2.3 用户行为特征的提取
![image_1ceqk1e0r9okioqqvc1v0g4nujg.png-189.1kB](http://static.zybuluo.com/rianusr/feqqmtzpxbq98rx03dbg3u19/image_1ceqk1e0r9okioqqvc1v0g4nujg.png)
- 金融领域,用户交易数据
- 提取最近一次消费时间、消费频率、总的购买金额
- 购买商品类型、价格
2.4 用户画像特征
![image_1ceqk3b03a6o1di73hck8d1av9jt.png-296.2kB](http://static.zybuluo.com/rianusr/gb2szrz46y8fynptcrwnh9b7/image_1ceqk3b03a6o1di73hck8d1av9jt.png)
2.5 特征提取的总结:
- 特征设计时需要与目标高度相关,应考虑以下三个问题:
- 这个特征对于目标是否有用?
- 如果有用,这个特征重要程度如何?
- 这个特征的信息是否在其他的特征上体现过?
- 特征设计需要一定的领域知识、直觉和数学知识
- 初始提取特征后还需要进行特征转换处理后,再进入算法模型
- 特征设计和提取需要不断进行反复的迭代验证,需要大量时间
3 用户RFM行为特征提取
3.1 RFM指标
![客户关系管理(CRM)领域-RFM行为特征提取.png-259.1kB](http://static.zybuluo.com/rianusr/sls4sfanur0oazvgmg3nfna8/%E5%AE%A2%E6%88%B7%E5%85%B3%E7%B3%BB%E7%AE%A1%E7%90%86%EF%BC%88CRM%EF%BC%89%E9%A2%86%E5%9F%9F-RFM%E8%A1%8C%E4%B8%BA%E7%89%B9%E5%BE%81%E6%8F%90%E5%8F%96.png)
3.2 RFM五等分法
![RFM五等分法.png-408.5kB](http://static.zybuluo.com/rianusr/gz1xut5asw3yc63fxut9o4v5/RFM%E4%BA%94%E7%AD%89%E5%88%86%E6%B3%95.png)
3.3 RFM应用价值:用户细分
![RFM应用价值:用户细分.png-379.2kB](http://static.zybuluo.com/rianusr/94bzyw5o7obooxkz41pnx68h/RFM%E5%BA%94%E7%94%A8%E4%BB%B7%E5%80%BC%EF%BC%9A%E7%94%A8%E6%88%B7%E7%BB%86%E5%88%86.png)
3.4 RFM应用价值:用户价值及营销响应评估
![RFM应用价值:用户价值及营销响应评估.png-434.8kB](http://static.zybuluo.com/rianusr/blbag872afeuropwy7m933si/RFM%E5%BA%94%E7%94%A8%E4%BB%B7%E5%80%BC%EF%BC%9A%E7%94%A8%E6%88%B7%E4%BB%B7%E5%80%BC%E5%8F%8A%E8%90%A5%E9%94%80%E5%93%8D%E5%BA%94%E8%AF%84%E4%BC%B0.png)
3.5 RFM指标的计算.png
![RFM指标的计算.png-489.6kB](http://static.zybuluo.com/rianusr/sbfnrhjf0g6f5zuj5k2qkkcf/RFM%E6%8C%87%E6%A0%87%E7%9A%84%E8%AE%A1%E7%AE%97.png)