@zqbinggong
2018-03-26T10:56:14.000000Z
字数 585
阅读 1670
Part1 基本算法的基本思想及优缺点
机器学习
参考书籍: 周志华《机器学习》
线性模型
广义线性模型
将线性模型的预测值作为对的预测
对数线性回归
对数几率回归
- 优点:
- 直接对分类可能性建模,无需事先假设数据分布,这样就避免了因为假设分布不够准确所带来的问题
- 不是仅预测出“类别”,而是得到了近似概率预测,这对许多需要利用概率辅助预测的人物很有用
- 対率函数是任意阶可导的凸函数,现有的许多数值优化算法都可直接用于求解最优解
线性判别分析 LDA
- 思想: 将训练样本集投影到一条直线上,使得同类别的尽可能靠近,不同类别的尽可能远离
- 多分类LDA
多分类学习
- 基本思路就是将多分类人物拆解成若干个二分类任务,而关键就在于如何拆解
- 拆解方式:
- OvO 需要训练个分类器,而OvR只需训练N个分类器;但前者每个分类器只需用到两个类别的样例,而后者每个训练器需要用到所有的样例
类别不平衡问题
- 思路:再放缩,即作为判断的依据
- 实现方法:
- 再放缩技术也是代价敏感学习的基础