@lyc102
2017-04-08T13:37:05.000000Z
字数 1585
阅读 2254
machine_learning
Mathematically, is a date set containing samples. Each instance is a feature vecotr in the -dimensional sample space , where is the -th attribute value of the -th sample. is called the dimensionality of the sample.
从数据中学习某种模型,对应了关于数据的某种潜在的规律。这个规律称为:hypothesis or ground-truth.
.
根据我们欲预测的值,可以将学习任务归为
Mathematically, we want to get a map from the examples .
根据训练数据是否拥有标记信息,可分为
- Supervised learning: classification and regression
- Unsupervised learning: clustering
机器学习的目标是使学得的模型能很好地适用于“新样本”,该能力称为“泛化” (generalization) 能力。通常假设样本空间全体样本服从一个未知分布,每个样本是i.i.d.采样获得。样本越多,就越有可能通过学习知道该分布,从而获得具有强泛化能力的模型。
Inductive learning
- 广义:从样例中学习(黑箱)
- 狭义:学得概念(太难)
从函数拟合的角度,相同的取样点,可以有多条曲线通过这些点,怎么判断哪个曲线更好?
归纳偏好可看作学习算法的“价值观”。一般性的原则:Occam's razor.
若有多个假设和观察一致,选最简单的那个
问题转化为,如何定义“简单”。
算法的归纳偏好是否与问题本身匹配,大多数时候直接决定了算法能否取得好的性能。
No Free Lunch Theorem.
NFL定理的意义是:脱离具体问题,空泛地讨论“什么学习算法更好”毫无意义。要讨论算法的相对优劣,必须要针对具体的学习问题。
数学上来说,是在函数空间的某个子集上,选取一个好的度量,而这个度量是和问题相关的。给定度量后,最好的,如果存在的话,可以通过变分求解。