[关闭]
@lyc102 2017-04-08T13:37:05.000000Z 字数 1585 阅读 2254

机器学习(周志华)第一章:绪论

machine_learning


基本术语

Mathematically, is a date set containing samples. Each instance is a feature vecotr in the -dimensional sample space , where is the -th attribute value of the -th sample. is called the dimensionality of the sample.

从数据中学习某种模型,对应了关于数据的某种潜在的规律。这个规律称为:hypothesis or ground-truth.

.

根据我们欲预测的值,可以将学习任务归为

Mathematically, we want to get a map from the examples .

根据训练数据是否拥有标记信息,可分为
- Supervised learning: classification and regression
- Unsupervised learning: clustering

机器学习的目标是使学得的模型能很好地适用于“新样本”,该能力称为“泛化” (generalization) 能力。通常假设样本空间全体样本服从一个未知分布,每个样本是i.i.d.采样获得。样本越多,就越有可能通过学习知道该分布,从而获得具有强泛化能力的模型。

假设空间

Inductive learning
- 广义:从样例中学习(黑箱)
- 狭义:学得概念(太难)

归纳偏好 (Inductive bias)

从函数拟合的角度,相同的取样点,可以有多条曲线通过这些点,怎么判断哪个曲线更好?

归纳偏好可看作学习算法的“价值观”。一般性的原则:Occam's razor.

若有多个假设和观察一致,选最简单的那个

问题转化为,如何定义“简单”。

算法的归纳偏好是否与问题本身匹配,大多数时候直接决定了算法能否取得好的性能。

No Free Lunch Theorem.

NFL定理的意义是:脱离具体问题,空泛地讨论“什么学习算法更好”毫无意义。要讨论算法的相对优劣,必须要针对具体的学习问题。

数学上来说,是在函数空间的某个子集上,选取一个好的度量,而这个度量是和问题相关的。给定度量后,最好的,如果存在的话,可以通过变分求解。

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注