@lokvahkoor
2020-07-14T23:37:20.000000Z
字数 1258
阅读 781
机器学习
损失函数(loss function)一般用来评估模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值函数,通常使用L(Y, f(x))来表示。损失函数越小,模型的准确性就越高。在机器学习实践中,我们一般针对模型的结构风险进行优化,模型的结构风险函数包括了经验风险项和正则项,针对结构风险的优化过程通常可以表达为如下式子:
上式中代表损失函数,代表预测模型,,代表样本和样本标签,代表模型参数,代表正则化系数,代表正则约束函数
相关概念:
损失函数:度量模型一次预测的好坏
风险函数:度量平均意义下的模型预测好坏
经验风险:训练集的总损失定义为经验风险:
期望风险:损失的期望称为期望风险:
结构风险:虽然可以使用经验损失近似估计期望风险,但是大数定理的前提是N无穷大,实际上,我们的训练集一般不会特别大,此时就需要对经验风险做出适当调整才能近似估计。结构化风险可以缓解数据集过小而导致的过拟合现象,它在经验风险的基础上引入了对模型复杂度的惩罚机制(正则化项)
假设分类数据集,定义模型的输出为样本属于类别的概率: 。针对二分类问题:,有:
通过上式,我们可以得到模型正确预测训练集D中所有样本类别的概率:
上式中代表在样本分布下产生样本的概率,代表
【参考】