@songying
2018-11-04T20:57:34.000000Z
字数 640
阅读 1078
deep-learning
理解偏差和方差能够协助你决定是否应该添加数据,并依此合理安排时间去执行其它的策略来提升性能。
假设你的算法在开发集上有 16% 的错误率(84% 精度),我们将这 16% 的错误率分为两部分:
- 算法在训练集上的错误率。在本例中,它是 15%。我们非正式地将它作为算法的 偏差(bias)
- 第二部分指的是算法在开发集(或测试集)上的表现比训练集上差多少。在本例中,开发集表现比训练集差1%。我们非正式地将它作为算法的方差(variance)
如果可避免偏差值是负的,即算法在训练集上的表现比最优错误率要好。这意味着你正在过拟合训练集,并且算法已经过度记忆(over-memorized)训练集。你应该专注于有效降低方差的方法,而不是选择进一步减少偏差的方法。
偏差 = 最佳误差率 + 可避免的偏差