@zqbinggong
2018-05-23T23:43:39.000000Z
字数 653
阅读 1024
《tensorflow实战》
源代码
注意源代码中关于conv2d_same的解释文档中存在一个小错误,即even应该改成odd
1. 与Highway Network类似,允许原始输入信息直接传输到后面的层中。
2. 最初的灵感源于degradation问题,即不断加深神经网络时,准确率会献上升,然后达到饱和,再之后就会下降(不是过拟合所致,因为在训练集上也会如次)
3. ResNet的相当于学习目标变了,即由学习完整的输出变成输出和输入的差别,即参差(residual)
4. ResNer在某种程度上解决了传统卷积层或全连接层在信息传递时或多或少存在信息丢失、损耗等问题
5. ResNet V2相比V1,主要区别在于:作者研究发现,前馈和反馈信号可以直接传输,因此skip connection的非线性激活函数(ReLU)可以替换为identify mapping,使得新的参差学习单元比之前更容易训练并泛化性更强.在代码中主要体现在:
- 每一层都使用了BN
- 对输入进行preactivation
6. 研究表明:
- ResNet基本等价如RNN且其效果类似于在多层网络间的集成方法
- 理论上证明了加深网络比加宽网络更有效