@nrailgun
2017-04-23T19:36:42.000000Z
字数 1152
阅读 1739
论文笔记
本文提出了一个高准确度 JPEG compression artifacts removal(简称 CAR)的方法。在 DCT 域和像素域联合训练了深度网络,充分利用了 DCT 域的领域知识,优于深度网络方法和稀疏编码。
压缩算法是必要的,压缩损失是难以避免的。考虑到视觉任务(图像分割等)极大依赖于图像质量,如何 CAR 是值得关注的。JPEG 压缩产生了块效应,振铃效应,模糊。
文章提出了 Deep Dual-domain Convolutional neural Networks(DDCN):
原始图像 ,压缩图像 ,目标找到 尽量接近 。
DDCN包含了 3 个组件:
We emphasize that overlapping sampling is very important for removing artificial structures of JPEG compression, especially the notorious DCT blocking artifacts.
这是一个比较广泛的启发,先验知识和感受野的结合。
Deep CNN + PReLU。
在 channel dimension 上对两个 branch 输出做 concate,结构:Deep CNN + PReLU。听起来有点像是 AdaBoost。
深度网络可以更好表示非线性,然而 SRCNN 和 ARCNN 指出 Deeper is not better。其中一个主要问题仍然是导数爆炸。在高级视觉任务中 batch normalization 可以有效解决问题,但是在低级任务中表现不佳。SRCNN 和 ARCNN 使用了极其小的学习率,导致了漫长的收敛时间。
ADAM:
损失函数采用 MSE,学习目标为 GroundTruth 和 Input 之间的残差:
描述网络结构及超参数设置。