[关闭]
@nrailgun 2017-04-23T19:36:42.000000Z 字数 1152 阅读 1739

Building Dual-Domain Representations for CAR

论文笔记


本文提出了一个高准确度 JPEG compression artifacts removal(简称 CAR)的方法。在 DCT 域和像素域联合训练了深度网络,充分利用了 DCT 域的领域知识,优于深度网络方法和稀疏编码。

Introduction

压缩算法是必要的,压缩损失是难以避免的。考虑到视觉任务(图像分割等)极大依赖于图像质量,如何 CAR 是值得关注的。JPEG 压缩产生了块效应,振铃效应,模糊。

文章提出了 Deep Dual-domain Convolutional neural Networks(DDCN):

  1. 利用 DCT 域的先验知识同时利用像素域 CNN 强大力量,
  2. 通过仔细控制 Gradient updates 和残差学习,DDCN 较为容易建立更深层次的模型。

Deep Dual-Domain Convolutional Network

原始图像 ,压缩图像 ,目标找到 尽量接近
DDCN包含了 3 个组件:

DCT 域分支网络

We emphasize that overlapping sampling is very important for removing artificial structures of JPEG compression, especially the notorious DCT blocking artifacts.

这是一个比较广泛的启发,先验知识和感受野的结合。

像素域分支网络

Deep CNN + PReLU。

聚合网络:结合两个分支重建图像。

在 channel dimension 上对两个 branch 输出做 concate,结构:Deep CNN + PReLU。听起来有点像是 AdaBoost。

构造深度网络

深度网络可以更好表示非线性,然而 SRCNN 和 ARCNN 指出 Deeper is not better。其中一个主要问题仍然是导数爆炸。在高级视觉任务中 batch normalization 可以有效解决问题,但是在低级任务中表现不佳。SRCNN 和 ARCNN 使用了极其小的学习率,导致了漫长的收敛时间。

ADAM:

损失函数采用 MSE,学习目标为 GroundTruth 和 Input 之间的残差:

Experiments

描述网络结构及超参数设置。

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注