SRCNN: Image Super Resolution Using Deep Convolutional Networks - Deepest-Project/Greedy-Survey GitHub Wiki
Resources
Youtube, TensorFlow KR ๋ ผ๋ฌธ์ฝ๊ธฐ ๋ชจ์
Abstract
- SISR(Single-Image Super-Resolution) ๋ฌธ์ ์ ์ต์ด๋ก ๋ฅ๋ฌ๋์ ์ ์ฉํ์๋ค.
- ์ด์ ์ State-of-art ๋ฐฉ๋ฒ์ด์๋ Sparse-coding Based SR์ด CNN์ ๊ด์ ์ผ๋ก๋ ํด์ํ ์ ์์์ ๋ณด์๋ค.
- ๋ค์ํ ์์ ์ฑ๋, Kernel Size์ ๋ํด ์คํํ์ผ๋ฉฐ ์์ ์ฑ๋์ RGB์ผ๋ ๊ฐ์ฅ ์ข๊ฒ, Kernel Size๋ Performance์ Time์ด Compromiseํ๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์๋ค.
Introduction
Prior Knowledge
PSNR: Peak Signal-to-noise ratio
ํต์์ ์ผ๋ก ์ ํธ ๋ ์ก์ ๋น์ ์๋ฏธ๋ฅผ ๊ฐ์ง๊ณ ์์ง๋ง, Image Restoration์์๋ ๋ค๋ฅธ ์๋ฏธ๋ฅผ ๊ฐ์ง๋ค. ๋ถ๋ชจ ๋ถ๋ถ์ MSE๊ฐ {์๋ณธ ์ด๋ฏธ์ง - ๋ณต์ ์ด๋ฏธ์ง}์ L2 Loss๋ก ๋ค์ด๊ฐ๋ฉฐ, Loss(๋ถ๋ชจ)๊ฐ ์์ผ๋ฉด PSNR์ด ์ปค์ง๊ธฐ ๋๋ฌธ์ PSNR์ Image Restoration์ ํ์ง์ ์ธก์ ํ๋ ์ฒ๋ ์ค ํ๋์ด๋ค.
Bicubic Interpolation
Image Upsampling(์ด๋ฏธ์ง ์ฌ์ด์ฆ ํค์ฐ๊ธฐ)๋ฅผ ํ ๋ ์ฐ์ด๋ ๋ฐฉ๋ฒ ์ค ํ๋. Wikipedia
SRCNN, VDSR ๋ฑ pre-upsampling ๊ธฐ๋ฐ์ SISR ๊ธฐ๋ฒ์์ ์ฃผ๋ก ์ฌ์ฉ๋์์ผ๋, Interpolation์ ๊ทธ ๋น์ฉ์ด ์ ์ง ์๊ณ , ๊ธฐ์กด์ ์ด๋ฏธ์ง์ ๋ํ ์ถ๊ฐ์ ์ธ ์ ๋ณด๋ฅผ ์ ํ ์ ๊ณตํ์ง ์๋๋ค๋ ์ง์ ๋๋ฌธ์ ESPCN ๋ฑ์ post-upsampling SISR ๊ธฐ๋ฒ๋ค์ด ๋์ค๊ธฐ๋ ํ์๋ค.
Sparse Coding
Experiments and Results
์ฐธ๊ณ - Github TesorFlow Code(https://github.com/tegg89/SRCNN-Tensorflow)
Experiments
1. Patch Extraction Input Image๋ฅผ ๊ฐ์ Size(๋ ผ๋ฌธ์์๋ 33 * 33)์ Patch๋ก ์กฐ๊ฐ๋ธ๋ค.
2. Patch Representation Conv1 - Relu1 Layer๋ฅผ ๊ฑฐ์ณ ๋๊ป n_1์ feature map์ ์์ฑํ๋ค.
3. Non-linear Mapping Conv2 - Relu2 Layer๋ฅผ ๊ฑฐ์ณ ๋๊ป n_2์ feature map์ ์์ฑํ๋ฉฐ, ์ด๋ ๋ชจ๋ธ์ nonlinearity๋ฅผ ๋ชจ๋ธ์ ๋ถ์ฌํ๋ ์ญํ ์ ํ๋ค.
4. Reconstruction Conv3 Layer๋ฅผ ๊ฑฐ์ณ Restored Image๋ฅผ ์์ฑํ๋ค.
Loss Function:
์ค์ ๋ก model์ evaluateํ ๋๋ ๊ฐ๊ฐ์ patch๋ฅผ mergeํ์ฌ ํ๋์ ์ด๋ฏธ์ง๋ก ํฉ์น๋ ๊ณผ์ ์ด ์๋ฐ๋๋ค(๋ฐ๋ผ์ Zero Padding์ ํ์ง ์์ ๊ฒฝ์ฐ output์ด HR์ด๋ฏธ์ง์์ ํ ๋๋ฆฌ๋ฅผ ์๋ผ๋ธ ํํ๊ฐ ๋๋ค).
Results
Discussion
Sparse-Coding Based Method์์ ๋น๊ต
Sparse Coding Based SR ๋ ผ๋ฌธ arxiv์ ์ ๋ ํ๊ธฐ ์ด๋ ค์ด ๊ด๊ณ๋ก, Sparse Coding ์์ฒด์ SRCNN์ ๋น๊ตํด๋ณธ๋ค.
(https://bskyvision.com/177)
์์ ์ค๋ช
ํ Sparse coding(DMOS๋ฅผ ์์ธกํ๋ ๋ฐฉ๋ฒ)๊ณผ SRCNN์ ๋น๊ตํ๋ค.
- Representation ์ ์๋ก์ด Image์ ํน์ฑ์ ๋ฝ์๋ด์ ์๋ก์ด ์ด๋ฒกํฐ๋ฅผ ๋ง๋๋ ๊ฒ์ ํด๋นํ๋ค.
- Non-linear mapping ์ ๊ฐ atom์ ํด๋นํ๋ DMOS ๊ฐ์ ๋์์ํค๋ ๊ณผ์ ์ ํด๋นํ๋ค.
- Reconstruction์ ๊ณ์๋ค์ DMOS๊ฐ์ ๊ฐ๊ฐ ๊ณฑํด์ ์ต์ข ๊ฒฐ๊ณผ(Prediction)์ ๋ง๋ค์ด๋ด๋ ๊ฒ์ ํด๋นํ๋ค.
์ง๋ฌธ
Super Resolution ๋ฌธ์ ์์ Confidence Map์ ์ด๋ป๊ฒ ๊ทธ๋ฆด ์ ์์๊น?