Image Processing - BD-SEARCH/MLtutorial GitHub Wiki

๊ธฐ๋ณธ ๊ฐœ๋…

์ตํ˜€์•ผ ํ•  ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ์ˆ 

  • CNN (Convolution Neural Network): ์ด๋ฏธ์ง€ feature ์ถ”์ถœ์— ์‚ฌ์šฉ

ImageNet

ํ™ˆ ํŽ˜์ด์ง€: http://www.image-net.org/

  • WordNet์˜ ๋ช…์‚ฌ๋“ค๊ณผ ๊ด€๋ จ๋œ ์ด๋ฏธ์ง€๋ฅผ ๋ชจ์•„ ๋‘๋Š” ํ”„๋กœ์ ํŠธ
    • WordNet: ๋‹จ์–ด ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ํŠธ๋ฆฌ ํ˜•ํƒœ๋กœ ๋‚˜ํƒ€๋‚ด๋Š” ํ”„๋กœ์ ํŠธ
  • 100๋งŒ ์žฅ์ด ๋„˜๋Š” ์ด๋ฏธ์ง€๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ์Œ
  • ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ ์–‘์ด ๋ฐฉ๋Œ€ํ•˜์—ฌ, ImageNet์œผ๋กœ ๋จผ์ € ํ•™์Šตํ•œ ๋’ค, Transfer Learning(์ „์ดํ•™์Šต)์— ์ด์šฉ๋˜๊ธฐ๋„ ํ•œ๋‹ค.
  • ImageNet ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•œ ImageNet Large Scale Visual Recognition Challenge(ILSVRC)๋ผ๋Š” Image Classification Model ๊ฐ„์˜ ๋Œ€ํšŒ๊ฐ€ 2010๋…„๋ถ€ํ„ฐ 2017๋…„๊นŒ์ง€ ๊ฐœ์ตœ๋˜์—ˆ๋‹ค.
    • ๋”ฅ๋Ÿฌ๋‹ ๋„์ž… ์ด์ „ ์šฐ์Šน ๋ชจ๋ธ์˜ Top-5 Error rate๊ฐ€ 25%(2014๋…„, Xerox)์ด์—ˆ์œผ๋‚˜, ๋”ฅ๋Ÿฌ๋‹ ๋„์ž… ์ดํ›„ 6.7%(2014๋…„, GoogleNet)๋กœ ์ค„์–ด๋“ค์—ˆ๋‹ค. 2017๋…„ SeNet ์šฐ์Šน ์ดํ›„ ๋Œ€ํšŒ๋Š” ์ข…๋ฃŒ๋˜์—ˆ๋‹ค.

์ „์ฒ˜๋ฆฌ

  • R, G, B ๊ฐ’์˜ ํ‰๊ท ๊ฐ’์„ ๋‚ด์–ด ํ”ฝ์…€ ํ•˜๋‚˜ ๋‹น ํ•˜๋‚˜์˜ ๊ฐ’๋งŒ ๊ฐ€์ง€๋„๋ก ํ•œ๋‹ค.
  • RGB๋ฅผ ๋ช…๋„/์ฑ„๋„/์ƒ‰์ƒ์œผ๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ ๋ช…๋„๊ฐ’๋งŒ ์ด์šฉํ•  ์ˆ˜๋„ ์žˆ๋‹ค.

Image Classification ๋ชจ๋ธ

ImageNet ๋ฐ์ดํ„ฐ๋กœ pre-train๋œ ๋ชจ๋ธ์„ ์ด์šฉํ•˜๋Š” ๊ฒƒ์ด ํŽธ๋ฆฌํ•˜๋‹ค.

๋ชจ๋ธ ๊ฐ„ ๋น„๊ต์— ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ์ง€ํ‘œ

  • Top-5 Accuracy: ๊ฒฐ๊ณผ๊ฐ’์˜ ์ƒ์œ„ 5๊ฐœ ํ›„๋ณด๊ตฐ ์ค‘์— ์‹ค์ œ class๊ฐ€ ์žˆ๋Š” ๋น„์œจ
    • class ์ˆ˜๊ฐ€ ๋งŽ๊ณ , ์‚ฌ๋žŒ์ด ๋ด๋„ ํ—ท๊ฐˆ๋ฆฌ๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๊ธฐ ๋•Œ๋ฌธ์— ์ •๋‹ต์ด 1๋“ฑ์ด ์•„๋‹ˆ๋ผ 2๋“ฑ, 3๋“ฑ ๋“ฑ์— ์žˆ์„ ์ˆ˜ ์žˆ์Œ.
  • Top-1 Accuracy: ๊ฒฐ๊ณผ๊ฐ’์˜ ์ƒ์œ„ 1๊ฐœ ํ›„๋ณด๊ตฐ ์ค‘์— ์‹ค์ œ class๊ฐ€ ์žˆ๋Š” ๋น„์œจ

์ฃผ๋กœ ์‚ฌ์šฉํ•˜๋Š” ๋ชจ๋ธ

  • VGGNet
    • ๊ฐ€์žฅ ๋ฌด๋‚œํ•œ ์„ ํƒ.
    • VGG16 ๊ธฐ์ค€ Top-5 Accuracy 90%, Top-1 Accuracy 71.5% ์ •๋„.
    • ๊ตฌ์กฐ๊ฐ€ ์ง๊ด€์ ์ด๊ณ  ์ดํ•ดํ•˜๊ธฐ ์‰ฌ์šฐ๋‚˜ oldํ•œ ๋ชจ๋ธ์ด๋ผ๋Š” ๋‹จ์ ์ด ์žˆ์Œ. ์„ฑ๋Šฅ์— ๋น„ํ•ด ํŒŒ๋ผ๋ฏธํ„ฐ์ˆ˜๊ฐ€ ๋งŽ์Œ.
  • MobileNet
    • ๋ชจ๋ธ์ด ๊ฐ€๋ณ๋‹ค. Top-5 Accuracy๊ฐ€ 87%๋ฐ–์— ๋˜์ง€ ์•Š์ง€๋งŒ ๋ชจ๋ธ ์šฉ๋Ÿ‰์ด 17MB๋ฐ–์— ๋˜์ง€ ์•Š์Œ.
    • MobileNet V2, V3 ๋“ฑ๋“ฑ ๊ณ„์† ๋ฐœ์ „ํ•˜์—ฌ, VGG์™€ ๋น„์Šทํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ด๊ธฐ๋„ ํ•œ๋‹ค.
  • ResNet
  • Inception

VGG

๊ตฌ์กฐ

  • 224*224 ์ด๋ฏธ์ง€๋ฅผ ๋ฐ›์•„ 4096๊ฐœ์˜ feature๋ฅผ ์ถœ๋ ฅํ•˜๋Š” ๋ถ€๋ถ„, 4096๊ฐœ์˜ feature๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ 1000๊ฐœ์˜ class๋กœ ์‚ฌ์ง„์„ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ถ€๋ถ„์œผ๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๋‹ค.
  • Convolution์„ ํ•˜๊ณ  ์ด๋ฏธ์ง€ ํฌ๊ธฐ๋ฅผ ์ค„์ด๋Š” ๊ณผ์ •์„ ์—ฌ๋Ÿฌ ๋ฒˆ ๋ฐ˜๋ณตํ•˜๋ฉด์„œ ์ด๋ฏธ์ง€์˜ ์ถ”์ƒ์ ์ธ ํŠน์ง•์„ ๋ฝ‘์•„๋‚ธ๋‹ค.
  • ๋‹จ์ : ์šฉ๋Ÿ‰์ด ๋งค์šฐ ํฌ๋‹ค. (500~600MB)

์ฐธ๊ณ  ์ž๋ฃŒ

ResNet

๋…ผ๋ฌธ: https://arxiv.org/abs/1512.03385

  • residual block์„ ํ•œ ๋‹จ์œ„๋กœ ํ•˜๋Š” ๊ฒƒ์ด ํŠน์ง•์ด๋‹ค.
  • Residual block์ด๋ผ๋Š” ๊ฐœ๋…์„ ํ™œ์šฉํ•ด์„œ Layer ๊ฐœ์ˆ˜๊ฐ€ ๋งŽ์•„์ง€๋ฉด ์ƒ๊ธฐ๋Š” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•œ ๋ชจ๋ธ
    • ๊ณ„์ธต์ด ๊นŠ์œผ๋ฉด ์—ญ์ „ํŒŒ๊ฐ€ ์ œ๋Œ€๋กœ ๋˜์ง€ ์•Š๋Š” gradient vanishing ํ˜„์ƒ
  • Top-5 Accuracy 96.4%๋ฅผ ๊ธฐ๋กํ•˜์—ฌ ILSVRC 2015์—์„œ ์šฐ์Šน
  • ๊ณ„์ธต์ด ๊นŠ๊ธฐ ๋•Œ๋ฌธ์— ๋น„์„ ํ˜•์„ฑ์ด ํฌ๋ฏ€๋กœ, VGG์™€ ๋‹ฌ๋ฆฌ Fully-connected layer๊ฐ€ ์—†๋‹ค.
  • ํŒŒ๋ผ๋ฏธํ„ฐ ๊ฐœ์ˆ˜๊ฐ€ ์ ๊ธฐ ๋•Œ๋ฌธ์— VGG์— ๋น„ํ•ด ๋ชจ๋ธ ํฌ๊ธฐ๋„ ์ž‘๊ณ  ์‹คํ–‰ ์†๋„๋„ ์กฐ๊ธˆ ๋น ๋ฅด๋‹ค.

์žฌ๋ฏธ์žˆ๋Š” ๋…ผ๋ฌธ/ํ”„๋กœ์ ํŠธ ์†Œ๊ฐœ

๋…ผ๋ฌธ์„ ๋” ์ฐพ์•„๋ณด๋ ค๋ฉด Github์—๋‹ค๊ฐ€ <์›ํ•˜๋Š” ํ‚ค์›Œ๋“œ> + Papers๋กœ ์น˜๋ฉด ์žฌ๋ฐŒ๋Š” ๋…ผ๋ฌธ์„ ๋งŽ์ด ์ฐพ์„ ์ˆ˜ ์žˆ๋‹ค. ํ•˜์ง€๋งŒ ์ด๋ฏธ์ง€์˜ ๋ฐ์ดํ„ฐ ํฌ๊ธฐ๊ฐ€ ํฌ๊ธฐ ๋•Œ๋ฌธ์— ์‹ค์ œ๋กœ ๋…ผ๋ฌธ์„ ๋ณด๊ณ  ๋ชจ๋ธ์„ ์ƒˆ๋กœ ๋งŒ๋“œ๋Š” ๊ฒƒ์€ ์–ด๋ ต๋‹ค. ๊ฐœ๋ฐœ์ž๋‚˜ ๋‹ค๋ฅธ ์‚ฌ๋žŒ์ด ๋ฏธ๋ฆฌ ๋งŒ๋“ค์–ด๋‘” Model์ด ์žˆ๋Š” ๋…ผ๋ฌธ๋“ค์„ ๋ณด๋Š” ๊ฒƒ์„ ์ถ”์ฒœํ•œ๋‹ค. ๋…ผ๋ฌธ์„ ์ฝ์–ด์„œ ์ดํ•ดํ•œ ๋’ค ๋ฐ”๋กœ ์จ ๋ณด๊ฑฐ๋‚˜, ๋จผ์ € ์จ ๋ณด๊ณ  ๋…ผ๋ฌธ์„ ์ฝ์œผ๋ฉด ์ดํ•ด๊ฐ€ ๋” ์ž˜ ๋œ๋‹ค.

์ด๋Ÿฐ ๋…ผ๋ฌธ์ด๋‚˜ ํ”„๋กœ์ ํŠธ๋Š” VGG ๋ชจ๋ธ์„ ๊ทธ๋Œ€๋กœ ๊ฐ€์ ธ์™€ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜, VGG ๋ชจ๋ธ์„ ๋ณ€ํ˜•ํ•ด์„œ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๋‹ค. ์™œ๋ƒ๋ฉด VGG ๋ชจ๋ธ์ด ์ง๊ด€์ ์œผ๋กœ ์ดํ•ดํ•˜๊ธฐ ์‰ฝ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

Image Segmentation

Image Segmentation์€ ์–ด๋–ค object๊ฐ€ ์žˆ๋Š”์ง€, ๊ทธ๋ฆฌ๊ณ  ๊ทธ object์˜ ๋ฒ”์œ„๊ฐ€ ๋ฌด์—‡์ธ์ง€ ์•Œ์•„๋‚ด๋Š” ๊ฒƒ์ด๋‹ค.

*[๋ฒˆ์—ญ๊ธ€] Image Segmentation์— ๋Œ€ํ•œ ์งง์€ ์ด์•ผ๊ธฐ: R-CNN ์—์„œ ๋ถ€ํ„ฐ Mask R-CNN ๊นŒ์ง€

Colorization

Colorization์€ ํ‘๋ฐฑ ์ด๋ฏธ์ง€๋ฅผ ์ปฌ๋Ÿฌ ์ด๋ฏธ์ง€๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

์‚ฌ์šฉ์ž์˜ ์ •๋ณด ์ œ๊ณต ์—†์ด ์ž๋™์œผ๋กœ ํ‘๋ฐฑ ์‚ฌ์ง„์„ ์ปฌ๋Ÿฌ๋กœ ๋ฐ”๊ฟ”์ฃผ๋Š” ๋ชจ๋ธ๋„ ์žˆ๊ณ , ์‚ฌ์šฉ์ž๊ฐ€ hint๋ฅผ ์ฃผ๋ฉด ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ฑ„์ƒ‰ํ•˜๋Š” ๋ชจ๋ธ๋„ ์žˆ๋‹ค. ์‚ฌ์ง„ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๋งŒํ™” ๋“ฑ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์— ์ ์šฉํ•˜๊ณ ์ž ํ•˜๋Š” ์—ฐ๊ตฌ๊ฐ€ ์ง„ํ–‰ ์ค‘์— ์žˆ๋‹ค.

Colorful Image Colorization

๋…ผ๋ฌธ ๋งํฌ: https://arxiv.org/abs/1603.08511 Source: https://github.com/richzhang/colorization

์‚ฌ์šฉ์ž hint ์—†์ด ํ‘๋ฐฑ ์‚ฌ์ง„์„ ์ฑ„์ƒ‰ํ•˜๋Š” ๋ชจ๋ธ์„ ์ œ์•ˆํ•˜์˜€๋‹ค. ๊ฐ„๋‹จํ•œ ์›๋ฆฌ๋Š” Convolution์œผ๋กœ feature๋ฅผ ์ถ”์ถœํ•ด์„œ ํ™•๋ฅ  ๋ถ„ํฌ๋กœ ์ƒ‰์ƒ์„ ์ถ”์ •ํ•œ ๋’ค ๊ธฐ์กด ํ‘๋ฐฑ ์‚ฌ์ง„์— ์ƒ‰์„ ์ž…ํžˆ๋Š” ๊ฒƒ์ด๋‹ค.

Deep Colorization

๋…ผ๋ฌธ ๋งํฌ: https://arxiv.org/abs/1605.00075

Real-Time User-Guided Image Colorization with Learned Deep Priors

๋…ผ๋ฌธ ๋งํฌ: https://arxiv.org/abs/1705.02999 Github ๋งํฌ: https://github.com/junyanz/interactive-deep-colorization

์‚ฌ์šฉ์ž์˜ ์ž…๋ ฅ๊ฐ’์— ๋”ฐ๋ผ ๋ณ€ํ™˜๋œ ์ปฌ๋Ÿฌ ์ด๋ฏธ์ง€์˜ ์ƒ‰์„ ๋ณ€๊ฒฝํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด ํŠน์ง•.

Style Transfer for Anime Sketches with Enhanced Residual U-net and Auxiliary Classifier GAN

๋…ผ๋ฌธ ๋งํฌ: https://arxiv.org/abs/1706.03319

๋งŒํ™” ์Šค์ผ€์น˜(์„ ๋งŒ ์žˆ๋Š” ๊ฒƒ)์™€ ์ฑ„์ƒ‰์ด ๋œ ๊ทธ๋ฆผ์„ ์ž…๋ ฅ์œผ๋กœ ๋„ฃ์œผ๋ฉด ์Šค์ผ€์น˜๋ฅผ ์ฑ„์ƒ‰๋œ ๊ทธ๋ฆผ์˜ ์Šคํƒ€์ผ๋Œ€๋กœ ์ƒ‰์น ํ•ด์ฃผ๋Š” ๋ชจ๋ธ์„ ์ œ์•ˆํ•˜์˜€๋‹ค.

GAN์ธ ๋งŒํผ ์ƒ์„ฑ์ž์™€ ๊ฐ๋ณ„์ž๊ฐ€ ์žˆ๋‹ค. ์ƒ์„ฑ์ž์˜ ๊ตฌ์กฐ๋ฅผ ๊ฐ„๋‹จํžˆ ์„ค๋ช…ํ•˜๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. ์Šค์ผ€์น˜ ๊ทธ๋ฆผ์— ๋Œ€ํ•ด U-net์„ ์ด์šฉํ•˜์—ฌ feature๋ฅผ ์ถ”์ถœํ•œ๋‹ค. ์ฑ„์ƒ‰๋œ ๊ทธ๋ฆผ์„ VGG16 ๋ชจ๋ธ์— ๋„ฃ์–ด feature๋ฅผ ์ถ”์ถœํ•œ๋‹ค. ๋‘ feature๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋‹ค์‹œ U-net์„ ์ด์šฉํ•˜์—ฌ ์ฑ„์ƒ‰๋œ ์ด๋ฏธ์ง€๋ฅผ ์ถ”์ถœํ•œ๋‹ค.

์ด ๋…ผ๋ฌธ์—์„œ ์ธ์šฉํ•œ ๊ทธ๋ฆผ์˜ ์ถœ์ฒ˜๋Š” Github์˜ lllyasviel/style2paints repo์ด๋‹ค. ์ฐธ๊ณ ๋กœ ์ด repo์—์„œ๋Š” ์‚ฌ๋žŒ์˜ hint๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์Šค์ผ€์น˜๋ฅผ ์ฑ„์ƒ‰ํ•˜๋Š” ๋ชจ๋ธ ๋ฐ ์˜จ๋ผ์ธ ๋ฐ๋ชจ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.

Consistent Comic Colorization with Pixel-wise Background Classification

๋…ผ๋ฌธ ๋งํฌ: https://nips2017creativity.github.io/doc/Consistent_Comic_Colorization.pdf

๋„ค์ด๋ฒ„์›นํˆฐ ์ฃผ์‹ํšŒ์‚ฌ์˜ ์ธํ„ด ๊ฐ•์„ฑ๋ฏผ์”จ๊ฐ€ ์›นํˆฐ์„ ์ž๋™ ์ฑ„์ƒ‰ํ•˜๋Š” Model์„ ์ œ์•ˆํ•œ ๋…ผ๋ฌธ์ด๋‹ค. ์ด ๋…ผ๋ฌธ์˜ ๊ตฌํ˜„์ฒด๋Š” ๊ณต๊ฐœ๋˜์–ด ์žˆ์ง€ ์•Š์ง€๋งŒ github ๋“ฑ์„ ๋’ค์ง€๋ฉด ์ด์™€ ๋น„์Šทํ•œ ์—ญํ• ์„ ํ•œ ์—ฌ๋Ÿฌ Model์ด ๋งŽ์ด ๊ณต๊ฐœ๋˜์–ด ์žˆ๋‹ค

โš ๏ธ **GitHub.com Fallback** โš ๏ธ