Image Processing - BD-SEARCH/MLtutorial GitHub Wiki
- CNN (Convolution Neural Network): ์ด๋ฏธ์ง feature ์ถ์ถ์ ์ฌ์ฉ
ํ ํ์ด์ง: http://www.image-net.org/
- WordNet์ ๋ช
์ฌ๋ค๊ณผ ๊ด๋ จ๋ ์ด๋ฏธ์ง๋ฅผ ๋ชจ์ ๋๋ ํ๋ก์ ํธ
- WordNet: ๋จ์ด ๊ฐ์ ๊ด๊ณ๋ฅผ ํธ๋ฆฌ ํํ๋ก ๋ํ๋ด๋ ํ๋ก์ ํธ
- 100๋ง ์ฅ์ด ๋๋ ์ด๋ฏธ์ง๋ก ๊ตฌ์ฑ๋์ด ์์
- ์ด๋ฏธ์ง ๋ฐ์ดํฐ ์์ด ๋ฐฉ๋ํ์ฌ, ImageNet์ผ๋ก ๋จผ์ ํ์ตํ ๋ค, Transfer Learning(์ ์ดํ์ต)์ ์ด์ฉ๋๊ธฐ๋ ํ๋ค.
- ImageNet ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ ImageNet Large Scale Visual Recognition Challenge(ILSVRC)๋ผ๋ Image Classification Model ๊ฐ์ ๋ํ๊ฐ 2010๋
๋ถํฐ 2017๋
๊น์ง ๊ฐ์ต๋์๋ค.
- ๋ฅ๋ฌ๋ ๋์ ์ด์ ์ฐ์น ๋ชจ๋ธ์ Top-5 Error rate๊ฐ 25%(2014๋ , Xerox)์ด์์ผ๋, ๋ฅ๋ฌ๋ ๋์ ์ดํ 6.7%(2014๋ , GoogleNet)๋ก ์ค์ด๋ค์๋ค. 2017๋ SeNet ์ฐ์น ์ดํ ๋ํ๋ ์ข ๋ฃ๋์๋ค.
- R, G, B ๊ฐ์ ํ๊ท ๊ฐ์ ๋ด์ด ํฝ์ ํ๋ ๋น ํ๋์ ๊ฐ๋ง ๊ฐ์ง๋๋ก ํ๋ค.
- RGB๋ฅผ ๋ช ๋/์ฑ๋/์์์ผ๋ก ๋ณํํ์ฌ ๋ช ๋๊ฐ๋ง ์ด์ฉํ ์๋ ์๋ค.
ImageNet ๋ฐ์ดํฐ๋ก pre-train๋ ๋ชจ๋ธ์ ์ด์ฉํ๋ ๊ฒ์ด ํธ๋ฆฌํ๋ค.
๋ชจ๋ธ ๊ฐ ๋น๊ต์ ์ฌ์ฉ ๊ฐ๋ฅํ ์งํ
- Top-5 Accuracy: ๊ฒฐ๊ณผ๊ฐ์ ์์ 5๊ฐ ํ๋ณด๊ตฐ ์ค์ ์ค์ class๊ฐ ์๋ ๋น์จ
- class ์๊ฐ ๋ง๊ณ , ์ฌ๋์ด ๋ด๋ ํท๊ฐ๋ฆฌ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๊ธฐ ๋๋ฌธ์ ์ ๋ต์ด 1๋ฑ์ด ์๋๋ผ 2๋ฑ, 3๋ฑ ๋ฑ์ ์์ ์ ์์.
- Top-1 Accuracy: ๊ฒฐ๊ณผ๊ฐ์ ์์ 1๊ฐ ํ๋ณด๊ตฐ ์ค์ ์ค์ class๊ฐ ์๋ ๋น์จ
์ฃผ๋ก ์ฌ์ฉํ๋ ๋ชจ๋ธ
-
VGGNet
- ๊ฐ์ฅ ๋ฌด๋ํ ์ ํ.
- VGG16 ๊ธฐ์ค Top-5 Accuracy 90%, Top-1 Accuracy 71.5% ์ ๋.
- ๊ตฌ์กฐ๊ฐ ์ง๊ด์ ์ด๊ณ ์ดํดํ๊ธฐ ์ฌ์ฐ๋ oldํ ๋ชจ๋ธ์ด๋ผ๋ ๋จ์ ์ด ์์. ์ฑ๋ฅ์ ๋นํด ํ๋ผ๋ฏธํฐ์๊ฐ ๋ง์.
-
MobileNet
- ๋ชจ๋ธ์ด ๊ฐ๋ณ๋ค. Top-5 Accuracy๊ฐ 87%๋ฐ์ ๋์ง ์์ง๋ง ๋ชจ๋ธ ์ฉ๋์ด 17MB๋ฐ์ ๋์ง ์์.
- MobileNet V2, V3 ๋ฑ๋ฑ ๊ณ์ ๋ฐ์ ํ์ฌ, VGG์ ๋น์ทํ ์ฑ๋ฅ์ ๋ณด์ด๊ธฐ๋ ํ๋ค.
- ResNet
- Inception
๊ตฌ์กฐ
- 224*224 ์ด๋ฏธ์ง๋ฅผ ๋ฐ์ 4096๊ฐ์ feature๋ฅผ ์ถ๋ ฅํ๋ ๋ถ๋ถ, 4096๊ฐ์ feature๋ฅผ ๊ธฐ๋ฐ์ผ๋ก 1000๊ฐ์ class๋ก ์ฌ์ง์ ๋ถ๋ฅํ๋ ๋ถ๋ถ์ผ๋ก ๊ตฌ์ฑ๋์ด ์๋ค.
- Convolution์ ํ๊ณ ์ด๋ฏธ์ง ํฌ๊ธฐ๋ฅผ ์ค์ด๋ ๊ณผ์ ์ ์ฌ๋ฌ ๋ฒ ๋ฐ๋ณตํ๋ฉด์ ์ด๋ฏธ์ง์ ์ถ์์ ์ธ ํน์ง์ ๋ฝ์๋ธ๋ค.
- ๋จ์ : ์ฉ๋์ด ๋งค์ฐ ํฌ๋ค. (500~600MB)
์ฐธ๊ณ ์๋ฃ
- Very Deep Convolutional Networks for Large-Scale Image Recognition: VGG ๋ชจ๋ธ ๋ ผ๋ฌธ
- ์์ตํด๋ ๋ชจ๋ฅด๊ฒ ๋ ๋ฅ๋ฌ๋, ๋จธ๋ฆฟ์์ ์ธ์คํจ ์์ผ๋๋ฆฝ๋๋ค: VGG ๋ชจ๋ธ์ ์ค์ฌ์ผ๋ก ๋ฅ๋ฌ๋์ ์ค๋ช ํ๋ PPT
- How to Use The Pre-Trained VGG Model to Classify Objects in Photographs: VGG16 ๋ชจ๋ธ๋ก ๊ฐ๋จํ ์ด๋ฏธ์ง๋ฅผ ๋ถ๋ฅํ๋ ํํ ๋ฆฌ์ผ
- Building powerful image classification models using very little data: VGG16 ๋ชจ๋ธ์ ๋ณํํด์ ์๋ก์ด ์ข ๋ฅ์ ์ฌ์ง์ ๋ถ๋ฅํ ์ ์๋ ๋ชจ๋ธ์ ๋ง๋๋ ๋ฐฉ๋ฒ
- ๋์ ์ฃผ์ ์ผ๊ตด ์์น ์ถ์ ๊ธฐ: Class Activation Mapping์ ํตํด ๋ฌผ์ฒด์ ์์น๋ฅผ ์ถ์ ํ๋ ๋ฐฉ๋ฒ ์ ์
๋ ผ๋ฌธ: https://arxiv.org/abs/1512.03385
- residual block์ ํ ๋จ์๋ก ํ๋ ๊ฒ์ด ํน์ง์ด๋ค.
- Residual block์ด๋ผ๋ ๊ฐ๋
์ ํ์ฉํด์ Layer ๊ฐ์๊ฐ ๋ง์์ง๋ฉด ์๊ธฐ๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ๋ชจ๋ธ
- ๊ณ์ธต์ด ๊น์ผ๋ฉด ์ญ์ ํ๊ฐ ์ ๋๋ก ๋์ง ์๋ gradient vanishing ํ์
- Top-5 Accuracy 96.4%๋ฅผ ๊ธฐ๋กํ์ฌ ILSVRC 2015์์ ์ฐ์น
- ๊ณ์ธต์ด ๊น๊ธฐ ๋๋ฌธ์ ๋น์ ํ์ฑ์ด ํฌ๋ฏ๋ก, VGG์ ๋ฌ๋ฆฌ Fully-connected layer๊ฐ ์๋ค.
- ํ๋ผ๋ฏธํฐ ๊ฐ์๊ฐ ์ ๊ธฐ ๋๋ฌธ์ VGG์ ๋นํด ๋ชจ๋ธ ํฌ๊ธฐ๋ ์๊ณ ์คํ ์๋๋ ์กฐ๊ธ ๋น ๋ฅด๋ค.
๋ ผ๋ฌธ์ ๋ ์ฐพ์๋ณด๋ ค๋ฉด Github์๋ค๊ฐ <์ํ๋ ํค์๋> + Papers๋ก ์น๋ฉด ์ฌ๋ฐ๋ ๋ ผ๋ฌธ์ ๋ง์ด ์ฐพ์ ์ ์๋ค. ํ์ง๋ง ์ด๋ฏธ์ง์ ๋ฐ์ดํฐ ํฌ๊ธฐ๊ฐ ํฌ๊ธฐ ๋๋ฌธ์ ์ค์ ๋ก ๋ ผ๋ฌธ์ ๋ณด๊ณ ๋ชจ๋ธ์ ์๋ก ๋ง๋๋ ๊ฒ์ ์ด๋ ต๋ค. ๊ฐ๋ฐ์๋ ๋ค๋ฅธ ์ฌ๋์ด ๋ฏธ๋ฆฌ ๋ง๋ค์ด๋ Model์ด ์๋ ๋ ผ๋ฌธ๋ค์ ๋ณด๋ ๊ฒ์ ์ถ์ฒํ๋ค. ๋ ผ๋ฌธ์ ์ฝ์ด์ ์ดํดํ ๋ค ๋ฐ๋ก ์จ ๋ณด๊ฑฐ๋, ๋จผ์ ์จ ๋ณด๊ณ ๋ ผ๋ฌธ์ ์ฝ์ผ๋ฉด ์ดํด๊ฐ ๋ ์ ๋๋ค.
์ด๋ฐ ๋ ผ๋ฌธ์ด๋ ํ๋ก์ ํธ๋ VGG ๋ชจ๋ธ์ ๊ทธ๋๋ก ๊ฐ์ ธ์ ์ฌ์ฉํ๊ฑฐ๋, VGG ๋ชจ๋ธ์ ๋ณํํด์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค. ์๋๋ฉด VGG ๋ชจ๋ธ์ด ์ง๊ด์ ์ผ๋ก ์ดํดํ๊ธฐ ์ฝ๊ธฐ ๋๋ฌธ์ด๋ค.
Image Segmentation์ ์ด๋ค object๊ฐ ์๋์ง, ๊ทธ๋ฆฌ๊ณ ๊ทธ object์ ๋ฒ์๊ฐ ๋ฌด์์ธ์ง ์์๋ด๋ ๊ฒ์ด๋ค.
*[๋ฒ์ญ๊ธ] Image Segmentation์ ๋ํ ์งง์ ์ด์ผ๊ธฐ: R-CNN ์์ ๋ถํฐ Mask R-CNN ๊น์ง
Colorization์ ํ๋ฐฑ ์ด๋ฏธ์ง๋ฅผ ์ปฌ๋ฌ ์ด๋ฏธ์ง๋ก ๋ณํํ๋ ๊ฒ์ด๋ค.
์ฌ์ฉ์์ ์ ๋ณด ์ ๊ณต ์์ด ์๋์ผ๋ก ํ๋ฐฑ ์ฌ์ง์ ์ปฌ๋ฌ๋ก ๋ฐ๊ฟ์ฃผ๋ ๋ชจ๋ธ๋ ์๊ณ , ์ฌ์ฉ์๊ฐ hint๋ฅผ ์ฃผ๋ฉด ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ฑ์ํ๋ ๋ชจ๋ธ๋ ์๋ค. ์ฌ์ง ๋ฟ๋ง ์๋๋ผ ๋งํ ๋ฑ ๋ค์ํ ๋ถ์ผ์ ์ ์ฉํ๊ณ ์ ํ๋ ์ฐ๊ตฌ๊ฐ ์งํ ์ค์ ์๋ค.
๋ ผ๋ฌธ ๋งํฌ: https://arxiv.org/abs/1603.08511 Source: https://github.com/richzhang/colorization
์ฌ์ฉ์ hint ์์ด ํ๋ฐฑ ์ฌ์ง์ ์ฑ์ํ๋ ๋ชจ๋ธ์ ์ ์ํ์๋ค. ๊ฐ๋จํ ์๋ฆฌ๋ Convolution์ผ๋ก feature๋ฅผ ์ถ์ถํด์ ํ๋ฅ ๋ถํฌ๋ก ์์์ ์ถ์ ํ ๋ค ๊ธฐ์กด ํ๋ฐฑ ์ฌ์ง์ ์์ ์ ํ๋ ๊ฒ์ด๋ค.
๋ ผ๋ฌธ ๋งํฌ: https://arxiv.org/abs/1605.00075
๋ ผ๋ฌธ ๋งํฌ: https://arxiv.org/abs/1705.02999 Github ๋งํฌ: https://github.com/junyanz/interactive-deep-colorization
์ฌ์ฉ์์ ์ ๋ ฅ๊ฐ์ ๋ฐ๋ผ ๋ณํ๋ ์ปฌ๋ฌ ์ด๋ฏธ์ง์ ์์ ๋ณ๊ฒฝํ ์ ์๋ ๊ฒ์ด ํน์ง.
๋ ผ๋ฌธ ๋งํฌ: https://arxiv.org/abs/1706.03319
๋งํ ์ค์ผ์น(์ ๋ง ์๋ ๊ฒ)์ ์ฑ์์ด ๋ ๊ทธ๋ฆผ์ ์ ๋ ฅ์ผ๋ก ๋ฃ์ผ๋ฉด ์ค์ผ์น๋ฅผ ์ฑ์๋ ๊ทธ๋ฆผ์ ์คํ์ผ๋๋ก ์์น ํด์ฃผ๋ ๋ชจ๋ธ์ ์ ์ํ์๋ค.
GAN์ธ ๋งํผ ์์ฑ์์ ๊ฐ๋ณ์๊ฐ ์๋ค. ์์ฑ์์ ๊ตฌ์กฐ๋ฅผ ๊ฐ๋จํ ์ค๋ช ํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค. ์ค์ผ์น ๊ทธ๋ฆผ์ ๋ํด U-net์ ์ด์ฉํ์ฌ feature๋ฅผ ์ถ์ถํ๋ค. ์ฑ์๋ ๊ทธ๋ฆผ์ VGG16 ๋ชจ๋ธ์ ๋ฃ์ด feature๋ฅผ ์ถ์ถํ๋ค. ๋ feature๋ฅผ ํ์ฉํ์ฌ ๋ค์ U-net์ ์ด์ฉํ์ฌ ์ฑ์๋ ์ด๋ฏธ์ง๋ฅผ ์ถ์ถํ๋ค.
์ด ๋ ผ๋ฌธ์์ ์ธ์ฉํ ๊ทธ๋ฆผ์ ์ถ์ฒ๋ Github์ lllyasviel/style2paints repo์ด๋ค. ์ฐธ๊ณ ๋ก ์ด repo์์๋ ์ฌ๋์ hint๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ค์ผ์น๋ฅผ ์ฑ์ํ๋ ๋ชจ๋ธ ๋ฐ ์จ๋ผ์ธ ๋ฐ๋ชจ๋ฅผ ์ ๊ณตํ๋ค.
๋ ผ๋ฌธ ๋งํฌ: https://nips2017creativity.github.io/doc/Consistent_Comic_Colorization.pdf
๋ค์ด๋ฒ์นํฐ ์ฃผ์ํ์ฌ์ ์ธํด ๊ฐ์ฑ๋ฏผ์จ๊ฐ ์นํฐ์ ์๋ ์ฑ์ํ๋ Model์ ์ ์ํ ๋ ผ๋ฌธ์ด๋ค. ์ด ๋ ผ๋ฌธ์ ๊ตฌํ์ฒด๋ ๊ณต๊ฐ๋์ด ์์ง ์์ง๋ง github ๋ฑ์ ๋ค์ง๋ฉด ์ด์ ๋น์ทํ ์ญํ ์ ํ ์ฌ๋ฌ Model์ด ๋ง์ด ๊ณต๊ฐ๋์ด ์๋ค