DeepLearning_Lec11 - 8BitsCoding/RobotMentor GitHub Wiki


Convolutional Neural Networks(CNN)

์ด๋ฏธ์ง€

๊ธฐ๋ณธ๊ฐœ๋… : ํ•˜๋‚˜์˜ ์ด๋ฏธ์ง€๊ฐ€ ์žˆ๋‹ค๋ฉด ์ด๋ฏธ์ง€ ์ „์ฒด๋ฅผ ์ธํ’‹์œผ๋กœ ๋„ฃ๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ๋‚˜๋ˆ„์–ด์„œ ์ธํ’‹์œผ๋กœ ๋„ฃ๊ฒŒ ๋œ๋‹ค.

ํ ... ๋ญ”๋ง์ด์ง€?

์˜ˆ๋ฅผ ๋“ค์–ด ์„ค๋ช…ํ•ด๋ณด๊ฒ ๋‹ค.

์•„๋ž˜์™€ ๊ฐ™์€ ํ•˜๋‚˜์˜ ์ด๋ฏธ์ง€๊ฐ€ ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•ด๋ณด์ž.

32x32x3์˜ ์ด๋ฏธ์ง€์ด๋‹ค.

์ด๋ฏธ์ง€

์ธํ’‹์œผ๋กœ ์ „์ฒด ์ด๋ฏธ์ง€๋ฅผ ๋„ฃ๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ์ž˜๋ผ์„œ ๋„ฃ๊ฒŒ ๋œ๋‹ค.

์ด๋ฏธ์ง€

์ด๋ฏธ์ง€

5x5x3์˜ ์ด๋ฏธ์ง€๋ฅผ ๋ฝ‘์•„์„œ ํ•˜๋‚˜์˜ ์ˆซ์ž๋กœ ๋ณ€๊ฒฝ์‹œํ‚จ๋‹ค.

์ด๋ฏธ์ง€

ํ•˜๋‚˜์˜ ์ˆซ์ž๋กœ ๋ณ€๊ฒฝํ•˜๋Š” ๋ฐฉ๋ฒ•์€ Wx+b๋ฅผ ์‚ฌ์šฉํ•˜์ž

๋ฌด์Šจ๋ง์ธ๊ฐ€?? ์–ด๋–ป๊ฒŒ ์ €๋ ‡๊ฒŒ ํ‘œํ˜„ํ•˜์ง€?

์ด๋ฏธ์ง€

์ด์ œ ์˜†์œผ๋กœ ํ•„ํ„ฐ๋ฅผ ๋„˜๊ธฐ๋ฉด์„œ ๊ฐ’์„ ๊ฐ€์ ธ์˜จ๋‹ค.

์—ฌ๊ธฐ์„œ ๋ถ€ํ„ด ์‚ฐ์ˆ˜...

ํ•„ํ„ฐ๋ฅผ ํ†ตํ•ด์„œ ๋ช‡๊ฐœ์˜ ์ˆซ์ž๊ฐ€ ๋‚˜์˜ค๋Š”์ง€ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ์–ด์•ผํ•œ๋‹ค.

์ด๋ฏธ์ง€

7x7์ด๋ฏธ์ง€์— 3x3ํ•„ํ„ฐ๋ฅผ ๋Œ๋ฆฐ๋‹ค๋ฉด???

์ด๋ฏธ์ง€

ํ•œ ์นธ์”ฉ(stride=1) ์›€์ง์ธ๋‹ค๋Š” ๊ฐ€์ •์•„๋ž˜ 5x5 output์ด ๋‚˜์˜จ๋‹ค.

๋‘ ์นธ์”ฉ(stride=2) ์›€์ง์ธ๋‹ค๋ฉด 3x3์˜ output

์ด๋ฏธ์ง€

์ฃผ์˜ํ•  ์ ์€ strideํ•  ์ˆ˜ ์—†๋Š” ์ˆซ์ž๊ฐ€ ์กด์žฌํ•œ๋‹ค๋Š” ์ !(์œ„์—์„œ๋Š” stride=3)

๊ทธ๋Ÿฐ๋ฐ? output์˜ ๊ฐœ์ˆ˜๋Š” ๊นŠ์ด๋ฅผ ์ง€์†ํ•  ์ˆ˜๋ก ์ž‘์•„์ง€๋Š” ๊ฒƒ์ธ๊ฐ€? ์ •๋ณด๋ฅผ ์žƒ๋Š”๋‹ค๋Š” ๋ง ๊ฐ™์€๋ฐ??

๊ทธ๋ž˜์„œ ์ค€๋น„ํ–ˆ๋‹ค. : padding

์ด๋ฏธ์ง€

์ด๋ฏธ์ง€

7x7์„ ๋„ฃ์–ด๋„ 7x7์˜ ์•„์›ƒํ’‹์ด ๋‚˜์˜ฌ์ˆ˜ ์žˆ๋‹ค.

์ด๋ฏธ์ง€

6๊ฐœ์˜ ํ•„ํ„ฐ๋ฅผ ์ ์šฉ์‹œ

์ด๋ฏธ์ง€

convolution์„ ์—ฌ๋Ÿฌ๋ฒˆ ์ ์šฉ์‹œํ‚จ๋‹ค.