DeepLearning_Lec10 - 8BitsCoding/RobotMentor GitHub Wiki


๋ณต์Šต

์ด๋ฏธ์ง€

XOR์„ ํ‘œํ˜„ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ํ•˜๋‚˜์˜ ๋กœ์ง์ด ์•„๋‹Œ ์—ฌ๋Ÿฌ๊ฐœ์˜ ๋กœ์ง์„ ๊ฒน์ณ์„œ ์—ฐ์‚ฐํ•ด์•ผํ•œ๋‹ค.

(์ฐธ๊ณ ) Sigmoid function์„ Activation function์ด๋ผ๊ณ ๋„ ํ•œ๋‹ค.

์ด๋ฏธ์ง€

๋” ๊นŠ์€ ์—ฐ์‚ฐ์€ ์–ด๋–ป๊ฒŒ ํ•˜๋‚˜??

์ด๋ฏธ์ง€

(์ฐธ๊ณ ) Tensor Board๋ฅผ ํ†ตํ•ด์„œ ์‹œ๊ฐํ™” ํ•˜๊ณ ์‹ถ๋‹ค๋ฉด??

์ด๋ฏธ์ง€

์ด๋ฏธ์ง€

๋” ๊นŠ์€ ์—ฐ์‚ฐ์€ ๊ณง ๋” ์ข‹์€ ๊ฒฐ๊ณผ๋ฅผ ์•ผ๊ธฐํ• ๊นŒ??

์•„๋ž˜ ๊ทธ๋ฆผ์—์„œ ๋ณด๊ฒ ์ง€๋งŒ ๊ผญ ๊ทธ๋ ‡์ง€๋Š” ์•Š๋‹ค.

์ด๋ฏธ์ง€

์™œ ๊ทธ๋Ÿด๊นŒ??

BackPropagation์€ ๋‹จ ์ˆ˜ (๋” ๊นŠ์€ ์—ฐ์‚ฐ)์„ ํ•  ๊ฒฝ์šฐ ํ•™์Šต์ด ์•ˆ๋˜๋Š” ๋ฌธ์ œ๊ฐ€ ์žˆ๋‹ค.

์™œ?

์ด๋ฏธ์ง€

๊ฐ•์˜๋ฅผ ๋ณด๋ฉด ์ •ํ™•ํ•˜๊ฒŒ ์•Œ ์ˆ˜ ์žˆ๋‹ค(9:20)

๊ฐ„๋‹จํ•˜๊ฒŒ ์ •๋ฆฌํ•˜๋ฉด Sigmoidํ•จ์ˆ˜๋ฅผ ์—ฌ๋Ÿฌ๋ฒˆ ๊ฑฐ์น˜๋ฉด์„œ SigmoidํŠน์„ฑ์„ ํƒ€๊ฒŒ๋œ๋‹ค. (0~1์‚ฌ์ด ๊ฐ’๋งŒ ์กด์žฌ) ๊ทธ๋Ÿฌ๋ฉด์„œ ํ•™์Šต์ด ์•ˆ๋˜๋Š” ํ˜„์ƒ์ด ๋ฐœ์ƒํ•˜๊ฒŒ ๋œ๋‹ค.

์œ„ ํ˜„์ƒ์„ Vanishing gradient๋ผ๊ณ  ํ•œ๋‹ค.

์ด ๋ฌธ์ œ๋กœ ์ธํ•ด Machine Learning์€ 2์ฐจ ๊ฒจ์šธ์„ ๋งž๋Š”๋‹ค...

์–ด๋–ป๊ฒŒ ํ•ด๊ฒฐํ–ˆ๋Š”๋ฐ??

Sigmoid๋กœ ์•ผ๊ธฐ๋œ ๋ฌธ์ œ์ด๋‹ˆ Sigmoid๋ง๊ณ  ๋‹ค๋ฅธ๊ฑฐ ์จ๋ณด์ž?

์ด๋ฏธ์ง€

ReLU(Rectified Linear Unit)์˜ ๋“ฑ์žฅ

0๋ณด๋‹ค ์ž‘์€๊ฑฐ๋Š” 0์œผ๋กœ,

0๋ณด๋‹ค ํฌ๋‹ค๋ฉด ๋ฆฌ๋‹ˆ์–ดํ•˜๊ฒŒ ๊ฐ’์„ ์ ์šฉ!

์ด๋ฏธ์ง€

๋‹จ, ๋งˆ์ง€๋ง‰ ๋‹จ์€ Sigmoid๋ฅผ ์จ์•ผํ•œ๋‹ค.(0ํ˜น์€ 1๋กœ ๊ฐ’์„ ๋ฐ›์•„์•ผํ•˜๊ธฐ ๋•Œ๋ฌธ!)

์ด๋ฏธ์ง€