DeepLearning_Lec07 - 8BitsCoding/RobotMentor GitHub Wiki
Learning Rate์ผ๋ก ์ธํ Over shooting
๋ณดํต ์์ ๊ฐ์ด Learning Rate์ ๋๋ค.
ํ์ง๋ง Learning Rate์ ์๋ชป ์ค์ ํ๋ฉด Over shootingํ์์ด ๋ฐ์ํ ์ ์๋ค. ์๋ฅผ ๋ค์ด๋ณด์.
Learning Rate์ด ๋๋ฌด ํฌ๋ค๋ฉด : ์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ์ ํํ ์ต์ ์ ์ ์ฐพ์ง ๋ชปํ๋ ํ์์ด ๋ฐ์ํ ์ ์๋ค.
Learning Rate์ด ๋๋ฌด ์๋ค๋ฉด : ๊ณ์ฐ์ ์๊ฐ์ด ๋๋ฌด ์ค๋๊ฑธ๋ฆฌ๊ฑฐ๋, ์ต์ ๊ฐ๊น์ง ๋๋ฌํ์ง ๋ชปํ๋ ํ์์ด ๋ฐ์
Learning Rate์ ์ ๊ธฐ์ค์ด ๋ญ๋ฐ ๊ทธ๋ผ?
- ์ ๋ต์ ์๋ค. 0.01๋ถํฐ์์ํด์ ๊ณ์ํด๋ณด๋ ์ ๋ฐ์...
- ๋ฐ์ฐ์ด ๋๋ฉด ์๊ฒ, ๋๋ฌด ๋ฆ๊ฒ ์์ง์ด๋ฉด ํฌ๊ฒ
์ฃผ์ด์ง ๋ฐ์ดํฐ ๊ฐ์ด ๋ง์ด ๋ค๋ฅผ ๊ฒฝ์ฐ?
x1, x2๋ฐ์ดํฐ๊ฐ ๋ง์ด ๋ฌ๋ผ์ Learning Rate์ ๋ฐ๋ผ ๋ฐ์ฐ or ๊ณ์ฐ์ด ์ค๋ ๊ฑธ๋ฆด ์ ์๋ค.
ํด๊ฒฐ์ฑ ์ ๋ญ๋ฐ?
- zero-centreed data
- normalized data
Learning Rate๋ฅผ ์ ์ก์๊ฑฐ ๊ฐ์๋ฐ ๋ฐ์ฐ์ด๋ ๋๋ฌด ์ค๋๊ฑธ๋ฆฌ๋ ํ์์ด ๋ฐ์ํ๋ค๋ฉด ๋ฐ์ดํฐ๋ฅผ ์์ฌํ๋ผ!
Overfitting
ํ์ต ์ ๋๋ฌด ๋ฐ์ดํฐ ์์กด์ ํ์ต๋ชจ๋ธ์ด ๋์ค๋ ํ์์ ์๋ฏธ, ์๋๊ทธ๋ฆผ์ ์ฐธ๊ณ ํ์
์ด๋ป๊ฒ Overfitting์ ๋ฐฉ์งํ์ง?
- More training data (๋ง์ ์๋ฃ)
- Reduce the number of features(์ค๋ณต๋ ์๋ฃ๋ฅผ ์ ๊ฑฐ)
- Regularization(์ผ๋ฐํ ์ํจ๋ค?)
Regularization
costํจ์์ ํน์ ํ ์ ์ถ๊ฐ ํด ์ค์ผ๋ก์ ๊ฐ๋จํ๊ฒ ํด๊ฒฐ๊ฐ๋ฅ
ํ์ต์ด ์ ๋์๋์ง ์ด๋ป๊ฒ ํ์ธํ์ง???
ํ์ต์ํจ ๋ฐ์ดํฐ๋ฅผ ๋ค์ ๋ฌผ์ด๋ณด๋ฉด ์ด๋จ๊น?
๊ฐ์ ๋ฐ์ดํฐ์ ์ํด ํ์ต๋์๊ธฐ์ ํ์ต์ ๊ฒ์ฆ์ ์ํด์ ์ข์ง ๋ชปํ ๋ฐฉ๋ฒ์ด๋ค(100% ์ ํํ ๊ฒฐ๊ณผ๊ฐ ๋์ฌ ํ๋ฅ ์ด ๋์.)
์์ 70%๋ฅผ ํ์ต์ํค๊ณ ๋ค์ 30%๋ฅผ ํ ์คํธํ๋ ๋ฐฉ๋ฒ์ ์ด๋ค๊ฐ?
์ถ๊ฐ์ ์ผ๋ก Validation Set(๋ชจ์์ํ)์ ๋์ด ํ๋์ฉ ๋ฐ์ดํฐ๋ฅผ ๋จ๊ธฐ๊ธฐ๋ํ๋ค.
Online learning
๋ฐ์ดํฐ์ ์์ด ๋ง๋ค๋ฉด ๋ฐ์ดํฐ๋ฅผ ๋๋์ด ํ์ต์ํค๋ ๋ฐฉ๋ฒ