Hyperparameter - BD-SEARCH/MLtutorial GitHub Wiki

Hyperparameter

Hyperparameter(ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ)๋Š” ๊ฐ ์ธต์˜ ๋‰ด๋Ÿฐ์ˆ˜๋ฅผ ๋น„๋กฏํ•˜์—ฌ ๋ชจ๋ธ์˜ ๊ตฌ์กฐ๋ฅผ ์ •ํ•˜๋Š” ๋ณ€์ˆ˜, ๋ฐฐ์น˜ ํฌ๊ธฐ, ํ•™์Šต๋ฅ , ๊ฐ€์ค‘์น˜ ๊ฐ์†Œ ๋“ฑ ๋ชจ๋ธ ํ•™์Šต์— ์‚ฌ์šฉ๋˜๋Š” ์—ฌ๋Ÿฌ๊ฐ€์ง€ ๊ฐ’์ด๋‹ค.

Hyperparameter ํŠœ๋‹์„ ์œ„ํ•œ ๋ฐ์ดํ„ฐ ๋ถ„๋ฆฌ

  • ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ (Train data): ํŒŒ๋ผ๋ฏธํ„ฐ(๋งค๊ฐœ๋ณ€์ˆ˜) ํ•™์Šต์— ์‚ฌ์šฉ
  • ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ (Validation data): Hyperparameter ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐ์ดํ„ฐ
  • ์‹œํ—˜ ๋ฐ์ดํ„ฐ (Test data): ๋ชจ๋ธ๋ง์˜ ๋ฒ”์šฉ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐ์ดํ„ฐ

Hyperparameter ์ตœ์ ํ™” ๋ฐฉ๋ฒ•

  • Hyperparameter ๋ฒ”์œ„๋ฅผ ์ ์  ์ค„๋ ค๊ฐ€๋ฉด์„œ ์ตœ์ ์˜ hyperparameter ๊ฐ’์„ ์ฐพ์•„๋‚ด๋Š” ๋ฐฉ๋ฒ•
  • ์•„๋ž˜ ๋ฐฉ๋ฒ•์œผ๋กœ ์ˆ˜ํ–‰์ด ๊ฐ€๋Šฅํ•˜๋‹ค.
    1. ์ •ํ•ด์ง„ ๋ฒ”์œ„ ๋‚ด์—์„œ ๋žœ๋คํ•˜๊ฒŒ Hyperparameter๋ฅผ ์ถ”์ถœํ•œ๋‹ค.
    2. 1์—์„œ ๋ฝ‘์€ Hyperparameter๋ฅผ ์ด์šฉํ•ด ํ•™์Šตํ•˜๊ณ  ๋ฐ์ดํ„ฐ ์ •ํ™•๋„๋ฅผ ์ธก์ •ํ•œ๋‹ค. (์ ์€ epoch์œผ๋กœ ์ˆ˜ํ–‰)
    3. 1, 2๋‹จ๊ณ„๋ฅผ ๋ฐ˜๋ณตํ•˜๋ฉด์„œ Hyperparameter์˜ ๋ฒ”์œ„๋ฅผ ์ค„์—ฌ๋‚˜๊ฐ„๋‹ค.

Bayesian Optimization

hyperparameter ์ตœ์ ํ™”๋ฅผ ํšจ์œจ์ ์œผ๋กœ ํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•์ด๋‹ค.

Reference

  • ๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 6์žฅ