Machine Learning - BD-SEARCH/MLtutorial GitHub Wiki

๊ฐœ์š”

1. ๋จธ์‹ ๋Ÿฌ๋‹์˜ ํ•ต์‹ฌ ์š”์†Œ

  • ๋ฐ์ดํ„ฐ
  • ๋Ÿฌ๋‹ ๋ชจ๋ธ (+๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜)
  • ์š”์ธ ์ถ”์ถœ (ํ•„์ˆ˜๋Š” ์•„๋‹ˆ๋‹ค.)

2. ๋จธ์‹ ๋Ÿฌ๋‹์˜ ๋ถ„๋ฅ˜

1. Supervised learning

: ๋ชฉํ‘œ๊ฐ’์ด ์ œ์‹œ๋œ ๋ฐ์ดํ„ฐ๊ฐ€ ํ•™์Šต ๋ฐ์ดํ„ฐ๋กœ ์ฃผ์–ด์ง„๋‹ค.

  • Classification(๋ถ„๋ฅ˜): ๋ฐ์ดํ„ฐ๋ฅผ label์— ๋”ฐ๋ผ ๋‚˜๋ˆ„๋Š” ๋ฐฉ๋ฒ•
    • Binary classification(์˜ˆ/์•„๋‹ˆ์˜ค)
    • multi label classification(๊ฐœ/๊ณ ์–‘์ด/์†Œ..)
  • Regression : feature์„ ํ† ๋Œ€๋กœ ๊ฐ’์„ ์ธก์ •. ๊ฒฐ๊ณผ๋Š” ์—ฐ์†๋œ ๊ทธ๋ž˜ํ”„๋กœ ๋‚˜์˜จ๋‹ค.
  • CNN, RNN

2. Unsupervised learning

: ๋ชฉํ‘œ๊ฐ’์ด ์ œ์‹œ๋˜์ง€ ์•Š์€ ๋ฐ์ดํ„ฐ๊ฐ€ ํ•™์Šต ๋ฐ์ดํ„ฐ๋กœ ์ฃผ์–ด์ง„๋‹ค. ๋ฐ์ดํ„ฐ์˜ ์ˆจ๊ฒจ์ง„ ํŠน์ง•(Hidden feature)์ด๋‚˜ ๊ตฌ์กฐ๋ฅผ ๋ฐœ๊ฒฌํ•˜๋Š” ๋ฐ์— ์‚ฌ์šฉ๋œ๋‹ค.

  • Clustering(๊ตฐ์ง‘ํ™”): label์ด ์ฃผ์–ด์ง€์ง€ ์•Š์€ ๋ฐ์ดํ„ฐ๋ฅผ, ์ผ์ •ํ•œ ๊ฐœ์ˆ˜์˜ cluster(๊ตฐ์ง‘)์œผ๋กœ ๋ชจ์œผ๋Š” ๋ฐฉ๋ฒ•
  • Autoencoder: ๋ฐ์ดํ„ฐ๋ฅผ ๋‚ด๋ถ€ ํ‘œํ˜„์œผ๋กœ ๋ฐ”๊พธ๋Š” Encoder, ๋‚ด๋ถ€ ํ‘œํ˜„์„ ๋ฐ์ดํ„ฐ๋กœ ๋ฐ”๊พธ๋Š” Decoder๋กœ ๊ตฌ์„ฑ๋œ ๋ชจ๋ธ. ๋‚ด๋ถ€ ํ‘œํ˜„์„ ์ธ์ฝ”๋”ฉ๋œ ๊ฐ’์œผ๋กœ ํ™œ์šฉ ๊ฐ€๋Šฅํ•˜๋‹ค.

3. Reinforcement learning

: Unsupervised learning์˜ ์ผ๋ถ€. ์–ด๋–ค state์—์„œ action์„ ์ทจํ•˜๊ณ  reward๋ฅผ ๋ฐ›์•„ ์ ์ฐจ ํšจ์œจ์ ์ธ ๋ฐฉ์‹์œผ๋กœ ํ–‰๋™์„ ๊ฐ•ํ™”ํ•œ๋‹ค.

  • Q-learning
  • DQN (Deep-Q-Network) : ๋”ฅ๋Ÿฌ๋‹๊ณผ ๊ฒฐํ•ฉ๋œ Q-learning.

๊ธฐ๊ณ„ํ•™์Šต์ด ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ?

์ฐธ๊ณ ) ์†”๋ผ๋ฆฌ์Šค์˜ ์ธ๊ณต์ง€๋Šฅ ์—ฐ๊ตฌ์‹ค : ๋ชจ๋“  ๋ฌธ์„œ ์ •๋….