Classification - BD-SEARCH/MLtutorial GitHub Wiki
๋ถ๋ฅ (Classification)
๋ถ๋ฅ(Classification)๋ ๋ฐ์ดํฐ๋ฅผ ์ฌ๋์ด ๋ฏธ๋ฆฌ label์ ๋ฌ์ ๋ class๋ก ๋๋๋ ๋ฐฉ๋ฒ์ด๋ค. ์ด ๋ ํ ๋ฐ์ดํฐ๋ ํ๋์ class์๋ง ์ํ๋๋ก ๊ตฌํํ ์๋ ์๊ณ ์ฌ๋ฌ class์ ์ํ๋๋ก ๊ตฌํํ ์ ์๋ค. ๋ฐ์ดํฐ๊ฐ ํน์ class์ ์ํ๋/์๋๋๋ฅผ ์๊ณ ์ถ์ ๋ ์ฐ๋ ์๊ณ ๋ฆฌ์ฆ์ด๋ค.
๋ถ๋ฅ๋ฅผ ์ฌ์ฉํ๋ ์๋ ์๋์ ๊ฐ๋ค.
- ์ฌ์ง ๋ถ๋ฅ: ์ฌ์ง์ด ์ฌ๋์ธ์ง, ์๋์ฐจ์ธ์ง ๋ฑ๋ฑ ์ด๋ค ์ฌ์ง์ ์ํ๋์ง ๋ถ๋ฅํ ์ ์๋ค.
- ํ ์คํธ ๋ถ๋ฅ: ํ ์คํธ์ ์ฃผ์ ๋ฑ์ ๋ถ๋ฅํ ์ ์๋ค.
- ์์ฑ ์ธ์: ๋ค์ด์จ ์์ฑ์ด ์ด๋ค ์์ ์ธ์ง ๋ถ๋ฅํ ์ ์๋ค.
(1) KNN Classification
- K-nearest neighbor classification
- ์๋ก์ด ๋ฐ์ดํฐ๊ฐ ์ฃผ์ด์ง๋ฉด, ํธ๋ ์ด๋ ๋ ๋ฐ์ดํฐ ์ค์์ ๊ฐ์ฅ ๊ฐ๊น์ด k๊ฐ์ ์ด์์ ์ ๋ณด๋ก ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์์ธกํ๋ ๋ฐฉ๋ฒ.
- Lazy Model, Instance-based Learning: ๋ชจ๋ธ์ ๋ณ๋๋ก ํ์ตํ์ง ์๊ณ , ์๋ก์ด ๋ฐ์ดํฐ์ ๊ธฐ์กด ๋ฐ์ดํฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ์ฌ์ ์ด์์ ๋ฝ๋๋ค. (๋ฐ๋๋๋ ๊ฐ๋
: Model-based Learning)
- ๋ถ๋ฅ: ๊ฐ์ฅ ๊ฐ๊น์ด k๊ฐ์ ๋ฐ์ดํฐ ์ค, ๊ฐ์ฅ ๋น์ค์ด ํฐ label์ ๋ฐ๋ผ๊ฐ๋ค.
- ํ๊ท: ๊ฐ์ฅ ๊ฐ๊น์ด k๊ฐ์ ๋ฐ์ดํฐ ๊ฐ์ ํ๊ท ๊ฐ์ด ์์ธก๊ฐ.
ํ์ดํผํ๋ผ๋ฏธํฐ (hyper-parameter)
- k: ํ์ํ ์ด์ ์
- ๋๋ฌด ์์ผ๋ฉด ์ง์ญ์ ํน์ฑ์ ๊ณผํ๊ฒ ๋ฐ์(overfitting), ๋๋ฌด ํฌ๋ฉด ๋ชจ๋ธ์ด ๊ณผํ๊ฒ ๋จ์ํด์ง(underfitting).
- ๋ฐ์ดํฐ์ ํน์ฑ์ ๋ฐ๋ผ ์ ์ ํ๊ฒ ์กฐ์ ํด์ผ ํจ.
- ๊ฑฐ๋ฆฌ ์ธก์ ๋ฐฉ๋ฒ: Euclidean Distance, Manhattan Distance, ...
reference