What is Machine learning - yarak001/machine_learning_common GitHub Wiki
What is Macine Learning
- Definitions
- Mitchellโs Machine Learning
- โ๊ธฐ๊ณํ์ต ๋ถ์ผ๋ ๊ฒฝํ์ ์ํด computer program์ด ์๋์ ์ผ๋ก ์ฑ๋ฅ๊ฐ์ ๋๋ ๋ฐฉ๋ฒ์ ๋ํ ์ง๋ฌธ๊ณผ ์ฐ๊ด๋์ด ์๋คโ -Mitchellโs Machine Learning-
- โ์ด๋ค task T์ ๋ํด P์ ์ํด ์ธก์ ๋๊ณ ๊ฒฝํ E๋ก ํฅ์๋๋ฉด Computer program์ ์ด๋ค task์ ์ด๋ค ์ฑ๋ฅ์ธก์ P์ ๊ดํ์ฌ ๊ฒฝํ E๋ก๋ถํฐ ํ์ตํ๋ค๊ณ ํ๋ค.โ -Mitchellโs Machine Learning-
- E: ์์ง๋์ด์ผ ํ data
- T: S/W์ ํ์ํ ๊ฒฐ์ ์ฌํญ
- P: ๊ฒฐ๊ณผ๋ฅผ ํ๊ฐํ๋ ๋ฐฉ๋ฒ
- Elements of Statistical Learning
- โ๋ง์ ๋ถ์ผ์์ ๊ฑฐ๋ํ data๊ฐ ๋ง๋ค์ด์ง๊ณ ์๊ณ , ์ด data๋ฅผ ์ดํดํ๋ ๊ฒ์ด ํต๊ณํ์์ ์ง์ ์ด๋ค. ์ค์ํ pattern๊ณผ trend๋ฅผ ์ถ์ถํ๊ณ โdata๊ฐ ์ด์ผ๊ธฐํ๋ ๊ฒโ์ ์ดํดํ๋ ๊ฒ์ ์ฐ๋ฆฌ๋ data๋ก๋ถํฐ ํ์ต์ด๋ผ ๋ถ๋ฅธ๋คโ
- Pattern Recognition
- โPattern์ธ์์ ๊ณตํ์ ๊ทผ๋ณธ์ ๋ ๋ฐ๋ฉด, machine learning์ computer๊ณผํ์ผ๋ก๋ถํฐ ์๋ผ๋ฌ๋ค. ๊ทธ๋ฌ๋, ๊ทธ ํ๋๋ค์ ๊ฐ์ ๋ถ์ผ์ ๋๊ฐ์ง ์์์ผ๋ก ๋ณด์ฌ์ง์ ์๋คโฆโ
- ๊ณตํ์ ๊ด์ ์์ ์์ํ์ฌ Computer๊ณผํ์ ๋ฐฐ์ฐ๊ณ ํ์ฉํจ => ์ฐ๋ฆฌ๊ฐ ๋ณธ๋ฐ์์ผํ ์ฑ์ํ ์ ๊ทผ๋ฐฉ์
- ๋ฐฉ๋ฒ์ ๋ํด ์ฃผ์ฅํ๋ ๋ถ์ผ์ ์๊ด์์ด, โdata๋ก๋ถํฐ ํ์ตโ์ ์ํ ๊ฒฐ๊ณผ๋ ํต์ฐฐ๋ ฅ์ ์ข๋ ๊ทผ์ ํจ์ผ๋ก์ ์ฐ๋ฆฌ์ ์๊ตฌ์ฌํญ์ ๋ง์กฑ์ํค๋ฉด, ์ฐ๋ฆฌ๋ ๊ทธ๊ฒ์ ๊ธฐ๊ณํ์ต์ด๋ผ ๋ช ๋ช ํ ์ ์๋ค.
- โPattern์ธ์์ ๊ณตํ์ ๊ทผ๋ณธ์ ๋ ๋ฐ๋ฉด, machine learning์ computer๊ณผํ์ผ๋ก๋ถํฐ ์๋ผ๋ฌ๋ค. ๊ทธ๋ฌ๋, ๊ทธ ํ๋๋ค์ ๊ฐ์ ๋ถ์ผ์ ๋๊ฐ์ง ์์์ผ๋ก ๋ณด์ฌ์ง์ ์๋คโฆโ
- An Alogorithmic Perspective
- โMachine learning์ ๊ฐ์ฅ ํฅ๋ฏธ๋ก์ด ์์๋ ์ฃผ๋ก computer๊ณผํ, ํต๊ณํ, ์ํ, ๊ณตํ์ ์ฌ๋ฌ ๋ค๋ฅธ ํ๋ฌธ ๋ถ์ผ์ ๊ฑธ์ณ ์๋ค๋ ๊ฒ์ด๋ค. ...machine learning์ computer๊ณผํ์์ ํ๊ณ ํ ์ธ๊ณต์ง๋ฅ์ ํ ๋ถ์ผ๋ก ์ฐ๊ตฌ๋๋ค. ...์ด๋ฌํ ์๊ณ ๋ฆฌ๋ฌ์ด ์๋ํ๋ ์ด์ ๋ฅผ ์ดํดํ๋ ค๋ฉด ์ปดํจํฐ ๊ณผํ ํ๋ถ์๋ค๋ก๋ถํฐ ์ข ์ข ๋๋ฝ๋๋ ์ผ์ ๋์ ํต๊ณ ๋ฐ ์ํ์ ์ํผ์ผ์ด์ (sophistics)์ด ํ์ํ๋ค => ์ฌ๋ฌ ๋ฐฉ๋ฉด์ ํ๋ฌธ๊ณผ ์ฐ๊ฒฐ๋์ด ์์, ํ ๋ถ์ผ์ ๋๋ฌด ์ง์ฐนํ๋ฉด ์๋จ
- Mitchellโs Machine Learning
- Definitions Machine Learning
- โMachine Learning์ ์ฑ๋ฅ์ธก์ฒญ์ ๋ํ ๊ฒฐ์ ์ ์ผ๋ฐํํ๋ data๋ก๋ถํฐ model ํ๋ จ์ด๋ค
- Model์ ํ๋ จ => ํ๋ จ ์์ ์ ์
- Model => ๊ฒฝํ์ ํตํด ํ๋ํ ์ํ ์ ์
- ๊ฒฐ์ ์ ์ผ๋ฐํ => ๊ฒฐ์ ์ด ํ์ํ ๋ฏธ๋์ ๋ณด์ด์ง ์๋ ์ ๋ ฅ๊ณผ ์์ํ์ง ๋ชปํ ์ ๋ ฅ์ ๊ธฐ๋ฐ์ผ๋ก ์์ฌ ๊ฒฐ์ ์ ๋ด๋ฆด ์ ์๋ ๋ฅ๋ ฅ์ ์์ฌํ๋ค.
- ์ฑ๋ฅ์ธก์ ์ ๋ํ => ๋ชฉํ ์๊ตฌ์ฌํญ๊ณผ model์ด ์ค๋นํด์ผํ ์ฑ๋ฅ์ ๋ฐฉํฅ์ฑ ์ ์
- โMachine Learning์ ์ฑ๋ฅ์ธก์ฒญ์ ๋ํ ๊ฒฐ์ ์ ์ผ๋ฐํํ๋ data๋ก๋ถํฐ model ํ๋ จ์ด๋ค
What Are the Key Concepts in Machine Learning?
-
Data
์ดํด๋ฅผ ์ํด ๋จ์ํ row์ column์ ์ง๋ DB table์ด๋ Excel spreedsheet๋ก ์๊ฐํ ์ ์์(๋น์ ํ data๋ ์ฌ๊ธฐ์ ์ ์ธํจ)
- Instance
- data์ ๋จ์ผ ํ(row)
- Domain์ผ๋ฅด๋ถํฐ์ ๊ด์ธก์น
- Feature
- data์ ๋จ์ผ column(feature)
- ๊ด์ธก์น์ ๊ตฌ์ฑ์ด๋ฉฐ, data instance์ ์์ฑ(attribute)
- ํน์ feature๋ model์ ์ ๋ ฅ์ผ๋ก, ๋ค๋ฅธ featuer๋ model์ ์ถ๋ ฅ ๋๋ ์์ธก๊ฐ์ผ๋ก ์ฌ์ฉ
- Data Type
- feature๋ data type์ ๊ฐ์ง
- ์ค์ ๋๋ ์ ์๊ฐ(real value), ๋ฒ์ฃผํ๊ฐ(categorical value), ์์๊ฐ(ordinary value)
- ๋ฌธ์์ด, ๋ ์ง, ์๊ฐ, ๋ณต์กํ type์ ๊ฐ์ง ์ ์์
- ์ ํต์ ์ธ machine learning ๋ฐฉ๋ฒ์ผ๋ก ์์ ์ ์ค์ ๊ฐ์ด๋ ๋ฒ์ฃผํ ๊ฐ ์ฌ์ฉ
- Datasets
- Instance์ ์งํฉ
- Machine Learning ์์ ์ ๋ชฉ์ ์ ๋ฐ๋ฅธ ๋ช๊ฐ์ dataset ํ์
- Training Dataset
- model์ ํ๋ จ์ํค๊ธฐ ์ํด์ machine learning algorithm์ ์ฃผ์ด์ง๋ dataset
- Testing Dataset
- model์ ์ ํ๋ ๊ฒ์ฆ์ ์ํด ์ฌ์ฉ๋๋ dataset(ํ๋ จ์๋ ์ฌ์ฉ๋์ง ์์),
- ๊ฒ์ฆ(Validation) dataset๋ผ ํ ์ ์์
- Instance
-
Learning
Algorithm์ ์ด์ฉํ ์๋ํ๋ ํ์ต์ ์ค์
- Induction
- Machine Learning์ ์ ๋(induction) ๋๋ ์ ๋ํ์ต(inductive learning)์ด๋ผ ๋ถ๋ฆฌ๋ ๊ณผ์ ์ ํตํด ํ์ต
- ์ ๋๋ ํน์ ์ ๋ณด(dataset)์ผ๋ก๋ถํฐ ์ผ๋ฐํ(generalization)(model)์ ๋ง๋๋ ์ถ๋ก process
- Generalization
- ํ๋ จ ์ค์ ๋ณด์ด์ง ์๋ ํน์ data instance๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ธก, ๊ฒฐ์ ์ ํด์ผํ๋ฏ๋ก ์ผ๋ฐํ๊ฐ ํ์
- Over-Learning
- ํ๋ จ data์ ๋๋ฌด ๊ฐ๊น๊ฒ(closely) ํ์ต๋์ด ์ผ๋ฐํํ์ง ์์์ ๊ฒฝ์ฐ
- ํ๋ จ data์ธ data์ ํํธ์๋ ์ฑ๋ฅ์ ๊ฐ์ง
- over fitting์ด๋ผ๊ณ ๋ ํจ
- Under-Learning
- model์ ํ์ต๊ณผ์ ์ด ๋๋ฌด ์ผ์ฐ ์ข ๋ฃ๋์ด database๋ก๋ถํฐ ์ถฉ๋ถํ ํ์ตํ์ง ๋ชปํ ๊ฒฝ์ฐ
- ์ผ๋ฐํ๋ ์ข์ง๋ง ๋ชจ๋ data์ ๋ฎ์ ์ฑ๋ฅ์ ๊ฐ์ง
- under fitting์ด๋ผ๊ณ ๋ ํจ
- Online Learning
- ์ฌ์ฉ ๊ฐ๋ฅํ ๋ domain์์ data instance๋ฅผ updateํ ๋ฐฉ๋ฒ
- noise๊ฐ ๋ง์ data์ ๊ฐ๋ ฅํ ๋ฐฉ๋ฒ์ด ํ์ํ์ง๋ง domain์ ํ์ฌ์ํ์ ๋ ์ ๋ง๋ model์ ์์ฑํ ์ ์์
- Offline Learning
- ์ค๋น๋ data์ ๋ํด ์์ฑ๋ ํ ๊ด์ฐฐ๋์ง ์์ data์ ๋ํด ์ด์์ ์ผ๋ก ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ
- ํ๋ จdata์ ๋ฒ์๊ฐ ์๋ ค์ ธ ์๊ธฐ ๋๋ฌธ์ ํ๋ จ ๊ณผ์ ์ ์ฃผ์๊น๊ฒ ์ ์ดํ๊ณ ์กฐ์ ํ ์ ์์
- Model์ ์ค๋นํ ํ์๋ update๋์ง ์์ผ๋ฉฐ, domain์ด ๋ณ๊ฒฝ๋ ๊ฒฝ์ฐ ์ฑ๋ฅ์ด ์ ํ๋ ์ ์์
- Supervised Learning
- ์์ธก์ด ํ์ํ ๋ฌธ์ ์ ์ผ๋ฐ์ ์ธ ํ์ต process
- โ๊ต์ก ๊ณผ์ (teaching process)โ๋ model์ ์์ธก๊ณผ ์ ๋ต์ ๋น๊ตํ์ฌ model๋ด์์ ์์
- Unsupervised Learning
- ์์ธก์ด ํ์ํ์ง ์์ data์ ๊ตฌ์กฐ๋ฅผ ์ผ๋ฐํํ๊ธฐ ์ํ ํ์ต process
- ์์ฐ์ ์ด ๊ตฌ์กฐ๊ฐ ํ์ธ๋๊ณ ์๋ก ์ฐ๊ด๋ instance๋ค๋ก exploited๋จ
- Induction
-
Modelling
๊ธฐ๋ณธ์ ์ผ๋ก program์ธ Machine Learning๊ณผ์ ์ ์ํด ๋ง๋ค์ด์ง ์ธ๊ณต๋ฌผ, ์ฐ๋ฆฌ๊ฐ ํ๋ ค๊ณ ํ๋ ๋ฌธ์ ์ model์ด๋ฏ๋ก model์ด๋ผ๊ณ ๋ถ๋ฆ
- Model Selection
- ์ค์ (configure)์ model ํ๋ จ๊ณผ์ => model selection process
- ๋งค๊ณผ์ ์์ ์ฌ์ฉ ๋๋ ์์ ํ model์ ๊ฐ์ง๊ณ ์์
- machine learning algorithm ์ ํ์ Model selection์ ํ ๊ณผ์
- ๋ฌธ์ ์ ๋ํด ์กด์ฌํ๋ ๋ชจ๋ ๊ฐ๋ฅํ model์ค, ์ ํ๋ ํ๋ จ dataset์ ์ฃผ์ด์ง algorithm๊ณผ algorithm ์ค์ ์ ์ต์ข ์ ์ผ๋ก ์ ํ๋ model์ ์ ๊ณตํ ๊ฒ์
- Inductive Bias
- ์ ํ๋ model์ ๋ด์ ๋ ์ ํ๊ฐ
- ๋ชจ๋ model์ ํธํฅ๋์ด ์์ด model ์ค๋ฅ๊ฐ ๋ฐ์ํ๊ณ ์ ์์ ๋ชจ๋ model์๋ ์ค๋ฅ ์กด์ฌ(๊ด์ธก์ฃ ์ผ๋ฐํํ model์)
- ํธํฅ์ model์ ๊ตฌ์ฑ๊ณผ ๋ชจ๋ธ์ ์์ฑํ๋ algorithm ์ ํ์ ํฌํจํ์ฌ model์์ ๋ง๋ค์ด์ง ์ผ๋ฐํ์ ์ํด ๋์
- Machine learning ๋ฐฉ๋ฒ์ ๋ฎ์ or ๋์ bias๋ฅผ ๊ฐ์ง mode์ ์์ฑํ ์ ์๊ณ , ๋งค์ฐ ํธํฅ๋ model์ bias๋ฅผ ์ค์ผ ์ ์๋ ์ ๋ต์ ์ฌ์ฉํ ์ ์๋ค.
- Model Variance
- ํ๋ จํ dataset์ model์ด ์ผ๋ง๋งํผ ๋ฏผ๊ฐํ๊ฐ
- variance๋ฅผ ์ค์ด๋ ์ ์ ์ ๋ค๋ฅธ ์ด๊ธฐ์กฐ๊ฑด์ผ๋ก dataset์ ์ฌ๋ฌ๋ฒ ์คํํ๊ณ model ์ฑ๋ฅ์ ํ๊ท ๊ฐ์ ์ทจํจ
- Bias-Variance Tradeoff
- model selection์ bias์ variance์ trade-off๋ก ์๊ฐํ ์ ์์
- ๋ฎ์ bias๋ ๋์ variance๋ฅผ ๊ฐ์ง๊ฒ์ด๋ฉฐ, ์ฌ์ฉ๊ฐ๋ฅํ model์ ์ป๊ธฐ์ํด ๋ ๋ง์ ํ๋ จ์ด ํ์
- ๋์ bias๋ ๋ฎ์ variance๋ฅผ ๊ฐ์ง ๊ฒ์ด๋ฉฐ, ๋น ๋ฅธ ํ๋ จ์ ๋ ๊ฒ์ด์ง๋ง ๋ฎ๊ณ , ์ ํ๋ ์ฑ๋ฅ์ ๊ฒฝํ
- Model Selection
What Problems Can Machine Learning Address?
Machine Learning์ ์ดํดํ๋ ํ ๋ถ๋ถ์ผ๋ก, ์ด๋ค type์ ๋ฌธ์ ๋ฅผ machine learning์ด ํด๊ฒฐํ ์ ์๋์ง ์ดํดํ๋ ๊ฒ์ด ์ ์ฉํจ
์ง๋ฉดํ ๋ฌธ์ type์ ์์ผ๋ก์ ํ์ํ data์ algorithm์ ๋ํด ์๊ฐํ๊ฒ ๋๋ฏ๋ก ๊ฐ์น์์
- Example Problems
- Spam ํ์ง
- ์ ์ฉcard ์ฌ๊ธฐ ํ์ง
- ์ซ์ ์ธ์
- ์์ฑ ์ดํด
- ์ผ๊ตด ์ธ์
- ์ ํ ๊ถ์ฅ
- ์ํ ์ง๋จ
- ์ฃผ์ ๊ฑฐ๋
- ๊ณ ๊ฐ์ธ๋ถํ
- ํ์ ํ์ง
- Types of Problems
- Classification
- Regression
- Clustering
- Rule Extraction
What Algorithm Does Machine Learning Provide?
Machine learning์ ๊ณต๋ถํ๋๊ฒ์ machine learning algorithm์ ๊ณต๋ถํ๋ ๊ฒ
์ฌ๋ฌ ๋ฐฉ๋ฒ์ข ๋ฅ์ ํ์ฅ์ด ์๊ณ , ์ด๋ค ๊ฒ์ด ์ญํ์ Algorithm์ ๊ตฌ์ฑํ๋์ง ๋น ๋ฅด๊ฒ ํ๋จํ๊ธฐ๊ฐ ์ด๋ ค์
- Algorithm Similarity
- machine learning algorithm์ ๋ถ๋ฅํ๋ ๋ฐฉ๋ฒ์ ๋ง์
- Algorithm์ ์ฌ์ฑ์ด ๊ฐ์ฅ ๊ฐ๋จํ ๋ฐฉ๋ฒ
- ๊ธฐ๋ฅ์ด๋ ํํ์ ์ ์ฌ์ฑ์ ์ํด groupํ ex)tree based methods, neural network inspired methods
- tree based method์ด๋ฉด์ neural netword inspired method ์ธ Learning Vector Quantization๊ณผ ๊ฐ์ algorithm์ด ์กด์ฌํจ
- Regression๊ณผ Clustering์ฒ๋ผ ๋ฌธ์ ์ข ๋ฅ์ algorithm์ข ๋ฅ ๋์ผํ ์ด๋ฆ์ธ category๊ฐ ์กด์ฌํจ
- Machine Learning Algorithm ์์ฒด๋ก ์๋ฒฝํ๊ณ , ์์ ์ถฉ๋ถํ model์ ์์
- Regression
- model์ ์ํ ์์ธก๊ฐ์ error์ธก์ ์ ์ฌ์ฉํ์ฌ ๋ฐ๋ณต์ ์ผ๋ก ์ ์ ๋ ๋ณ์๋ค๊ฐ์ ๊ด๊ณ๋ฅผ modelling
- ํต๊ณ์ ํต์ฌ์ด๋ฉฐ ํต๊ณ์ machine learning์ผ๋ก ํตํฉ๋จ
- ๋ฌธ์ ์ข ๋ฅ์ algorithm์ข ๋ฅ๋ก ์ธ๊ธํ ์ ์์ด ํผ๋ํ ์ ์์
- ์ค์ regression์ ์คํ๊ณผ์ (process)์
- Example
- Ordinary Least Squares Linear Regression
- Logistic Regression
- Stepwise Regression
- Multivariative Adaptive Regression Splines(MARS)
- Locally Estimated Scatterplot Smoothing(LOESS)
- Instance-based Methods
- model์ ๊น๊ฒ ์ค์ํ๊ฑฐ๋ ํ์ํ ํ๋ จ data์ ์์ ๋๋ instance๊ธฐ๋ฐ์ผ๋ก ๊ฒฐ์ ๋ฌธ์ ๋ฅผ model
- ์์ data database๋ฅผ ๋ง๋ค๊ณ ์ต์ match์ ์์ธก์ ์ํด ์ ๊ท data๋ฅผ ์ ์ฌ์ธก์ ์ ์ฌ์ฉํ์ฌ database์ ๋น๊ต
- ์ด๋ฐ ์ด์ ๋ก winner-take all method, case-based and memory based ํ์ต์ด๋ผ ํจ
- Example
- k-Nearest Neighbour(kNN)
- Learning Vector Quantization(LVQ)
- Self-Organizing Map(SOM)
- Regularization Methods
- ์ผ๋ฐํ์ ์ข์ ์ข๋ ๊ฐ๋จํ model ์ ํธํ๋ฉด์, model์ ๋ณต์ก์ฑ์ ๊ธฐ๋ฐ์ผ๋กํ์ฌ model์ penalty๋ฅผ ๋ถ์ฌํ์ฌ ๋ค๋ฅธ model(์ฃผ๋ก regression)์ ํ์ฅ
- Example
- Ridge Regression
- Least Absolute Shrinkage and Selection Operator(LASSO)
- Elastic Net
- Decision Tree Learning
- Data์ ์ค์ ์์ฑ๊ฐ์ ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ง ๊ฒฐ์ model์ ๊ตฌ์ฑํ๋ ๋ฐฉ๋ฒ
- ํด๋น record์ ๋ํ ๊ฒฐ์ ์ด ๋ง๋ค์ด์ง๋๊น์ง tree ๊ตฌ์กฐ๋ฅผ fork
- classification์ด๋ regression ๋ฌธ์ ์ data๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ จ
- Examples
- Classification and Regression Tree(CART)
- Iterative Dichotomiser3(ID3)
- C4.5
- Chi-squared Automatic Interaction Detection(CHAID)
- Decision Stump
- Random Forest
- Muitivariative Adaptive Regression Splines(MARS)
- Gradient Boosting Machines(BGM)
- Bayesian
- Classification๊ณผ regression ๋ฌธ์ ์ ๋ช ์์ ์ผ๋ก ๋ฒ ์ด์ฆ ์ด๋ก ์ ์ ์ฉํ ๋ฐฉ๋ฒ
- Examples
- Naive Bayes
- Averaged One-Dependence Estimators(AODE)
- Bayesian Belief Network(BBN)
- Kernel Methods
- ๋ฐฉ๋ฒ๊ณผ ๋ฐฉ๋ฒ์ ์งํฉ์ฒด์ธ Support Vector Machine(SVM)์ด ๊ฐ์ฅ ์ ์๋ ค์ง
- ์ฝ๊ฒ modellingํ ์ ์๋ classification์ด๋ regression๋ฌธ์ ์์ input data๋ฅผ ๊ณ ์ฐจ์์ vector๊ณต๊ฐ์ผ๋ก mapping
- Examples
- Support Vector Machine(SVM)
- Radial Basis Function(RBF)
- Linear Discriminate Analysis(LDA)
- Clustering Methods
- regression์ฒ๋ผ ๋ฌธ์ ์ ๋ฐฉ๋ฒ์ ์๊ธฐํจ
- centroid-based๋ hierarchical๊ณผ ๊ฐ์ modelling์ ์ ๊ทผ์ผ๋ก ์กฐ์งํ๋จ
- ์ต๋ ์ ์ฌ๋์ group์ผ๋ก data๋ฅผ ์กฐ์งํํ๊ธฐ ์ํด์ data์ ๊ณ ์ ๊ตฌ์กฐ๋ฅผ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ
- Examples
- k-Means
- Expectation Maximisation(EM)
- Association Rule Learning
- data๋ด ์์ฑ์ ๊ด์ฐฐ๋ ์ฐ๊ด๊ด๊ณ๋ฅผ ์ค๋ช ํ ์ ์๋ ์ต์ ์ ๊ท์น์ ์ฐพ์๋ด๋ ๋ฐฉ๋ฒ
- ์ด๋ฌํ ๊ท์น์ ์กฐ์ง์ด ์ด์ฉํ ์ ์๋ ๋๊ท๋ชจ ์ฐจ์ ๋ฐ์ดํฐ ์ธํธ์์ ์ค์ํ๊ณ ์์ ์ ์ผ๋ก ์ ์ฉํ ์ฐ๊ด์ฑ์ ๋ฐ๊ฒฌํ ์ ์๋ค.
- Examples
- Apriori algorithm
- Eclat algorithm
- Artificial Neural Networks
- ์๋ฌผํ์ ์ ๊ฒธ๋ง์์ ์๊ฐ์ ์ป์
- classification๊ณผ regression์ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ๋๋ pattern matching์ด์๋ง ๋ชจ๋ ๋ฌธ์ ์ ๋ํด์ ์๋ฐฑ๊ฐ์ง์ algorithm๊ณผ ๋ณํ์ผ๋ก ๊ตฌ์ฑ๋ ์ด๋ง์ด๋งํ ์์ญ
- Examples(Deep Learning ๊ณผ ๋ถ๋ฆฌ)
- Perceptron
- Back-Propagation
- Hopfield Network
- Self-Organizing Map(SOM)
- Learning Vector Quantization(LVQ)
- Deep Learning
- ์ธ๊ณต ์ ๊ฒฝ๋ง(ANN)์ ์ต์ version
- ์ ๋ ํฌ๊ณ , ๋ณต์กํ ์ ๊ฒฝ๋ง์ ๊ตฌ์ฑ, labelling๋ ์์ data๋ฅผ ๊ฐ์ง ํฐ dataset์์์ ๋ฐ์ง๋ํ์ต์ ๊ด๋ จ
- Examples
- Restricted Boltzman Machine(RBM)
- Deep Belief Networks(DBN)
- Convolutional Network
- Stacked Auto-encoders
- Dimensionality Reduction
- Clustering์ฒ๋ผ data๋ด ๊ณ ์ ํ ๊ตฌ์กฐ๋ฅผ ์ฐพ๊ณ ํ์
- ๋น์ง๋ ๋ฐฉ์์ด๋ ์ ์ ์ ๋ณด๋ฅผ ์ฌ์ฉํ์ฌ data๋ฅผ ์์ฝํ๊ฑฐ๋ ์ค๋ช
- ๊ณ ์ฐจ์ data๋ฅผ visualizeํ๊ฑฐ๋ ์ง๋ํ์ต์์ ์ฌ์ฉํ data๋ฅผ ๋จ์ํํ ๋ ์ ์ฉ
- Examples
- Principal Component Analysis(PCA)
- Partial Least Squares Regression(PLS)
- Sammon Mapping
- Multidimensional Scaling(MDS)
- Project Pursuit
- Ensemble Methods
- ๊ฐ๊ฐ ๋ ๋ฆฝ์ ์ผ๋ก ํ๋ จ๋ ๋ค์์ model๋ฅผ ๊ฒฐํฉํ์ฌ ์์ธก๊ฐ๋ค์ ํน์ ํ ๋ฐฉ์์ผ๋ฌ ์ ์ฒด ์์ธก๊ฐ์ ๋ง๋ฆ
- ์ด๋ค type์ model๋ค์ ๊ฒฐํฉํ๊ณ , ์ด๋ป๊ฒ ๊ฒฐํฉํ ๊ฒ์ธ์ง์ ๋ ธ๋ ฅ์ด ํ์
- ๊ฐ๋ ฅํ๊ณ ์ธ๊ธฐ ์๋ ๊ธฐ์
- Examples
- Bagging
- Bootstrapped Aggregation(Boosting)
- AdaBoost
- Stacked Generalization(blending)
- Gradient Boosting Machines(GBM)
- Random Forest
What Other Fields Are Related to Machine Learning
-
Foundations
์ํ๊ณผ computer ๊ณผํ๋ถ์ผ ๊ธฐ๋ฐ
๋ฐฉ๋ฒ์ ์ ํ๊ณผ ํ๋ ฌ ๋์๋ก, ๋์์ ํต๊ณ์ ํ๋ฅ ๋ก ์ดํด
- Probability
- Statistics
- Artificial Intelligence
-
Progenitors
- Computational Intelligence
- Data Mining
- Data Science