Supervised Learning - BD-SEARCH/MLtutorial GitHub Wiki

Supervised learning?

Supervised: fully labelled
- classification
Semi-supervised: labelled + unlabeled
- 더 큰 data를 다루기에 supervised learning보다 더 좋은 성능을 보임
- unlabeled data가 모델 구조를 더 정확하게 모델링하기 때문
Weakly-supervised
- Bootstrapping 또는 self-training (더 적은 training example 사용)
- 적은 수의 샘플에서 시작해서 classifier를 학습하고, positive example을 예측해서 labeling을 하고 다시 re-training을 함으로써 classifier를 성장시킴
- positive example 예측이 잘못된 경우가 많으면 classifier가 더 나빠질 수 있음
Unsupervised: no labelled
- clustering
- 순수하게 데이터만 가지고 클러스터링 진행 -> 결과가 잘 된건지 판단 어려움