Supervised Learning - BD-SEARCH/MLtutorial GitHub Wiki

Supervised learning?

  • Supervised: fully labelled
    • classification
  • Semi-supervised: labelled + unlabeled
    • 더 큰 data를 다루기에 supervised learning보다 더 좋은 성능을 보임
    • unlabeled data가 모델 구조를 더 정확하게 모델링하기 때문
  • Weakly-supervised
    • Bootstrapping 또는 self-training (더 적은 training example 사용)
    • 적은 수의 샘플에서 시작해서 classifier를 학습하고, positive example을 예측해서 labeling을 하고 다시 re-training을 함으로써 classifier를 성장시킴
    • positive example 예측이 잘못된 경우가 많으면 classifier가 더 나빠질 수 있음
  • Unsupervised: no labelled
    • clustering
    • 순수하게 데이터만 가지고 클러스터링 진행 -> 결과가 잘 된건지 판단 어려움

Reference