Clustering 알고리즘 - kirseia/study GitHub Wiki

개요

  • 데이터를 그룹화 하기 위해 필요한 알고리즘

왜?

  • 최근엔 머신 러닝에서 데이터를 그룹화하기 위해 많이 사용
  • 내가 찾아본건 사진들을 장소에 따라 그룹화 하고 싶어서 찾아봄
  • gps 좌표를 기준으로 여러 사진이 있을 때 그룹화 하고 싶었음

어떤게 있나

  • 대표적으로 k-means / mean-shift / hierarchy / dbscan(density-based spatial clustering) 이 있음
  • 어떤 것은 그룹이 최초 몇개 가 있는지 입력이 필요 한 것들도 있고, 아닌 것들도 있음
  • 아닌 것들은 어느 시점에 그룹화를 멈출지 값이 필요함

코드

Ref.