Clustering 알고리즘 - kirseia/study GitHub Wiki
개요
- 데이터를 그룹화 하기 위해 필요한 알고리즘
왜?
- 최근엔 머신 러닝에서 데이터를 그룹화하기 위해 많이 사용
- 내가 찾아본건 사진들을 장소에 따라 그룹화 하고 싶어서 찾아봄
- gps 좌표를 기준으로 여러 사진이 있을 때 그룹화 하고 싶었음
어떤게 있나
- 대표적으로 k-means / mean-shift / hierarchy / dbscan(density-based spatial clustering) 이 있음
- 어떤 것은 그룹이 최초 몇개 가 있는지 입력이 필요 한 것들도 있고, 아닌 것들도 있음
- 아닌 것들은 어느 시점에 그룹화를 멈출지 값이 필요함
코드
- mean-shift 파이썬 코드
- k-means 코드
- dbscan 코드
Ref.
- https://towardsdatascience.com/the-5-clustering-algorithms-data-scientists-need-to-know-a36d136ef68
- https://towardsdatascience.com/using-unsupervised-learning-to-plan-a-paris-vacation-geo-location-clustering-d0337b4210de
- https://www.nextobe.com/single-post/2018/02/26/%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B3%BC%ED%95%99%EC%9E%90%EA%B0%80-%EC%95%8C%EC%95%84%EC%95%BC-%ED%95%A0-5%EA%B0%80%EC%A7%80-%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0%EB%A7%81-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98
- https://ratsgo.github.io/machine%20learning/2017/04/16/clustering/
- http://sanghyukchun.github.io/69/