40.모델(알고리즘) - yojulab/learn_MLs GitHub Wiki
데이터 종류 따른 주요 모델(알고리즘)
- 알고리즘 선택 시 고려 사항 : 정확성, 학습시간, 사용 편의성 Performance Comparison of Deep learning-based algorithms Vs Traditional Algorithms
대표 알고리즘
- 통계 기반(주로 정형 데이터 사용) : Regression(회귀), SVM(Support Vector Machine), Decision Tree --> (Esemble) Random Forest, Naive Bayes, KNN(K-Nearest Neighbors), DB-SCan, K-Mean
- 신경망 기반(주로 비정형 데이터 사용) : ANN(Artificial Neural Network) -> 흑망성쇠 후 Rename Deep learning.
- 알고리즘 기반 : Reinforcement Learning
Machine Learning 종류
- 지도 학습 (Supervised Learning) : 목표변수(Y)와 설명변수(X)간 관계 수식화, 새로운 설명변수(X)에 대해 목표변수(Y)를 예측하는 기법
- 회귀 (Regression, y-연속형) : 정확한 수치 예측
- 분류 (Classification, Y-범주형) : 특정 항목 구분 예측
Ex) 주가예측프로그램 -> Y 주가 (회귀) / 스팸 메시지 분류기 -> Y 스팸여부 (분류)
- 비지도 학습 (Unsupervised Learning) : 설명변수(X)들 간의 관계/연관성등 파악해 비슷한 데이터끼리나 연관성 있는 데이터 묶는 기법
- 군집분석 (Clustering) : 서로 유사한 특성 데이터끼리 묶어주는 작업
- 연관분석 (Association Analysis) : 데이터 간 유사도를 계산해 서로 연관성 높은 데이터를 찾는 기법
Ex) 장바구니 분석 / 추천 시스템.
- 강화 학습 (Reinforcement Learning) : 컴퓨터 시뮬레이션을 통해 주어진 환경에 대해 보상이 좋은 방향으로 학습하는 기법
- 데이터가 없이도 학습이 가능