40.모델(알고리즘) - yojulab/learn_MLs GitHub Wiki

데이터 종류 따른 주요 모델(알고리즘)

알고리즘 선택 시 고려 사항 : 정확성, 학습시간, 사용 편의성 Performance Comparison of Deep learning-based algorithms Vs Traditional Algorithms

대표 알고리즘

통계 기반(주로 정형 데이터 사용) : Regression(회귀), SVM(Support Vector Machine), Decision Tree --> (Esemble) Random Forest, Naive Bayes, KNN(K-Nearest Neighbors), DB-SCan, K-Mean
신경망 기반(주로 비정형 데이터 사용) : ANN(Artificial Neural Network) -> 흑망성쇠 후 Rename Deep learning.
알고리즘 기반 : Reinforcement Learning

Machine Learning 종류

지도 학습 (Supervised Learning) : 목표변수(Y)와 설명변수(X)간 관계 수식화, 새로운 설명변수(X)에 대해 목표변수(Y)를 예측하는 기법

회귀 (Regression, y-연속형) : 정확한 수치 예측
분류 (Classification, Y-범주형) : 특정 항목 구분 예측

Ex) 주가예측프로그램 -> Y 주가 (회귀) / 스팸 메시지 분류기 -> Y 스팸여부 (분류)

비지도 학습 (Unsupervised Learning) : 설명변수(X)들 간의 관계/연관성등 파악해 비슷한 데이터끼리나 연관성 있는 데이터 묶는 기법

군집분석 (Clustering) : 서로 유사한 특성 데이터끼리 묶어주는 작업
연관분석 (Association Analysis) : 데이터 간 유사도를 계산해 서로 연관성 높은 데이터를 찾는 기법

Ex) 장바구니 분석 / 추천 시스템.

강화 학습 (Reinforcement Learning) : 컴퓨터 시뮬레이션을 통해 주어진 환경에 대해 보상이 좋은 방향으로 학습하는 기법

데이터가 없이도 학습이 가능