40.모델(알고리즘) - yojulab/learn_MLs GitHub Wiki

데이터 종류 따른 주요 모델(알고리즘)

대표 알고리즘

  • 통계 기반(주로 정형 데이터 사용) : Regression(회귀), SVM(Support Vector Machine), Decision Tree --> (Esemble) Random Forest, Naive Bayes, KNN(K-Nearest Neighbors), DB-SCan, K-Mean
  • 신경망 기반(주로 비정형 데이터 사용) : ANN(Artificial Neural Network) -> 흑망성쇠 후 Rename Deep learning.
  • 알고리즘 기반 : Reinforcement Learning

Machine Learning 종류

  1. 지도 학습 (Supervised Learning) : 목표변수(Y)와 설명변수(X)간 관계 수식화, 새로운 설명변수(X)에 대해 목표변수(Y)를 예측하는 기법
  • 회귀 (Regression, y-연속형) : 정확한 수치 예측
  • 분류 (Classification, Y-범주형) : 특정 항목 구분 예측

Ex) 주가예측프로그램 -> Y 주가 (회귀) / 스팸 메시지 분류기 -> Y 스팸여부 (분류)

  1. 비지도 학습 (Unsupervised Learning) : 설명변수(X)들 간의 관계/연관성등 파악해 비슷한 데이터끼리나 연관성 있는 데이터 묶는 기법
  • 군집분석 (Clustering) : 서로 유사한 특성 데이터끼리 묶어주는 작업
  • 연관분석 (Association Analysis) : 데이터 간 유사도를 계산해 서로 연관성 높은 데이터를 찾는 기법

Ex) 장바구니 분석 / 추천 시스템.

  1. 강화 학습 (Reinforcement Learning) : 컴퓨터 시뮬레이션을 통해 주어진 환경에 대해 보상이 좋은 방향으로 학습하는 기법
  • 데이터가 없이도 학습이 가능