50 평가 - yojulab/learn_MLs GitHub Wiki

  • 평가 방법 (Evaluation)
  • 학습 능력 : y_train (실제값) - y_train.pred(예측값)
  • 일반화 능력 : y_test (실제값) - Y_test pred(예측값)
  • Overfitting (과적합): 학습 데이터에 대해서는 성능이 높게 나오지만, 검증 데이터에 성능이 매우 저조하게 나오는 현상
    • 해결책 : 특성공학 기법 이용, 학습 알고리즘 통제

회귀 모델

  • 회귀 모델 평가 지표 (Model Evaluation)
  • R Square (결정계수 R2) : 회귀선이 데이터를 얼마나 잘 대변하는가 (0~1)

분류 모델

  • 분류 모델에서 평가 방법 (Evaluation) : 정확도 = 정확하게 분류한 데이터 수 / 전체 데이터 수
  • 오차 행렬 (Confusion Matrix)

Ex) 참여 인원 이용해 태도를 분류하는 모델을 생성

실제 정상 실제 불량
예측 정상 940 40
예측 불량 10 10
950 50
y (불량여부) 1000개 정상 950/ 불량50
Model 정확도 950 / 1000 = 95%
Model 정밀도 10 / 20 = 50%
Model 재현율 10 / 50 = 20%