50 평가 - yojulab/learn_MLs GitHub Wiki
- 평가 방법 (Evaluation)
- 학습 능력 : y_train (실제값) - y_train.pred(예측값)
- 일반화 능력 : y_test (실제값) - Y_test pred(예측값)
- Overfitting (과적합): 학습 데이터에 대해서는 성능이 높게 나오지만, 검증 데이터에 성능이 매우 저조하게 나오는 현상
- 해결책 : 특성공학 기법 이용, 학습 알고리즘 통제
회귀 모델
- 회귀 모델 평가 지표 (Model Evaluation)
- R Square (결정계수 R2) : 회귀선이 데이터를 얼마나 잘 대변하는가 (0~1)
분류 모델
- 분류 모델에서 평가 방법 (Evaluation) : 정확도 = 정확하게 분류한 데이터 수 / 전체 데이터 수
- 오차 행렬 (Confusion Matrix)
Ex) 참여 인원 이용해 태도를 분류하는 모델을 생성
|
실제 정상 |
실제 불량 |
예측 정상 |
940 |
40 |
예측 불량 |
10 |
10 |
|
950 |
50 |
y (불량여부) 1000개 |
정상 950/ 불량50 |
Model 정확도 |
950 / 1000 = 95% |
Model 정밀도 |
10 / 20 = 50% |
Model 재현율 |
10 / 50 = 20% |