機器學習 || 相關筆記 - SeanWu1977/Machine-Learning GitHub Wiki
- 先用訓練集(含輸入與結果)進行訓練 --產生--> 預測模型
- 之後用此預測模型對新資料進行預測
- 多用於 分類 與 迴歸
- 無法辨試不在訓練集內的資料
- 利用環境回饋(獎勵)來判斷好不好
- trial-and-error
- 以得到最大回饋為目標
- ex:圍棋 就是要win
- 考量整體結果,而不是一時/局部的結果
- 只有輸入訓練集
- 用於分類或降維(數據壓縮)
- 發現、擷取數據中的隱藏結構
W=[W1,W2,...,Wm]
X=[X1,X2,..,Xm]
z=W1X1+W2X2+...+WmXm , sum(XiWi)=WT*X
feature scaling 特微縮放 ex. 1-100 ==> 0-1
Xn:m ==> n row,m column
- 過度適合(overfitting) :
對於訓練/測試數據效能好,未知數據效能差。
模型有高變異high variance 。
產生原因可能是過多特徵而產生太複雜的模型。 - 低度適合(underfitting) :
模型不夠複雜到能夠清楚從訓練資到找到好的pattern,因此未知數據的效能也不會好。
模型有高偏誤high bias。