機器學習 || 相關筆記 - SeanWu1977/Machine-Learning GitHub Wiki

1. 監督式學習

  • 先用訓練集(含輸入與結果)進行訓練 --產生--> 預測模型
  • 之後用此預測模型對新資料進行預測
  • 多用於 分類 與 迴歸
  • 無法辨試不在訓練集內的資料

2. 強化學習

  • 利用環境回饋(獎勵)來判斷好不好
  • trial-and-error
  • 以得到最大回饋為目標
  • ex:圍棋 就是要win
  • 考量整體結果,而不是一時/局部的結果

3. 非監督式學習

  • 只有輸入訓練集
  • 用於分類或降維(數據壓縮)
  • 發現、擷取數據中的隱藏結構

內積

W=[W1,W2,...,Wm]
X=[X1,X2,..,Xm]
z=W1X1+W2X2+...+WmXm , sum(XiWi)=WT*X

補充

feature scaling 特微縮放 ex. 1-100 ==> 0-1
Xn:m ==> n row,m column

  • 過度適合(overfitting) :
    對於訓練/測試數據效能好,未知數據效能差。
    模型有高變異high variance 。
    產生原因可能是過多特徵而產生太複雜的模型。
  • 低度適合(underfitting) :
    模型不夠複雜到能夠清楚從訓練資到找到好的pattern,因此未知數據的效能也不會好。
    模型有高偏誤high bias。
⚠️ **GitHub.com Fallback** ⚠️