這軟體是如何煉成的 - acdsee400/TKU_Course_Helper GitHub Wiki

Ver0.1

  • Dry Run 3000 Samples

    • 辨識率大約落在80-85%左右
    • 可進一步測試 若事先優化圖片 是否可以達到更好的效果? Imgur
    • 第一次試做的效果並不好,有高度錯誤的可能性
  • 驗證碼組成分析

    • PNG格式

    • 背景圖片:

      • R:0
      • G:128
      • B:0
      • Alpha通道:透明度管理
    • PNG圖檔 缺口雜訊由透明圖層組合而成 Imgur

    • 可先透過OpenCV處理 去除缺口雜訊 Imgur

import cv2
def main():
    img=cv2.imread("test1.png",cv2.IMREAD_UNCHANGED)
    h,w,c=img.shape
    for i in range(w):
        for j in range(h):
            if(img[j][i][3]!=255):
                print(img[j][i])
                img[j][i][0]=0
                img[j][i][1]=128
                img[j][i][2]=0
                img[j][i][3]=255
    cv2.imwrite("DeAcc2.png",img)
    #print(img[0][0][3])
main()
  • 背景線條 可否在二值化之後 透過Hough Line處理 移除干擾?
    • 背景線條實質上不影響判讀
    • 在此使用Otsu來進行自動二值化判斷
    • Result Imgur
_,th = cv2.threshold(img,0,255,cv2.THRESH_BINARY_INV+cv2.THRESH_OTSU)

Ver0.2

  • 模型訓練時間大約為1~1.5hr
    • 總樣本數為3013 取10%作為確認比率
    • 最終Val_acc:0.9934
    • Result: Imgur Imgur Imgur