竞品分析 - panshaowu/mindocr GitHub Wiki

海康DavarOCR

  • DavarOCR: A Toolbox for OCR and Multi-Modal Document Understanding
  • 含21个算法、10类任务,提供对文档识别子任务相对更完整的覆盖支持,侧重于支持 多模态OCR
  • 基于PyTorch+torchvision+opencv构建
  • 架构参考mmocr,拓展其任务模块并可与其兼容,采用mmdetection-2.11.0架构和mmcv-1.3.4训练,重写开发相关代码以规避开源问题
  • 在mmdetection BACKBONENECKROI_EXTRACTORHEAD 等4个功能模块的基础上,新增 TRANSFORMATION (text recognition、text spotting、video text tasks)、 EMBEDDING (KIE、NER、Layout Analysis、ROD)、 CONNECT (text spotting、KIE、NER)等功能模块
  • 针对多种类型的任务,统一了数据标注格式
大类 类别 算法 年份
基础OCR Text Detection EAST CVPR 2017
基础OCR Text Detection MASK RCNN ICCV 2017
基础OCR Text Detection Text Perceptron Det AAAI 2020
基础OCR Text Recognition Attention CVPR 2016
基础OCR Text Recognition CRNN CVPR 2016
基础OCR Text Recognition ACE CVPR 2019
基础OCR Text Recognition SPIN AAAI 2021
基础OCR Text Recognition RF-Learning ICDAR 2021
基础OCR Text Spotting Mask RCNN E2E -
基础OCR Text Spotting Text Perceptron E2E AAAI 2020
基础OCR Text Spotting MANGO AAAI 2021
基础OCR Text Spotting DLD ECCV 2022
基础OCR Video Text Spotting YORO ACM MM 2019
文档理解 Information Extraction Chargrid EMNLP 2018
文档理解 Information Extraction TRIE ACM MM 2020
文档理解 Table Recognition LGPMA ICDAR 2021
文档理解 Table Understanding CTUNet ACMMM 2022
文档理解 Layout Recognition VSR ICDAR 2021
文档理解 Reading Order Detection GCN-PN ECCV 2020
文档理解 Named Entity Reocognition Bert-based NER, including BERT+CRF/Span/Softmax -
文档理解 Named Entity Reocognition BiLSTM+CRF NER Arxiv 2016

Tesseract

chineseOCR

chineseOCR_lite

EasyOCR