竞品分析 - panshaowu/mindocr GitHub Wiki
海康DavarOCR
- DavarOCR: A Toolbox for OCR and Multi-Modal Document Understanding
- 含21个算法、10类任务,提供对文档识别子任务相对更完整的覆盖支持,侧重于支持 多模态OCR
- 基于PyTorch+torchvision+opencv构建
- 架构参考mmocr,拓展其任务模块并可与其兼容,采用mmdetection-2.11.0架构和mmcv-1.3.4训练,重写开发相关代码以规避开源问题
- 在mmdetection BACKBONE 、 NECK 、 ROI_EXTRACTOR 、 HEAD 等4个功能模块的基础上,新增 TRANSFORMATION (text recognition、text spotting、video text tasks)、 EMBEDDING (KIE、NER、Layout Analysis、ROD)、 CONNECT (text spotting、KIE、NER)等功能模块
- 针对多种类型的任务,统一了数据标注格式
大类 | 类别 | 算法 | 年份 |
---|---|---|---|
基础OCR | Text Detection | EAST | CVPR 2017 |
基础OCR | Text Detection | MASK RCNN | ICCV 2017 |
基础OCR | Text Detection | Text Perceptron Det | AAAI 2020 |
基础OCR | Text Recognition | Attention | CVPR 2016 |
基础OCR | Text Recognition | CRNN | CVPR 2016 |
基础OCR | Text Recognition | ACE | CVPR 2019 |
基础OCR | Text Recognition | SPIN | AAAI 2021 |
基础OCR | Text Recognition | RF-Learning | ICDAR 2021 |
基础OCR | Text Spotting | Mask RCNN E2E | - |
基础OCR | Text Spotting | Text Perceptron E2E | AAAI 2020 |
基础OCR | Text Spotting | MANGO | AAAI 2021 |
基础OCR | Text Spotting | DLD | ECCV 2022 |
基础OCR | Video Text Spotting | YORO | ACM MM 2019 |
文档理解 | Information Extraction | Chargrid | EMNLP 2018 |
文档理解 | Information Extraction | TRIE | ACM MM 2020 |
文档理解 | Table Recognition | LGPMA | ICDAR 2021 |
文档理解 | Table Understanding | CTUNet | ACMMM 2022 |
文档理解 | Layout Recognition | VSR | ICDAR 2021 |
文档理解 | Reading Order Detection | GCN-PN | ECCV 2020 |
文档理解 | Named Entity Reocognition | Bert-based NER, including BERT+CRF/Span/Softmax | - |
文档理解 | Named Entity Reocognition | BiLSTM+CRF NER | Arxiv 2016 |