算盘文档目标识别 - xuelang-group/suanpan-docs GitHub Wiki

算盘文档目标识别模板(TensorFlow)使用-更新记录

日期	版本	更新人	备注

2019/7/5	V0.1	张程伟	算盘文档目标识别模板(TensorFlow)使用最初版本。

算盘文档目标识别模板(TensorFlow)使用

模板ID：4206

算盘文档目标识别模板(TensorFlow)

目标识别模板（TensorFlow），用于定位图片中的物体。建议在配置过GPU加速的机器上运行。如果您只能在CPU机器上运行，训练将消耗较长时间，且建议您给训练节点分配尽量多的资源，操作如下。

分配资源

目标识别节点底层使用TensorFlow Object Detection API。

节点使用介绍

TF目标识别训练

接收上传的data.zip训练数据压缩包文件训练目标识别模型。

关于data.zip文件，你可以下载下列文件并参考：https://suanpan-test.oss-cn-beijing.aliyuncs.com/sp_share/data.zip

压缩前文件结构如下，压缩前建议将您的图片大小做适当的压缩并归一化，比如归一化为800 * 600 的图片以减小上传文件的时间。

data
└── images
├── test
│   ├── 10.jpg
│   ├── 10.xml
│   ├── 15.jpg
│   └── 15.xml
└── train
├── 0.jpg
├── 0.xml
├── 1.jpg
├── 1.xml
├── ....
├── 22.jpg
└── 22.xml

xml文件为标注文件，标注格式为Pascal VOC。你可以下载并使用labelImg标注工具对你的图片进行标注。https://tzutalin.github.io/labelImg/

你可以在参数设置中配置此节点。目前提供两种目标识别模型架构供选择。ssd MobileNet V2 和 Faster RCNN Inception V2。前者模型较后者更为轻量，训练和预测时对硬件要求更低，但准确度比后者更低。根据你的硬件配置设置训练时的batchSize。numSteps会影响模型训练的时间长度。numEvalSteps会影响模型评估的时间长度。