算盘文档 目标识别 - xuelang-group/suanpan-docs GitHub Wiki
算盘文档目标识别模板(TensorFlow)使用-更新记录
日期 | 版本 | 更新人 | 备注 |
---|---|---|---|
2019/7/5 | V0.1 | 张程伟 | 算盘文档目标识别模板(TensorFlow)使用最初版本。 |
算盘文档目标识别模板(TensorFlow)使用
模板ID:4206
算盘文档目标识别模板(TensorFlow)
目标识别模板(TensorFlow),用于定位图片中的物体。建议在配置过GPU加速的机器上运行。如果您只能在CPU机器上运行,训练将消耗较长时间,且建议您给训练节点分配尽量多的资源,操作如下。
分配资源
目标识别节点底层使用TensorFlow Object Detection API。
节点使用介绍
TF目标识别训练
接收上传的data.zip训练数据压缩包文件训练目标识别模型。
关于data.zip文件,你可以下载下列文件并参考:https://suanpan-test.oss-cn-beijing.aliyuncs.com/sp_share/data.zip
压缩前文件结构如下,压缩前建议将您的图片大小做适当的压缩并归一化,比如归一化为800 * 600 的图片以减小上传文件的时间。
data
└── images
├── test
│ ├── 10.jpg
│ ├── 10.xml
│ ├── 15.jpg
│ └── 15.xml
└── train
├── 0.jpg
├── 0.xml
├── 1.jpg
├── 1.xml
├── ....
├── 22.jpg
└── 22.xml
xml文件为标注文件,标注格式为Pascal VOC。你可以下载并使用labelImg标注工具对你的图片进行标注。https://tzutalin.github.io/labelImg/
你可以在参数设置中配置此节点。目前提供两种目标识别模型架构供选择。ssd MobileNet V2 和 Faster RCNN Inception V2。前者模型较后者更为轻量,训练和预测时对硬件要求更低,但准确度比后者更低。根据你的硬件配置设置训练时的batchSize。numSteps会影响模型训练的时间长度。numEvalSteps会影响模型评估的时间长度。
TF目标识别训练节点参数
训练结束后pb和pbtxt端子输出两个文件
-
frozen_inference_graph.pb:TensorFlow pb二进制模型文件,
-
label_map.pbtxt:文本文件,含分类标签信息。
TF目标识别预测(可视化)
此节点加载训练完的模型并对上传的test.zip中的图片进行预测、框出识别的物体。运行后可视化结果图片可以在右面板查看。
查看结果
test.zip为对所有需要预测图片打的一个zip包。你可以下载下列文件参考:https://suanpan-test.oss-cn-beijing.aliyuncs.com/sp_share/test.zip
可视化图片效果