算盘文档 目标识别 - xuelang-group/suanpan-docs GitHub Wiki

算盘文档目标识别模板(TensorFlow)使用-更新记录

日期 版本 更新人 备注
2019/7/5 V0.1 张程伟 算盘文档目标识别模板(TensorFlow)使用最初版本。

算盘文档目标识别模板(TensorFlow)使用

模板ID:4206

算盘文档目标识别模板(TensorFlow)

目标识别模板(TensorFlow),用于定位图片中的物体。建议在配置过GPU加速的机器上运行。如果您只能在CPU机器上运行,训练将消耗较长时间,且建议您给训练节点分配尽量多的资源,操作如下。

分配资源

目标识别节点底层使用TensorFlow Object Detection API。

节点使用介绍

TF目标识别训练

接收上传的data.zip训练数据压缩包文件训练目标识别模型。

关于data.zip文件,你可以下载下列文件并参考:https://suanpan-test.oss-cn-beijing.aliyuncs.com/sp_share/data.zip

压缩前文件结构如下,压缩前建议将您的图片大小做适当的压缩并归一化,比如归一化为800 * 600 的图片以减小上传文件的时间。

data
└── images
├── test
│   ├── 10.jpg
│   ├── 10.xml
│   ├── 15.jpg
│   └── 15.xml
└── train
├── 0.jpg
├── 0.xml
├── 1.jpg
├── 1.xml
├── ....
├── 22.jpg
└── 22.xml

xml文件为标注文件,标注格式为Pascal VOC。你可以下载并使用labelImg标注工具对你的图片进行标注。https://tzutalin.github.io/labelImg/

你可以在参数设置中配置此节点。目前提供两种目标识别模型架构供选择。ssd MobileNet V2 和 Faster RCNN Inception V2。前者模型较后者更为轻量,训练和预测时对硬件要求更低,但准确度比后者更低。根据你的硬件配置设置训练时的batchSize。numSteps会影响模型训练的时间长度。numEvalSteps会影响模型评估的时间长度。

TF目标识别训练节点参数

训练结束后pb和pbtxt端子输出两个文件

  • frozen_inference_graph.pb:TensorFlow pb二进制模型文件,

  • label_map.pbtxt:文本文件,含分类标签信息。

TF目标识别预测(可视化)

此节点加载训练完的模型并对上传的test.zip中的图片进行预测、框出识别的物体。运行后可视化结果图片可以在右面板查看。

查看结果

test.zip为对所有需要预测图片打的一个zip包。你可以下载下列文件参考:https://suanpan-test.oss-cn-beijing.aliyuncs.com/sp_share/test.zip

可视化图片效果