自定义数据集 - bobo0810/Classification GitHub Wiki
分类任务
一.原始目录结构
假设图像根路径为/home/xxx/CatDog/
,格式如下
├── cat
├── cat_x.jpg
├── cat_y.jpg
├── ....
├── dog
├── dog_x.jpg
├── dog_y.jpg
├── ....
二.划分数据集
默认Config/
下生成dataset.txt。
python ./ExtraTools/build_dataset.py --ImgsPath=/home/xxx/CatDog/
- ImgsPath 数据集根路径
- Ratio 训练集:验证集:测试集的各类别划分比例,默认"0.7,0.1,0.2"
- Verify 验证图像完整性(耗时,可选)
- TxtPath 保存路径
三. 训练格式
dataset.txt 格式为[类型,类别名,图像路径]
train, dog, /xxxx/img1.jpg
val, cat, /xxxx/img2.jpg
test, cat, /xxxx/img3.jpg