带landmark的数据准备 - SiYue0211/mtcnn_tf GitHub Wiki

带landmark的数据集准备

landmark的含义就是对人脸的两个眼睛(2个点),一个鼻子(2个点),一个嘴(2个点)共5个点进行标记,使用lfw_5590数据集和net_7876作为数据集生成PNet,RNet, ONet所需要的训练集

备注:PNet所需要的训练集图片大小为12*12,RNet所需要的训练集图片大小为24*24,ONet所需要的训练集图片大小为48*48。带landmark的数据集都是正样本,不像PNet的box训练集分为正样本,负样本,忽略样本。

  • 根据trainImageList.txt里的信息,将人脸crop下来并resize成不同网络所需要的训练集图片大小,计算当前landmark

  • 数据增强

    带有lfw,net数据集每张图片只有一个人脸标记,数据量有点小,数据增强可以帮助训练,防止过拟合

    数据增强方式:

    1. 轻微调整人脸框,并确保和GT的IOU大于0.65

    2. 水平翻转人脸框,并调整landmark

    3. 旋转人脸框(顺时针and逆时针),并调整landmark

    4. 在数据增强之前每张图片只可以生成一个训练样本,数据增强后可以生成20个左右