带landmark的数据准备 - SiYue0211/mtcnn_tf GitHub Wiki
带landmark的数据集准备
landmark的含义就是对人脸的两个眼睛(2个点),一个鼻子(2个点),一个嘴(2个点)共5个点进行标记,使用lfw_5590数据集和net_7876作为数据集生成PNet,RNet, ONet所需要的训练集
备注:PNet所需要的训练集图片大小为12*12
,RNet所需要的训练集图片大小为24*24
,ONet所需要的训练集图片大小为48*48
。带landmark的数据集都是正样本,不像PNet的box训练集分为正样本,负样本,忽略样本。
-
根据trainImageList.txt里的信息,将人脸crop下来并resize成不同网络所需要的训练集图片大小,计算当前landmark
-
数据增强
带有lfw,net数据集每张图片只有一个人脸标记,数据量有点小,数据增强可以帮助训练,防止过拟合
数据增强方式:
-
轻微调整人脸框,并确保和GT的IOU大于0.65
-
水平翻转人脸框,并调整landmark
-
旋转人脸框(顺时针and逆时针),并调整landmark
-
在数据增强之前每张图片只可以生成一个训练样本,数据增强后可以生成20个左右
-