PADDLE_ENFORCE Rewriting Specification - PaddlePaddle/Paddle GitHub Wiki
规范概要:
- 第1节,本规范的背景,即为什么要改写
PADDLE_ENFORCE
。- 第2节,如何改写不合规的
PADDLE_ENFORCE
表达式(共9类),已加入CI监控- 第3节,当前不需要修改的
PADDLE_ENFORCE
表达式(共3类),届时请找 chenwhql(陈威行)或luotao1(骆涛) approve补充说明:
- 规范在执行过程中,可能会发现现有规范未考虑到的方面,需要在实施过程中不断补充与完善,也请大家积极反馈意见
- 后续会进一步对
PADDLE_THROW
表达式进行完善和监控
- 为什么不推荐
PADDLE_ENFORCE
表达式?-
PADDLE_ENFORCE(COND, ...)
表达式接收的是bool型表达式,只能判断true和false,不能给出具体错误提示。。 -
PADDLE_ENFORCE_GT(__VAL0, __VAL1, ...)
等表达式接收具体参数,并对应着具体比较条件,易于给出精准的错误信息。 -
如PADDLE_ENFORCE(A>B)
只能报true
和false
,但改成PADDLE_ENFORCE_GT(A, B)
,会报出A和B的具体值是什么。
-
- 为什么不靠加强报错信息来解决,非要改接口呢?
- 添加的详细报错信息是具体个人写的,写的好坏参差不齐,全凭自觉。每个审核人的标准也是不一样的,而且比较难注意到是否加详细的报错信息了。机器自动化报错要优先人工添加报错信息,会更加客观标准,因此优先改进。
- 如果靠几个特定审核人来Review的话,审核人会成为瓶颈。目前存量不合规代码有2700条。
注意:为了描述更加简单,以下示例只针对表达式进行修改,报错信息文案修改请参考Paddle报错信息文案书写规范。
2.1 使用PADDLE_ENFORCE_EQ/NE/GT/GE/LT/LE
表达式
// 判断是否true
PADDLE_ENFORCE(ctx->HasInput("X")); // 修改前
PADDLE_ENFORCE_EQ(ctx->HasInput("X"), true); //修改后
// 判断是否相等
PADDLE_ENFORCE(input_num == 1); //修改前
PADDLE_ENFORCE_EQ(input_num, 1UL); //修改后
// 判断是否不相等
PADDLE_ENFORCE(output_name_map.count(name) != 0); //修改前
PADDLE_ENFORCE_NE(output_name_map.count(name), 0UL); //修改后
// 判断是否大于
PADDLE_ENFORCE(h_inter_ctxs_.size() > 0); //修改前
PADDLE_ENFORCE_GT(h_inter_ctxs_.size(), 0UL); //修改后
// 判断是否大于等于
PADDLE_ENFORCE(run_order_ >= 0); //修改前
PADDLE_ENFORCE_GE(run_order_, 0UL); //修改后
// 判断是否小于
PADDLE_ENFORCE(cur_loc < 64); //修改前
PADDLE_ENFORCE_LT(cur_loc, 64UL); //修改后
// 判断是否小于等于
PADDLE_ENFORCE(part_height <= trans_dims[2]); //修改前
PADDLE_ENFORCE_LE(part_height, trans_dims[2]); //修改后
2.2 使用PADDLE_ENFORCE_NOT_NULL
表达式
// 判断是否空指针
PADDLE_ENFORCE(scope_ptr); //修改前
PADDLE_ENFORCE_NOT_NULL(scope_ptr); //修改后
2.3 CUDA相关接口请使用PADDLE_ENFORCE_CUDA_SUCCESS
表达式
PADDLE_ENFORCE(dynload::cublasCreate(&handle_)); //修改前
PADDLE_ENFORCE_CUDA_SUCCESS(dynload::cublasCreate(&handle_)); // 修改后
2.4 不允许含有&&
,即对子表达式需要分别进行报错
// 简单&&表达式
PADDLE_ENFORCE(bit_length >= 1 && bit_length <= 16); //修改前
PADDLE_ENFORCE_GE(bit_length, 1UL); //修改后
PADDLE_ENFORCE_LE(bit_length, 16UL);
// 复杂&&表达式
PADDLE_ENFORCE(((start < end) && (step > 0)) || ((start > end) && (step < 0))); //修改前
// 修改后
if(step > 0) PADDLE_ENFORCE_LT(start, end);
elseif(step < 0) PADDLE_ENFORCE_GT(start, end);
3.1 表达式中含有||
,如
PADDLE_ENFORCE(input->dims().size() == 4 || input->dims().size() == 5);
PADDLE_ENFORCE(is_train || !is_backward);
PADDLE_ENFORCE(v < 0 || v >= 1);
PADDLE_ENFORCE((lbl >= 0 && lbl < axis_dim) || lbl == ignore_index);
PADDLE_ENFORCE(!fuse_residual_conn || !force_fp32_output);
PADDLE_ENFORCE(op_desc.type() != kFeedOpType || expect_feed);
3.2 特殊处理的cuda error,如paddle/fluid/memory/detail/system_allocator.cc
中
// Purposefully allow cudaErrorCudartUnloading, because
// that is returned if you ever call cudaFreeHost after the
// driver has already shutdown. This happens only if the
// process is terminating, in which case we don't care if
// cudaFreeHost succeeds.
if (err != cudaErrorCudartUnloading) {
PADDLE_ENFORCE(err, "cudaFreeHost failed in GPUPinnedAllocator::Free.");
}
3.3 GPU内核函数中的报错
注意:
- GPU内核函数在
.cu
文件中,但并不是所有.cu
文件中的都是GPU内核函数。只有使用__global__
,HOSTDEVICE
等关键字装饰的函数才是。- 如下的
paddle/fluid/operators/center_loss_op.cu
例子,只说明PADDLE_ENFORCE表达式不需要修改,但文案修改请参考Paddle报错信息文案书写规范
__global__ void ComputeDifferent(T *centers_diff, const T *X, const T *centers,
const int64_t *ids, const int64_t N,
const int64_t K, const int64_t D) {
int idx = threadIdx.x;
int idy = blockIdx.x + threadIdx.y * GridDimX;
while (idy < K) {
int64_t id = ids[idy];
PADDLE_ENFORCE(id >= 0, "received id:", id);
PADDLE_ENFORCE(id < N, "received id:", id);
T *out = centers_diff + idy * D;
const T *x = X + idy * D;
const T *cent = centers + id * D;
for (int i = idx; i < D; i += BlockDimX) {
out[i] = x[i] - cent[i];
}
idy += BlockDimY * GridDimX;
}
}