FP8 Basic - yiliu30/yi GitHub Wiki
scale
and scale_inv
input_bf16 = input_fp8 * input_scale
input_fp8 = input_bf16 / input_scale = input_bf16 * input_scale_inv
In general, input_scale
< 1.0.
input_scale = max(x) / 448.0
scale
and scale_inv
input_bf16 = input_fp8 * input_scale
input_fp8 = input_bf16 / input_scale = input_bf16 * input_scale_inv
In general, input_scale
< 1.0.
input_scale = max(x) / 448.0