FP8 Basic - yiliu30/yi GitHub Wiki

scale and scale_inv

input_bf16 = input_fp8 * input_scale
input_fp8 = input_bf16 / input_scale = input_bf16 * input_scale_inv

In general, input_scale < 1.0.

input_scale = max(x) / 448.0