[output issue] found mistakes in llama-3-70b output by bf16_int4 during benchmark #413

intelyoungway · 2024-05-21T08:08:36Z

weights: Meta-Llama-3-70B-Instruct
precision: bf16_int4 (v.s. bf16)
version: 1.6.0
hardware: 2S-SPR9468 (Quadrant/Flat)
system: Ubuntu22.04LTS container (latest XFT image)
kernel: 5.17.3
command:

bf16 precision:

bash run_benchmark.sh -m llama-3-70b -d bf16 -s 2 -bs 1 -in 1024 -out 128 -i 1

bf16_int4:

bash run_benchmark.sh -m llama-3-70b -d bf16_int4 -s 2 -bs 1 -in 1024 -out 128 -i 1

issue:

on bf16 precision, output is valid:

on bf16_int4 precision, output is invalid:

pujiang2018 · 2024-05-23T02:49:11Z

new quantization mechanism is under design, need some time to make the potential fix.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[output issue] found mistakes in llama-3-70b output by bf16_int4 during benchmark #413

[output issue] found mistakes in llama-3-70b output by bf16_int4 during benchmark #413

intelyoungway commented May 21, 2024

pujiang2018 commented May 23, 2024

[output issue] found mistakes in llama-3-70b output by bf16_int4 during benchmark #413

[output issue] found mistakes in llama-3-70b output by bf16_int4 during benchmark #413

Comments

intelyoungway commented May 21, 2024

pujiang2018 commented May 23, 2024