FastDeploy

mirror of https://github.com/PaddlePaddle/FastDeploy.git synced 2026-04-24 01:29:57 +08:00

Files

T

History

zhupengyang 27b00cf385 [XPU] glm-4.5-air (#7071 )

2026-04-14 11:31:49 +08:00

2026-03-16 21:32:43 +08:00

__init__.py

[XPU] glm-4.5-air (#7071 )

2026-04-14 11:31:49 +08:00

block_wise_fp8.py

2026-04-13 00:01:53 -07:00

fp8_utils.py

2026-04-13 11:43:26 +08:00

kv_cache.py

…

mix_quant.py

…

mxfp4.py

2026-04-13 11:43:26 +08:00

nvfp4.py

2026-04-13 11:43:26 +08:00

quant_base.py

2026-04-03 15:43:19 +08:00

tensor_wise_fp8.py

…

w4a8.py

…

w4afp8.py

…

w8a8.py

…

weight_only.py

2026-03-18 10:31:00 +08:00

wfp8afp8.py

…

wint2.py

…