FastDeploy

mirror of https://github.com/PaddlePaddle/FastDeploy.git synced 2026-04-23 08:21:53 +08:00

Files

T

lizhenyun01 2be8656c29 [BugFix] fix mtp split kv attetion (#5920 )

* [BugFix] fix mtp split kv attetion

* clean code

* clean code

2026-01-07 04:07:31 -08:00

FA3 support qwen3 (#5441 )

2025-12-09 16:16:16 +08:00

__init__.py

…

append_attn_backend.py

2026-01-07 04:07:31 -08:00

attention_selecter.py

…

attention.py

2025-12-18 14:31:54 +08:00

base_attention_backend.py

…

block_multihead_attn_backend.py

…

flash_attn_backend.py

FA3 support qwen3 (#5441 )

2025-12-09 16:16:16 +08:00

flash_mask_attn_backend.py

2025-12-26 14:31:35 +08:00

iluvatar_attn_backend.py

2025-12-18 02:14:25 -08:00

mla_attention_backend.py

…

moba_attention_backend.py

…

native_paddle_backend.py

…

utils.py

…

xpu_attn_backend.py

2025-12-12 14:30:09 +08:00