FastDeploy/custom_ops/gpu_ops/mla_attn at a1fc4e249e0f118dfabe51ba2ba907ca4703ec0a - FastDeploy - 子说镜像小站

apps/FastDeploy

mirror of https://github.com/PaddlePaddle/FastDeploy.git synced 2026-04-23 08:21:53 +08:00

Files

T

History

周周周 83ae59431e [BugFix] fix BatchMLAWithPagedKVCacheKernel O_tmp (#5895 )

2026-01-06 15:39:06 +08:00

..

attention_updater.cuh

[Sync] Update to latest code (#2679 )

2025-07-03 15:43:53 +08:00

batch_mla_with_paged_kv_cache.cu

[BugFix] fix BatchMLAWithPagedKVCacheKernel O_tmp (#5895 )

2026-01-06 15:39:06 +08:00

batch_mla_with_paged_kv_cache.h

【Inference Optimize】DeepSeek-V3-model MLA Optimize (#3886 )

2025-09-11 10:46:09 +08:00

epilogue.cuh

[Sync] Update to latest code (#2679 )

2025-07-03 15:43:53 +08:00

kernel_traits.cuh

[Sync] Update to latest code (#2679 )

2025-07-03 15:43:53 +08:00

mainloop_load.cuh

【Inference Optimize】DeepSeek-V3-model MLA Optimize (#3886 )

2025-09-11 10:46:09 +08:00

mainloop_mma.cuh

【Inference Optimize】DeepSeek-V3-model MLA Optimize (#3886 )

2025-09-11 10:46:09 +08:00

mla_hopper.cuh

[PD Disaggregation] Support PD deployment of DeepSeekv3. (#5251 )

2025-12-02 14:11:50 +08:00

named_barrier.cuh

[Sync] Update to latest code (#2679 )

2025-07-03 15:43:53 +08:00

utils.cuh

【Inference Optimize】DeepSeek-V3-model MLA Optimize (#3886 )

2025-09-11 10:46:09 +08:00