[Others] support import deepgemm/deepep from fleet ops (#6351)

* update paddleformers to v1.0 * only change import fleetpath
2026-04-23 00:17:25 +08:00 · 2026-02-09 11:53:13 +08:00
parent 74762b0fb2
commit 9bcd863902
4 changed files with 46 additions and 33 deletions
@@ -23,6 +23,7 @@ from paddle import Tensor, nn
 from paddle.framework import in_dynamic_mode
 from scipy.linalg import block_diag

+import fastdeploy
 from fastdeploy.config import FDConfig
 from fastdeploy.platforms import current_platform

@@ -254,10 +255,7 @@ def per_block_cast_to_fp8(x: Tensor, block_size: list = [128, 128]) -> Tuple[Ten
    Only used in deep_gemm block wise quant weight.
    copy from FastDeploy/custom_ops/gpu_ops/fp8_deep_gemm/tests/test_core.py.
    """
-    try:
-        from deep_gemm import ceil_div
-    except ModuleNotFoundError:
-        from fastdeploy.model_executor.ops.gpu.deep_gemm import ceil_div
+    ceil_div = fastdeploy.model_executor.layers.quantization.fp8_utils.deep_gemm.ceil_div

    assert x.dim() == 2
    m, n = x.shape