[RL] support moe-topk use topk_reduce_func (#7218)

* support moe-topk use topk_reduce_func * fix ep error * fix ut * fix ut
2026-04-24 01:29:57 +08:00 · 2026-04-09 11:01:03 +08:00
parent 7005404ce3
commit 43ace7af25
7 changed files with 66 additions and 112 deletions
@@ -509,6 +509,7 @@ class EPRunner:
                    expert_in_rank_num_list=expert_in_rank_num_list,
                    tokens_per_expert_stats_list=tokens_per_expert_stats_list,
                    redundant_ep_rank_num_plus_one=layer.fd_config.eplb_config.redundant_experts_num + 1,
+                    topk_reduce_func=getattr(layer, "topk_reduce_func", None),
                )
            else:
                topk_idx, topk_weights = fastdeploy.model_executor.ops.gpu.moe_redundant_topk_select(
@@ -534,6 +535,7 @@ class EPRunner:
                    layer.routed_scaling_factor,
                    layer.gate_correction_bias,
                    getattr(layer, "renormalize", True),
+                    topk_reduce_func=getattr(layer, "topk_reduce_func", None),
                )
            else:
                topk_idx, topk_weights = fastdeploy.model_executor.ops.gpu.moe_topk_select(