torch_npu.npu_moe_finalize_routing

功能描述

接口原型

npu_moe_finalize_routing(Tensor expanded_permuted_rows, Tensor? skip1, Tensor? skip2, Tensor? bias, Tensor? scales, Tensor expanded_src_to_dst_row, Tensor? export_for_source_row, int? drop_pad_mode=0) -> Tensor

参数说明

输出说明

out:Device侧的Tensor类型,最后处理合并MoE FFN的输出结果。

约束说明

支持的型号

Atlas A2 训练系列产品/Atlas 800I A2 推理产品

调用示例