torch_npu.npu_moe_gating_top_k_softmax

功能描述

MoE计算中,对输入x做Softmax计算,再做topk操作。

接口原型

npu_moe_gating_top_k_softmax(Tensor x, Tensor? finished=None, int k=1) -> (Tensor, Tensor, Tensor)

参数说明

输出说明

约束说明

支持的型号

Atlas A2 训练系列产品/Atlas 800I A2 推理产品

调用示例