接口原型

torch_npu.contrib.function.matmul_transpose(tensor1, tensor2):

功能描述

使用NPU自定义算子替换原生写法，以提高性能。

参数说明

tensor1 (Tensor) - 第一个要乘的张量。
tensor2 (Tensor) - 第二个要乘的张量。

输出说明

Tensor - 输出张量。

约束说明

在动态shape场景中，由于算子限制，不支持Box transformation deltas。

支持的型号

Atlas 训练系列产品
Atlas A2 训练系列产品
Atlas A3 训练系列产品
Atlas 推理系列产品

调用示例

>>> from torch_npu.contrib.function import matmul_transpose
>>> tensor1 = torch.randn(68, 5, 75, 16).npu()
>>> tensor1.requires_grad = True
>>> tensor2 = torch.randn(68, 5, 75, 16).npu()
>>> tensor2.requires_grad = True
>>> output = matmul_transpose(tensor1, tensor2)
>>> output.sum().backward()

（beta）torch_npu.contrib.function.matmul_transpose

接口原型

功能描述

参数说明

输出说明

约束说明

支持的型号

调用示例