SetTensorA

功能说明

设置矩阵乘的左矩阵A。

函数原型

__aicore__ inline void SetTensorA(const GlobalTensor<SrcAT>& gm, bool isTransposeA = false)

__aicore__ inline void SetTensorA(const LocalTensor<SrcAT>& leftMatrix, bool isTransposeA = false)

__aicore__ inline void SetTensorA(SrcAT aScalar)

Atlas推理系列产品AI Core不支持SetTensorA(SrcAT aScalar)接口原型。

Atlas 200/500 A2推理产品，不支持SetTensorA(SrcAT aScalar)接口原型。

参数说明

表1 参数说明
参数名	输入/输出	描述
gm	输入	A矩阵在Global Memory上的首地址。 Atlas A2训练系列产品/Atlas 800I A2推理产品，支持的数据类型为：half/float/bfloat16_t/int8_t/int4b_t Atlas推理系列产品AI Core，支持的数据类型为：half/float/int8_t Atlas 200/500 A2推理产品，支持的数据类型为：half/float/bfloat16_t/int8_t
leftMatrix	输入	A矩阵在TSCM上的首地址或者在VECOUT上的首地址。 Atlas A2训练系列产品/Atlas 800I A2推理产品，支持的数据类型为：half/float/bfloat16_t/int8_t/int4b_t Atlas推理系列产品AI Core，支持的数据类型为：half/float/int8_t Atlas 200/500 A2推理产品，支持的数据类型为：half/float/bfloat16_t/int8_t 若设置TSCM首地址，默认矩阵可全载，已经位于TSCM，Iterate接口无需再进行GM->A1/B1搬运。
aScalar	输入	A矩阵中设置的值。支持传入标量数据，标量数据会被扩展为一个形状为[1, K]的tensor参与矩阵乘计算，tensor的数值均为该标量值。例如，开发者可以通过将aScalar设置为1来实现矩阵B在K方向的reduce sum操作。 Atlas A2训练系列产品/Atlas 800I A2推理产品，支持的数据类型为：half/float Atlas推理系列产品AI Core不支持该参数。 Atlas 200/500 A2推理产品不支持该参数。
isTransposeA	输入	A矩阵是否需要转置。注意：若A矩阵MatmulType ISTRANS参数设置为true，此参数可以为true也可以为false，即运行时可以转置和非转置交替使用；若A矩阵MatmulType ISTRANS参数设置为false，此参数只能设置为false，若强行设置为true，精度会有异常。 Atlas推理系列产品AI Core，A矩阵为int8_t数据类型时不支持转置，即不支持该参数设置为true。 Atlas A2训练系列产品/Atlas 800I A2推理产品，A矩阵为int4b_t数据类型时不支持转置，即不支持该参数设置为true。

返回值

无

支持的型号

Atlas A2训练系列产品/Atlas 800I A2推理产品

Atlas推理系列产品AI Core

Atlas 200/500 A2推理产品

注意事项

传入的TensorA地址空间大小需要保证不小于singleM * singleK。

调用示例

REGIST_MATMUL_OBJ(&pipe, GetSysWorkSpacePtr(), mm, &tiling);
mm.SetTensorA(gm_a);    // 设置左矩阵A
mm.SetTensorB(gm_b);
mm.SetBias(gm_bias);
mm.IterateAll(gm_c);

父主题： Matmul