aclblasGemmEx

执行矩阵-矩阵的乘法，C = αAB + βC，输入数据、输出数据的数据类型通过入参设置，异步接口：

A、B、C的数据类型支持仅支持以下组合， α和β的数据类型与C一致。

aclError aclblasGemmEx(aclTransType transA,

aclTransType transB,

aclTransType transC,

int m,

int n,

int k,

const void *alpha,

const void *matrixA,

int lda,

aclDataType dataTypeA,

const void *matrixB,

int ldb,

aclDataType dataTypeB,

const void *beta,

void *matrixC,

int ldc,

aclDataType dataTypeC,

aclComputeType type,

aclrtStream stream)

参数名	输入/输出	说明
transA	输入	A矩阵是否转置的标记。
transB	输入	B矩阵是否转置的标记。
transC	输入	C矩阵的标记，当前仅支持ACL_TRANS_N。
m	输入	矩阵A的行数与矩阵C的行数。
n	输入	矩阵B的列数与矩阵C的列数。
k	输入	矩阵A的列数与矩阵B的行数。
alpha	输入	用于执行乘操作的标量α的指针。
matrixA	输入	矩阵A的指针。
lda	输入	A矩阵的主维，此时选择转置，按行优先，则lda为A的列数。预留参数，当前只能设置为-1。
dataTypeA	输入	矩阵A的数据类型。
matrixB	输入	矩阵B的指针。
ldb	输入	B矩阵的主维，此时选择转置，按行优先，则ldb为B的列数。预留参数，当前只能设置为-1。
dataTypeB	输入	矩阵B的数据类型。
beta	输入	用于执行乘操作的标量β的指针。
matrixC	输入&输出	矩阵C的指针。
ldc	输入	C矩阵的主维，预留参数，当前只能设置为-1。
dataTypeC	输入	矩阵C的数据类型。
type	输入	计算精度，默认高精度。
stream	输入	执行算子所在的Stream。

返回0表示成功，返回其它值表示失败。

接口调用流程，参见单算子调用流程。

父主题： CBLAS接口