函数:s8gemm
C函数原型 |
aclError aclblasS8gemm(aclTransType transA, aclTransType transB, aclTransType transC, int m, int n, int k, const int32_t *alpha, const int8_t *matrixA, int lda, const int8_t *matrixB, int ldb, const int32_t *beta, int32_t *matrixC, int ldc, aclComputeType type, aclrtStream stream) |
---|---|
Python函数 |
ret = acl.blas.s8gemm(trans_a, trans_b, trans_c, m, n, k, alpha, matrix_a, lda, matrix_b, ldb, beta, matrix_c, ldc, type, stream) |
函数功能 |
执行矩阵-矩阵的乘法,C = αAB + βC,输入数据的数据类型为int8_t,输出数据的数据类型为int32_t,异步接口。 |
输入说明 |
trans_a:int,矩阵A是否转置的标记。 trans_b:int,B矩阵是否转置的标记。 trans_c:int,C矩阵的标记,当前仅支持aclTrans_N。 m:int,矩阵A的行数与矩阵C的行数。 n:int,矩阵B的列数与矩阵C的列数。 k:int,矩阵A的列数与矩阵B的行数。 alpha:int, 用于执行乘操作的标量alpha数据指针地址。 matrix_a:int,矩阵A的数据指针地址。 lda:int,A矩阵的主维,此时选择转置,按行优先,则lda为A的列数。 matrix_b:int,矩阵B的数据指针地址。 ldb:int,B矩阵的主维,此时选择转置,按行优先,则leading dimension为B的列数。 beta:int,用于执行乘操作的标量beta的数据指针地址。 matrix_c:int,矩阵C的数据指针地址。 ldc:int,C矩阵的主维,当前预留。 type:int,计算精度。 stream:int,执行算子所在的Stream。 |
返回值说明 |
ret:int,错误码。
|
约束说明 |
无 |
参考资源 |
接口调用流程,参见接口调用流程。 |