执行矩阵-矩阵的乘法,C = αAB + βC,输入数据的数据类型为int8_t,输出数据的数据类型为int32_t,异步接口:
aclError aclblasS8gemm(aclTransType transA,
aclTransType transB,
aclTransType transC,
int m,
int n,
int k,
const int32_t *alpha,
const int8_t *matrixA,
int lda,
const int8_t *matrixB,
int ldb,
const int32_t *beta,
int32_t *matrixC,
int ldc,
aclComputeType type,
aclrtStream stream)
参数名 |
输入/输出 |
说明 |
---|---|---|
transA |
输入 |
A矩阵是否转置的标记。 |
transB |
输入 |
B矩阵是否转置的标记。 |
transC |
输入 |
C矩阵的标记,当前仅支持ACL_TRANS_N。 |
m |
输入 |
矩阵A的行数与矩阵C的行数。 |
n |
输入 |
矩阵B的列数与矩阵C的列数。 |
k |
输入 |
矩阵A的列数与矩阵B的行数。 |
alpha |
输入 |
用于执行乘操作的标量α的指针。 |
matrixA |
输入 |
矩阵A的指针。 |
lda |
输入 |
A矩阵的主维,此时选择转置,按行优先,则lda为A的列数。预留参数,当前只能设置为-1。 |
matrixB |
输入 |
矩阵B的指针。 |
ldb |
输入 |
B矩阵的主维,此时选择转置,按行优先,则ldb为B的列数。预留参数,当前只能设置为-1。 |
beta |
输入 |
用于执行乘操作的标量β的指针。 |
matrixC |
输入&输出 |
矩阵C的指针。 |
ldc |
输入 |
C矩阵的主维,预留参数,当前只能设置为-1。 |
type |
输入 |
计算精度,默认高精度。 |
stream |
输入 |
执行算子所在的Stream。 |
返回0表示成功,返回其它值表示失败。
接口调用流程,参见单算子调用流程。