下载
中文
注册

函数:gemm_ex

C函数原型

aclError aclblasGemmEx(aclTransType transA,

aclTransType transB,

aclTransType transC,

int m,

int n,

int k,

const void *alpha,

const void *matrixA,

int lda,

aclDataType dataTypeA,

const void *matrixB,

int ldb,

aclDataType dataTypeB,

const void *beta,

void *matrixC,

int ldc,

aclDataType dataTypeC,

aclComputeType type,

aclrtStream stream)

Python函数

ret = acl.blas.gemm_ex(trans_a, trans_b, trans_c,

m, n, k,

alpha, matrix_a, lda, data_type_a,

matrix_b, ldb, data_type_b,

beta, matrix_c, ldc, data_type_c,

type, stream)

函数功能

执行矩阵-矩阵的乘法,C = αAB + βC,输入数据、输出数据的数据类型通过入参设置,异步接口。

输入说明

trans_a:int,矩阵A是否转置的标记。

trans_b:int,B矩阵是否转置的标记。

trans_c:int,C矩阵的标记,当前仅支持aclTrans_N。

m:int,矩阵A的行数与矩阵C的行数。

n:int,矩阵B的列数与矩阵C的列数。

k:int,矩阵A的列数与矩阵B的行数。

alpha:int, 用于执行乘操作的标量alpha数据指针地址。

matrix_a:int,矩阵A的数据指针地址。

lda:int,A矩阵的主维,此时选择转置,按行优先,则lda为A的列数。预留参数,当前只能设置为-1。

data_type_a:int,矩阵A的数据类型。

matrix_b:int,矩阵B的数据指针地址。

ldb:int,B矩阵的主维,此时选择转置,按行优先,则ldb为B的列数。预留参数,当前只能设置为-1。

data_type_b:int,矩阵B的数据类型。

beta:int,用于执行乘操作的标量beta的数据指针地址。

matrix_c:int,矩阵C的数据指针地址。

ldc:int,C矩阵的主维。预留参数,当前只能设置为-1。

data_type_c:int,矩阵C的数据类型。

type:int,计算精度。

stream:int,执行算子所在的Stream。

返回值说明

ret:int,错误码。

  • 返回0表示成功。
  • 返回其它值表示失败。

约束说明

A、B、C的数据类型支持仅支持以下组合, α和β的数据类型与C一致。

A的数据类型 x的数据类型 y的数据类型

aclFloat16 aclFloat16 aclFloat16

aclFloat16 aclFloat16 float(float32)

int8_t int8_t float(float32)

int8_t int8_t int32_t

参考资源

接口调用流程、示例,参见接口调用流程