函数：gemm_ex

C函数原型	aclError aclblasGemmEx(aclTransType transA, aclTransType transB, aclTransType transC, int m, int n, int k, *const void alpha, const void matrixA,* int lda, aclDataType dataTypeA, *const void matrixB, int ldb, aclDataType dataTypeB, const void beta,* *void matrixC, int ldc, aclDataType dataTypeC, aclComputeType type, aclrtStream stream)**
Python函数	ret = acl.blas.gemm_ex(trans_a, trans_b, trans_c, m, n, k, alpha, matrix_a, lda, data_type_a, matrix_b, ldb, data_type_b, beta, matrix_c, ldc, data_type_c, type, stream)
函数功能	执行矩阵-矩阵的乘法，C = αAB + βC，输入数据、输出数据的数据类型通过入参设置，异步接口。
输入说明	trans_a：int，矩阵A是否转置的标记。 trans_b：int，B矩阵是否转置的标记。 trans_c：int，C矩阵的标记，当前仅支持aclTrans_N。 m：int，矩阵A的行数与矩阵C的行数。 n：int，矩阵B的列数与矩阵C的列数。 k：int，矩阵A的列数与矩阵B的行数。 alpha：int，用于执行乘操作的标量alpha数据指针地址。 matrix_a：int，矩阵A的数据指针地址。 lda：int，A矩阵的主维，此时选择转置，按行优先，则lda为A的列数。预留参数，当前只能设置为-1。 data_type_a：int，矩阵A的数据类型。 matrix_b：int，矩阵B的数据指针地址。 ldb：int，B矩阵的主维，此时选择转置，按行优先，则ldb为B的列数。预留参数，当前只能设置为-1。 data_type_b：int，矩阵B的数据类型。 beta：int，用于执行乘操作的标量beta的数据指针地址。 matrix_c：int，矩阵C的数据指针地址。 ldc：int，C矩阵的主维。预留参数，当前只能设置为-1。 data_type_c：int，矩阵C的数据类型。 type：int，计算精度。 stream：int，执行算子所在的Stream。
返回值说明	ret：int，错误码。返回0表示成功。返回其它值表示失败。
约束说明	A、B、C的数据类型支持仅支持以下组合， α和β的数据类型与C一致。 A的数据类型 x的数据类型 y的数据类型 aclFloat16 aclFloat16 aclFloat16 aclFloat16 aclFloat16 float(float32) int8_t int8_t float(float32) int8_t int8_t int32_t
参考资源	接口调用流程、示例，参见接口调用流程。

父主题： CBLAS接口（blas）