下载
中文
注册

函数:gemv_ex

C函数原型

aclError aclblasGemvEx(aclTransType transA,

int m,

int n,

const void *alpha,

const void *a,

int lda,

aclDataType dataTypeA,

const void *x,

int incx,

aclDataType dataTypeX,

const void *beta,

void *y,

int incy,

aclDataType dataTypeY,

aclComputeType type,

aclrtStream stream);

Python函数

ret = acl.blas.gemv_ex(trans_a, m, n,alpha, a, lda, data_type_a, x, incx, data_type_x, beta, y, incy, data_type_y, type, stream )

函数功能

执行矩阵-向量的乘法,y = αAx + βy,输入数据、输出数据的数据类型通过入参设置,异步接口。

输入说明

trans_a:int,矩阵A是否转置的标记。

m:int,矩阵A的行数,存储矩阵乘数据时,行优先。

n:int,矩阵A的列数。

alpha:int, 用于执行乘操作的标量alpha数据指针地址。

a:int,矩阵A的数据指针地址。

lda:int,A矩阵的主位,此时选择转置,按行优先,则lda为A的列数。预留参数,当前只能设置为-1。

data_type_a:int,矩阵A的数据类型。

x:int,向量x的数据指针地址。

incx:int,x连续元素之间的步长。预留参数,当前只能设置为-1。

data_type_x:int,向量x的数据类型。

beta:int,用于执行乘操作的标量beta的数据指针地址。

y:int,向量y的数据指针地址。

incy:int,y连续元素之间的步长。预留参数,当前只能设置为-1。

data_type_y:int,向量y的数据类型。

type:int,计算精度,默认高精度。

stream:int,执行算子所在的Stream。

返回值说明

ret:int,错误码。

  • 返回0表示成功。
  • 返回其它值表示失败。

约束说明

A、x、y的数据类型支持仅支持以下组合, α和β的数据类型与y一致。

A的数据类型 x的数据类型 y的数据类型

aclFloat16 aclFloat16 aclFloat16

aclFloat16 aclFloat16 float(float32)

int8_t int8_t float(float32)

int8_t int8_t int32_t

参考资源

接口调用流程,参见接口调用流程