aclblasGemvEx

函数功能

执行矩阵-向量的乘法,y = αAx + βy,输入数据、输出数据的数据类型通过入参设置,异步接口。

约束说明

A、x、y的数据类型支持仅支持以下组合, α和β的数据类型与y一致。

A的数据类型

x的数据类型

y的数据类型

aclFloat16

aclFloat16

aclFloat16

aclFloat16

aclFloat16

float(float32)

int8_t

int8_t

float(float32)

int8_t

int8_t

int32_t

函数原型

aclError aclblasGemvEx(aclTransType transA,

int m,

int n,

const void *alpha,

const void *a,

int lda,

aclDataType dataTypeA,

const void *x,

int incx,

aclDataType dataTypeX,

const void *beta,

void *y,

int incy,

aclDataType dataTypeY,

aclComputeType type,

aclrtStream stream);

参数说明

参数名

输入/输出

说明

transA

输入

A矩阵是否转置的标记。

m

输入

矩阵A的行数,存储矩阵乘数据时,行优先。

n

输入

矩阵A的列数。

alpha

输入

用于执行乘操作的标量α的指针。

a

输入

矩阵A的指针。

lda

输入

A矩阵的主维,此时选择转置,按行优先,则lda为A的列数。预留参数,当前只能设置为-1。

dataTypeA

输入

矩阵A的数据类型。

x

输入

向量x的指针。

incx

输入

x连续元素之间的步长。

预留参数,当前只能设置为-1。

dataTypeX

输入

向量x的数据类型。

beta

输入

用于执行乘操作的标量β的指针。

y

输入&输出

向量y的指针。

incy

输入

y连续元素之间的步长。

预留参数,当前只能设置为-1。

dataTypeY

输入

向量y的数据类型。

type

输入

计算精度,默认高精度。

stream

输入

执行算子所在的Stream。

返回值说明

返回0表示成功,返回其它值表示失败。

参考资源

接口调用流程,参见单算子调用流程