下载
中文
注册

vcmax

功能说明

vcmax指令抽象。

计算输入的vector中的元素最大值。

接口原型

class vcmax(x, y, reduce_num)

参数说明

参数名

输入/输出

数据类型

说明

x

输入

tensor变量

输入x向量tensor,支持FP16、FP32。

y

输出

tensor变量

输出y向量tensor,支持FP16、FP32。

reduce_num

输入

int

指定最后一维reduce到多少倍,实测性能数据reduce对性能无影响。

约束说明

reduce_num不能为0。

使用示例

1
2
3
4
5
6
from mskpp import vcmax, Tensor
ub_x, ub_y = Tensor("UB"), Tensor("UB")
gm_x = Tensor("GM")
reduce_num = 16
ub_x.load(gm_x)
out = vcmax(ub_x, ub_y, reduce_num)()