vec_trans

功能说明

对连续的16*16的二维矩阵数据块进行转置,通过repeat_times参数指定转置操作的次数。每个迭代内操作256个连续地址空间数据,不同迭代间地址可以不连续,不同迭代间的空间间隔通过dst_rep_stride 和src_rep_stride参数指定。

函数原型

vec_trans(dst, src, repeat_times, dst_rep_stride, src_rep_stride)

参数说明

参数名称

输入/输出

含义

dst

输出

目的操作数,保存转置结果,支持的数据类型为Tensor(int16/uint16/float16)。

Tensor的scope为Unified Buffer

src

输入

源操作数,支持的数据类型为Tensor(int16/uint16/float16)。

Tensor的scope为Unified Buffer

repeat_times

输入

迭代次数,支持的数据类型为Scalar(int/uint)、立即数(int)、Expr(int/uint),取值范围[1, 4095]。

dst_rep_stride

输入

相邻两次迭代之间dst地址间隔,单位为16 * block_size大小,支持的数据类型为:Scalar(int/uint)、立即数(int)、Expr(int/uint), 范围:[0,4095]

src_rep_stride

输入

相邻两次迭代之间src地址间隔,单位为512B,支持的数据类型为Scalar(int/uint)、立即数(int)、Expr(int/uint),范围:[0,4095]

支持的型号

Atlas 200/300/500 推理产品

Atlas 训练系列产品

Atlas推理系列产品AI Core

Atlas推理系列产品Vector Core

Atlas A2训练系列产品

Atlas 200I/500 A2推理产品

AS31XM1X AI处理器

注意事项

返回值

调用示例