此为对归约指令的通用格式,指令对当前迭代的相邻内对(elements)源操作数进行统一处理。注:这不是真正的指令。
instruction (mask, dst, src, repeat_times, dst_rep_stride, src_rep_stride)
参数名称 |
输入/输出 |
含义 |
---|---|---|
instruction |
输入 |
指令名称,TIK DSL中为全小写字符串。 |
mask |
输入 |
请参考表1中mask参数描述。 |
dst |
输出 |
目的操作数,tensor起始element。 Tensor的scope为Unified Buffer。 |
src |
输入 |
源操作数,tensor起始element。 Tensor的scope为Unified Buffer。 |
repeat_times |
输入 |
重复迭代次数 |
dst_rep_stride |
输入 |
相邻迭代间,目的操作数相同block地址步长。 |
src_rep_stride |
输入 |
相邻迭代间,源操作数相同block地址步长。 |
针对Atlas 200/300/500 推理产品,当dst_rep_stride传入0时,按照1处理。
针对Atlas 训练系列产品,当dst_rep_stride传入0时,按照1处理。