ScaleAdd

Tensor类的张量缩放加法运算（即dst=src1 * scale + src2），支持float16、float32、uint8。支持异步调用。不支持inplace操作。

当前支持Atlas 推理系列产品和Atlas 200I/500 A2 推理产品。

在Atlas 200I/500 A2 推理产品上，支持预加载（预加载时需要添加attr属性，示例请参见“初始化算子预加载文件实例”章节）。

使用时需满足以下条件：

接口中输入输出Tensor必须在Device或DVPP侧且各参数（stream及数据内存）需位于同一Device中。
同步场景下，数据内存所在Device需与初始化的Device一致。
请注意处理数据越界问题。
各输入、输出参数对应Tensor形状（shape）相等、类型一致且不超过4维。
在Atlas 推理系列产品产品上，当输入Tensor数据类型为Float32或Float16，尺寸在480P（640*480）以上，或者输入Tensor数据类型为uint8，尺寸在1080P（1920*1080）以上时，ScaleAdd计算性能优于cv::scaleAdd在CPU上的性能。
在Atlas 200I/500 A2 推理产品上，当输入尺寸在720P（720*1280）时，计算性能优于cv::scaleAdd在CPU上的性能。

APP_ERROR ScaleAdd(const Tensor &src1, float scale, const Tensor &src2, Tensor &dst, AscendStream& stream = AscendStream::DefaultStream());

参数名	输入/输出	说明
src1	输入	Tensor类，输入张量，支持float16、float32、uint8类型输入，数据内存必须在Device或DVPP侧。
scale	输入	缩放尺度参数，输入标量，Float类型。
src2	输入	Tensor类，输入张量，支持float16、float32、uint8类型输入，数据内存必须在Device或DVPP侧。
dst	输出	Tensor类，输出张量，float16、float32、uint8类型。支持传入空Tensor，如果dst不为空，形状必须与src相同，需调用Tensor.Malloc()接口提前分配内存，数据内存必须在Device侧（与“src”同一个Device）或DVPP侧。
stream	输入	AscendStream类型，默认值为“AscendStream::DefaultStream()”。当参数值为默认值时，接口为同步操作，其他情况下，接口为异步操作。

数据结构	说明
APP_ERROR	程序执行返回的错误码，请参考APP_ERROR说明。

父主题： TensorOperations