GetBroadCastMaxMinTmpSize
功能说明
kernel侧BroadCast接口的计算需要开发者预留/申请临时空间,本接口用于在host侧获取预留/申请的最大最小临时空间大小,开发者基于此范围选择合适的空间大小作为Tiling参数传递到kernel侧使用。
- 为保证功能正确,预留/申请的临时空间大小不能小于最小临时空间大小;
- 在最小临时空间-最大临时空间范围内,随着临时空间增大,kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能,开发者可以根据实际的内存使用情况进行空间预留/申请。
函数原型
void GetBroadCastMaxMinTmpSize(const platform_ascendc::PlatformAscendC &ascendcPlatform, const ge::Shape &srcShape,const ge::Shape &dstShape, uint32_t typeSize, const bool isReuseSource, uint32_t &maxValue,uint32_t &minValue)
参数说明
参数名 |
输入/输出 |
描述 |
---|---|---|
ascendcPlatform |
输入 |
执行的平台信息 |
srcShape |
输入 |
输入的shape信息。 |
dstShape |
输入 |
输出的shape信息。 |
typeSize |
输入 |
算子输入的数据类型大小,单位为字节。比如算子输入的数据类型为half,此处应传入2。 |
isReuseSource |
输入 |
是否复用源操作数输入的空间,与kernel侧接口一致。 |
maxValue |
输出 |
BroadCast接口能完成计算所需的最大临时空间大小,超出该值的空间不会被该接口使用。在最小临时空间-最大临时空间范围内,随着临时空间增大,kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能,开发者可以根据实际的内存使用情况进行空间预留/申请。最大空间大小为0表示计算不需要临时空间。
说明:
maxValue仅作为参考值,有可能大于Unified Buffer剩余空间的大小,该场景下,开发者需要根据Unified Buffer剩余空间的大小来选取合适的临时空间大小。 |
minValue |
输出 |
BroadCast接口能完成计算所需最小临时空间大小。为保证功能正确,接口计算时预留/申请的临时空间不能小于该数值。最小空间大小为0表示计算不需要临时空间。 |
返回值
无
调用示例
// 输入shape信息为(1024,1);算子输入的数据类型为half;不允许修改源操作数 auto platformInfo = context_->GetPlatformInfo(); auto ascendcPlatform = platform_ascendc::PlatformAscendC(platformInfo); std::vector<int64_t> srcShapeVec = {1024. 1}; std::vector<int64_t> dstShapeVec = {1024, 16} ge::Shape srcShape(srcShapeVec); ge::Shape dstShape(dstShapeVec); uint32_t maxValue{0}; uint32_t minValue{0}; GetBroadCastMaxMinTmpSize(ascendcPlatform, srcShape,dstShape, 2, false, maxValue, minValue);
父主题: 数据填充