GetPowerTmpBufferFactorSize
功能说明
该接口用于获取maxLiveNodeCnt和extraBuf,在固定空间大小的情况下,通过maxLiveNodeCnt和extraBuf可以推算算子单次最大计算元素数量。maxLiveNodeCnt表示临时空间是单次计算数据量所占空间的多少倍;extraBuf表示使用的额外临时空间大小。
推算示例如下:
算子实现需要调用Power接口,开发者为其预留currBuff大小的空间,利用GetPowerTmpBufferFactorSize接口得到maxLivedNodeCnt 、extraBuf输出值,可推导算子单次最大计算元素数量为:
currentShapeSize = (currBuff - extraBuf) / maxLivedNodeCnt / typeSize
注意上文中的currBuff表示接口计算可用的空间,需要去除用户输入输出等空间;另外,接口获取的maxLivedNodeCnt值可能为0,计算时需要判断该值非0,避免除0错误。
函数原型
1
|
void GetPowerTmpBufferFactorSize(const bool baseIsTensor, const bool expIsTensor, const bool typeIsInt, const uint32_t typeSize, uint32_t& maxLiveNodeCount, uint32_t& extraBuffer) |
参数说明
接口 |
输入/输出 |
功能 |
---|---|---|
baseIsTensor |
输入 |
底数是Tensor输入true,否则输入false |
expIsTensor |
输入 |
指数是Tensor输入true,否则输入false |
typeIsInt |
输入 |
数据类型是int时输入true,否则输入false |
typeSize |
输入 |
算子输入的数据类型大小,单位为字节。比如算子输入的数据类型为half,此处应传入2。 |
maxLiveNodeCnt |
输出 |
最大存活节点数,表示临时空间是单次计算数据量所占空间的多少倍。 |
extraBuf |
输出 |
使用的额外临时空间大小,单位为byte。 |
返回值
无
支持的型号
Atlas A2训练系列产品/Atlas 800I A2推理产品
约束说明
当利用maxLiveNodeCnt,extraBuf反推出的currentShapeSize * typeSize < 256B时,currentShapeSize按照256B/ typeSize的值向上取整。
调用示例
uint32_t maxLiveNodeCnt = 0; uint32_t extraBuf = 0; AscendC::GetPowerTmpBufferFactorSize(true, true, true, 4, maxLiveNodeCnt, extraBuf);