InitBuffer
功能说明
TPipe是用来管理全局内存的框架,用户可以调用TPipe中的InitBuffer接口为TQue/TBuf进行内存分配。
函数原型
- 为TQue分配内存
1 2
template <class T> __aicore__ inline bool InitBuffer(T& que, uint8_t num, uint32_t len)
- 为TBuf分配内存
1 2
template <TPosition bufPos> __aicore__ inline bool InitBuffer(TBuf<bufPos>& buf, uint32_t len)
参数说明
表1 bool InitBuffer(T& que, uint8_t num, uint32_t len) 原型定义参数说明
表2 InitBuffer(TBuf<bufPos>& buf, uint32_t len)原型定义参数说明
支持的型号
Atlas 训练系列产品
Atlas推理系列产品AI Core
Atlas推理系列产品Vector Core
Atlas A2训练系列产品/Atlas 800I A2推理产品
Atlas 200I/500 A2推理产品
注意事项
同一个TPosition上QUE Buffer的数量根据AI处理器型号的不同,有数量约束。申请Buffer时,需要满足该约束。
针对Atlas 训练系列产品不超过4块。
针对Atlas推理系列产品AI Core不超过8块。
Atlas A2训练系列产品/Atlas 800I A2推理产品不超过8块。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 |
AscendC::TQue<AscendC::TPosition::VECIN, 1> que0; AscendC::TQue<AscendC::TPosition::VECIN, 1> que1; // 不建议: // 比如,算子有6个输入,需要申请6块buffer // 通过2个队列为其申请内存,分别为que0、que1分配3块,申请VECIN position上的buffer总数为6 // 针对Atlas 训练系列产品同一个TPosition上QUE Buffer的数量限制为4,超出该限制,在后续使用AllocTensor/FreeTensor可能会出现分配资源失败。 pipe.InitBuffer(que0, 3, len); pipe.InitBuffer(que1, 3, len); // 此时建议通过以下方法解决: // 如果确实有多块buffer使用, 可以将多个buffer合并到一块buffer, 通过偏移使用 pipe.InitBuffer(que0, 1, len * 3); pipe.InitBuffer(que1, 1, len * 3); /* * 分配出3块内存大小的LocalTensor, local1的地址为que0中buffer的起始地址, * local2的地址为local1的地址偏移len后的地址,local3的地址为local1的地址偏移 * len * 2的地址 */ int32_t offset1 = len; int32_t offset2 = len * 2; AscendC::LocalTensor<T> local1 = que0.AllocTensor<T>(); AscendC::LocalTensor<T> local2 = local1[offset1]; AscendC::LocalTensor<T> local3 = local1[offset2]; |
返回值
返回Buffer初始化的结果
调用示例
1 2 3 4 5 6 7 8 9 10 11 |
// 为TQue分配内存,分配内存块数为2,每块大小为128Bytes AscendC::TPipe pipe; // Pipe内存管理对象 AscendC::TQue<AscendC::TPosition::VECOUT, 2> que; //输出数据Queue队列管理对象,QuePosition为VECOUT uint8_t num = 2; uint32_t len = 128; pipe.InitBuffer(que, num, len); // 为TBuf分配内存,分配长度为128Bytes AscendC::TPipe pipe; AscendC::TBuf<AscendC::TPosition::A1> buf; //输出数据管理对象,QuePosition为A1 uint32_t len = 128; pipe.InitBuffer(buf, len); |
父主题: TPipe