AllocTensor
函数功能
为了减少输入输出的拷贝耗时,提供了构建使用共享内存的类型的类FlowBufferFactory 。
AllocTensor根据shape、data type和对齐大小申请tensor,默认申请以64字节对齐,可以指定对齐大小,方便性能调优。
函数原型
1 | std::shared_ptr<Tensor> AllocTensor(const std::vector<int64_t> &shape, TensorDataType dataType, uint32_t align = 512U) |
参数说明
参数名 |
输入/输出 |
描述 |
---|---|---|
shape |
输入 |
Tensor的shape。 |
dataType |
输入 |
Tensor的dataType。 |
align |
输入 |
申请内存地址对齐大小,取值范围 【32、64、128、256、512、1024】。 |
返回值
申请的tensor指针
异常处理
申请不到tensor指针则返回NULL。
约束说明
无。
父主题: FlowBufferFactory类