aclrtMalloc
函数功能
在Device上申请size大小的线性内存,通过*devPtr返回已分配内存的指针,同步接口。
通过该接口申请的Device内存都支持cache缓存,不需要用户处理cpu与npu之间的cache一致性。
调用媒体数据处理的接口前,若需要申请Device上的内存存放输入或输出数据,需调用acldvppMalloc申请内存。
约束说明
- 使用aclrtMalloc接口申请的内存,需要通过aclrtFree接口释放内存。
- 频繁调用aclrtMalloc接口申请内存、调用aclrtFree接口释放内存,会损耗性能,建议用户提前做内存预先分配或二次管理,避免频繁申请/释放内存。
- 调用aclrtMalloc接口申请内存时,会对用户输入的size按向上对齐成32字节整数倍后,再多加32字节。
- 若用户使用本接口申请大块内存并自行划分、管理内存时,每段内存需同时满足以下需求:
- 内存大小向上对齐成32整数倍+32字节(m=ALIGN_UP[len,32]+32字节);
- 内存起始地址需满足64字节对齐(ALIGN_UP[m,64])。
len表示某段内存的大小,ALIGN_UP[len,k]表示向上按k字节对齐:((len-1)/k+1)*k。
函数原型
aclError aclrtMalloc(void **devPtr, size_t size, aclrtMemMallocPolicy policy)
参数说明
参数名 |
输入/输出 |
说明 |
---|---|---|
devPtr |
输出 |
“Device上已分配内存的指针”的指针。 |
size |
输入 |
申请内存的大小,单位Byte。 size不能为0。 |
policy |
输入 |
内存分配规则。 typedef enum aclrtMemMallocPolicy { ACL_MEM_MALLOC_HUGE_FIRST, // 当申请的内存小于等于1M时,即使使用该内存分配规则,也是申请普通页的内存。当申请的内存大于1M时,优先申请大页内存,如果大页内存不够,则使用普通页的内存。 ACL_MEM_MALLOC_HUGE_ONLY, // 仅申请大页,如果大页内存不够,则返回错误。 ACL_MEM_MALLOC_NORMAL_ONLY, // 仅申请普通页。 ACL_MEM_MALLOC_HUGE_FIRST_P2P, //仅Device之间内存复制场景下申请内存时使用该选项,表示优先申请大页内存,如果大页内存不够,则使用普通页的内存。Atlas 200/300/500 推理产品,当前版本不支持该选项。 ACL_MEM_MALLOC_HUGE_ONLY_P2P, //仅Device之间内存复制场景下申请内存时使用该选项,仅申请大页内存,如果大页内存不够,则返回错误。Atlas 200/300/500 推理产品,当前版本不支持该选项。 ACL_MEM_MALLOC_NORMAL_ONLY_P2P, //仅Device之间内存复制场景下申请内存时使用该选项,仅申请普通页的内存。Atlas 200/300/500 推理产品,当前版本不支持该选项。 } aclrtMemMallocPolicy; |
返回值说明
返回0表示成功,返回其它值表示失败。
参考资源
接口调用示例,参见数据传输。
父主题: 内存管理