下载
中文
注册

函数:malloc

C函数原型

aclError aclrtMalloc(void **devPtr, size_t size, aclrtMemMallocPolicy policy)

Python函数

dev_ptr, ret = acl.rt.malloc(size, policy)

函数功能

在Device上申请size大小的线性内存,该接口对用户申请的size向上对齐成32字节整数倍后再多加32字节,并通过“dev_ptr”返回已分配内存的指针地址。同步接口。

通过该接口申请的Device内存都支持cache缓存,不需要用户处理CPU与NPU之间的cache一致性。

调用媒体数据处理的接口前,若需要申请Device上的内存存放输入或输出数据,需调用acl.media.dvpp_malloc申请内存。

输入说明

size:int,申请内存的大小,单位Byte,size不能为0。

policy:int,内存分配规则。
  • 0:ACL_MEM_MALLOC_HUGE_FIRST,当申请的内存小于等于1M时,即使使用该内存分配规则,也是申请普通页的内存。当申请的内存大于1M时,优先申请大页内存,如果大页内存不够,则使用普通页的内存。
  • 1:ACL_MEM_MALLOC_HUGE_ONLY,仅申请大页,如果大页内存不够,则返回错误。
  • 2:ACL_MEM_MALLOC_NORMAL_ONLY,仅申请普通页。
  • 3:ACL_MEM_MALLOC_HUGE_FIRST_P2P,仅Device之间内存复制场景下申请内存时使用该选项,表示优先申请大页内存,如果大页内存不够,则使用普通页的内存。预留选项。
  • 4:ACL_MEM_MALLOC_HUGE_ONLY_P2P,仅Device之间内存复制场景下申请内存时使用该选项,仅申请大页内存,如果大页内存不够,则返回错误。预留选项。
  • 5:ACL_MEM_MALLOC_NORMAL_ONLY_P2P,仅Device之间内存复制场景下申请内存时使用该选项,仅申请普通页的内存。预留选项。

返回值说明

dev_ptr:int,指向Device上已分配内存的指针地址。

ret:int,错误码。

  • 返回0表示成功。
  • 返回其它值表示失败。

约束说明

  • 使用acl.rt.malloc接口申请的内存,需要通过acl.rt.free接口释放内存。
  • 频繁调用acl.rt.malloc接口申请内存、调用acl.rt.free接口释放内存,会损耗性能,建议用户提前做内存预先分配或二次管理,避免频繁申请/释放内存。
  • 调用acl.rt.malloc接口申请内存时,会对用户输入的size按向上对齐成32字节整数倍后,再多加32字节。
    若用户使用本接口申请大块内存并自行划分、管理内存时,每段内存需同时满足以下需求:
    • 内存大小向上对齐成32整数倍加32字节(m = ALIGN_UP[len, 32] + 32字节)。
    • 内存起始地址需满足64字节对齐(ALIGN_UP[m, 64])。
    说明:

    len表示某段内存的大小,ALIGN_UP[len, k]表示向上按k字节对齐:((len - 1) / k + 1) * k。

参考资源

接口调用示例,参见数据传输