aclrtMemcpy2dAsync
Atlas 推理系列加速模块产品不支持该接口。
函数功能
实现异步内存复制,主要用于矩阵数据的复制。异步接口。
约束说明
- 该接口是异步接口,调用接口成功仅表示任务下发成功,不表示任务执行成功。调用该接口后,需调用同步等待接口(例如,aclrtSynchronizeStream)确保内存复制的任务已执行完成,否则可能会导致训练或推理等业务异常、Device断链掉卡等未知情况。
- 当前仅支持ACL_MEMCPY_HOST_TO_DEVICE类型和ACL_MEMCPY_DEVICE_TO_HOST类型的内存复制。
- Atlas 200/300/500 推理产品,Ascend RC形态下,不支持调用本接口。
- Atlas 200I/500 A2推理产品,Ascend RC形态下,不支持调用本接口。
函数原型
aclError aclrtMemcpy2dAsync(void *dst, size_t dpitch, const void *src, size_t spitch, size_t width, size_t height, aclrtMemcpyKind kind, aclrtStream stream)
参数说明
参数名 |
输入/输出 |
说明 |
---|---|---|
dst |
输入 |
目的内存地址指针。 |
dpitch |
输入 |
目的内存中相邻两列向量的地址距离。 |
src |
输入 |
源内存地址指针。 |
spitch |
输入 |
源内存中相邻两列向量的地址距离。 |
width |
输入 |
待复制的数据宽度。 |
height |
输入 |
待复制的数据高度。 height最大设置为5*1024*1024=5242880,否则接口返回失败。 |
kind |
输入 |
内存复制的类型。 typedef enum aclrtMemcpyKind { ACL_MEMCPY_HOST_TO_HOST, // Host内的内存复制 ACL_MEMCPY_HOST_TO_DEVICE, // Host到Device的内存复制 ACL_MEMCPY_DEVICE_TO_HOST, // Device到Host的内存复制 ACL_MEMCPY_DEVICE_TO_DEVICE, // Device内或Device间的内存复制 ACL_MEMCPY_DEFAULT, // 由系统根据源、目的内存地址自行判断拷贝方向 } aclrtMemcpyKind; |
stream |
输入 |
指定stream。 |
返回值说明
返回0表示成功,返回其他值表示失败。
参考信息
本接口的内存复制示意图:
父主题: 内存管理