下载
中文
注册

aclrtMemcpy2dAsync

Atlas 推理系列加速模块产品不支持该接口。

函数功能

实现异步内存复制,主要用于矩阵数据的复制。异步接口。

约束说明

  • 该接口是异步接口,调用接口成功仅表示任务下发成功,不表示任务执行成功。调用该接口后,需调用同步等待接口(例如,aclrtSynchronizeStream)确保内存复制的任务已执行完成,否则可能会导致训练或推理等业务异常、Device断链掉卡等未知情况。
  • 当前仅支持ACL_MEMCPY_HOST_TO_DEVICE类型和ACL_MEMCPY_DEVICE_TO_HOST类型的内存复制。
  • Atlas 200/300/500 推理产品Ascend RC形态下,不支持调用本接口。
  • Atlas 200I/500 A2推理产品Ascend RC形态下,不支持调用本接口。

函数原型

aclError aclrtMemcpy2dAsync(void *dst, size_t dpitch, const void *src, size_t spitch, size_t width, size_t height, aclrtMemcpyKind kind, aclrtStream stream)

参数说明

参数名

输入/输出

说明

dst

输入

目的内存地址指针。

dpitch

输入

目的内存中相邻两列向量的地址距离。

src

输入

源内存地址指针。

spitch

输入

源内存中相邻两列向量的地址距离。

width

输入

待复制的数据宽度。

height

输入

待复制的数据高度。

height最大设置为5*1024*1024=5242880,否则接口返回失败。

kind

输入

内存复制的类型。

typedef enum aclrtMemcpyKind {
ACL_MEMCPY_HOST_TO_HOST,     // Host内的内存复制
ACL_MEMCPY_HOST_TO_DEVICE,   // Host到Device的内存复制
ACL_MEMCPY_DEVICE_TO_HOST,   // Device到Host的内存复制
ACL_MEMCPY_DEVICE_TO_DEVICE, // Device内或Device间的内存复制
ACL_MEMCPY_DEFAULT,         // 由系统根据源、目的内存地址自行判断拷贝方向
} aclrtMemcpyKind;

stream

输入

指定stream。

返回值说明

返回0表示成功,返回其他值表示失败。

参考信息

本接口的内存复制示意图: