aclSetTensorAddr
函数功能
通过aclSetAclOpExecutorRepeatable使能aclOpExecutor可复用后,若输入或输出Device内存地址变更,需要刷新对应aclTensor中记录的Device内存地址。
函数原型
aclnnStatus aclSetTensorAddr(aclOpExecutor *executor, const size_t index, aclTensor *tensor, void *addr)
参数说明
参数名 |
输入/输出 |
说明 |
---|---|---|
executor |
输入 |
设置为复用状态的aclOpExecutor。 |
index |
输入 |
待刷新的aclTensor索引,从0开始计数。 |
tensor |
输入 |
待刷新的aclTensor指针。 |
addr |
输入 |
需要刷新到指定aclTensor中的Device存储地址。 |
返回值说明
返回0表示成功,返回其他值表示失败,返回码列表参见aclnn返回码。
可能失败的原因:
- 返回561103:executor或tensor是空指针。
- 返回161002:index取值越界。
- 返回161002:第一次执行aclnnXxxGetWorksapceSize时传入的aclTensor是nullptr,不再支持刷新地址。
使用样例
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 | // 创建输入和输出的aclTensor和aclTensorList std::vector<int64_t> shape = {1, 2, 3}; aclTensor tensor1 = aclCreateTensor(shape.data(), shape.size(), aclDataType::ACL_FLOAT, nullptr, 0, aclFormat::ACL_FORMAT_ND, shape.data(), shape.size(), nullptr); aclTensor tensor2 = aclCreateTensor(shape.data(), shape.size(), aclDataType::ACL_FLOAT, nullptr, 0, aclFormat::ACL_FORMAT_ND, shape.data(), shape.size(), nullptr); aclTensor tensor3 = aclCreateTensor(shape.data(), shape.size(), aclDataType::ACL_FLOAT, nullptr, 0, aclFormat::ACL_FORMAT_ND, shape.data(), shape.size(), nullptr); aclTensor output = aclCreateTensor(shape.data(), shape.size(), aclDataType::ACL_FLOAT, nullptr, 0, aclFormat::ACL_FORMAT_ND, shape.data(), shape.size(), nullptr); aclTensor *list[] = {tensor1, tensor2}; auto tensorList = aclCreateTensorList(list, 2); uint64_t workspace_size = 0; aclOpExecutor *executor; // AddCustom算子有两个输入(aclTensorList和aclTensor),一个输出(aclTensor) // 调用第1段接口 aclnnAddCustomGetWorkspaceSize(tensorList, tensor3, output, &workspace_size, &executor); // 设置executor为可复用 aclSetAclOpExecutorRepeatable(executor); void *addr; aclSetTensorAddr(executor, 0, tensor1, addr); // 刷新输入tensorlist中第1个aclTensor的device地址 aclSetTensorAddr(executor, 1, tensor2, addr); // 刷新输入tensorlist中第2个aclTensor的device地址 aclSetTensorAddr(executor, 2, tensor3, addr); // 刷新输入aclTensor的device地址 aclSetTensorAddr(executor, 3, output, addr); // 刷新输出aclTensor的device地址 ....... // 调用第2段接口 aclnnAddCustom(workspace, workspace_size, executor, stream); // 清理executor aclDestroyAclOpExecutor(executor); |
父主题: 基础接口