aclrtDeviceTaskAbort
Atlas 200/300/500 推理产品,不支持该接口。
Atlas 训练系列产品,不支持该接口。
Atlas 推理系列产品(Ascend 310P处理器),不支持该接口。
Atlas 200I/500 A2推理产品不支持该接口。
函数功能
停止指定Device上的正在执行的任务,同时丢弃指定Device上已下发的任务。该接口支持用户设置永久等待、或配置具体的超时时间,若配置具体的超时时间,则调用本接口超出超时时间,则接口返回报错。
使用场景及流程:调用AscendCL接口返回ACL_ERROR_RT_DEVICE_MTE_ERROR时,可调用本接口,但需与以下其它接口配合使用,获取并修复内存UCE的错误虚拟地址:
- 调用aclrtGetMemUceInfo接口获取内存UCE的错误虚拟地址。
- 调用aclrtDeviceTaskAbort接口停止对应Device上正在执行的任务。
- 调用aclrtMemUceRepair接口修复内存UCE的错误虚拟地址。
- 修复问题后,重新跑业务。
函数原型
aclError aclrtDeviceTaskAbort(int32_t deviceId, uint32_t timeout);
参数说明
参数名 |
输入/输出 |
说明 |
---|---|---|
deviceId |
输入 |
Device ID。 与aclrtSetDevice接口中Device ID保持一致。 |
timeout |
输入 |
超时时间。 取值说明如下:
|
返回值说明
返回0表示成功,返回非0表示失败。
示例代码
调用示例请参见示例代码。
父主题: 异常处理