下载
中文
注册
进程异常退出后重新执行任务失败

进程异常退出后重新执行任务失败

2022/08/11

156

暂无评分
我要评分

问题信息

问题来源产品大类产品子类关键字
官方CANN应用开发AscendCL进程、退出、异常、任务、失败

问题现象描述

  • 业务场景:DVPP、模型推理、应用/算子开发
  • 适用处理器:Atlas 200/300/500 推理产品Atlas 推理系列产品Atlas 训练系列产品
  • 处理器形态:EP、RC
  • 问题现象:

    进程异常退出时,包括强行终止任务(如ctrl + c或者kill命令终止进程)的场景,然后重新启动任务失败。

原因分析

进程异常退出时,只能依赖系统检测到程序退出后才进行资源释放,释放资源最长需要一分钟的执行时间。如果在未执行完资源释放前执行新的任务,可能导致新执行的任务失败。

解决措施

进程异常退出后需要等待一分钟,才能保证下一次重新执行任务成功。

本页内容