在模型运行或者算子运行时遇到报错“Error in atexit._run_exitfuncs:”
2023/06/06
185
问题信息
问题来源 | 产品大类 | 关键字 |
---|---|---|
官方 | 模型训练 | -- |
问题现象描述
- 报错文本
Error in atexit._run_exitfuncs: Traceback (most recent call last): File "/root/archiconda3/envs/***/lib/python3.7/site-packages/torch/__init__.py", line 429, in _npu_shutdown torch._C._npu_shutdown() RuntimeError
原因分析
在torch初始化时,若未通过torch_npu.npu.device(id)指定NPU设备,则默认使用device 0设备。若直接使用其他NPU设备,如指定在device 1上创建tensor,那么在运行时会出现上述错误。
解决措施
在调用NPU设备之前,通过torch_npu.npu.set_device(device)指定需要使用的NPU设备即可。
本页内容