训练任务概率性失败,根据日志打印发现打开设备失败。
[drvHdcSetSessionReference 15333] <> Set reference open pcie device failed. (strerror=operation not permitted)
根据日志信息,判断为hdc打开设备失败。可能原因:OS存在问题,概率性出现打开字符设备时设备权限和属组信息不正确。
确认OS是否支持连续打开字符设备,可以编写1个简单程序,连续打开系统字符设备dev/random,如出现问题请找OS定位。