Paddle启动训练时报错:Call aclrtGetDevice failed.
2024/02/21
153
问题信息
问题来源 | 产品大类 | 产品子类 | 关键字 |
---|---|---|---|
官方 | 模型训练 | Paddle | -- |
问题现象描述
Paddle启动训练时报错:Call aclrtGetDevice failed.
原因分析
在创建数据迭代器时,未申请新进程。当前(6.0.RC1版本)暂不支持DataLoader的默认参数num_workers=0。
排查方法
通过GDB断点调试,定位到在迭代DataLoader时抛出异常。
解决措施
DataLoader的默认参数num_workers改为大于0的值。
本页内容