安装PyTorch后执行--test指令报“ERROR”
2025/01/23
34
问题信息
问题来源 | 产品大类 | 产品子类 | 关键字 |
---|---|---|---|
官方 | 安装部署 | Ascend Deployer | Ascend Deployer、安装配置、PyTorch、安装 |
问题描述
使用MindCluster Ascend Deployer工具安装PyTorch后,执行如下安装后检查命令,报错“ERROR”
bash install.sh --test=pytorch
报错截图示例:
原因分析
可能原因:模型运行时依赖三方库文件的实际加载顺序受环境中glibc版本、三方库加载时机以及实际依赖库版本等因素影响,部分场景下生成的加载顺序无法顺利触发DTV表的扩容机制,导致DTV表耗尽,触发该问题。
问题定位:
- 进入/usr/local目录,执行如下命令配置Python环境变量。
cd /usr/local . ascendrc
- 进入已安装CANN软件包所在目录,执行如下命令配置环境变量,以ascend-toolkit为例。
cd Ascend/ascend-toolkit . set_env.sh
- 执行如下命令,查看回显。
python3 -c "import torch;import torch_npu"
- 报错“cannot allocate memory in static TLS block”则参考解决方法处理。若不是请参考实际报错信息定位解决。
解决方法
使用LD_PRELOAD环境变量指定对报错的单个或多个库文件进行优先加载,并写入~/.bashrc文件。
- 以运行用户在任意目录下执行vi ~/.bashrc命令,打开.bashrc文件,在文件最后一行后面添加以下内容。
export LD_PRELOAD=$LD_PRELOAD:{报错信息中实际依赖库的路径}
- 执行:wq!命令保存文件并退出。
- 执行source ~/.bashrc命令使其立即生效。
本页内容