下载
中文
注册
安装PyTorch后执行--test指令报“ERROR”

安装PyTorch后执行--test指令报“ERROR”

2025/01/23

34

暂无评分
我要评分

问题信息

问题来源产品大类产品子类关键字
官方安装部署Ascend DeployerAscend Deployer、安装配置、PyTorch、安装

问题描述

使用MindCluster Ascend Deployer工具安装PyTorch后,执行如下安装后检查命令,报错“ERROR”

bash install.sh --test=pytorch

报错截图示例:

原因分析

可能原因:模型运行时依赖三方库文件的实际加载顺序受环境中glibc版本、三方库加载时机以及实际依赖库版本等因素影响,部分场景下生成的加载顺序无法顺利触发DTV表的扩容机制,导致DTV表耗尽,触发该问题。

问题定位:

  1. 进入/usr/local目录,执行如下命令配置Python环境变量。

    cd /usr/local
    . ascendrc

  2. 进入已安装CANN软件包所在目录,执行如下命令配置环境变量,以ascend-toolkit为例。

    cd Ascend/ascend-toolkit
    . set_env.sh

  3. 执行如下命令,查看回显。

    python3 -c "import torch;import torch_npu"

  4. 报错“cannot allocate memory in static TLS block”则参考解决方法处理。若不是请参考实际报错信息定位解决。

解决方法

使用LD_PRELOAD环境变量指定对报错的单个或多个库文件进行优先加载,并写入~/.bashrc文件。

  1. 以运行用户在任意目录下执行vi ~/.bashrc命令,打开.bashrc文件,在文件最后一行后面添加以下内容。
    export LD_PRELOAD=$LD_PRELOAD:{报错信息中实际依赖库的路径}
  2. 执行:wq!命令保存文件并退出。
  3. 执行source ~/.bashrc命令使其立即生效。

本页内容