安装包相关
描述CANN软件安装完成后,系统通过“set_env.sh”脚本默认配置的程序编译、执行相关的基础环境变量,以及后续程序编译执行时,需要手工配置的跟安装包相关的环境变量。
安装后自动配置环境变量
CANN软件安装完成后,默认会自动配置程序编译、执行所依赖的基础环境变量,但用户进程结束后相关环境变量自动失效,您也可以通过如下环境变量脚本一键式配置。
# root用户安装时环境变量配置示例: # 安装toolkit包时 source /usr/local/Ascend/ascend-toolkit/set_env.sh # 安装nnrt包时 source /usr/local/Ascend/nnrt/set_env.sh # 安装nnae包时 source /usr/local/Ascend/nnae/set_env.sh # 安装nnal包时 source /usr/local/Ascend/nnal/atb/set_env.sh
# 非root用户安装时环境变量配置示例: # 安装toolkit时 source ${HOME}/Ascend/ascend-toolkit/set_env.sh # 安装nnrt包时 source ${HOME}/Ascend/nnrt/set_env.sh # 安装nnae包时 source ${HOME}/Ascend/nnae/set_env.sh # 安装nnal包时 source ${HOME}/Ascend/nnal/atb/set_env.sh
用户也可以通过修改~/.bashrc文件方式设置永久环境变量,操作如下:
- 以运行用户在任意目录下执行vi ~/.bashrc命令,打开.bashrc文件,在文件最后一行后面添加上述内容。
- 执行:wq!命令保存文件并退出。
- 执行source ~/.bashrc命令使其立即生效。
详细环境变量说明如下表所示。
软件包 |
环境变量名称 |
环境变量说明 |
配置示例 |
---|---|---|---|
开发套件包(toolkit) |
LD_LIBRARY_PATH |
动态库的查找路径。 |
export LD_LIBRARY_PATH=/usr/local/Ascend/driver/lib64:/usr/local/Ascend/driver/lib64/common:/usr/local/Ascend/driver/lib64/driver:$LD_LIBRARY_PATH export ASCEND_TOOLKIT_HOME=/home/HwHiAiUser/Ascend/ascend-toolkit/latest export LD_LIBRARY_PATH=${ASCEND_TOOLKIT_HOME}/lib64:${ASCEND_TOOLKIT_HOME}/lib64/plugin/opskernel:${ASCEND_TOOLKIT_HOME}/lib64/plugin/nnengine:$LD_LIBRARY_PATH export PYTHONPATH=${ASCEND_TOOLKIT_HOME}/python/site-packages:${ASCEND_TOOLKIT_HOME}/opp/built-in/op_impl/ai_core/tbe:$PYTHONPATH export PATH=${ASCEND_TOOLKIT_HOME}/bin:${ASCEND_TOOLKIT_HOME}/compiler/ccec_compiler/bin:$PATH export ASCEND_AICPU_PATH=${ASCEND_TOOLKIT_HOME} export ASCEND_OPP_PATH=${ASCEND_TOOLKIT_HOME}/opp export TOOLCHAIN_HOME=${ASCEND_TOOLKIT_HOME}/toolkit export ASCEND_HOME_PATH=${ASCEND_TOOLKIT_HOME} |
ASCEND_TOOLKIT_HOME |
CANN-toolkit软件包安装后文件存储路径。 |
||
PYTHONPATH |
Python搜索路径。 |
||
PATH |
可执行文件查找路径。 |
||
ASCEND_AICPU_PATH |
AI CPU组件的安装路径。 |
||
ASCEND_OPP_PATH |
算子库根目录。 |
||
TOOLCHAIN_HOME |
工具链安装路径。 |
||
ASCEND_HOME_PATH |
同ASCEND_TOOLKIT_HOME,代表CANN-toolkit软件安装后文件存储路径。 |
||
离线推理引擎包(nnrt) |
ASCEND_NNRT_HOME |
nnrt软件包安装后文件存储路径。 |
export LD_LIBRARY_PATH=/usr/local/Ascend/driver/lib64:/usr/local/Ascend/driver/lib64/common:/usr/local/Ascend/driver/lib64/driver:$LD_LIBRARY_PATH export ASCEND_NNRT_HOME=/home/HwHiAiUser/Ascend/nnrt/latest export LD_LIBRARY_PATH=${ASCEND_NNRT_HOME}/lib64:$LD_LIBRARY_PATH export PYTHONPATH=${ASCEND_NNRT_HOME}/python/site-packages:$PYTHONPATH export ASCEND_AICPU_PATH=${ASCEND_NNRT_HOME} export ASCEND_OPP_PATH=${ASCEND_NNRT_HOME}/opp |
LD_LIBRARY_PATH |
动态库的查找路径。 |
||
PYTHONPATH |
Python搜索路径。 |
||
ASCEND_AICPU_PATH |
AI CPU组件的安装路径。 |
||
ASCEND_OPP_PATH |
算子库根目录。 |
||
深度学习引擎包(nnae) |
ASCEND_NNAE_HOME |
nnae软件包安装后文件存储路径。 |
export LD_LIBRARY_PATH=/usr/local/Ascend/driver/lib64:/usr/local/Ascend/driver/lib64/common:/usr/local/Ascend/driver/lib64/driver:$LD_LIBRARY_PATH export ASCEND_NNAE_HOME=/home/HwHiAiUser/Ascend/nnae/latest export LD_LIBRARY_PATH=${ASCEND_NNAE_HOME}/lib64:${ASCEND_NNAE_HOME}/lib64/plugin/opskernel:${ASCEND_NNAE_HOME}/lib64/plugin/nnengine:$LD_LIBRARY_PATH export PYTHONPATH=${ASCEND_NNAE_HOME}/python/site-packages:${ASCEND_NNAE_HOME}/opp/built-in/op_impl/ai_core/tbe:$PYTHONPATH export PATH=${ASCEND_NNAE_HOME}/bin:${ASCEND_NNAE_HOME}/compiler/ccec_compiler/bin:$PATH export ASCEND_AICPU_PATH=${ASCEND_NNAE_HOME} export ASCEND_OPP_PATH=${ASCEND_NNAE_HOME}/opp export ASCEND_HOME_PATH=${ASCEND_NNAE_HOME} |
LD_LIBRARY_PATH |
动态库的查找路径。 |
||
PYTHONPATH |
Python搜索路径。 |
||
PATH |
可执行文件查找路径。 |
||
ASCEND_AICPU_PATH |
AI CPU组件的安装路径。 |
||
ASCEND_OPP_PATH |
算子库根目录。 |
||
ASCEND_HOME_PATH |
同ASCEND_NNAE_HOME,代表nnae软件安装后文件存储路径。 |
||
加速库(nnal) |
ATB_HOME_PATH |
软件包安装后文件存储路径。 |
export ATB_HOME_PATH="${atb_path}/latest/atb/cxx_abi_${cxx_abi}" export LD_LIBRARY_PATH=$ATB_HOME_PATH/lib:$ATB_HOME_PATH/examples:$ATB_HOME_PATH/tests/atbopstest:$LD_LIBRARY_PATH export PATH=$ATB_HOME_PATH/bin:$PATH #加速库环境变量 export ATB_STREAM_SYNC_EVERY_KERNEL_ENABLE=0 export ATB_STREAM_SYNC_EVERY_RUNNER_ENABLE=0 export ATB_STREAM_SYNC_EVERY_OPERATION_ENABLE=0 export ATB_OPSRUNNER_SETUP_CACHE_ENABLE=1 export ATB_OPSRUNNER_KERNEL_CACHE_TYPE=3 export ATB_OPSRUNNER_KERNEL_CACHE_LOCAL_COUNT=1 export ATB_OPSRUNNER_KERNEL_CACHE_GLOABL_COUNT=5 export ATB_OPSRUNNER_KERNEL_CACHE_TILING_SIZE=10240 export ATB_WORKSPACE_MEM_ALLOC_ALG_TYPE=1 export ATB_WORKSPACE_MEM_ALLOC_GLOBAL=0 export ATB_COMPARE_TILING_EVERY_KERNEL=0 export ATB_HOST_TILING_BUFFER_BLOCK_NUM=128 export ATB_DEVICE_TILING_BUFFER_BLOCK_NUM=32 export ATB_SHARE_MEMORY_NAME_SUFFIX="" export ATB_LAUNCH_KERNEL_WITH_TILING=1 export ATB_MATMUL_SHUFFLE_K_ENABLE=1 export ATB_RUNNER_POOL_SIZE=64 #算子库环境变量 export ASDOPS_HOME_PATH=$ATB_HOME_PATH export ASDOPS_MATMUL_PP_FLAG=1 export ASDOPS_LOG_LEVEL=ERROR export ASDOPS_LOG_TO_STDOUT=0 export ASDOPS_LOG_TO_FILE=1 export ASDOPS_LOG_TO_FILE_FLUSH=0 export ASDOPS_LOG_TO_BOOST_TYPE=atb export ASDOPS_LOG_PATH=~ export ASDOPS_TILING_PARSE_CACHE_DISABLE=0 export LCCL_DETERMINISTIC=0 |
LD_LIBRARY_PATH |
Linux系统中加载动态库时的搜寻路径列表。 |
||
PATH |
将ATB软件包bin目录的路径添加到系统PATH环境变量中,推荐使用默认路径。 |
||
ATB_STREAM_SYNC_EVERY_KERNEL_ENABLE |
用于问题定位,确定报错所在的kernel。当变量配置为1时,每个Kernel的Execute结束时就做流同步。 |
||
ATB_STREAM_SYNC_EVERY_RUNNER_ENABLE |
用于问题定位,确定报错所在的runner。当变量配置为1时,每个Runner的Execute时就做流同步。 |
||
ATB_STREAM_SYNC_EVERY_OPERATION_ENABLE |
用于问题定位,确定报错所在的Operation。当变量配置为1时,每个Operation的Execute时就做同步。 |
||
ATB_OPSRUNNER_SETUP_CACHE_ENABLE |
是否开启ATB的SetupCache功能。该功能在检测到operation的输入和输出tensor未发生变化时会跳过setup的大部分流程,进而提升调度侧性能。 默认开启,以进行性能加速。 |
||
ATB_OPSRUNNER_KERNEL_CACHE_TYPE |
是否开启ATB的kernelCache功能。该功能在检测到operation的输入与参数未发生变化时,会复用已经计算好的tiling数据及内部结构体,进而提升调度侧性能。 |
||
ATB_OPSRUNNER_KERNEL_CACHE_LOCAL_COUNT |
本地kernelCache的槽位数。
|
||
ATB_OPSRUNNER_KERNEL_CACHE_GLOABL_COUNT |
全局kernelCache的槽位数。
|
||
ATB_OPSRUNNER_KERNEL_CACHE_TILING_SIZE |
设置kernelCache中每一块用于存储tiling的buffer大小(单位:字节)。 一般不建议用户更改,仅在算子tiling大小超过buffer大小时配置。 |
||
ATB_WORKSPACE_MEM_ALLOC_ALG_TYPE |
workspace内存分配算法选择。根据环境变量配置不同,ATB会选择不同的算法去计算workspace大小与workspace分配,用户可通过选择不同算法自行测试workspace分配情况。 |
||
ATB_WORKSPACE_MEM_ALLOC_GLOBAL |
是否使用全局中间tensor内存分配算法。开启后会对中间tensor内存进行大小计算与分配。 |
||
ATB_COMPARE_TILING_EVERY_KERNEL |
每个Kernel运行后,比较运行前和后的NPU上tiling内容是否变化,一般用于检查是否发生tiling内存踩踏。 |
||
ATB_HOST_TILING_BUFFER_BLOCK_NUM |
Context内部HostTilingBuffer块数,数量与OP并行的最大并行数有关,通常使用默认值,不建议修改。 |
||
ATB_DEVICE_TILING_BUFFER_BLOCK_NUM |
Context内部DeviceTilingBuffer块数,数量与OP并行的最大并行数有关,通常使用默认值,不建议修改。 |
||
ATB_SHARE_MEMORY_NAME_SUFFIX |
共享内存命名后缀,多用户同时使用通信算子时,需通过设置该值进行共享内存的区分。 |
||
ATB_LAUNCH_KERNEL_WITH_TILING |
tiling拷贝随算子下发功能开关。开启后会修改tiling拷贝方式,主要用于Atlas 推理系列产品上的性能提升。 |
||
ATB_MATMUL_SHUFFLE_K_ENABLE |
Shuffle-K使能,矩阵乘的结果矩阵不同位置计算时的累加序一致/不一致。会影响matmul算子内部累加序。 |
||
ATB_RUNNER_POOL_SIZE |
加速库runner池中可存放runner的个数。 不建议用户更改,在OP输入tensor与参数配置多变的情况下,增加runner池容量可提升性能,但会增加host内存的使用量。 |
||
ASDOPS_HOME_PATH |
配置算子库路径,便于使用ATB功能。 |
||
ASDOPS_MATMUL_PP_FLAG |
算子库开启使用PPMATMUL。 |
||
ASDOPS_LOG_LEVEL |
算子库日志级别。 |
||
ASDOPS_LOG_TO_STDOUT |
算子库日志是否输出到控制台。 |
||
ASDOPS_LOG_TO_FILE |
算子库日志是否输出到文件。 |
||
ASDOPS_LOG_TO_FILE_FLUSH |
日志写文件是否刷新。 |
||
ASDOPS_LOG_TO_BOOST_TYPE |
加速库日志目录名称。 |
||
ASDOPS_LOG_PATH |
算子库日志保存路径。 |
||
ASDOPS_TILING_PARSE_CACHE_DISABLE |
控制是否开启算子库tilingParse缓存优化。 开启优化后会提升非首token性能。 |
||
LCCL_DETERMINISTIC |
LCCL确定性AllReduce(保序加)是否开启。需注意,开启功能在rankSize<=8时生效。 开启后会有如下影响:
|
手工配置环境变量
程序编译执行过程中,可能会需要配置跟软件包安装相关的环境变量。下面描述CANN提供的不同场景下需要手工配置的环境变量。
软件包 |
环境变量名称 |
环境变量说明 |
配置示例 |
---|---|---|---|
自定义算子安装包 |
ASCEND_CUSTOM_OPP_PATH |
用户自定义算子包安装路径。 支持配置多个路径,以英文冒号分隔,排在最前面的优先级最高。 |
export ASCEND_CUSTOM_OPP_PATH=/home/HwHiAiUser/Ascend/ascend-toolkit/latest/opp/vendor_name1:/home/HwHiAiUser/Ascend/ascend-toolkit/latest/opp/vendor_name2 |