ASCEND_WORK_PATH
功能描述
- 此环境变量指定的路径支持大小写字母(a-z,A-Z)、数字(0-9)、下划线(_)、中划线(-)、句点(.)、中文字符。
- 请确保指定的路径存在且路径有效,执行用户需要具有读、写、可执行权限。
各组件落盘到${ASCEND_WORK_PATH}路径下的文件如下表所示。
组件 |
共享文件落盘路径 |
文件内容 |
优先级说明 |
---|---|---|---|
AOE |
${ASCEND_WORK_PATH}/aoe_data |
记录AOE调优过程中的相关信息,包括调优任务名称、调优耗时、调优前后的模型执行时间/算子执行时间、知识库命中信息等。 |
ASCEND_WORK_PATH > AOE默认调优工作目录 AOE默认调优工作目录为: ${install_path}/latest/tools/aoe/conf/aoe.ini中“WORK_PATH”参数的取值。 |
LOG |
${ASCEND_WORK_PATH}/log |
日志文件。 |
ASCEND_PROCESS_LOG_PATH > ASCEND_WORK_PATH > 日志默认存储路径($HOME/ascend/log) |
TRACE |
${ASCEND_WORK_PATH}/atrace |
trace日志文件。 |
ASCEND_WORK_PATH > trace日志默认存储路径($HOME/ascend/atrace) |
ATC |
${ASCEND_WORK_PATH}/kernel_meta |
算子编译生成的调试相关的过程文件,包括但不限于算子.o(算子二进制文件)、.json(算子描述文件)、.cce等文件。 |
|
${ASCEND_WORK_PATH}/ |
预检结果文件check_result.json。 |
||
$ASCEND_WORK_PATH/FE/${进程号}/fusion_result.json |
除去fusion_switch.cfg文件中关闭的融合规则外,仍旧使用的融合规则。 |
ASCEND_WORK_PATH > 默认路径(./当前执行路径) |
|
${ASCEND_WORK_PATH}/ |
开启DUMP图描述信息打印的场景下(即配置环境变量DUMP_GE_GRAPH的场景),会落盘相应的DUMP图文件。 |
环境变量“DUMP_GRAPH_PATH” > ASCEND_WORK_PATH > 默认路径(./当前执行路径) |
|
TF Adapter |
${ASCEND_WORK_PATH}/kernel_meta |
算子编译生成的调试相关的过程文件,包括但不限于算子.o(算子二进制文件)、.json(算子描述文件)、.cce等文件。 |
TF Adapter配置参数“debug_dir” > ASCEND_WORK_PATH > 默认路径(./当前执行路径)。 |
${ASCEND_WORK_PATH}_<pid>_<sessionid> |
开发者通过配置参数“external_weight”开启权重外置的场景下,此目录下存储Const/Constant节点的权重文件。 |
ASCEND_WORK_PATH > 默认路径(./当前执行路径) |
|
${ASCEND_WORK_PATH}/ |
开启DUMP图描述信息打印的场景下(即配置环境变量DUMP_GE_GRAPH的场景),会落盘相应的DUMP图文件。 |
环境变量“DUMP_GRAPH_PATH” > ASCEND_WORK_PATH > 默认路径(./当前执行路径) |
|
${ASCEND_WORK_PATH}/extra-info/data-dump/<device_id> |
配置参数“enable_exception_dump”取值为“2”且未配置环境变量“NPU_COLLECT_PATH”的场景下,落盘异常算子的输入数据。 |
ASCEND_WORK_PATH > 默认存储路径(当前脚本执行路径)。 |
|
AscendCL |
${ASCEND_WORK_PATH}/kernel_meta |
算子编译生成的调试相关的过程文件,包括但不限于算子.o(算子二进制文件)、.json(算子描述文件)、.cce等文件。 |
|
${ASCEND_WORK_PATH}_<pid>_<sessionid> |
开发者通过配置参数“external_weight”开启权重外置的场景下,此目录下存储Const/Constant节点的权重文件。 |
ASCEND_WORK_PATH > 默认路径(./当前执行路径) |
|
Profiling |
${ASCEND_WORK_PATH}/profiling_data |
Profiling工具收集到的性能数据的存放路径。 |
离线推理场景:
TensorFlow训练/在线推理场景: PROFILING_OPTIONS环境变量中的“output”参数、训练脚本“profiling_options”配置中的“output”参数、训练脚本调用Profiler类配置的“output_path”参数,优先级大于ASCEND_WORK_PATH。 需要注意:训练/在线推理场景下,output/output_path参数与环境变量ASCEND_WORK_PATH二者需要配置一个,否则profiling性能数据采集功能报错。 PyTorch训练/在线推理场景: on_trace_ready=tensorboard_trace_handler函数指定的性能数据路径 > ASCEND_WORK_PATH > 默认路径 若配置tensorboard_trace_handler函数后未指定具体路径,可以通过环境变量ASCEND_WORK_PATH设置,此时落盘的性能数据会自动解析;若代码中未使用on_trace_ready=torch_npu.profiler.tensorboard_trace_handler函数,那么通过环境变量ASCEND_WORK_PATH设置并落盘的性能数据为原始数据。 |
配置示例
export ASCEND_WORK_PATH=/repo/task001/172.16.1.12_01_03
配置的路径需要为已存在目录,且执行用户具有读、写、可执行权限,该路径的最后一段字段需要可唯一标识当前机器。
- machineID:当前机器的IP地址。
- vmID:虚拟机ID。
- dockerID:Docker容器ID。
如果您是物理机环境,仅通过IP地址标识即可。
使用约束
多服务器场景下,各机器上的AI处理器型号以及固件驱动与CANN软件版本需要保持一致。
支持的型号
Atlas 200/300/500 推理产品
Atlas 训练系列产品
Atlas 推理系列产品
Atlas A2训练系列产品/Atlas 800I A2推理产品
Atlas 200/500 A2推理产品