NPU_COLLECT_PATH
功能描述
在复现问题场景下,使用该环境变量指定故障信息(包括dump图、算子编译.o文件、AI Core算子异常数据、算子编译过程信息等)的保存路径,可配置为绝对路径或相对路径(此处是相对执行程序或命令的路径),执行用户需对该路径具有读、写、可执行权限,若路径不存在,系统会自动创建该路径中的目录。
注意,使用该环境变量需关注以下事项:
- 设置该环境变量,默认自动开启异常算子dump数据采集功能;
- 开启该环境变量之后转换模型,在编译om模型时会增加调试信息,导致om模型文件增大,若关注内存规划或内存资源有限时,则在调试完成后及时删除该环境变量;
- 开启该环境变量后,仅收集L1 exception dump信息,不收集模型Dump信息、单算子Dump信息、溢出算子Dump信息、L0 exception Dump信息。
配置示例
export NPU_COLLECT_PATH=$HOME/demo/
使用约束
如果设置了此环境变量,模型编译时会在线编译算子,不再使用已编译好的算子二进制文件。
调用单算子API(例如aclnn类API)时,会使用已编译好的算子二进制文件,不涉及在线编译算子。
支持的型号
Atlas 200/300/500 推理产品
Atlas 训练系列产品
Atlas 推理系列产品
Atlas A2训练系列产品/Atlas 800I A2推理产品
Atlas 200/500 A2推理产品
父主题: 故障信息收集