总体流程
推理场景
图1 推理流程
- 执行推理时,发现了AI Core Error问题。
- 配置支持AI Core Error分析工具相关参数,包括支持异常算子代码行号映射的op_debug_level参数和debug_dir参数。
- 重新执行模型转换,生成指令映射文件。
- 使用AI Core Error分析工具解析问题。
训练场景
图2 训练流程
- 进行模型训练时,发现了AI Core Error问题。
- 配置支持AI Core Error分析工具相关参数,包括如下参数:
- 支持异常算子代码行号映射的op_debug_level参数。
- 支持dump异常算子信息的enable_exception_dump参数。
- 重新执行模型训练脚本,生成指令映射文件和异常算子的dump文件。
- 使用AI Core Error分析工具解析问题。
父主题: AI Core Error分析工具