ASCEND_LAUNCH_BLOCKING
功能描述
PyTorch训练或在线推理场景,可通过此环境变量控制算子执行时是否启动同步模式。
由于NPU模型训练时默认算子异步执行,导致算子执行过程中出现报错时,打印的报错堆栈信息并不是实际的调用栈信息。当设置为“1”时,强制算子采用同步模式运行,这样能够打印正确的调用栈信息,从而更容易地调试和定位代码中的问题。设置为“0”时则会采用异步方式执行。
默认配置为0。
ASCEND_LAUNCH_BLOCKING设置为“1”时,强制算子采用同步模式运行会导致性能下降。
配置示例
export ASCEND_LAUNCH_BLOCKING=1
使用约束
无
支持的型号
Atlas 训练系列产品
Atlas A2 训练系列产品