INF_NAN_MODE_ENABLE
功能描述
PyTorch训练与在线推理场景下,用于控制芯片对输入数据为Inf/NaN的处理能力,即控制芯片使用饱和模式还是INF_NAN模式。默认值为“1”。
- 0:饱和模式,计算出现溢出时,计算结果会饱和为浮点数极值(+-MAX)。
- 1:INf_NAN模式,根据定义输出Inf/NaN的计算结果。
针对Atlas 训练系列产品,仅支持饱和模式,该环境变量不生效。
针对Atlas A2 训练系列产品,默认值为“1”INF_NAN模式,支持配置为“0”饱和模式。
Atlas A2 训练系列产品,该环境变量默认为“1”INF_NAN模式。如模型中使用了Inf/NaN,配置为“0”饱和模式时,会有不可预期的精度问题。因此,请勿在模型中使用了Inf/NaN的情况下进行配置更改。
饱和模式:Inf置为max,NaN置为0。
torch.exp(torch.tensor([12], dtype=torch.float16).npu()) # tensor([65504.], device='npu:0', dtype=torch.float16)
INF_NAN模式:IEEE 754标准模式,与GPU行为一致。
torch.exp(torch.tensor([12], dtype=torch.float16).npu()) # tensor([inf], device='npu:0', dtype=torch.float16)
配置示例
export INF_NAN_MODE_ENABLE=1
是否必选
否
使用约束
无
支持的型号
Atlas 训练系列产品
Atlas A2 训练系列产品