下载
中文
注册

INF_NAN_MODE_ENABLE

功能描述

PyTorch训练与在线推理场景下,用于控制芯片对输入数据为Inf/NaN的处理能力,即控制芯片使用饱和模式还是INF_NAN模式。默认值为“1”。
  • 0:饱和模式,计算出现溢出时,计算结果会饱和为浮点数极值(+-MAX)。
  • 1:INf_NAN模式,根据定义输出Inf/NaN的计算结果。

针对Atlas 训练系列产品,仅支持饱和模式,该环境变量不生效。

针对Atlas A2 训练系列产品,默认值为“1”INF_NAN模式,支持配置为“0”饱和模式。

Atlas A2 训练系列产品,该环境变量默认为“1”INF_NAN模式。如模型中使用了Inf/NaN,配置为“0”饱和模式时,会有不可预期的精度问题。因此,请勿在模型中使用了Inf/NaN的情况下进行配置更改。

饱和模式:Inf置为max,NaN置为0。

torch.exp(torch.tensor([12], dtype=torch.float16).npu()) 
# tensor([65504.], device='npu:0', dtype=torch.float16)

INF_NAN模式:IEEE 754标准模式,与GPU行为一致。

torch.exp(torch.tensor([12], dtype=torch.float16).npu()) 
# tensor([inf], device='npu:0', dtype=torch.float16)

配置示例

export INF_NAN_MODE_ENABLE=1

使用约束

支持的型号

Atlas 训练系列产品

Atlas A2 训练系列产品