INF_NAN_MODE_ENABLE
功能描述
通过此环境变量可控制芯片对输入数据为Inf/NaN的处理能力,即控制芯片使用饱和模式还是INF_NAN模式。默认值为“1”。
- 0:饱和模式,计算出现溢出时(Inf),计算结果会饱和为浮点数极值(+-MAX);出现无法计算的数值时(NaN),计算结果会变为0值。
- 1:INF_NAN模式,根据定义输出Inf/NaN的计算结果。
针对
针对

饱和模式:Inf置为max,NaN置为0。
Inf示例
torch.exp(torch.tensor([12], dtype=torch.float16).npu()) # tensor([65504.], device='npu:0', dtype=torch.float16)
NaN示例
torch.sqrt(torch.tensor([-1.0], dtype=torch.float16).npu()) # tensor([0.], device='npu:0', dtype=torch.float16)
INF_NAN模式:IEEE 754标准模式。
Inf示例
torch.exp(torch.tensor([12], dtype=torch.float16).npu()) # tensor([inf], device='npu:0', dtype=torch.float16)
NaN示例
torch.sqrt(torch.tensor([-1.0], dtype=torch.float16).npu()) # tensor([nan], device='npu:0', dtype=torch.float16)
配置示例
export INF_NAN_MODE_ENABLE=1
使用约束
无
支持的型号
Atlas A2 训练系列产品 Atlas A3 训练系列产品
父主题: 算子执行