HCCL_RDMA_TIMEOUT
功能描述
用于配置RDMA网卡重传超时时间的系数timeout。
RDMA网卡重传超时时间最小值的计算公式为:4.096 μs * 2 ^ timeout,其中timeout为该环境变量配置值,且实际重传超时时间与用户网络状况有关。
- 针对Atlas 训练系列产品,该环境变量配置为整数,取值范围为[5,24],默认值为20。
- 针对Atlas 300I Duo 推理卡,该环境变量配置为整数,取值范围是[5,24],默认值为20。
- 针对Atlas A2 训练系列产品,该环境变量配置为整数,取值范围为[5,20],默认值为20。
配置示例
#超时时间配置为6 export HCCL_RDMA_TIMEOUT=6
使用约束
无
支持的型号
Atlas 训练系列产品
Atlas 300I Duo 推理卡
Atlas A2 训练系列产品
父主题: 集合通信