HCCL_RDMA_QPS_PER_CONNECTION
功能描述
两个rank之间RDMA通信时会默认创建1个QP(Queue Pair)进行数据传输,若开发者想让两个rank之间的RDMA通信使用多个QP,可通过此环境变量实现。
此环境变量代表两个rank间需要使用的QP个数,需要配置为整数,取值范围:[1,8],默认值:1。
假设HCCL_RDMA_QPS_PER_CONNECTION环境变量配置为N1,则会在每两个rank之间创建N1个QP,两个rank之间通过RDMA传递的业务数据会平均分配到N1个QP上并行收发。
开启多QP传输的功能后,开发者还可以通过环境变量HCCL_MULTI_QP_THRESHOLD设置每个QP分担数据量的最小阈值。
配置示例
export HCCL_RDMA_QPS_PER_CONNECTION=4
使用约束
- 该环境变量仅支持Atlas A2 训练系列产品的单算子调用方式,不支持静态图模式。
- 当此环境变量取值超过8时,可能会造成由于内存占用过多导致业务运行失败的情况。
支持的型号
Atlas A2 训练系列产品
父主题: 集合通信