下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

HCCL_RDMA_QPS_PER_CONNECTION

功能描述

两个rank之间RDMA通信时会默认创建1个QP(Queue Pair)进行数据传输,若开发者想让两个rank之间的RDMA通信使用多个QP,可通过此环境变量实现。

此环境变量代表两个rank间需要使用的QP个数,需要配置为整数,取值范围:[1,8],默认值:1。

假设HCCL_RDMA_QPS_PER_CONNECTION环境变量配置为N1,则会在每两个rank之间创建N1个QP,两个rank之间通过RDMA传递的业务数据会平均分配到N1个QP上并行收发。

开启多QP传输的功能后,开发者还可以通过环境变量HCCL_MULTI_QP_THRESHOLD设置每个QP分担数据量的最小阈值。

配置示例

export HCCL_RDMA_QPS_PER_CONNECTION=4

使用约束

  • 该环境变量仅支持Atlas A2 训练系列产品的单算子调用方式,不支持静态图模式。
  • 当此环境变量取值超过8时,可能会造成由于内存占用过多导致业务运行失败的情况。

支持的型号

Atlas A2 训练系列产品

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词